DR. FREDERIK SIMON BÄUMER IT CONSULTING

Information Extraction

Unstrukturierte Daten wie Texte stellen eine Herausforderung für die EDV dar. Informationsextraktion macht Informationen sichtbar und für die maschinelle Weiterverarbeitung verfügbar.

Information Retrieval

Suchmaschinen zu bauen bedeutet, die Anforderungen von Suchenden mit dem Potential der Datenquellen in Einklang zu bringen. Manchmal heißt das, zuerst das Potential der Daten herauszuarbeiten.

Information Acquisition

Daten sind komplex: Strukturiert, unstrukturiert, zentral oder verteilt. Es bedarf Tools, die Daten sammeln, zusammenführen und normalisieren: Von Web-Crawling bis Linked Open Data.

Chat Bots

Trend oder Revolution? Dialogbasierte und freie Chat Bots können die Erstberatung von Kunden oder die initiale Aufnahme von Daten übernehmen.

Machine Learning

Übersetzungen und die Verarbeitung gesprochener Sprache sind Gegenstände maschinellen Lernens. Aber auch das Klassifizieren, Sortieren und Filtern von Dokumenten fällt in diesen Bereich.

(Web-)Development

Die Nachfrage nach modularen Spezialanfertigungen wie WordPress- oder Chrome-Plugins steigt stetig. Doch auch isolierte PHP/Python-Projekte sind nach wie vor eine spannende Herausforderung.

{ NLP Suchmaschinen Information Extraction Machine Learning SEO Wordpress Plugins CRM }

IT Consulting rund um den Themenkomplex Natural Language Processing umfasst z. B.  die Entwicklung von Systemen zur automatischen Informationsextraktion und -klassifikation sowie die Entwicklung und Optimierung von Enterprise Suchmaschinen. Die Mehrheit meiner Projekte findet im Bereich Online-Vertrieb, Produktion und Finanzen statt.

Wir ertrinken in Informationen, aber wir hungern nach Wissen…“ (John Naisbitt). Diese Situation ist im Zuge zunehmender Digitalisierung in vielen Unternehmen gelebte Realität. Mein Ziel ist es, durch Anwendung moderner Technologien den Fokus wieder mehr auf das Wesentliche zu richten.

Lassen Sie uns Ihre Ideen zusammen umsetzen.

<RESEARCH>

Information Retrieval

Die Technologie hinter modernen Suchmaschinen ist vielfältig und komplex: Umfangreiche NLP-Pipelines sorgen dafür, dass aus heterogenen Dokumenten ein durchsuchbarer, effizienter Index entsteht. Diese Verfahren und ihr Potential interessieren mich besonders.

Information Extraction

Unstrukturierte Daten wie Freitexte sind für Computer schwer zu interpretieren. Informationsextraktion zielt auf die Erkennung und Verarbeitung vordefinierter Typen von Informationen wie Entitäten oder Relationen in maschinenlesbaren Dokumenten ab.

Dialoge / Bots

Chat Bots helfen beim Einkaufen oder beantworten Fragen im offenen Gespräch. Mein bisheriger Forschungsfokus liegt auf Dialogen im Requirements Engineering und allgegenwärtigen Herausforderungen durch Ungenauigkeiten im Gesprächsverlauf wie z. B. Ambiguitäten: Mehr

Sentiment Analysis

Die Erkennung von Stimmungen in Fließtexten, beispielsweise ob Kunden einem Produkt positiv oder negativ gegenüberstehen, ist eine domänenspezifische Herausforderung, der unterschiedlich begegnet werden kann. Neue Herangehensweisen sowie die Erstellung linguistischer Ressourcen ist hier von Interesse.

Privacy in NLP

Die automatisierte Erkennung und Sichtbarmachung potentieller Privatsphäreverstöße wird mit der stetig wachsenden Menge textueller Daten wichtiger denn je. Meine Forschung in diesem Bereich wird von der Gesellschaft für Angewandte Linguistik e.V. gefördert. Hier erfahren Sie mehr: Poster

Named Entity Recognition

Ein populäres Teilgebiet der Informationsextraktion ist die Erkennung und Klassifikation benannter Entitäten in Fließtexten. Dies können Personen- oder Unternehmensnamen sein sowie z.B. Währungseinheiten.

Unique Content Generation

Unter Bezeichnungen wie Text Generation, Data2Text oder AutoSEO finden sich Ansätze zur automatischen Erzeugung natürlichsprachlicher Texte auf Basis strukturierter Daten. Hier existieren noch zahlreiche Herausforderungen und somit Forschungsbedarf, um Texte natürlich und menschlich klingen zu lassen.

Linked Open Data

LOD bezeichnet freie Daten, die per URI identifiziert werden können und auf andere Daten verweisen. Idealerweise werden zur Kodierung und Verlinkung der Daten das RDF und darauf aufbauende Standards verwendet. Umfangreiche Datenbestände vorzubereiten, zugänglich und greifbar zu machen ist eine aktuelle und spannende Herausforderung.

Einblicke

Apache Solr Workshop an der LMU München

Am 02. August 2019 fand an der Ludwig-Maximilians-Universität München zum vierten Mal der von Dr. Frederik Bäumer geleitete Apache Solr Workshop statt, welcher die grundsätzlichen Designentscheidungen der Suchmaschinenentwicklung sowie die Inbetriebnahme, Konfiguration als auch Integration von Apache Solr zum Gegenstand hatte. Sechzig Studierende lernten an diesem Tag die Open Source Enterprise-Suche Apache Solr kennen und auf eigene…

DATA 2019 – Web Mining für B2B CRM-Systeme

Gegenstand der 8. Internationalen Konferenz über Datenwissenschaft, Technologie und Anwendungen (DATA) ist es, Forscher, Ingenieure und Praktiker zusammenzubringen, die an Datenbanken, Big Data, Data Mining, Datenmanagement, Datensicherheit und anderen Aspekten von Informationssystemen und -technologien mit fortgeschrittenen Datenanwendungen interessiert sind. Dr. Frederik Bäumer und Bianca Buff aus der AG Semantische Informationsverarbeitung (Digitale Kulturwissenschaften) widmen sich in…

Vortrag: „Tooling Up For Digital Humanities“

Am 18.12.2018 hielt Dr. Bäumer im Rahmen der Ringvorlesung „Tooling Up for Digital Humanities“ seinen Vortrag „Der steinige Weg der maschinellen Analyse online-verfügbarer Patientenbewertungen: Herausforderungen, Tools und Vorgehensweisen“. Die Ringvorlesung lädt Wissenschaftler und Wissenschaftlerinnen aus verschiedenen Disziplinen ein, über den Einsatz von Software-Tools in ihrer Forschungsarbeit zu berichten. Herr Dr. Frederik Bäumer beschäftigt sich bereits seit…

Ausgewählte Kunden & Partner

Kontakt

LocationS

Aachen, Paderborn

Schreiben sie mir

Skype: frederik.baeumer