Profiles of Leading Women Scientists on AcademiaNet.
Search among the members of the Leopoldina for experts in specific fields or research topics.
Year of election: | 2018 |
Section: | Informationswissenschaften |
City: | Saarbrücken |
Country: | Deutschland |
Forschungsschwerpunkte: Informatik, Wissensbanken, automatische Wissensextraktion, Entwicklung von Suchmaschinen, Algorithmen
Gerhard Weikum ist Informatiker. Er entwickelt Methoden und Modelle, um Wissen im Internet automatisch verfügbar zu machen. Er hat mit seinem Team große Wissensbanken konstruiert und Pionierarbeit auf dem Gebiet der automatischen Wissensextraktion aus Internetquellen geleistet.
Das Internet umfasst heute das wichtigste Wissen der Menschheit in Form von Enzyklopädien, wissenschaftlichen Publikationen, Büchern, Nachrichten und weiteren Quellen. Diese textuellen und visuellen Inhalte sind von vornherein für Computer unverständlich. Wie man daraus weitgehend automatisch durch Algorithmen umfassende Wissensbanken konstruieren kann, ist das zentrale Forschungsthema von Gerhard Weikum und seinem Team am Max-Planck-Institut für Informatik.
Die entwickelten Algorithmen basieren auf der geschickten Kombination von statistischer und logischer Inferenz, zum Beispiel, indem musterbasierte Verfahren des maschinellen Lernens durch das Überprüfen logischer Invarianten erweitert werden. Mit solchen Methoden ist es u.a. gelungen, die Wissensbank Yago zu konstruieren, die Millionen von Entitäten wie Personen, Orte, Organisationen und Ereignisse sowie Hunderte Millionen Fakten über diese Entitäten umfasst. Dieses Projekt war Trendsetter für industrielle Projekte wie z.B. dem Google Knowledge Graph, der Hintergrundwissen für die verbesserte Suche nach Entitäten liefert.
Ein wichtiger Anwendungsbereich für diese Art von Maschinenwissen ist das Erschließen textueller und visueller Inhalte. Mit Methoden des maschinellen Lernens und der mathematischen Optimierung hat Weikums Team Werkzeuge entwickelt, die Entitäten und deren Zusammenhänge in Nachrichten und anderen Texten erkennen und eindeutig den Einträgen einer Wissensbank zuordnen. Beispielsweise können diese Methoden eine Schlagzeile wie „Ma founded Alibaba with VC money from Goldman“ auf die Entitäten Jack Ma, Alibaba Group und Goldman Sachs sowie das verbindende Konzept des Venture Capital Investments abbilden. Dies wiederum kann Analysten und Meinungsforscher unterstützen, etwa bei einer Trendanalyse, wie sich Investitionen und Unternehmen entwickeln und wie sie in der Öffentlichkeit wahrgenommen werden. Die in Weikums Team entwickelte Werkzeug-Suite ambiverseNLU ist als Open-Source-Code für Forschungsprojekte verfügbar und hat vielfältige Anwender gefunden.
Seit einigen Jahren beschäftigt sich Weikum, u.a. im Rahmen eines ERC Synergy Grants, auch mit der dunklen Seite digitalen Wissens: Was wissen Maschinen über individuelle Personen, und wie verwenden sie potenziell dieses Wissen für das Generieren von Anzeigen, personalisierte Filter und Empfehlungssysteme bis hin zur algorithmischen Entscheidungsvorbereitung etwa bei der Prüfung von Kredit- oder Visumsanträgen. In diesem aktuellen Forschungskomplex geht es um Fragen der Privatsphäre, der Transparenz von Dateneinflüssen, des Vertrauens in digitale Informationen und des Entdeckens von Fehlinformationen sowie um die Integration von Fairnesskriterien in Methoden und Anwendungen des maschinellen Lernens.