Presseportal

HU-Informatiker entwickeln effektive Suchmaschine für Zitate

Ein Anwendungsfall für die Erforschung der Frage, wie Computer lernen, menschliche Sprache zu verarbeiten

Sie suchen aktuelle Zitate von bestimmten Personen oder zu einzelnen 金贝棋牌 aus den Medien? Sie wollen die Quelle eines Zitates verifizieren? Sie wollen wissen, in welchem Kontext ein Zitat ge?u?ert wurde? Am Institut für Informatik der Humboldt-Universit?t zu Berlin (HU) hat Prof. Dr. Alan Akbik mit seinem Team eine Zitatsuchmaschine entwickelt.

Vollautomatisierter Prozess schafft riesige Datenbank

Diese Zitatsuchmaschine geht über das hinaus, was herk?mmliche Suchmaschinen zu bieten haben. Denn die Webcrawler durchforsten fortlaufend den Website-Content von deutschsprachigen journalistischen Medien und extrahieren Zitate, die dann quasi in Echtzeit verschlagwortet nach 金贝棋牌 und Personen auf der Website zu finden sind. Durch den vollautomatisierten Prozess auf Basis von KI-Modellen, die das Team um Akbik in den letzten vier Jahren entwickelt haben, ist eine riesige Datenbank entstanden: Zwei Millionen Zitate von 240 Tausend Sprecher*innen aus rund 50 verschiedenen journalistischen Quellen. Jeden Tag kommen mehr als 10.000 weitere Zitate hinzu.

Für Alan Akbik, der den Lehrstuhl für Maschinelles Lernen innehat, ist die Zitatsuchmaschine ein Nebenprodukt seiner Forschung. Er und sein Team besch?ftigten sich mit Sprachmodellen und der Frage, wie Computer lernen, menschliche Sprache zu verarbeiten (Natural Language Processing, NLP). Dafür wollen die Informatiker*innen m?glichst daten- und ressourceneffiziente Methoden entwickeln.

?Für uns ist eine wichtige Frage, wie wir als Universit?t mit unseren eigenen Sprachmodellen mit Unternehmen wie OpenAI mithalten k?nnen“, sagt Alan Akbik. ?Deswegen arbeiten wir an NLP-Modellen, die mit m?glichst wenig Daten trainiert werden k?nnen und weniger Ressourcen brauchen. Die Zitatsuchmaschine ist für uns ein Anwendungsfall dieser Forschung.“

Darüber hinaus wollen Alan Akbik und sein Team mit ihrer Zitatsuchmaschine, die fortlaufend verbessert und ausgebaut werden soll, ein Recherchetool für Journalist*innen und andere Nutzer*innen zur Verfügung stellen.

Weitere 金贝棋牌

Zitatsuchmaschine – entwickelt an der Humboldt-Universit?t zu Berlin

金贝棋牌

Prof. Dr. Alan Akbik
Lehrstuhl für Maschinelles Lernen an der Humboldt-Universit?t zu Berlin

alan.akbik@hu-berlin.de

?

?

?

?

?