Wissenschaftsjahr 2014 - Die Digitale Gesellschaft

Digitale Lesehilfen

Forscher werten riesige Textmengen per Computer aus

Texte lesen und auswerten – das kann eine Mammutaufgabe sein. Vor allem, wenn es um eine Vielzahl an Materialien geht. Hier kommen Computerlinguisten ins Spiel: Sie können in riesigen Textmengen nicht nur einzelne Wörter finden, sondern ganze Sprachmuster analysieren, ja selbst versteckte Inhalte herausarbeiten. So lassen sich wichtige von unwichtigen Informationen rasch trennen.

Computerlinguisten (rechts: Professor Ulrich Heid) durchforsten Hunderttausende Texte nach bestimmten Kriterien. (©Isa Lange/Universität Hildesheim)

Professor Ulrich Heid von der Universität Hildesheim erläutert dies am Beispiel eines Forschungsprojekts, bei dem Computerlinguisten aus einem Fundus von rund 800.000 Zeitungsartikeln diejenigen identifizieren müssen, in denen es um "Krisen, Krieg und militärische Interventionen" geht. Thema des Projekts, in dem Linguisten und Politologen zusammenarbeiten, ist die Darstellung kollektiver Identität in internationalen Krisen.

Mit Hilfe der computergestützten Verfahren können die Forscher zügig erkennen, ob sich ein Text tatsächlich mit dem Thema Krieg beschäftigt – oder zum Beispiel mit Fußball. Denn auch hier wird geschossen oder verteidigt. "Wir analysieren das Umfeld, nicht einzelne Worte", betont Heid. "Man muss hinter die Formulierung schauen und tiefer in den Text einsteigen."

Angewendet werden können die Verfahren in deutscher, englischer und französischer Sprache. Das Projekt "eldentity", an dem neben der Universität Hildesheim auch die Universitäten Stuttgart und Potsdam beteiligt sind, wird vom Bundesforschungsministerium gefördert.

 

Zum Projekt