Ereignis-basierte Informationsnetzwerke

Einblicke in gesellschaftliche Themen und globale Zusammenhänge

Wie kam es zum Ukraine-Konflikt? Was ist der aktuelle Stand der griechischen Schuldenkrise? Welche Wellen haben die "Panama Papers" geschlagen? Wie läuft der Atomausstieg? Diese und viele weitere Fragen spiegeln die Komplexität unserer heutigen Gesellschaft in den verschiedensten Bereichen wider. Aber wie informiert man sich über solche Themen?

Projektsteckbrief

Ansprechpartner:

Universität Heidelberg
Marietta Fuhrmann-Koch
marietta.fuhrmann-koch@rektorat.uni-heidelberg.de

Die Medienlandschaft ist unüberschaubar und täglich gibt es unzählige neue Meldungen in den verschiedensten Nachrichtenportalen und Diskussionsforen, in denen ein einzelnes Ereignis schnell untergeht – von der Informationsflut in den sozialen Medien ganz zu schweigen. Auch ein aktueller, ausführlich geschriebener Wikipedia-Artikel hilft hier meist nicht weiter, denn der Leser verliert sich schnell im Gewirr von Links, wenn er zu verschiedenen Aspekten eines Ereignisses weitere Informationen sucht.

Ein einfacher und erprobter Ansatz, der es dem Anwender erlaubt, sich einen Überblick über komplexe gesellschaftliche Abläufe zu verschaffen, ist die Organisation entlang einer zeitlichen Achse. Solche Timelines, wie man sie aus dem Geschichtsunterricht kennt, sind gut geeignet, um dem Leser einen Überblick über abgeschlossene, manuell aufgearbeitete Ereignisse zu geben. Sie werden daher auch von einigen Zeitungen zur Illustration verwendet, um einen Artikel zugänglicher zu machen. Bei aktuellen, sich konstant entwickelnden Geschehnissen sind solche Timelines aber schnell nicht mehr aktuell und erlauben auch keine weiterführende Exploration der Themen.

Bei genauerer Betrachtung stellt man fest, dass Fragestellungen wie die obigen gut über Events beschrieben bzw. zusammengefasst werden können. Aus den Neurowissenschaften und der kognitiven Psychologie ist schon seit langem bekannt, dass die Wahrnehmung und Erinnerung des Menschen auf Ereignissen basiert, im aktuellen Sprachgebrauch als Events bezeichnet. Kennzeichnend für einen Event ist, dass er beschreibt, was zu einem Zeitpunkt an einem Ort unter Beteiligung von Akteuren (Personen und/oder Organisationen) geschehen ist. Timelines lassen sich daher im Wesentlichen als eine grobe Auflistung von Events über eine Zeitachse betrachten. Aufgrund der Komplexität von Events stößt diese lineare, inhärent eindimensionale Darstellung jedoch schnell an ihre Grenzen. Beispielsweise lassen sich parallele Entwicklungen von abhängigen Ereignissen schlecht über Timelines visualisieren. Ein wesentlich besserer Ansatz ist es daher, die komplexen Beziehungen zwischen Orten, Zeiten und Akteuren in Form von Netzwerken darzustellen, die eine intuitive Exploration in mehreren Dimensionen erlauben. Da Events meist in einem komplexen Kontext eingebettet sind, würde bei keinem der obigen Beispielthemen ein einzelner Event oder eine reine Abfolge von Events den vollständigen Sachzusammenhang des Themas umfassend beschreiben können.

In vielen naturwissenschaftlichen Anwendungsgebieten wie der Biologie, Medizin oder Physik hat sich die Betrachtung von komplexen Systemen als Netzwerke bereits bewährt. In diesen Gebieten, die oft keine Festlegung auf eine reine mikroskopische oder makroskopische Sicht auf ein zu analysierendes System erlauben, ist die Betrachtung von Netzwerken – oder sogar Netzwerken von Netzwerken – inzwischen unverzichtbar. Trotz dieser Fähigkeit zur Repräsentation komplexer Zusammenhänge ist die zugrundeliegende Intuition von Netzwerken hingegen leicht verständlich und kann daher auch dazu dienen, dem Anwender den Zugang zu komplexen Zusammenhängen wie Nachrichten zu ermöglichen und eine Struktur in die Informationsflut zu bringen.

In der Arbeitsgruppe Datenbanken am Institut für Informatik der Universität Heidelberg werden zu diesem Zweck Methoden und Werkzeuge entwickelt, die kontinuierlich aus einer großen Zahl von Datenquellen Informationen zu Ereignissen extrahieren. So werden beispielsweise deutsch- und englischsprachige Nachrichtentexte in Echtzeit daraufhin untersucht, welche Personen, Organisationen und Orte erwähnt werden (sogenannte Entitäten). Die Zusammenführung der Informationen aus individuellen Artikeln erfolgt dann auf Basis der Hypothese, dass sehr wahrscheinlich eine Beziehung zwischen zwei Entitäten besteht, wenn diese häufig zusammen erwähnt werden. Beziehungen zwischen den Entitäten werden dann als Netzwerk dargestellt und lassen sich mit weiteren Informationen anreichern, wie z.B. wichtigen Schlagworten aus dem Kontext der Erwähnung oder dem Publikationsdatum der Texte. Diese Herangehensweise zur Konstruktion eines Informationsnetzwerkes basiert somit auf statistischen Verfahren, die die gemeinsame Erwähnung von Entitäten in unstrukturierten Fließtexten in strukturierte Netzwerkinformation übersetzen. Mithilfe der extrahierten Informationen zu Zeitangaben können den Beziehungen im Netzwerk dann Gültigkeitszeiträume zugeordnet werden, wobei neue Entitäten und Beziehungen aus neu publizierten Artikeln über die Zeit hinzugefügt werden.

Ein derartiges Netzwerk bietet dem Nutzer eine Vielzahl von Möglichkeiten zur Exploration und Analyse. So kann zum Beispiel das Netzwerk auf einen relevanten Zeitraum eingeschränkt oder die Verbindung zwischen Personen nachverfolgt werden. Über die einfache Exploration hinaus können auch algorithmische Analysen erfolgen, wie z.B. die Identifikation und Gruppierung von Personen, die maßgeblich an einem Ereignis beteiligt sind. Unterstützt werden diese Analysemethoden durch neueste Forschungsergebnisse in den Bereichen der Netzwerkanalyse und der Informationsextraktion. Die in der Arbeitsgruppe entwickelten Methoden eröffnen daher Möglichkeiten von Anwendungen, die weit über den akademischen Bereich hinausgehen. Im Bereich der Bildung können geeignet zugeschnittene Informationsnetzwerke u.a. in Schulen eingesetzt werden, um Schülerinnen und Schüler dabei zu helfen, sich einen Überblick über ein komplexes (geschichtliches) Thema anzueignen. Darüber hinaus bieten Netzwerke von Ereignissen und Entitäten auch einen effektiven Zugang zu großen Dokumentensammlungen, wie beispielsweise Akten oder Berichten, sofern diese in elektronischer Form vorliegen.