 |
Universität Potsdam

Die Arbeitsgruppe Angewandte Computerlinguistik an der Universität Potsdam unter der Leitung von Prof. Dr. Manfred Stede befasst sich mit Aufgaben
rund um die Verarbeitung von (geschriebenen) Texten und (gesprochenen) Dialogen. Für Telefonie-basierte Dialogsysteme, die eine Informationssuche
in natürlicher Sprache erlauben, entwickeln wir Anwendungsprototypen (u.a. für den Bereich Tourismus) und betreiben Grundlagenforschung, so zur
effektiven Behandlung von Missverständnissen in Dialogsystemen, wie sie z.B. durch Fehler in der Spracherkennung entstehen.
Bei der Verarbeitung von Textdokumenten stehen Anwendungen wie die Informationsextraktion im Vordergund, etwa für medizinische Berichte, in denen
die wichtigsten Fakten identifiziert werden sollen. Dabei setzen wir sowohl statistische als auch symbolische, Ontologie-gestützte Verfahren ein.
Als Grundlage für die textbezogenen Aufgaben entwickeln wir eine modulare, XML-basierte Analyse-Umgebung, die dem aktuellen Ansatz der
„multi-level annotation“ folgt: Einzelne, von speziellen Modulen gelieferte Analyse-Ergebnisse (u.a.: Satzsyntax, Ko-Referenz von Nominalphrasen,
rhetorische Textstruktur) werden jeweils in einer separaten Beschreibungsebene dargestellt, und verschiedene dieser Ebenen können dann für bestimmte
Aufgaben miteinander verzahnt werden, was eine flexible Konfiguration von Dokumentverarbeitungs-Komponenten erlaubt.
Die für PINK entwickelte Komponente nutzt die Textanalyse-Plattform für die spezielle Aufgabe der Automatischen Zusammenfassung von Texten.
Unser System verknüpft domänenunabhängige statistische Verfahren mit domänenspezifischen wissensbasierten Methoden; damit wird einerseits eine
hohe Robustheit – auch für dem System unbekannte Textsorten – erreicht, andererseits eine höhere Qualität für Texte, deren Sorte vorab bekannt ist.
Einen Schwerpunkt setzen wir bei der Erkennung von subjektiven Meinungsäußerungen in Texten und deren adäquater Integration in die Zusammenfassung,
etwa für Produktbesprechungen, Rezensionen, Kommentare. Am Ende der Projektlaufzeit soll auch eine multi-document summarization möglich sein, die
mehrere Dokumente zum gleichen Thema (beispielsweise Nachrichtenmeldungen verschiedener Agenturen zum gleichen Vorgang oder verschiedene Rezensionen
desselben Produkts) analysiert, einander entsprechende Informationen identifiziert, und eine einzige, möglichst redundanzarme Zusammenfassung erstellt.
Die Gruppe bearbeitet Projekte mit Förderung der Deutschen Forschungsgemeinschaft, des Bundesministeriums für Bildung und Forschung, der Europäischen Union,
sowie mit Firmen der Region, zu denen vielfältige Kontakte bestehen.
Webpage: http://www.ling.uni-potsdam.de/acl-lab
Universität Potsdam
Ansprechpartner: Prof. Dr. Manfred Stede Institut für Linguistik AG Angewandte Computerlinguistik
Postfach 601553 14415 Potsdam
Tel. +49.331.977-1474
Fax +49.331.977-1130
stede@ling.uni-potsdam.de
www.uni-potsdam.de
|
|