Universität Potsdam

Plattform für intelligente Kollaborationsportale

Universität Potsdam

Die Arbeitsgruppe Angewandte Computerlinguistik an der Universität Potsdam unter der Leitung von Prof. Dr. Manfred Stede befasst sich mit Aufgaben rund um die Verarbeitung von (geschriebenen) Texten und (gesprochenen) Dialogen. Für Telefonie-basierte Dialogsysteme, die eine Informationssuche in natürlicher Sprache erlauben, entwickeln wir Anwendungsprototypen (u.a. für den Bereich Tourismus) und betreiben Grundlagenforschung, so zur effektiven Behandlung von Missverständnissen in Dialogsystemen, wie sie z.B. durch Fehler in der Spracherkennung entstehen.

Bei der Verarbeitung von Textdokumenten stehen Anwendungen wie die Informationsextraktion im Vordergund, etwa für medizinische Berichte, in denen die wichtigsten Fakten identifiziert werden sollen. Dabei setzen wir sowohl statistische als auch symbolische, Ontologie-gestützte Verfahren ein. Als Grundlage für die textbezogenen Aufgaben entwickeln wir eine modulare, XML-basierte Analyse-Umgebung, die dem aktuellen Ansatz der „multi-level annotation“ folgt: Einzelne, von speziellen Modulen gelieferte Analyse-Ergebnisse (u.a.: Satzsyntax, Ko-Referenz von Nominalphrasen, rhetorische Textstruktur) werden jeweils in einer separaten Beschreibungsebene dargestellt, und verschiedene dieser Ebenen können dann für bestimmte Aufgaben miteinander verzahnt werden, was eine flexible Konfiguration von Dokumentverarbeitungs-Komponenten erlaubt.

Die für PINK entwickelte Komponente nutzt die Textanalyse-Plattform für die spezielle Aufgabe der Automatischen Zusammenfassung von Texten. Unser System verknüpft domänenunabhängige statistische Verfahren mit domänenspezifischen wissensbasierten Methoden; damit wird einerseits eine hohe Robustheit – auch für dem System unbekannte Textsorten – erreicht, andererseits eine höhere Qualität für Texte, deren Sorte vorab bekannt ist. Einen Schwerpunkt setzen wir bei der Erkennung von subjektiven Meinungsäußerungen in Texten und deren adäquater Integration in die Zusammenfassung, etwa für Produktbesprechungen, Rezensionen, Kommentare. Am Ende der Projektlaufzeit soll auch eine multi-document summarization möglich sein, die mehrere Dokumente zum gleichen Thema (beispielsweise Nachrichtenmeldungen verschiedener Agenturen zum gleichen Vorgang oder verschiedene Rezensionen desselben Produkts) analysiert, einander entsprechende Informationen identifiziert, und eine einzige, möglichst redundanzarme Zusammenfassung erstellt.

Die Gruppe bearbeitet Projekte mit Förderung der Deutschen Forschungsgemeinschaft, des Bundesministeriums für Bildung und Forschung, der Europäischen Union, sowie mit Firmen der Region, zu denen vielfältige Kontakte bestehen.

Webpage: http://www.ling.uni-potsdam.de/acl-lab

Kontakt

Universität Potsdam
Ansprechpartner: Prof. Dr. Manfred Stede
Institut für Linguistik
AG Angewandte Computerlinguistik

Postfach 601553
14415 Potsdam

Tel. +49.331.977-1474
Fax +49.331.977-1130

stede@ling.uni-potsdam.de
www.uni-potsdam.de

 
 
PINK © 2010, neofonie - Technologieentwicklung und Informationsmanagement GmbH