|
|
 |
Intelligente Dokumenterschließung
- Projekt StrukturKontext (Chemie.DE)
- Projekt Summarization (Uni Potsdam)
- Projekt XJustiz-Parser (AM-SoFT)
1. Projekt StrukturKontext
Im Projekt StrukturKontext (Chemie.DE) soll ein bereits existierendes
Verfahren zu Erkennung inhaltlicher Kontexte verbessert werden. Das existierende Verfahren macht auf der Basis von trainierten Textmodellierungen implizites Hintergrundwissen derart speicherbar, dass es zu beliebigen unbekannten Texten eine auf diesem Wissen basierte Kontext-Matrix liefern kann. Dieses Verfahren soll so weiterentwickelt werden, dass anhand trainierbarer Strukturmodelle Texte in einzelne Bestandteile zerlegt werden, die wiederum inhaltlichen Kontexten zugeordnet werden.
2. Projekt Summarization
Das Projekt Summarization (Uni Potsdam) setzt auf einem Verfahren auf,
das Textdokumente in verschiedene Zonen einteilt und nach ihrer Wichtigkeit bewertet. Wichtige Passagen werden einer genaueren, textlinguistischen Analyse unterzogen, daraus wird anschließend eine Zusammenfassung des Dokuments erstellt, bei der anders als bei rein statistischen Extraktionsverfahren eine inhaltliche Kohärenz erreicht wird. Dieses Verfahren soll weiter verbessert werden, insbesondere durch Einbeziehung statistischer Verfahren (siehe Projekt StrukturKontext), um durch die Kombination statistischer und linguistischer Analyse die jeweiligen Vorteile – Robustheit und Qualität – miteinander zu verbinden. Dabei soll auch eine „multi-document summarization“ durchgeführt werden, bei der für die besten Trefferdokumente einer Suchanfrage (siehe Projekte Web Mining und Föderierte Suche) eine gemeinsame, vergleichende Zusammenfassung erstellt wird.
3. Projekt XJustiz-Parser
Das Projekt XJustiz-Parser (AM-SoFT) beschäftigt sich mit der
intelligenten Dokumenterschließung in einem speziellen Anwendungsfeld, den juristischen Klageschriften. Das existierende Verfahren „Elektronischer Gerichtsbriefkasten“, das elektronische Schriftsätze entgegennimmt, Formulardaten extrahiert, Signaturprüfung vornimmt und Metainformationen zusammenfasst, soll um das leistungsstarke X-Parser Modul erweitert werden. Der X-Parser erkennt Datenfelder anhand von gestalterischen Freitextstrukturen. Diese kommen sehr häufig im Klagerubrum, d.h. dem einleitenden Teil von Klageschriften vor. Das Klagerubrum enthält die Angaben zu den Verfahrensbeteiligten, insbesondere deren Namen und Adressen sowie deren Rolle im Verfahren.
Alle diese Angaben werden durch den X-Parser aus dem Freitext in die von der Justiz definierten Datenstruktur X-Justiz transformiert. Die resultiernden X-Justiz-Daten können unmittelbar und automatisch in Justizfachverfahren importiert werden.
> Zurück zur Projektübersicht
|
|
| |
|