Weblaw Aktuell

Weblaw AG am IRIS 2016: Openlaws Hackathon.

Wir freuen uns sehr, das Internationale Rechtsinformatik Symposion, Openlaws und fhs - Fachhochschule Salzburg im Rahmen des IRIS 2016 Openlaws Hackathons zu unterstützen.

Die Weblaw AG stellt folgende Projekte vor und unterstützt interessierte Hackathon Teilnehmende sehr gerne:

1. Auswertung von Entscheidtexten (Schweizerisches Bundesgericht).

Alle Entscheide des Schweizerischen Bundesgerichts (ab 1928), ergänzt um Metainformationen, d.h. Rechtsgebiete, erkannte Normen und Deskriptoren und weitere jur. Referenzen.

Motivation:
Ganz im Sinne des IRIS 2016 sollten Verbindungen und Muster in einem mittelgrossen Datenbestand gefunden werden. Der Wert von Daten liegt nicht nur in den Metadaten und im Volltext, sondern auch in expliziten oder impliziten Beziehungen zwischen einzelnen Datensätzen. Wir bieten einen umfassend analysierten, annotierten und verschlagworteten Datenbestand zum Spielen an.

Aufgabenstellung:
Ausgehend von einer Datenmenge in einem XML-Format sollen folgende und ähnliche Fragen beantwortet werden:

  • Welches sind die Leading Cases in einem bestimmten Rechtsgebiet?
  • Automatische Zuordnung von anderen Texten in die bestehenden Rechtsgebiete (Beispiel: zusätzliche Entscheide ohne Information, welchem Rechtsgebiet diese zugehörig sind - Versuch, diese Entscheide den korrekten Rechtsgebieten zuzuordnen).
  • Leading Cases in Bezug auf bestimmte Rechtsfragen bzw. einfacher: auf bestimmte Gesetzesartikel?

Hinweise:

  • Die Datenbasis umfasst alle Entscheide des Schweizerischen Bundesgerichts ab 1928 als einzelne XML Files. Diese Files beinhalten sowohl Metadaten (Deskriptoren, Referenzen, Thesaurus Werte) wie auch annotierte Volltexte.
  • Ein mögliches Vorgehen ist das Erstellen eines Graphen und dann die Erstellung eines entsprechenden Reports.

2. Generierung von Verzeichnissen wie z.B. ein Abkürzungsverzeichnis (weitere Möglichkeiten: Zeitschriftenverzeichnis, Literaturverzeichnis).

Motivation:
Das Erstellen eines Abkürzungsverzeichnisses gehört sicher nicht zu den beliebtesten und intellektuell herausforderndsten Aufgaben in der täglichen wissenschaftlichen Arbeit. Wie könnten eine Toolunterstützung und eine mögliche Datenbank aussehen, die eine solche Arbeit mindestens teilweise automatisieren. Damit ein bisschen mehr Zeit für Rechtschreibeprüfung bleibt, oder so.

2.1. Abkürzungsverzeichnis
Ziel: Zentrales Abkürzungsverzeichnis, länderübergreifend, mehrsprachig, kategorisiert -> Positivliste, die weiter gepflegt und ausgebaut werden kann. Möglichkeit, Kategorien hinzuzufügen (Tagging. Beispiel: Abkürzungen Gesetzgebung, Rechtsprechung, DE, AT, CH, Bund, Länder oder Kantone, generische Abkürzungen, Publikationsspezifische Abkürzungen, Beispiel IRIS-Tagungsband, etc.).

Vorgehen:
Bestehende Verzeichnisse suchen.

Zweiter Ansatz, schwieriger: Aus normalen Texten Abkürzungen und die Abkürzungserklärungstexte (Volltext zu einer Abkürzung) automatisiert finden und extrahieren.

Ziel bei beiden Ansätzen: Mit einer Positivliste unstrukturierte Texte auswerten können. Möglichkeiten zur semiautomatischen Unterstützung.

2.2. Analog dazu Zeitschriftenverzeichnis
Automatisches Erkennen von Zeitschriftenzitaten in Texten.

3. Erstellen von EPUBs oder PDFs aus HTML Texten.

Grundlage können Texte aus der Datenbank von Weblaw (Entscheide des Bundesgerichts) oder auch von Openlaws sein.

Idee:
Selektion von Texten, die zu einem Dokument zusammengefügt werden sollen, allenfalls Anpassung der Reihenfolge, Definition eines Titelblattes und Publikation als EPUB oder PDF.