Legal Tech and Translation Automation

2019-12-18 15:45

Legal Tech und Übersetzungsautomatisierung: gemeinsame Techniken und Trends

Im Herbst bzw. Winter 2019 habe ich für CrossLang N.V. an mehreren Veranstaltungen, Vorträgen und Gesprächen zu Legal Technology (Legal Tech) teilgenommen, bei denen auch der Aspekt der Übersetzungsautomatisierung eine Rolle spielte. Hier konnte ich viele Parallelen in der Entwicklung des und den Auswirkungen auf das Berufsbild von Übersetzern und Juristen feststellen:

  • Textanalysemethoden aus dem Bereich des Natural Language Processing (NLP) bzw. moderner Machine Learning-Verfahren haben im Legal Technology-Bereich in ähnlicher Weise Einzug gehalten wie sie in der maschinellen Übersetzung inzwischen etabliert sind. Sehr übersichtlich erläutert im Vortrag Legal Text Analytics - Challenges and Pitfalls von Prof. Dr. Michael Gertz, Universität Heidelberg, bei der Legal ®evolutions-Konferenz. [5a]
  • Praktisch implementiert sind solche NLP-Verfahren in Lösungen zur automatisierten Vertragsanalyse, eine davon wurde von rfrnz beim 1. Düsseldorfer LegalTech Pitch vorgestellt [1a]. Mit dabei in Düsseldorf war auch Judicio [4a], die speziell auf juristischen Daten trainierte maschinelle Übersetzungslösung für den Rechtsbereich von CrossLang. Sowohl rfrnz als auch CrossLang betonten die Bedeutung von sauberen, d. h. qualitativ hochwertigen Trainingsdaten für die Qualität ihrer jeweiligen Lösungen. Nachlese vom 1. Düsseldorfer LegalTech Pitch mit Kurzvideo ist zu finden in [1b].
  • Cloud-Lösungen sind auch bei hohen Sicherheitsanforderungen im Rechtsbereich inzwischen kein K.o.-Kriterium mehr, wenn entsprechende Verschlüsselungstechnologien bei der Übertragung eingesetzt werden, die Server idealerweise in Deutschland stehen und Datenschutzvorschriften eingehalten werden.
    Für eine effiziente und flexible Nutzung von Legal Tech- und Übersetzungsautomatisierungs-Lösungen, die mit modernen Machine Learning-Methoden arbeiten, ist die (sichere) Cloud fast unumgänglich; das Bewusstsein und die Akzeptanz hierzu steigt nicht nur in Großunternehmen, sondern auch bei Anwaltskanzleien. [1b]
  • Datenschutzanforderungen kombiniert mit Cloud-Nutzung machen oft auch Anonymisierungstechnologien erforderlich, die wiederum auf Eigennamenerkennung (Named Entity Recognition, NER) und damit NLP-Verfahren beruhen. Eigennamen sind zudem auch ein wichtiger Schlüssel für Informationsextraktion aus Dokumenten, insbesondere auch im juristischen Bereich. [5a]
  • Der Zeitfaktor spielt bei Erstellung und Analyse juristischer Dokumente eine immer größere Rolle: Die Unternehmensberatung KPMG zählt schnelle Dokumentenanalyse und effiziente Vertragsautomatisierung zu den wesentlichen Herausforderungen von Rechtsabteilungen in der heutigen Zeit. [5b]
    Ähnliches gilt für die Anfertigung von Übersetzungen, wodurch der Einsatz maschineller Hilfsmittel unumgänglich wird: Auch wenn das maschinelle Übersetzungsergebnis nicht perfekt ist, eine "Quick&Dirty"-Übersetzung mittels maschineller Übersetzung kann in vielen die Grundlage für weitere Entscheidungen zur Relevanz des Originaldokuments (z. B. beim eDiscovery) und des tatsächlichen Übersetzungsbedarfs sein und auch eine Ausgangsbasis für eine (zeitsparendere) Überprüfung durch einen mehrsprachigen Experten sein.
  • Die zu übersetzende Menge an Texten steigt im "Big Data"-Zeitalter insgesamt rasant an - auch im Rechtsbereich u. a. getrieben durch Lösungen zur automatischen Dokumentengenerierung [5a] – und wäre durch menschliche Übersetzer allein bei weitem nicht zu bewältigen. [2]
  • Im Zug der Digitalisierung in die Kanzleien und Rechtsabteilungen werden Verträge zunehmend standardisiert in elektronischen, wiederverwendbaren Mustervorlagen und Textbausteinen verfasst.[7b] Wenn diese in andere Sprachen zu übersetzen sind, können somit nun verstärkt Übersetzungsdatenbanken (Translation Memory-Systeme), wie sie bei der Übersetzung technischer Dokumentation seit ca. 20 Jahren im Einsatz sind, zwecks schnellerer und konsistenterer Übersetzung genutzt werden. Dabei können zudem auch Übersetzungsmanagement-Lösungen zum Einsatz kommen, die zentrale Ablage und Verwaltung von mehrsprachigen Dokumenten, Einbindung von Vorschlägen aus spezifisch trainierten maschinellen Übersetzungssystemen, Terminologie-Integration und weitere intelligente Qualitätssicherungsfunktionen sowie eine benutzerfreundliche Web-Oberfläche für die zweisprachigen Überprüfung bieten.[4b] Die geprüften und gespeicherten neuen Sprachdaten können wiederum als Basis für weiteres Optimieren der Textanalyse-Tools bzw. des maschinellen Übersetzungssystems genutzt werden.
  • Es wird bereits ein Rückgang des "klassischen" Übersetzungsbedarfs für professionelle (Einzel-)Übersetzer und Agenturen im Rechtsbereich festgestellt-  eben aufgrund der wiederverwendbaren, elektronisch gespeicherten, mehrsprachigen Textbausteine und weil die neuronale maschinelle Übersetzung (NMT) qualitativ immer bessere Ergebnisse liefert, so dass sprachkundige Mitarbeiter in Unternehmen und Kanzleien die Texte bzw. neuen Textbausteine und Änderungen selbst übersetzen. [7b]
  • Die Tätigkeit des Übersetzens ändert sich durch die technologischen Fortschritte: Weite Teile des klassischen Übersetzens in der technischen Dokumentation haben sich schon vor einigen Jahren gewandelt hin zum Nachbearbeiten (Posteditieren[3]) von automatisch abgerufenen fremdsprachigen Bausteinen aus Übersetzungsdatenbanken bzw. automatisch generierten Übersetzungsvorschlägen. Diese Arbeitsweise wird auch verstärkt bei der Übersetzung von Rechtstexten Einzug halten. [7b]
  • Die Preise und Abrechnungsmodelle für Übersetzen ändern sich [7a]: die Kosten für die "Humanübersetzung" wird auch im juristischen Bereich insgesamt sinken, dafür steigen die Investitionen in Anschaffung bzw. Nutzung technologischer Lösungen.
  • Vollautomatisierte Lösungen im Textanalyse-Bereich stoßen bei juristischen Texten allerdings noch stärker an ihre Grenzen als im Bereich der technischen Dokumentation aufgrund von Mehrdeutigkeiten und Kontextabhängigkeiten. Auch in struktureller Hinsicht sind juristische Texte meist komplexer aufgebaut und können nicht einfach sequenziell (von einer Maschine) analysiert werden, sondern erfordern aufgrund der zahlreichen, oftmals dokumentübergreifenden Referenzen und Fußnoten eine netzwerkartige Abbildung und Analyse, um maschinell verarbeitet zu werden. [5a]
    Bei vollautomatischer Übersetzung in Fremdsprachen ist es daher noch schwieriger, dokumentenübergreifende Verweise, Ambiguitäten und rechtsordnungsspezifische Benennungen und Konventionen korrekt zu transferieren, daher ist immer Vorsicht und menschliche Prüfung geboten [7c], idealerweise in einer integrierten Review-Umgebung, bevor ein wichtiger Text in maschinell übersetzter Form veröffentlicht oder als Entscheidungsgrundlage genutzt wird.
  • Schwachpunkte der neuronalen maschinellen Übersetzung sind u. a. nach wie vor terminologische Inkonsistenzen sowie Sinnentstellungen durch falsche Übertragung unbekannter Wörtern, insbesondere wenn nicht rechts- oder kundenspezifisch trainierte NMT-Lösungen (wie Google Translate oder DeepL) verwendet werden. [7c]
  • Trotz vieler Untersuchungen zu Best Practices im Umgang mit der Integration maschineller Übersetzung am Übersetzerarbeitsplatz gibt es keine allgemeingültigen Empfehlungen: Übersetzen ist keine homogene Aktivität; neuronale maschinelle Übersetzung verhält sich wie ein "Chamäleon" (liefert oft erstaunlich flüssige Übersetzungsergebnisse, aber manchmal auch komplette Fehlübersetzungen); unerfahrenere Übersetzer tendieren eher, sich zu sehr auf maschinelle Übersetzungsvorschläge zu verlassen, was zu potenziellen Qualitätsproblemen führen kann - so einige der Erfahrungen von ungarischen Rechtsübersetzern bei der Generaldirektion Übersetzung der Europäischen Kommission, die seit zwei Jahren mit dem intern entwickelten maschinellen Übersetzungssystem eTranslation arbeiten. [6]
  • So wie im Arbeitsalltag professioneller Übersetzer technische Hilfsmittel und zunehmend auch die Nutzung und Nachbearbeitung maschinell erstellter Übersetzungsvorschläge Einzug gehalten haben, wird sich auch voraussichtlich die Tätigkeit zumindest einiger Juristen dahingehend ändern, dass sie vermehrt maschinell generierte Verträge prüfen und bei entsprechenden fremdsprachlichen Kenntnissen ggf. auch gleich mehrsprachig erstellen und/oder automatisch übersetzte Verträge prüfen – mit ähnlichen Hilfsmitteln wie professionelle Übersetzer. [2]

Fazit

Sowohl der Rechtsbereich als auch der Übersetzungsbereich ist durch die Digitalisierung stark im Umbruch begriffen, die Technologien führen zu weitreichenden Änderungen in den jeweiligen Prozessen und Berufsbildern. Doch bringen die neuen Technologien auch neue Möglichkeiten und Chancen, nicht nur im Hinblick auf Automatisierungsmöglichkeiten: Juristen und Übersetzer mit technischer Aufgeschlossenheit und mit breiter Aus- oder Weiterbildung durch neuen Technologien repetitive Aufgaben vermeiden und neue Einsatz- und Tätigkeitsfelder erschließen, die ohne die technischen Werkzeuge bisher überhaupt nicht oder zumindest nicht zeit- oder kosteneffizient möglich waren.

Quellennachweise:

 

[1] 1. Düsseldorfer Legal Tech Pitch (21.11.2019)

- [1a] https://www.sack.de/aktuelles/veranstaltungen/legal-tech-pitch

- [1b] https://www.legal-tech.de/1-duesseldorfer-legal-tech-pitch/

[2] [2] De Palma, Don: Why Buy CAT Tools When NMT Rules? https://csa-research.com/Insights/ArticleID/604/global-content-translation-volume

[3] ISO 18587 - Übersetzungsdienstleistungen - Posteditieren maschinell erstellter Übersetzungen - Anforderungen (2017). https://www.din.de/de/mitwirken/normenausschuesse/nat/normen/wdc-beuth:din21:273220346

[4] Judicio: automatisierte Übersetzungslösung für den Rechtsbereich von CrossLang N.V.

- [4a] https://judic.io/de

- [4b] https://enterprise.judic.io/de/about

[5] Legal ®evolutions 2019 - Expo & Congress (4.-5.12.2019, Frankfurt)

- [5a] Gertz, Michael: Legal Text Analytics - Challenges and Pitfalls. https://www.legal-revolution.com/de/programm/vortraege-und-panels/113-die-redner/redner/736-profdrmichaelgertz

- [5b] KPMG: Legal@2022. https://www.legal-revolution.com/de/programm/vortraege-und-panels

[6] Lesznyák, Ágnes (2019): Hungarian translators’ perceptions of neural machine translation in the European Commission. In: Proceedings of Machine Translation Summit XVII. Volume 2: Translator, Project and User Tracks. S. 16-22. https://www.mtsummit2019.com/proceedings

[7] Übersetzen und Dolmetschen 4.0: Neue Wege im Digitalen Zeitalter. (22.-24.11.2019, Bonn).Tagungsband der 3. Internationalen Fachkonferenz des Bundesverbands der Dolmetscher und Übersetzer e. V. (BDÜ). BDÜ-Fachverlag 2019:

- [7a] Dalügge-Momme, Natascha: Legal Tech und das juristische Übersetzen

- [7b] Knobloch, Holger: "Legal Tech" - wie die Digitalisierung die Rechtsbranche und die Rahmenbedingungen für Rechtsübersetzer verändert

- [7c] Schlüter-Ellner, Corinna: Stolpersteine für DeepL beim juristischen Übersetzen

 

Über die Autorin:

Christine Bruckner ist Diplomübersetzerin für Spanisch und Englisch und hat ein Aufbaustudium in Computerlinguistik absolviert. Sie hat mehr als 20 Jahre Berufserfahrung im Bereich Übersetzungstechnologie und war u. a. in Sprachendiensten deutscher Großunternehmen und Behörden tätig.
Seit 2018 arbeitet sie selbständig als Beraterin, u. a. für das belgische Sprachtechnologie-Unternehmen CrossLang N.V.  Sie ist Mitglied im Bundesverband Deutscher Übersetzer und Dolmetscher (BDÜ) und steuert in dessen Publikationen regelmäßig Artikel zu maschineller Übersetzung bei.