Christine Spies

     

Automatisierte Texterstellung – Clunc Stuttgart 2016

Verantwortung & Datenqualität

15.03.2016

Wer einen Text über automatisierte Textgenerierung schreibt, befindet sich zwangsläufig auf einer Metaebene. Nein, hiermit versichere ich ausdrücklich, dass ich diesen Text als Mensch selbst geschrieben habe. Denn Zweifel kommen auf. Das Niveau der Textqualität, in der Texte automatisiert erstellt werden können, ist inzwischen beeindruckend gut.

Das wurde an der grossartigen Computerlinguistik Unconference oder kurz „clunc“ in Stuttgart anschaulich demonstriert. Nette Leute, spannende Sessions und lehrreiche Case Studies waren am 11. und 12. März das absolute Qualitätsmerkmal. In den Räumen der Agentur aexea in Stuttgart trafen und tauschten sich die zahlreichen Interessierten für Computerlinguistik aus. Dafür kann ich den Veranstaltern einfach nur ein fettes Lob aussprechen.

Inhaltlich standen vor allem die automatisch generierten Texte im Vordergrund. Natürlich sind es in erster Linie Gebrauchstexte, wie Produktdetailtexte oder Beschreibungstexte für Veranstaltungskalender oder Feriendestinationen, die maschinell gut generiert werden können.

Und wollen wir ehrlich sein. Diese Art der Textarbeit in grossem Volumen wollen wir menschlichen Textern doch ernsthaft auch nicht zumuten. Das können Maschinen sicher schneller und besser. Menschen, die professionell Texte erstellen, sollten sich darauf konzentrieren, komplexe Sachverhalte zu vertexten. Hierzu gehört alles, was eine Meinung, einen Standpunkt oder einen Vergleich erfordert. Auch überraschende Bezüge oder Ironie in Texten werden Maschinen in nächster Zeit kaum generieren können. Und ich denke, das müssen sie auch nicht. Aufgabe der Maschine sollte es sein, Texte in Masse zu produzieren.

Denn die menschliche Korrektur wird noch lange notwendig sein, wenn beispielsweise „culture knowledge“ gefordert ist. Das betrifft neben der Erstellung komplexer Bewertungstexte auch die Übersetzungsarbeit. Sowas fällt auf, wenn sich der Leser in Lateinamerika wundert, warum er den Fernseher im heiligen Wohnzimmer aufstellen sollte. Hier hilft nur die menschliche Korrektur. Eine der unterhaltsamen Anekdoten der Veranstaltung.

Ein entscheidender Knackpunkt in der automatischen Texterstellung wird sicher noch länger die Qualität der Daten bzw. die Optimierung der Daten bleiben. Nicht einmal bezahlte Daten liefern verlässliche Informationen – wie unter Gelächter vermerkt wurde. Eine grosse Herausforderung wird also sein, nicht nur einfach viele Daten zu sammeln, sondern die korrekten Daten zu erfassen und sinnvolle Bezüge zwischen ihnen herzustellen. Die Optimierung der Datenbanken und der Ausbau der strukturierten Daten werden schon allein wegen der folgenden Bereiche immer wichtiger:

  • optimaler Daten-Feed für Google-Shopping oder Preissuchmaschinen
  • optimale Daten für die Generierung von organischen Suchergebnissen
  • optimale Daten für die automatische Texterstellung
  • optimale Daten für datengetriebenes Content-Marketing


Abgesehen davon wurde die Frage der Verantwortung bei der automatisierten Texterstellung verhandelt:

  • Muss gekennzeichnet werden, wenn ein Text maschinell erstellt wurde?
  • Welchen Unterschied macht das für den Leser?
  • Dürfen Algorithmen darüber entscheiden, welche Themen für eine Redaktion relevant sind?


Schlussendlich geht es um Verantwortung: Und das war das grosse Stichwort der Keynote von Michael Steinbrecher ganz zu Anfang der Unkonferenz. Dass der Fortschritt im Kontext „Big Data“ eine Tatsache ist, steht ohnehin ausser Frage. Entscheidend ist es, einen eigenen Standpunkt dazu zu vertreten.

Das war das wichtige Fazit in der Diskussion um ethische Grundlagen im Roboterjournalismus, in der rege über die Möglichkeiten und nötigen Einschränkungen in diesem Arbeitsbereich diskutiert wurde. Es wird immer darum gehen müssen, in der Debatte einen Standpunkt zu vertreten – was sicher auch das Ziel der clunc war. Und das ist ihr mehr als gelungen!


Und hier gehts zu weiteren spannenden Beiträgen:
shttps://www.takevalue.de/blog/clunc-2016-automatische-textgenerierung/