Vlaamse Radio- en Televisieomroeporganisatie

Automatisierung der Erstellung von VRT-Nachrichtenzusammenfassungen mit Hilfe von Natural Language Processing

Auswirkung

Das KI-gesteuerte Modell ist ein leistungsf√§higes Instrument zur Unterst√ľtzung von Journalisten bei ihrer Schreibarbeit, indem es die Erstellung von Zusammenfassungen beschleunigt und alternative Formulierungen vorschl√§gt. Auf diese Weise k√∂nnen menschliche Kreativit√§t und KI ihre sich erg√§nzenden St√§rken gegenseitig verst√§rken und qualitativ hochwertige Ergebnisse liefern.

Der Kunde

Die VRT ist die nationale √∂ffentlich-rechtliche Rundfunkanstalt f√ľr die Fl√§mische Gemeinschaft Belgiens. Mit ihren drei Fernsehkan√§len, f√ľnf Radiosendern und verschiedenen digitalen Kan√§len erreicht die VRT jede Woche bis zu 90 % der fl√§mischen Bev√∂lkerung. Der VRT NWS ist der Nachrichtendienst der VRT und hat das Ziel, die fl√§mische Bev√∂lkerung √ľber seine verschiedenen Kan√§le (wie die Website, die Anwendung und Live-Fernseh√ľbertragungen) √ľber die nationalen und internationalen Nachrichten zu informieren. Der VRT hat auch eine Innovationsabteilung, die in enger Zusammenarbeit mit den Endnutzern st√§ndig neue Technologien und Anwendungen f√ľr Medienzwecke erforscht.

Die Herausforderung

Nachrichtenartikel auf der Website des VRT NWS bestehen in der Regel aus einer kurzen Zusammenfassung, gefolgt von dem gesamten Artikel. Die Zusammenfassung ist eine komprimierte Version des Artikels und fasst die wichtigsten Punkte des Artikels zusammen. Da die Erstellung von Zusammenfassungen ein sich wiederholender und zeitaufw√§ndiger Prozess ist, untersuchte die Innovationsabteilung des VRT die M√∂glichkeit, diese T√§tigkeit mithilfe von Natural Language Processing zu automatisieren. Dabei kommen zwei Ans√§tze in Frage: die extraktive und die abstrakte Zusammenfassung. Die extraktive Zusammenfassung konzentriert sich auf die Identifizierung der wichtigsten Teile des Artikels und erzeugt eine Reihe von S√§tzen aus dem Originaltext, w√§hrend die abstraktive Methode einen neuen Text auf der Grundlage der Interpretation des Artikels erzeugt. Die VRT entschied sich f√ľr die abstrahierende Methode, die dem neuesten Stand der Technik entspricht und vielversprechendere Ergebnisse liefert. Auf diese Weise versuchte die Innovationsabteilung, trainierte Modelle zu entwickeln, um die automatische Erstellung von Nachrichtenzusammenfassungen zu erm√∂glichen. Obwohl sie ihre Modelle bereits feinabgestimmt hatten, waren sie mit der Qualit√§t der Ergebnisse nicht zufrieden. Daher bot ML6 eingehende technische Beratung zum Training und zum Einsatz der Modelle an, um die bestm√∂gliche Leistung zu erzielen.

"Die Zusammenarbeit mit ML6 ist eine Investition in unsere eigenen Mitarbeiter. Wir glauben, dass es wichtig ist, internes Wissen zu haben. Durch unsere Zusammenarbeit wurde ein sehr effizienter Wissenstransfer ermöglicht, um unsere Mitarbeiter auf ein höheres Niveau zu bringen. Wir kaufen Wissen, wir kaufen Flexibilität, wir investieren in die Zukunft unserer Mitarbeiter."

Combine Automation Lead Engineer

Unter

CNHi

Lösung

Um das Training der Modelle und die Qualit√§t der Endergebnisse zu verbessern, schlug ML6 eine sequenzielle Arbeitsweise vor: ausgehend von einem vortrainierten mehrsprachigen NLP-"BART-Modell" (siehe Papier) wurde eine erste Feinabstimmung an ins Niederl√§ndische √ľbersetzten englischen Nachrichtenzusammenfassungen vorgenommen, und schlie√ülich wurden VRT-Daten in das Modell integriert. Diese Art der Erg√§nzung der Kundendaten durch verarbeitete Open-Source-Daten f√ľhrt zu einer h√∂heren Qualit√§t der generierten Zusammenfassungen.

Unter

Resultate

Diese Art von Transformer-Modell ist ein leistungsf√§higes Instrument zur Unterst√ľtzung von Journalisten bei ihrer Schreibarbeit. Sie k√∂nnen die Erstellung von Zusammenfassungen beschleunigen und alternative Formulierungen vorschlagen. Gleichzeitig k√∂nnen sie die Einsichten und die Kreativit√§t der Journalisten nicht ersetzen, da es sich dabei um menschliche F√§higkeiten handelt, die in gr√∂√üerem Umfang erworben wurden als die (begrenzten) Trainingsdaten, die dem NLP-Modell vorgelegt werden. In diesem Sinne kann man sagen, dass Menschen und KI ihre komplement√§ren St√§rken gegenseitig verst√§rken und qualitativ hochwertige Ergebnisse liefern k√∂nnen. Als abschlie√üenden Test dieser Theorie und zur Bewertung der Ausgabequalit√§t dieses Tools testete ein Journalist des VRT einige der Nachrichtenzusammenfassungen auf der Grundlage bestehender VRT-Artikel, wodurch die VRT-Innovation neue Erkenntnisse und R√ľckmeldungen gewinnen konnte.