Automatisering

“In 2020 wordt 90% van de artikelen door robots geschreven”

Het journalistieke vakgebied gaat ingrijpend veranderen doordat robots hun intrede doen, voorspelt Emiel Krahmer, hoogleraar Language, Cognition and Computation aan de Universiteit Tilburg. In 2020 zijn nieuwsberichten gepersonaliseerd, minder objectief en voor 90% door robots geschreven. Een goede journalist die zijn stukjes niet als invuloefeningen schrijft heeft echter niks te vrezen. “Een journalist moet een goede journalist worden.”

Dat zelfs grote persbureaus al software gebruiken om automatisch nieuwsberichten te schrijven, zoals Associated Press, is geen verrassing voor Emiel Krahmer. De software is deels gebaseerd op twintig jaar oude kennis, die promovendus Mariet Theune en hij zelf ontwikkelden. Narrative Science, een van de bedrijven die zulke software maakt, verwijst in hun patent naar een wetenschappelijk artikel dat Theune, Krahmer en collega’s in 2001 publiceerden. Krahmer onderzoekt hoe mensen taal produceren en communiceren, en wil daarmee de communicatie tussen computers en mensen verbeteren. Twintig jaar geleden werkte hij al mee aan de ontwikkeling van automatische nieuwsberichten over voetbalwedstrijden op basis van teletekstinformatie.

Hoe kun je een computer nieuwsberichten laten schrijven?

“Het achterliggende principe is heel simpel. Je bouwt een systeem met regels en sjablonen dat zich op een specifiek domein richt, zoals sportwedstrijden, het weer of financiële cijfers. Voetbalverslagen laten zich bijvoorbeeld heel goed automatiseren want, met alle respect, het zijn toch vaak aaneenschakelingen van clichés. Een bepaald vocabulaire komt elke keer voorbij. Je verzamelt voorbeeldteksten van heel veel voetbalwedstrijden en kijkt naar alle varianten die er zijn van zinsnedes zoals ‘het doelpunt werd gescoord door…’ Dat zijn de sjablonen die je kunt hergebruiken. Je vervangt alle informatie die specifiek bij die wedstrijd hoort, bijvoorbeeld wie het doelpunt maakte en in welke minuut. En je stelt de regel in: gebruik telkens het sjabloon dat het langst niet gebruikt is. De bedrijven die dit nu commercieel verkopen zoals Narrative Science en Automated Insights zullen beweren dat hun technieken veel geavanceerder zijn, en dat zal in zekere zin vast zo zijn, maar in de kern is het gebaseerd op deze simpele formule.”

Waarom werkte het twintig jaar geleden niet, en wordt het nu wel succesvol commercieel toegepast?

“Mensen vonden het toen heel oninteressant, omdat de informatie al op teletekst beschikbaar was.  Wat er nu verandert is, is dat er veel meer data beschikbaar zijn, niet alleen van topwedstrijden maar ook van de klassen daaronder, waar geen enkele zichzelf respecterende journalist naartoe gaat. Plus dat er veel meer data zijn die sneller beschikbaar zijn. Het weer, aardbevingen, vogels, grote gaming-wedstrijden: je kunt het zo gek niet bedenken of er is realtime data beschikbaar. De kracht van de robotjournalistiek zit in de veelheid en de personalisatie van dat nieuws. Je kunt het nieuws op elk individu toespitsen, bijvoorbeeld gericht op supporters van een bepaalde voetbalclub. Bij een doelpunt voor de eigen club heb je het dan over een ‘fantastische actie’, als de tegenpartij scoort heet het bijvoorbeeld een ‘geluksgoal’. Deze personalisatie van het nieuws zul je steeds meer zien.”

Hoe kan de robotjournalistiek verder komen dan het simpele digitale knip- en plakwerk dat het nu eigenlijk is?

“Nu worden voor alle domeinen, zoals sport, financiën of het weer, sjablonen gemaakt. Alles ligt daarin al vast, afgezien van enkele variabelen. Het zou interessanter zijn als computers dichter bij menselijke communicatie kunnen komen. Ook wij hebben die standaardzinnen beschikbaar, maar wij kunnen ook creatief zijn en meer persoonlijkheid in de tekst kwijt. Hoe kun je ervoor zorgen dat een computer met een onverwachte metafoor komt? Kunnen computers grappig zijn en genres beheersen die altijd door mensen worden gedaan, zoals poëzie en verhalend schrijven? Er zijn al voorbeelden van Twitterbots met humor, zoals @DeepDrumpf. Deze is getraind op het taalgebruik van Donald Trump en heeft daaruit patronen geleerd. Vervolgens genereert hij willekeurige tweets die lijken op Donald Trump-teksten. Maar deze robot begrijpt niet wat hij zegt. Echte interactie, waarin hij ook begrijpt wat je zegt, dat kunnen we nog lang niet. De winnaar van de Loebner-prijs, die jaarlijks wordt uitgereikt aan het systeem dat het meest menselijk communiceert, is een chatbot die langzaam typt en typefouten maakt. Dat is gewoon een trucje. Vanuit onderzoeksperspectief is het nogal teleurstellend om menselijke intelligentie te simuleren door computers typefouten te laten maken.”

Hoogleraar Emiel Krahmer: "Ik geloof niet dat een computer een Pulitzerprijs kan winnen."
Hoogleraar Emiel Krahmer: “Ik geloof niet dat een computer een Pulitzerprijs kan winnen.”

Welke impact gaat robotjournalistiek op ons vak hebben?

“Ik denk dat in 2020 90% van de artikelen door robots is geschreven. Maar dat komt vooral omdat het aantal artikelen zal vertienvoudigen. Denk aan die gepersonaliseerde sportverslagen, maar bijvoorbeeld ook automatische samenvattingen van forumdiscussies. Robotjournalistiek maakt extreme tailoring van nieuws mogelijk, zodat iedereen een totaal andere versie van dezelfde krant kan lezen. Journalisten vinden dit moeilijk te verteren omdat ze vinden dat je objectief en onafhankelijk nieuws moet brengen, maar ik vrees dat ze dit pleit gaan verliezen. Natuurlijk heb je een taak om belangrijk nieuws onder de aandacht te brengen, maar waarom zou je stukken waarvan je weet dat iemand die graag leest niet hoger plaatsen?”

Hoe moet een journalist zich onderscheiden van een robotjournalist?

“Je moet een goede journalist worden. Want een slechte journalist kan een computer redelijk goed simuleren. Ik hoorde eens dat er journalisten zijn die op hun computer standaard frasen hebben staan die ze telkens hergebruiken. Dan biedt je weinig meerwaarde ten opzichte van een robot. Ik zou me als journalist niet bekwamen in het letterlijk overnemen van een persbericht met een andere kop erboven. Reflectie, het koppelen van verschillende gebeurtenissen aan elkaar, het duiden van gebeurtenissen en het gebruik van creativiteit, dat kunnen computers nog lang niet. Een chatbot kan echt geen menselijke interviewer vervangen. Ik geloof ook niet dat een computer een Pulitzerprijs De Pulitzerprijs is een prestigieuze Amerikaanse prijs voor journalistieke producties. De prijs is vernoemd naar krantenmagnaatJoseph Pulitzer (1847-1911). kan winnen, zoals de oprichter van Narrative Science beweerde. Een Pulitzerprijs win je omdat je echt iets heel origineels doet. Iets wat nog niemand gedaan heeft, omdat je een unieke insteek hebt gevonden.”

Maar computers die het internet voor jou afspeuren op zoek naar bijzondere informatie kunnen toch helpen met het vinden van een unieke invalshoek?

“Ja, ze kunnen bijvoorbeeld helpen om patronen te vinden in grote databestanden die voor mensen verborgen blijven. Bij de Panama Papers De Panama Papers zijn documenten uit de interne administratie van een juridisch advieskantoor in Panama: Mossack Fonseca. Deze documenten zijn gelekt naar journalisten. is ongetwijfeld ook gebruik gemaakt van zulke tools. Het is belangrijk dat een journalist de mogelijkheden en beperkingen van computers kent. Je zou dus wel kunnen zeggen: over vijf jaar is er geen journalist meer die de Pulitzerprijs kan winnen zonder gebruik te maken van de technische hulpmiddelen, dàt geloof ik wel.”


— of — Reageer

Reacties

One Response to ““In 2020 wordt 90% van de artikelen door robots geschreven””

  1. Bokke

    Het vreemde is dat er door hobbyisten elke week weer gratis en voor niets honderden prachtige verhalen worden geschreven voor locale voetbalkrantjes en club-websites. Deze worden misschien door 10-20 bekenden gelezen terwijl deze automatisch gegenereerde inhoud juist in oplages van 100.000-en worden gedrukt. Wat ik denk dat er gaat gebeuren is dat wij als lezers steeds beter in staat zullen zijn om onderscheid te maken tussen wat écht geschreven is en wat niet, en op termijn deze botgegenereerde tekst gaan lezen op de manier waarop wij wij nu statistieken zoals voetbaluitslagen lezen. Je ziet dan ook in de sommige landelijke pers een counter-trend is met veel meer columns waarin deze hobbyisten hun ei kwijt kunnen, waarschijnlijk tegen zeer geinge betaling.

    Beantwoorden

Leave a Reply