Automatisering

Hoe objectief is de robotredacteur?

Hoe objectief is de robotredacteur?


Amerikaanse nieuwsmedia laten de verslaggeving van de presidentsverkiezingen gedeeltelijk over aan computers. Hoe zorg je dat die robots correcte en objectieve nieuwsberichten publiceren?

Door het kleine werkkamertje op de vijfde verdieping van The Washington Post laat Jeremy Gilbert behendig een telepresentie-robot rijden. Het apparaat, in feite een iPad op een lange stok met wieltjes eronder, werd afgelopen zomer ingezet bij de Democratische en Republikeinse conventies, waar Hillary Clinton en Donald Trump tot kandidaat werden gekozen.

De telepresentatie-robot van The Washington Post.
De telepresentatie-robot van The Washington Post.

Hij reed rond door het conventiegebouw en filmde wat hij zag via Periscope, de livestreaming video-app van Twitter. Een medewerker stuurde de robot op bezoekers af en stelde hen vragen. De gebruikers van de app konden via de chatfunctie ook vragen stellen aan de bezoekers, commentaar geven en liken. 76.000 mensen keken mee via de live-stream.

Voorbeeld van opnames die de robot maakte tijdens conventies:

Gilbert is verantwoordelijk voor strategische initiatieven bij de Amerikaanse krant, zoals de digitale koers en nieuwe vormen van ‘storytelling’. Hij laat een interactieve webdocumentaire zien over het gebruik van ‘the N-word’ bij American football en hij demonstreert de Amazon Echo, een kleine zwarte speaker op zijn bureau.

Hij raakt hem aan en begint er tegen te praten. ‘Alexa, vraag WaPo Elections naar de uitslag van de voorverkiezingen in Illinois.’ Alexa, de digitale assistent van Amazon, lepelt het antwoord duidelijk en foutloos op: Hillary Clinton won met 79 gedelegeerden, Donald Trump met 54 gedelegeerden. Ook tijdens de Olympische spelen van afgelopen zomer kon je haar vragen naar bijvoorbeeld het medailleklassement of de winnaar van de honderd meter sprint.

De robotredacteur

Alexa haalt haar informatie uit het computersysteem Heliograf, dat de Post zelf ontwikkeld heeft. Het schrijft automatisch verhalen op basis van data over bijvoorbeeld sportwedstrijden, misdaad of de verkiezingen. Heliograf werkt met sjablonen; dat zijn stukken tekst die de journalisten van tevoren zelf schrijven en die door het systeem worden verrijkt met de meest recente data. Ze worden zodanig geschreven dat ze inzetbaar zijn voor honderden verschillende berichten. Als die sjablonen eenmaal goed werken dan publiceert de computer automatisch nieuwsberichten op de website, zonder tussenkomst van een menselijke journalist.

Persbureau Associated Press (AP) publiceert al sinds 2014 honderden berichten over sport en business met behulp van zo’n robotredacteur. Voor de Post is robotverslaggeving nieuw, maar hun ambities reiken verder.

Momenteel werken ze aan een groot project over de presidentsverkiezingen dat een week voordat de stembussen openen live moet gaan. De redacteuren maken van tevoren sjablonen voor ruim vijfhonderd websiteartikelen. Over elk van de 435 kiesdistricten, elke senaatszetel en elke staat verschijnt een artikel met informatie over bijvoorbeeld de kandidaten per district, welke partij er in het verleden won en of de kandidaten voor de senaatszetel wel of geen nieuwkomers zijn. Die gegevens zijn allemaal uit databases te halen.

Gilbert: ‘In de aanloop naar de verkiezingen zullen die verhalen vrij statisch zijn, maar tijdens de verkiezingsnacht veranderen ze heel snel. Ze worden dan aangevuld met exitpolls en de uitslagen uit de stembureaus. Het wordt dus een levend verhaal dan steeds herschreven zal worden zodra de uitslagen binnenkomen.’

Data van de uitslagen, afkomstig van AP, wordt ingelezen in de software en kan zo automatisch in de berichten worden aangepast. Een mens zal er maar af en toe aan te pas komen. ‘Onze mensen zullen in sommige gevallen zinnen of paragrafen toevoegen aan de individuele berichten, maar ze zullen zich waarschijnlijk vooral toeleggen op de verhalen die over staten, de senaat en het Huis van Afgevaardigden als geheel gaan. Het wordt waarschijnlijk een hybride systeem waarin mens en computer samen stukken schrijven.’

Geautomatiseerd verkiezingsjaar

Mediabedrijven weten dat ze kunnen scoren rond verkiezingstijd met het trekken van websitebezoekers en krantverkopen, want de hele wereld smult van al het nieuws dat de campagnes opleveren. Met automatische berichtgeving kunnen ze sneller dan hun concurrent de laatste polls publiceren. Softwarebedrijf Automated Insights uit Durham, North Carolina is een van de twee grote Amerikaanse aanbieders van zulke robotschrijvers. Hun platform genaamd Wordsmith werkt net als Heliograf op basis van tekstsjablonen die mensen in eerste instantie zelf schrijven.

‘Ik denk dat 2016 een zeer geautomatiseerd verkiezingsjaar wordt’, zegt Adam Long, directeur productmanagement bij het bedrijf. Het bedrijf heeft veel aanvragen gekregen van mediabedrijven, maar, afgezien van AP en Yahoo, houden zij het gebruik van Wordsmith geheim. ‘Ze gebruiken de snelheid van Wordsmith als een concurrentievoordeel.’

Ook allerlei politieke belangengroepen gebruiken de software, bijvoorbeeld om de laatste polls te volgen. Volgens Long gebruiken de belangengroepen deze informatie vooral voor intern gebruik en niet om campagne mee te voeren. ‘Ze willen juist dat het objectieve informatie is. Ze sturen bijvoorbeeld wekelijkse samenvattingen naar hun kandidaten en gebruiken de informatie om te bekijken hoe hun kandidaat het doet en waar ze hun campagnegeld moeten inzetten.’

Objectiviteit van computers

De vraag hoe objectief informatie uit zo’n computerprogramma is, hangt echter volledig af van de objectiviteit van degene die de sjablonen maakt. Andreas Graefe, onderzoeker aan de Columbia University in New York, doet onderzoek naar robotjournalistiek en ontwikkelde zelf een ‘supervoorspeller’ genaamd Pollyvote, die verschillende verkiezingsvoorspellingen combineert, zoals polls, expertinterviews en economische modellen. Naar eigen zeggen levert die combinatie de meest accurate voorspeller op. Daaraan heeft hij een automatische berichtenschrijver gekoppeld (Pollybot) die direct een nieuwsbericht publiceert als er een nieuwe poll beschikbaar is.

Graefe, van huis uit econoom, liep tegen ethische dilemma’s aan bij het programmeren van Pollybot. ‘Wanneer schrijf je dat een achterstand of een voorsprong ‘groot’, ‘aanzienlijk’ of ‘klein’ is? Als nu uit een poll blijkt dat Clinton met vier punten aan kop gaat, dan schrijft een journalist waarschijnlijk: Clinton heeft een ‘comfortabele’ voorsprong. Maar als Trump met evenveel punten aan kop gaat schrijft hij misschien: Trump heeft een ‘enorme’ voorsprong. Die context is erg belangrijk, maar ontbreekt vaak in automatische berichtgeving. Hierdoor bereikt automatisering zijn grenzen.’

In zijn thuisland Duitsland liggen voorspellingen veel gevoeliger, aldus Graefe. De grote kranten branden er hun vingers niet aan omdat ze niet de indruk willen wekken dat ze partijdig zijn. Maar volgens Long van Automated Insights zijn de ethische dilemma’s bij computer gegenereerde artikelen niet anders dan wanneer mensen ze schrijven. ‘Doordat je in Wordsmith de regels vastlegt word je je er bewust van dát er bepaalde regels zijn. Maar dat zijn dezelfde regels die redacties nu ook al hanteren bij de verslaglegging van de verkiezingen. Onze software maakt alleen dat je daar al van tevoren expliciet over moet nadenken.’

Wanneer breng je uitslagen?

Als de interpretatie van de poll-uitslagen dus zo sterk wordt beïnvloed door degene die de sjablonen maakt, dan kan diegene de software ook zodanig programmeren dat een van beide kandidaten er beter uit komt. Wordsmith wordt namelijk ook gebruikt door e-commercebedrijven en makelaars die met een aantrekkelijke tekst hun schoenen of huizen willen aanprijzen. Technisch gezien is het dan maar een kleine stap naar het aanprijzen van een presidentskandidaat.

The Washington Post, dat eigenlijk altijd een Democratische kandidaat steunt, maakte na enige aarzeling half oktober eindelijk haar ‘endorsement’ voor Clinton bekend. Jeremy Gilbert van de Post benadrukt dat die keuze van de hoofdredactie los staat van de nieuwsredactie, waar objectiviteit voorop staat.

Hij worstelt bijvoorbeeld met de timing: wanneer breng je uitslagen tijdens de verkiezingsnacht naar buiten? Direct? Of programmeer je de software zodanig dat hij wacht totdat er een bepaalde drempelwaarde zoals een minimum aantal kiezers is bereikt? Rurale kiesdistricten stemmen vaak anders dan stedelijke districten, maar omdat de plattelandsdistricten kleiner zijn, zijn ze eerder klaar met tellen en is de uitslag daarvan eerder bekend. Zo kan Trump tijdens verkiezingsnacht lang aan kop gaan.

‘In sommige staten of districten moeten we dan misschien wachten met publiceren tot een bepaald aantal stemmen bekend is. We zetten onze politieke experts nu al in om hierover na te denken en misschien speciale versies te maken van artikelen over de staten waar dit fenomeen speelt. We willen niet alleen maar de informatie delen, maar er ook een interpretatie bij geven.’

Bij Automated Insights zijn ze niet op de hoogte van manipulatief gebruik van hun programma. Long: ‘Tendentieuze journalistiek blijft een menselijke keuze. Net zoals Microsoft Word ook niet voorkomt dat mensen de waarheid willen verdraaien, kan onze software dat ook niet.’

Dit artikel is op 3 november 2016 gepubliceerd in nrc.next en NRC Handelsblad en op nrc.nl.

 


— of — Reageer

Reacties

Leave a Reply