Automatisering

Kwootjes jagen? Laat dat maar over aan de chatbot

Hanna Zoon doet bij het Fontys Future Media Lab onderzoek naar robotjournalistiek. Daar maken ze onder andere een interview-chatbot en een persberichtenfilter. Handig om informatie te ordenen en op ‘kwootjes’ te jagen. Maar een bedreiging voor ons vakgebied? Dat niet. Maar misschien wel voor ons taalgebied.

Charlotte is anders dan de meeste chatbots. Ze is niet reactief, zij stelt zelf alle vragen. Charlotte is een interview-bot.

“Wat is er zo bijzonder aan dit product?” vraagt ze.
“Geen idee”, antwoord ik.
“Kun je daar een voorbeeld van geven?”
Eindeloos blijft ze vragen of ik een voorbeeld kan geven. Ik geef aan dat ik wil stoppen.
“Wil je stoppen?” vraagt ze.
Ik antwoord ja.
Maar Charlotte weet van geen ophouden. “Waarom?”

Als je iets antwoordt dat niet in haar straatje past, dan loopt het gesprek al snel in de soep. Charlotte is dan ook nog niet bepaald klaar voor de markt. Ze is slechts een prototype voor onderzoeksdoeleinden en maakt deel uit van het project Automatische Nieuwsredactie van het Fontys Future Media Lab. Hanna Zoon onderzoekt daar de invloed van technologie op het vertellen van verhalen. Zij kijkt welke aspecten van het journalistieke proces je kunt automatiseren.

Wat heeft een journalist aan die tools?

“Een deel van het journalistieke werk is niet zo leuk en kost heel veel tijd. Bijvoorbeeld het doorploegen van persberichten. Journalisten krijgen per dag heel veel persberichten in hun inbox. Het filteren van de relevante berichten kost heel veel tijd en levert vaak niks op. We hebben een tool gemaakt waarmee een journalist in één oogopslag kan zien of een persbericht relevant is. Hij hoeft daarvoor zelf niet op zoek naar extra informatie. Je stuurt het persbericht naar de tool, dan krijg je een dashboard te zien met een samenvatting van het persbericht en andere relevante bronnen. Ook onze chatbot Charlotte kan journalisten tijd besparen. Het kan soms moeilijk zijn om iemand te spreken te krijgen, en dat kan veel tijd kosten. Je kunt ook wel een e-mail sturen, maar dan kun je niet doorvragen bij interessante informatie. Je kunt Charlotte er dan op afsturen. De geïnterviewde vult de vragen in wanneer het hem uitkomt. Met het transcript kan de journalist vervolgens aan de slag. En dat transcript kun je ook nog automatisch laten samenvatten.”

Hanna Zoon met op haar scherm de tool die voor journalisten samenvattingen maakt van persberichten.
Hanna Zoon met op haar scherm de tool die voor journalisten samenvattingen maakt van persberichten. Foto: Amanda Verdonk.

Dat gedoe met afspraken maken kan ik inderdaad missen als kiespijn. Maar interviewen is toch juist het leuke deel van het werk?

“We hebben dit voorgelegd aan journalisten. Voor de grote, belangrijke interviews zouden ze dit niet gebruiken. Maar om even een quote te hunten, een bevestiging te krijgen of om even te kijken of een persoon interessant is, bleek het goed te werken. Nu kunnen ze toch meer kwaliteit leveren waar ze anders niemand zouden spreken of alleen per e-mail contact zouden hebben. Het is dus vooral interessant voor nieuwsjagers die snelheid belangrijk vinden, maar het zou ook interessant kunnen zijn voor onderzoeksjournalisten, die in plaats van een enquête onder duizenden mensen een chatbot kunnen inzetten. De chatbot kan doorvragen en daardoor nog meer nuttige informatie boven tafel krijgen. We waren blij verrast met de toepassingen die journalisten zagen voor deze tools.”

Hoe heb je Charlotte gemaakt?

“Charlotte is een zogeheten AIML-gebaseerde bot, dat is een programmeertaal die lijkt op HTML. Ik gebruik een template van Pandorabots. Het is regelgeboden: als jij ‘A’ zegt, dan zegt zij ‘B’ terug. Ze heeft ongeveer driehonderd van zulke programmeerregels. Het platform heeft helaas beperkingen zoals je zelf ook gemerkt hebt. Ik zou graag willen inprogrammeren dat hij maar vijf keer doorvraagt, maar dat kan niet. De grenzen van dit prototype zijn nu wel bereikt. Ik zou het interessant vinden om te weten wat er nog meer mee kan, maar dan moet ik hem in een andere programmeertaal bouwen en daar heb ik helaas de tijd niet voor.”

Regelgebonden programmeren, dat klinkt nogal ouderwets.

“Je hebt twee stromingen in de kunstmatige intelligentie: regelgebonden en machine learning. Regelgebonden betekent dat je goed gedefinieerde commando’s geeft: als… dan… Daarmee loop je snel tegen grenzen aan, omdat je nu eenmaal niet alles kunt voorspellen en alles in regels kunt vangen. Dan wordt het al snel heel complex. Bij machine learning of neurale netwerken schrijft de computer zijn eigen regels. De laatste jaren is dat heel populair. Maar daar zijn ook heel veel problemen mee. Zulke software heeft heel veel data nodig voordat het betrouwbare resultaten geeft. Er zijn al veel voorbeelden waarbij dat mis ging, zoals de chatbot Tay van Microsoft, die geprogrammeerd was om te leren door met mensen te converseren, maar die ontaardde in een racistisch en asociaal monster. Zulke chatbots moet je van tevoren trainen. Zo’n Nederlandstalige chatbot werkte voor geen meter, want kunstmatige intelligentie loopt enorm achter in ons taalgebied. Google Translate werkt bijvoorbeeld veel beter van  Engels naar Frans dan van Frans naar Nederlands. Ik maak me wel zorgen dat onze taal daardoor irrelevant wordt.”

De tools die jullie maken klinken nog relatief onschuldig. Maar er zijn ook al bedrijven die complete nieuwsverhalen automatisch laten schrijven door software, zoals Narrative Science en Automated Insights. Hebben we daarvan te vrezen?

“Ik denk eigenlijk dat de kunstmatige intelligentie van die bedrijven helemaal niet zo intelligent is als ze doen overkomen. Ze schetsen een beeld alsof hyperintelligente computersystemen volledig zelfstandig complexe taken uitvoeren, maar ik denk dat er best veel menselijk werk bij komt kijken. Ze geven weinig informatie over de werking van hun product. Documentairemaker Morgan Spurlock ging bijvoorbeeld bij Narrative Science langs om een biografie te laten maken door hun software. Je ziet uiteindelijk een mens de kamer in lopen met de biografie, maar je weet niet wat er achter de schermen gebeurd is. Zulke programma’s schrijven vooral financiële en sportberichten, omdat dat heel voorspelbaar nieuws is. Je maakt een paar templates waarin je variabelen kan invullen: ‘Bedrijf X heeft een beurskoers van Y gehaald. Dat is verrassend want vorige week stond het op Z.’ Dat is informatie die aan duidelijke regels gebonden is. Je hebt als journalist alleen wat te vrezen als je nu alleen maar hele gelijkwaardige stukken tikt. Stukken waar veel herhaling in zit en die zich aan regels en procedures houden, kun je automatiseren. Voor onderzoeksjournalisten blijft er juist veel meer tijd over voor diepgaande verhalen. Zij krijgen steeds meer tools om beter onderzoek te kunnen doen.”


— of — Reageer

Reacties

Leave a Reply