Sociale media

Op zoek naar wat analyse van sociale media de journalistiek kan opleveren

Sociale media zijn een enorm rijke bron van data voor advertentiebedrijven, inlichtingendiensten en overheden. Maar ook voor journalisten. Gerard Janssen ging op zoek naar de mogelijkheden. En de haken en ogen die zitten aan het gebruik van analysetools.

Volgens het digitale marketingbureau Smart Insights verschijnen er iedere 60 seconden 3,3 miljoen posts op Facebook, 448.800 tweets, 500 uur aan films op YouTube en 3,8 miljoen zoekopdrachten op Google. Welke mogelijkheden bieden deze nieuwe informatiebronnen? Wat doen inlichtingendiensten en bedrijven als Smart Insights met deze stroom van informatie, en wat zouden journalisten daarvan kunnen leren of moeten weten?

Het afgelopen jaar sprak ik sociale wetenschappers, mensen van inlichtingendiensten en psychologen over de nieuwe mogelijkheden die deze nieuwe open bronnen brengen, om nieuws te vinden, maar ook om nieuws te manipuleren. In dit artikel geef ik een overzicht van mijn zoektocht en verwijs ik naar de artikelen die ik hierover schreef voor Nieuwe Journalistiek, Vrij Nederland en de VPRO Gids.

Een levende kaart

De kiem van deze zoektocht werd gelegd op 27 september 2013. Op die dag was ik in de Jaarbeurs in Utrecht, op het Open Data NEXT congres. In een futuristische witte conferentieruimte prezen verschillende databedrijven hun producten aan.

Een van de grootste aandachttrekkers was de ‘touch table applicatie Phoenix’ van het bedrijf Geodan. Op een liggend beeldscherm – zo groot als een kleine eettafel – was een interactieve kaart van Nederland zichtbaar. Schepen zag je als kleine bewegende blokjes door de rivieren varen. De bewegende kruisjes waren de vliegtuigjes die van en naar Schiphol bewogen. Het was een soort digitaal Madurodam. Een levende kaart in de Bosatlas.

De ‘touch table applicatie Phoenix’ van Geodan.

Arjen Koekoek, een datawetenschapper van het bedrijf Geodan legde me uit hoe je verschillende open databronnen op de kaart zichtbaar kon maken, zoals huizenprijzen, en kiezersgedrag per stadswijk. Koekoek vertelde dat hij ook zichtbaar kon maken wat mensen twitterden op bepaalde locaties.

Verspreiding van tweets

De open-databeurs was ongeveer een jaar na Project X in Haren. TNO had niet lang ervoor een digitale reconstructie gepubliceerd, met filmpjes van hoe tweets zich verspreidden.

Retweet ripples lieten zien hoe sommige tweets viraal gingen en hoe sommige geruchten een eigen leven gingen leiden. Valse geruchten over een dood meisje en een groep Hells Angelsstron vermenigvuldigden zich als bacteriën op een petriglas. De filmpjes maakten zichtbaar hoe snel echte en valse informatie zich via Twitter door Nederland verspreidt.

De tafel van Geodan leek me geweldig gereedschap om een gebeurtenis als Project X te kunnen volgen. Of om gebeurtenissen op het spoor te komen die anderen nog niet zagen. Het was mogelijk om zichtbaar te maken hoe er in verschillende stadswijken verschillend getwitterd werd om zo de polarisatie in een stad op de voet te volgen.

Ik kon me goed voorstellen dat inlichtingendiensten geïnteresseerd waren in deze technologie. Maar was het ook niet iets voor de journalistiek? Dit was wel wat geraffineerder dan de teletekstschermpjes die er in de newsrooms van de Nederlandse kranten hingen.

Dit was – zo dacht ik – de toekomst van de journalistiek.

Hackaton met data

Een paar maanden na de kennismaking met de beeldschermtafel, bezocht ik een hackaton van de Dataschool in Utrecht, een onderzoeksproject waarin studenten data leren analyseren en visualiseren door opdrachten te doen voor organisaties.

De Amerikaanse president Obama bezocht Nederland in het kader van de Nuclear Security Summit. En de deelnemers van de hackaton volgden wat mensen hierover op sociale media plaatsten. Naast studenten, waren er op de hackaton mensen die werkten voor data-analyse-start-ups en een dozijn mensen van de politie.

Een team probeerde op basis van tweets de route van The Beast – de gepantserde auto van Obama – in kaart te krijgen. Ze kwamen er snel achter dat er twee identieke Beasts rondreden. Een agent van een politie-inlichtingendienst vertelde me dat er een ruimte was waar de inlichtingendiensten op een vergelijkbare manier de gebeurtenissen in Den Haag volgden, een Real Time Intelligence Centre.

Soorten analyse van socialemediadata

Er zijn grofweg twee manieren waarop data van sociale media real time geanalyseerd worden.

1. Stemmingsanalyse

Allereerst is er mood analysis. Woorden als ‘yes’ (+2)’ en ‘goed’ (+2) zijn positief en woorden als ‘slecht’ (-2) of ‘depressed’ (-2) zijn negatief. Door de ’waardes’ van woorden bij elkaar op te tellen kun je een tweet een sentiment geven, positief, negatief of neutraal. Het is een methode om te kijken hoe over een onderwerp gedacht wordt.

Quants, de wiskundigen van de financiële wereld, Quants zijn de personen die gespecialiseerd zijn in wiskundige of statistische analyse voor financiële vraagstukken.  passen deze technieken toe om ‘het sentiment’ rond sommige bedrijven of de stemming in de wereld te monitoren. Om zo beurskoersen te kunnen voorspellen. Dit soort werk vindt in het geheim plaats.

Maar dergelijke technieken worden ook toegepast rond vaccinatieprogramma’s. Ik sprak daarover met de wetenschapper Marcel Salathé. Lees het interview met Marcel Salathé in Vrij Nederland: Hoe computerdata de epidemiologie beïnvloeden. Ook voor journalisten zou dit een manier kunnen zijn om een indicatie te geven hoe de publieke opinie over een veelbesproken onderwerp is én hoe die real time verandert. Ook kan het een indicatie geven van de polarisatie in een land of stad, als over bepaalde onderwerpen verschillend gesproken wordt.

2. Netwerkanalyse

Een tweede manier van analyseren is het maken van netwerkdiagrammen. Eén van mijn belangrijkst inzichten bij de hackaton was hoe makkelijk je – door een bericht te retweeten – in een netwerkdiagram terecht komt, hoe makkelijk je een kleurtje krijgt dat bij jouw netwerk hoort – hoe makkelijk je kortom geprofileerd wordt. En hoe daar tijdens bijzondere gelegenheden – zoals in dit geval het bezoek van president Obama – gebruik van gemaakt wordt. Lees het artikel uit Vrij Nederland: Plaats delict social media.

Als overheidsdiensten ons labelen op basis van onze netwerken, zouden journalisten dan andersom ook niet politici en overheidsmedewerkers kunnen profileren op basis van hun netwerken?

Ik belde de Amerikaanse netwerkonderzoeker Valdis Krebs die me uitlegde hoe netwerkanayse ook voor journalisten een zinnige eerste stap zijn voor een diepgravend onderzoeksjournalistiek verhaal kan zijn. Lees op Nieuwe Journalistiek het artikel De analyse van netwerken als journalistieke onderzoeksmethode. Krebs maakte een netwerkdiagram rondom Paul Manafort om zo de contacten met de Oekraïne en Rusland bloot te leggen. De Amerikaan Paul Manafort was lobbyist voor controversiële buitenlandse leiders, zoals de Oekraïense president Viktor Janoekovytsj, Ferdinand Marcos (dictator van de Filipijnen),  Mobutu Sese Seko (dictator van Congo), en de Angolese guerrillaleider Jonas Savimbi. In 2016 was hij tijdelijk campagneleider van presidentskandidaat Donald Trump.

Valdis Krebs maakte dit netwerkdiagram rond Paul Manafort, campagneleider van Donald Trump

IS-netwerken op sociale media

Een andere netwerkonderzoeker die ik sprak was Jonathon Morgan. Hij bracht met Twitter de netwerken van IS in kaart. Lees het interview met Jonathon Morgan uit de VPRO Gids: IS online.

Morgan en zijn collega’s probeerden te begrijpen hoe IS-leden jongens via sociale media wisten te inspireren tot ’lone wolf’-aanvallen. Dit ’pad naar radicalisering’ is inmiddels goed begrepen. Het bevat berichten gericht aan kwetsbare mensen, met verhalen die ’warmte’ koppelen aan ’kracht’. Rekruteerders tonen empathie voor de mensen die vervreemd zijn geraakt of buitengesloten van de maatschappij. Tegelijkertijd beloven ze macht. Nieuwe leden mogen ’erbij horen’ als ze rechtvaardig geweld gebruiken tegen hun onderdrukkers.

Wat Morgan minstens evenveel zorgen baarde was de reactie op de IS-berichten en de omvang van extreem-rechtse twitteraars die op de IS-berichten reageerden. Een enorme online alt-right-beweging, die ook – zo waarschuwen de onderzoekers – dezelfde trucs toepast als IS.

Netwerkanalyse als onderzoeksjournalistiek

Het werk van Morgan en Berger verschilt in mijn ogen nauwelijks van goede onderzoeksjournalistiek. Een slimme journalist met toegang tot de Twitter Firehose (zie kader onderaan dit artikel) had dezelfde dingen kunnen vinden.

Het rapport ’Nazi vs. Isis on Twitter’ Hier vind je de pdf-versie van  het rapport ‘Nazi vs. Isis on Twitter’. uit september 2016 toont de gereedschappen die een datajournalist kan gebruiken. Netwerkdiagrammen die interacties zoals retweets in kaart brengen, en zo een groep zichtbaar maken, analyse van zoekopdrachten zoals ’white genocide’, het in kaart brengen van in bepaalde groepen veel voorkomende hashtags, en het onderzoeken welke filmpjes er gedeeld worden in deze groepen. Dit soort analyses lijkt in deze periode van fake news belangrijker dan ooit.

Manipulatie van sociale media

Wat de laatste jaren steeds duidelijk wordt, is dat social media relatief makkelijk gemanipuleerd kunnen worden. Als je weet dat financiële bedrijven het sentiment rond Coca Cola in de gaten houden, dan kan een slimmerik vrij eenvoudig een grote hoeveelheid nep-accounts de wereld in helpen waarop negatieve dingen worden geroepen over Coca Cola.

Via nepaccounts worden berichten en meningen op sociale media verspreid. Om mensen zwart te maken, om verdeeldheid te zaaien en zelfs om zoekopdrachten van Google te beïnvloeden. Alle ogen zijn nu gericht op ‘de Russen’, maar uit de zogenaamde JTRIG-documenten JTRIG staat voor Joint Threat Research Intelligence Group, een geheime afdeling van de Britse geheime dienst, waarvan het bestaan werd onthuld door de documenten die Edward Snowden lekte. afkomstig van Snowden, blijkt dat de Britse geheime dienst al jaren social media posts en online polls manipuleert, daarbij gebruik makend van de psychologische inzichten van de psycholoog Robert Cialdini. Ik zocht deze goeroe van de influencers op in zijn woonplaats Tempe in Arizona. Lees het interview met Robert Cialdini uit Vrij Nederland: ‘We zien onszelf graag als vrij en onafhankelijk.’

Een journalistieke organisatie als moderne inlichtingendienst

Ik kwam ook op het spoor van Vocativ, een journalistieke organisatie die claimde te werken op de manier die ik voor ogen had.

Screenshot van de website van Vocativ.

Het bedrijf is opgericht door Mati Kochavi die een verleden heeft in de wereld van de Israëlische inlichtingendiensten, en nu CEO is van AGT, een bedrijf dat werkt voor overheden. Vocativ is een journalistiek bedrijf dat werkt als een inlichtingendienst die sociale netwerken en het deep web Lees op Nieuwe Journalistiek de explainer: Wat is het deep web? monitort, om zo verhalen te vinden die andere nieuwsdiensten missen. Verhalen over Instagram-posts van elitaire feestjes in Syrië of het gebruik van Trump-maskers bij het beroven van ATM-machines.

Op bezoek bij Vocativ

Ik vond het een inspirerende manier van werken en zocht contact met Vocativ, eerst direct via de website en daarna via Twitter: via mensen die voor Vocativ werkten of gewerkt hadden. Maar niemand reageerde. Uiteindelijk heb ik het bedrijf zelf opgezocht in Manhattan, op de vijfde verdieping van 462 Fashion Avenue.

Bij toeval lukte het me er binnen te komen. Ik had het geluk dat er iemand net naar buiten kwam door een achterdeurtje. Ik kwam in een liftruimte met een bord aan de muur, waarop de namen van de verschillende bedrijven die in het pand aanwezig waren. De naam Vocativ stond niet op het bord, maar erboven stond met de hand geschreven: ‘Vocative 5’.

Ik nam de lift naar de vijfde verdieping. Er stonden meubels en wat rommel op de gang. Er was een onopvallende deur met een bel ernaast. Ik belde aan. Een Afro-Amerikaanse vrouw van een jaar of dertig – type ex-fotomodel – deed verbaasd de deur open. Ik zei haar dat ik iemand zocht die me wat kon vertellen over Vocativ.

Ze liet me binnen en haalde een blonde vrouw van een jaar of zestig erbij. Ik stelde me voor, maar ze wilde geen vragen beantwoorden. Ze gaf me een post-it met haar mailadres en begeleidde me via een andere lift weer naar buiten. Daar ging ik door de hoofdingang, langs de portiers weer naar buiten.

Aan het mailadres kon ik zien dat de mevrouw Erika Newman heette. Ik googelde haar. De combinatie ’Erika Newman’ en ‘Vocativ’ leverde niets op. Bij Linkedin was te zien dat ze Executive Assistant was geweest van CEO’s van LexisNexis en AGT.

Screenshot van de profielpagina op LinkedIn van Erika Newman.

Nu ik dit schrijf werkt ze als EA bij JetPay, een creditcardbedrijf. De EA is een supersecretaresse die de leiding heeft bij het behandelen van belangrijke klanten en gevoelige informatie.

Het tweede gedeelte van haar e-mailadres was starmanagement.net. Starmanagement is een bedrijf dat managements- en administratieve diensten levert aan bedrijven in de veiligheidsindustrie. Op mijn mailtjes heeft ze nooit meer gereageerd.

Journalisten die samenwerken met Palantir

Een minder schimmige organisatie die gebruik maakt van de nieuwste data-analyse methoden is het International Consortium of Investigative Journalists (CIJ). Het International Consortium of Investigative Journalists is een mondiaal netwerk van journalisten en redacties die gezamenlijk werken aan onderzoeksjournalistieke publicaties.

Zij gebruikten in 2012 de software van het bedrijf Palantir in hun onderzoek naar de internationale handel in menselijke weefsels. Het gebruik van de software van Palantir betekent nauwe samenwerking met Palantir. Je kunt dit soort software niet gewoon downloaden, Het wordt op maat gemaakt en onderhouden door medewerkers van Palantir zelf. Palantir Technologies is een Amerikaans technologiebedrijf dat gespecialiseerd is in analyse van big data. Het bedrijf werkt voor Amerikaanse inlichtingendiensten. Lees meer op Wikipedia.

Logo van het bedrijf Palantir.

De vraag is of het wenselijk is dat journalistieke organisaties zo nauw samenwerken met bedrijven die nauwe banden hebben met veiligheidsdiensten. Palantir is opgericht met geld van de CIA. Ik sprak daarover met een anonieme bron in de Nederlandse inlichtingenwereld. Lees op Nieuwe Journalistiek het artikel Big-data-bedrijven als Palantir bieden ongekende mogelijkheden aan journalisten, met grote gevaren.

Inmiddels werkt de CIJ met softwarebedrijf Nuix, die de software gratis beschikbaar stelde. CIJ gebruikte software van Nuix onder meer voor het onderzoek van Offshore Leaks en The Panama Papers. Gerard Ryle, de directeur van CIJ, legt uit dat Nuix niet wist waar de journalisten van CIJ mee bezig waren. Bekijk het interview met Gerard Ryle op YouTube. Dat moeten we dan maar aannemen.

De samenwerking met dit soort bedrijven is misschien niet per se verkeerd. Aan de andere kant ontwapent het niet de Russische claims dat de Panama Papers en de Paradise Papers uit de koker van westerse inlichtingendiensten komen.

Gebruik van databronnen op redacties

Hoe dan ook is duidelijk dat journalisten bij het monitoren en analyseren van databronnen en sociale media een fikse achterstand  hebben op de inlichtingendiensten en grote bedrijven. In de journalistiek werken (nog) nauwelijks wiskundigen.

Het AD lijkt op dit moment het meest visionair, met het aantrekken van Jaap van Zessen van Buzzcapture Buzzcapture is een bedrijf dat gespecialiseerd is in het monitoren van sociale media, met het oog op reputatiemanagement en webcare. Op 18 februari 2018 is Buzzcapture gefuseerd met OBI4wan en OBILytics. De bedrijfsnaam is nu OBI4wan. en Thomas Boeschoten van de Utrechtse Dataschool. Op AD.nl vind je een overzicht van artikelen die tot stand zijn gekomen met behulp van Buzzcapture.

Zowel de Volkskant als NRC maken nu gebruik van analysesoftware als Chartbeat, Moat, Smartocto en .io analytics. Maar deze software is vooral bedoeld om te kijken naar welke artikelen het best de aandacht weten te trekken, hoeveel ze gelezen worden en hoe lang mensen erover doen. En om te kijken welke journalisten het beste scoren. Zou het niet beter zijn om minder in de spiegel te kijken en de blik meer naar buiten te richten?

Hoewel mijn aandacht sinds 2013 verschoven is van de technische kant van het afgrazen van sociale media, naar de manieren waarop sociale media gebruikt worden om mensen te manipuleren, denk ik nog steeds dat het constructief bekijken van uitingen op sociale media een prachtige manier is om nieuwe trends en verschijnselen op het spoor te komen, om banden tussen mensen in kaart te brengen en niet te vergeten: creatieve uitingen van humor, verstrooiing en vertedering te vinden. En dus ook om in de gaten te houden op welke manieren Twitter, Facebook en Instagram gebruikt worden door trollen, politici en andere ‘influencers’ die proberen om het gedrag van grote groepen mensen en vooral ook journalisten te sturen.


Dure data

Het is voor een onafhankelijke freelancer vaak lastig om toegang te krijgen tot alle data zonder samen te werken met een bedrijf. Toegang tot de Twitter Firehose, alle tweets die verschijnen en verschenen zijn – is duur. Gewone gebruikers hebben toegang tot een kleine steekproef van alle tweets.

Het bedrijf Sifter heeft via Gnip – de toegangspoort van Twitter tot de ruwe twitterdata – toegang tot de complete undeleted historische database van Twitter, maar vraagt hoge prijzen. Een abonnement op Sifter kost 99 dollar per maand, daarbij komen nog veel extra kosten voor de data die je daadwerkelijk gebruikt.

Toegang tot Facebooks ‘like-data’ krijg je alleen via applicaties die mensen toestemming vragen naar persoonlijke data.

Het bedrijf Cambridge Analytica komt zo aan haar data. Cambridge Analytica is een bedrijf dat mensen profileert op basis van sociale media, om ‘strategische communciatie’ van politieke partijen te kunnen helpen. Een journalist die op dezelfde manier zou werken, zou ethische grenzen overschrijden.

De toegang tot interessante data van sociale media en de software om die data te analyseren, is voor bedrijven en inlichtingendiensten kortom groter dan voor journalisten.


— of — Reageer

Reacties

Comments are closed.