Het deep web

Wat is het deep web?

Wat is het deep web?


Heel simpel gezegd is het deepweb dat gedeelte van internet dat niet geïndexeerd wordt door zoekmachines, zoals Google of Bing. Het heet ook wel hidden web of invisible web. Schattingen lopen uiteen, maar het deep web is zeker duizenden keren groter dan het surface web (het gedeelte van internet dat de zoekmachines wél indexeren). Er is dus een schat aan informatie te vinden.

Hoewel Google al jarenlang niet meer weg te denken is uit ons dagelijks leven of van de redactievloer, is het onverstandig alleen op Google (of andere zoekmachines) te vertrouwen. Google vindt namelijk (lang) niet alles, want de zoekmachine indexeert niet alle webpagina’s.

Zo slaat Google webpagina’s over als je moet inloggen op een site, als de informatie die je zoekt op een dynamische pagina staat die alleen door een ‘database query’ Een ‘database query’ is een zoekvraag die gesteld wordt aan een database om daar relevante uit te selecteren. gevonden wordt, of als er geen links gaan naar de pagina die je zoekt.

Maar als Google het niet kan vinden, hoe moet jij dat dan kunnen?

Een van de grootste vindplaatsen van informatie zijn archieven. Dat kan een gedigitaliseerde bibliotheek uit de Achterhoek zijn, maar Flickr.com is ook een archief met een enorme hoeveelheid informatie.

De Nederlandse zoek- en archiefspecialist Eric Hennekam houdt een archief met archieven bij op archiefzoeker.nl. Daar kun je in ruim 5000 archieven zoeken naar dat ene archief dat misschien de informatie heeft die je nodig hebt: van Wayp (dat toegang geeft tot duizenden telefoonnummers wereldwijd) tot Farmsubsidy (database met veel informatie over Europese landbouwsubsidies).

Toch zoeken met Google?

Mocht je op archiefzoeker.nl niet de databank vinden die je nodig hebt, dan kun je het altijd via Google proberen. Het is belangrijk om goed scherp te krijgen wat je zoekt: niet dat ene document waarin alle informatie staat die je nodig hebt (want dat is niet geïndexeerd door Google, dus dat zul je niet vinden), maar de databank waarin dat document zich bevindt. Wat zal er op de webpagina van die databank staan?

Als je op zoekt bent naar de rechterlijke uitspraak in een bepaalde zaak, googel je niet ‘uitspraak zaak X’, maar ‘uitspraken zoek’. Je komt dan op het uitsprakenregister van de Nederlandse rechtspraak. ‘Zoek’ (of ‘search’ of ‘archief’) zijn hierbij belangrijke zoektermen, omdat ze je naar de voordeur van het archief brengen dat je nodig hebt.

Of zoek met sociale media!

Een gouden tip die een andere zoekspecialist in Nederland, Henk van Ess altijd geeft: vergeet sociale media niet. Dat zijn in feite enorme archieven met heel veel informatie over personen.

Als ik bijvoorbeeld op zoek zou zijn naar een Belgisch persoon die in Amsterdam in een Starbucks werkt, gebruik ik Facebook Graph.

Voor Twitter zijn er tal van tools om de miljarden berichten van miljoenen personen te doorzoeken (het grootste deel is openbaar en alles wordt bewaard). Kijk eens bij Journalism Tools voor een aantal daarvan.

Het ‘Dark Web’

Tenslotte is er ook nog het ‘Dark Web’. Dat zijn webpagina’s die je niet in het HTTP-protocol HTTP betekent Hypertext Transfer Protocol. Het HTTP-protocol is een techniek die ontwikkeld is voor het transporteren van HTML-bestanden. De techniek wordt gebruik om een pagina op het internet van de webserver bij de gebruiker te krijgen. vindt. Het bekendst is het onion-netwerk, een netwerk van pagina’s die je alleen met de Tor-browser vindt en waar de websites eindigen op .onion (in plaats van .com, .nl, etcetera).

Tor is een manier om volledig anoniem het web op te gaan, bijvoorbeeld als je in een land woont waar vrijheid van meningsuiting geen grondrecht is. Maar Tor staat vooral bekend als een plek op internet waar criminele dingen gebeuren. Silk Road was bijvoorbeeld een immense digitale marktplaats voor drugs, wapens en valse paspoorten, die alleen te bezoeken was met Tor (en waar je met Bitcoin Bitcoin is een digitale munteenheid die alleen op internet gebruikt wordt. Op Bitcoinspot vind je meer informatie. betaalde). In 2013 werd de site door de Amerikaanse FBI opgerold.

Naast het onion-netwerk wordt ook het onzichtbare internet, I2P, steeds populairder.


— of — Reageer

Reacties