You are here

Hoe ontwikkelt het internet zich?

Zo'n 40 jaar geleden begon het met een paar eenvoudige aan elkaar gekoppelde computers, inmiddels is het uitgegroeid tot een enorm netwerk van machines met elke dag miljarden gebruikers. Het internet ontwikkelt zich in een razend tempo. Hoe zal het er in de toekomst uit zien? Reginald Cushing over de evolutie van de grootste machine ter wereld: het internet.
Tekst: Edda Heinsman

Oeroude data, handen in de grot 'Cueva de las Manos' in Argentinie.

Cushing ziet het internet als één grote levende machine. Een soort enorme computer, bestaande uit allemaal aan elkaar gekoppelde data-machines. De data die je er op vindt, komt overal vandaan, van sociale media, van wetenschappers, van bedrijven. 'Mensen hebben altijd al iets van hun bestaan vast willen leggen', aldus Cushing. Op de voorkant van zijn proefschrift staat een foto van de handen uit de Cueva de las Manos. 'Een voorbeeld van de oudste vorm van data, mensen die letterlijk een afdruk achterlaten. En die hoeveelheid data die we produceren, neemt alleen maar toe. Hoe leid je dat in goede banen?'

Geboortejaren

Reginald – Reggie - Cushing komt uit Malta. Hij wilde eerst ingenieur worden, echt iets maken. 'Maar de jaren negentig waren de geboortejaren van de computer en het internet en ik werd erdoor gegrepen. Ik ontdekte programmeren, dat je een computer iets kunt laten doen dat je wilt, geweldig!', zegt Cushing enthousiast. Hij deed een bachelor computer science en ging aan de slag als grid-programmeur. Vervolgens deed hij een master grid computing aan de UvA.

Cloud versus Grid

Cushing startte met grid-computing, maar is nu overgegaan op de cloud. Verschil is dat je bij het grid te maken hebt met echte hardware, en bij de cloud alles virtueel is. Het grid werd vooral voor wetenschapsdoeleinden gebruikt, en was ook gratis. Voor de cloud moet je betalen, maar is wel toegankelijk voor iedereen. ‘Er worden dan ook verschillende niveaus van service aangeboden. De basis, waarbij je puur de rekenkracht van de computers gebruikt, is vergelijkbaar met het grid. Voor gewone cloud-gebruikers is de stap daarboven praktischer, je krijgt geen directe toegang tot de computers, maar tot de software via interfaces. Dat maakt het gebruiksvriendelijker, je hoeft niet zelf te programmeren. Vergelijk het met Dropbox.’

Cushing onderzoekt de infrastructuur van het internet. Hij kijkt niet alleen naar de virtuele machines, maar vooral naar de netwerken ertussen. 'Het draait wat mij betreft vooral om het concept data. Vandaar ook de titel van mijn proefschrift: Data-centric Computing on Distributed resources. De data, verdeelt over vele computers, staat centraal.' Om een duidelijk overzicht te krijgen hoe de netwerken in elkaar grijpen, keek Cushing naar het internet als een gelaagd systeem.

Het internet als gelaagd systeem (hoofdstuknummers verwijzen naar proefschrift).

Webbrowser

'Ik wilde niet alleen overzicht krijgen van de structuur van het internet, maar ook echte problemen oplossen. Want benutten we de infrastructuur wel optimaal? Hoe kun je meer rekenkracht verkrijgen uit de structuur zoals die nu is? Mijn oog viel op de webbrowsers. Een webbrowser is meer dan een interface tussen een mens en het internet. Het is software die zo krachtig is dat er ook mee gerekend kan worden, er kan data mee verwerkt worden. We zijn de eersten die zijn gaan onderzoeken of het mogelijk is je webbrowsers voor meer in te zetten dan het browsen van het web alleen.'

Cushings idee klopte, de browser blijkt een optie om meer uit het netwerk te halen, om meer rekenkracht te krijgen. Hij maakte een website om zijn onderzoek kracht bij te zetten. 'Ik vroeg collega's en vrienden de website te bezoeken. En alleen door het bezoeken van de site, konden wij beginnen met rekenen op hun computers. Ze wisten niet dat dit gebeurde, het leidde wel tot wat veiligheidsissues', gniffelt de wetenschapper. 'Het is niet zo dat er ook informatie gestolen kan worden van de computer, je browser is een veilig stuk software. Het gaat alleen om het stelen van rekenkracht, waardoor de computer langzamer wordt.'

Voor zover Cushing weet is het probleem met de browsers niet opgelost. 'Een poos nadat ik hierover publiceerde, werden we benaderd door een bedrijf dat wel geld zag in dit concept. Maar gelukkig zit er wel een beveiliging op, je kunt het gebruik namelijk niet verbergen. Dus zodra iemand met een beetje kennis de code analyseert, ziet hij meteen wat er aan de hand is, en zal hij alarm slaan. Dus als een groot bedrijf dit wil doen, dan wordt dat meteen opgemerkt.'

Cushing ging niet op het aanbod in, maar is hij ooit verleid om over te stappen tot de 'dark side' en zijn computertalent in te zetten voor snode plannen? 'Nee, wetenschap gaat juist om de mensheid vooruit helpen, ik wil niet destructief zijn. Je hebt een verantwoordelijkheid, dezelfde regels die in de maatschappij gelden, gelden ook op het internet. Toegegeven, het ontbreekt vaak nog aan wetgeving. Dus moet je handelen naar geweten.'

Facebook voor computerprogramma's

Browsers zitten onderin Cushings schematische internet-overzicht. Op hoger niveau in het schema gaat de informaticus op zoek naar verbanden om het netwerk te vereenvoudigen. 'Onderzoekers creëren bijvoorbeeld online hun eigen programma's om data te bewerken. Wij hebben deze geanalyseerd en gekeken of er verbanden tussen bestaan. Zo hebben we een soort facebook gemaakt van met elkaar verbonden programma's.’

‘We hebben enkele analyses gedaan, nog in vroeg stadium, maar kunnen nu al zeggen dat sommige programma's inderdaad te koppelen zijn. De ene webservice produceert data, de ander heeft dat soort data juist als input. We hebben overeenkomsten gevonden én ervoor gezorgd dat ze met elkaar gingen praten. Maar om ze echt met elkaar samen te laten werken, dat is de volgende stap.'

Evolutie data

In zijn proefschrift zit een vel papier met daarop een schematische tekening. Voor Cushing misschien wel dé belangrijkste realisatie, die hij had op het moment dat zijn proefschrift al naar de drukker was. 'We moeten data niet zien als statische informatie, maar juist de evolutie ervan vastleggen. Ik werk nu aan een model om dat te standaardiseren, vast te leggen in de taal, in de code van programmeren.'

'Er zijn allerlei verschillende soorten data, en manieren hoe de data met elkaar samenhangt. Neem bijvoorbeeld een auto, een object dat bestaat uit vier wielen en een stuur. Maar je kunt de data ook op een andere manier structureren. Een auto wordt gebruikt door mensen, mensen leven op aarde. De computer kan dan afleiden: de auto bevindt zich op aarde. Wij hebben nu bedacht om een soort derde dimensie aan de data toe te voegen. Het idee is dat data verandert in de tijd. Hoe langer het 'leeft' op het internet, hoe meer het verandert, wordt gebruikt en verwerkt tot nieuwe data. Het is een continue beweging.'

Post-mortem

Data in beweging, een derde dimensie toevoegen, het klinkt nog niet heel duidelijk. 'Stel je hebt een grote hoeveelheid data waar een afbeelding uit wordt gegenereerd, bijvoorbeeld een MRI-scan. Je doet daar analyses op, waardoor er weer nieuwe data ontstaat. Dan is provenance, het bijhouden hoe je tot de nieuwe data gekomen bent, heel belangrijk. Nu gaat dit vaak nog 'post-mortem', achteraf wordt gekeken wat de stappen waren. Het idee is dat we nu vooraf kijken wat er allemaal mogelijk is met de data. Doordat de data centraal staat, ga je op een andere manier naar de problemen kijken. Je wilt beginnen met de inputdata en dan al bedenken en modelleren hoe het verandert in de tijd, en dus ook hoe een resultaat tot stand komt.'

Het idee van de derde dimensie toevoegen aan de data klinkt misschien als iets wat ruimte kost, maar volgens Cushing scheelt het juist dataopslag. Bepaalde resultaten kun je namelijk weggooien, omdat het eenvoudig is de resultaten opnieuw te genereren. 'Stel je hebt een afbeelding bewerkt, in een ander formaat of er een filter over geplaatst. Dan hoef je niet alle versies van de afbeelding te bewaren, alleen de manier waarop de bewerking gaat. In de database vraag je vervolgens niet alleen om de file, maar om de file in een bepaalde staat.'

Ontdekkingsreis

Inmiddels werkt Cushing als postdoc bij dezelfde onderzoeksgroep verder aan dit idee. 'Het mooie van onderzoek doen, is dat je vrijheid hebt. Dat je zelf beslissingen kunt nemen, zelf bedenken waar je mee bezig gaat. Ik ga op een soort ontdekkingsreis in mijn hoofd. Allerlei ideeën zoek ik zelf uit. Elke dag is een nieuwe reis.' Lachend voegt de wetenschapper toe: 'Het nadeel van het niet-voorgebaande pad is dat je ook wel eens bang bent dat je een verkeerde afslag neemt.'

Terugkomend op de oerdata, de mensen die hun handen afbeeldden in de grot in Argentinië; Wat is de impressie die Cushing met zijn eigen onderzoek wil nalaten? 'Ik hoop dat mijn idee van het vastleggen van de ontwikkeling van data standaard wordt op het internet. Dan zou ik een klein stukje hebben bijgedragen aan de ontwikkeling van het internet.'

Reginald Cushing (Malta, 1981) haalde zijn bachelor in computer science aan de Universiteit van Malta. Vervolgens werkte hij als grid-programmeur. Hij behaalde zijn master in grid computing aan de Universiteit van Amsterdam. 4 november 2015 promoveerde hij daar met het proefschrift 'Data-centric Computing on Distributed Resources'. Zijn onderzoek werd deels gefinancierd door Commit, binnet het project IV-e.