You are here

Twitter verbetert de wereld

Van gladheid op de weg tot een watersnoodramp, Ali Hürriyetoğlu gebruikt twitter om nauwkeurig in kaart te brengen wat er speelt in de wereld. door Edda Heinsman

Elke dag worden er wereldwijd miljoenen tweets verstuurd. Ali Hürriyetoğlu maakt hier slim gebruik van. Zijn doel is: de juiste tweets er uit filteren die praktisch inzicht geven in de situatie. Waar moet bijvoorbeeld na een natuurramp de hulp naar toe en waar is precies behoefte aan? Of hoe verbeter je de file-informatie? Hürriyetoğlu to the rescue.

Ali Hürriyetoğlu heeft er geen probleem mee dat het interview wordt opgenomen. 'Absoluut niet! Wat mij betreft kunnen we niet open genoeg zijn. Als iedereen zijn data afschermt, blijft er voor mij weinig te onderzoeken over', lacht de onderzoeker. 'Ik ben voor mijn onderzoek afhankelijk van hoe open mensen online zijn.'

File-informatie
Eén van de uitdagingen waar Hürriyetoğlu aan werkte, was het krijgen van een beter begrip van de situatie op de weg. Nederland ligt vol verkeerssensoren, het zijn er duizenden. Deze sensoren tellen bijvoorbeeld hoeveel auto's er passeren op een bepaalde weg. De signalen zijn echter op meerdere manieren te interpreteren. Als een sensor ergens weinig voorbij rijdende auto's telt, betekent dit dan dat het op dat moment rustig is? Of staat er een file waardoor de auto's slechts langzaam voorbij rijden? Hürriyetoğlu bedacht samen met Marco Puts and Piet Daas van het CBS dat hij twitter kon gebruiken om de situatie ter plekke beter te begrijpen. 'Mensen praten over hun reis, ze hebben commentaar op het weer, reageren op de conditie van de weg en melden het als ze een spookrijder tegenkomen. Al dit soort commentaar heb ik meegenomen in de studie.'

Hürriyetoğlu keek naar tweeëntwintig verschillende informatie-categorieën, variërend van 'ongevallen' tot 'gladheid'. 'Voor elke informatiecategorie moesten we begrijpen hoe men er over praat in tweets. Bijvoorbeeld als een stuk tekst begint met een A, N of E en gevolgd wordt door een getal van maximaal drie cijfers, is dit waarschijnlijk een weg. 'A2' duidt echter niet altijd op een weg. Het kan ook een papierformaat of de naam van een sportclub zijn. En 'A320' is niet alleen een weg maar ook een vliegtuig. Al deze uitzonderingen moet je er uit filteren.' De onderzoeker ontwikkelde samen met zijn copromotor Nelleke Oostdijk de website Sinfex. 'Voor de ontwikkeling van het systeem gebruikten we data van  twiqs.nl, een database van Nederlandstalige tweets. Demo-website Sinfex werkt inmiddels op realtime tweets uit heel Nederland. De site verzamelt tweets, extraheert daar informatie uit en publiceert deze informatie. Zo hebben we laten zien dat we data van verkeerssensoren kunnen aanvullen en verrijken met data die we uit sociale media halen.'


Foto © Floodtags

Natuurrampen
Hürriyetoğlu keek niet alleen naar files tijdens zijn onderzoek. 'Vanaf het begin van mijn promotietraject ben ik op zoek gegaan naar serieuze onderwerpen, gerelateerd aan problemen van mensen. Daarvoor volgde ik online grote organisaties als de Verenigde Naties. Ik kwam een blog tegen van de organisatie Floodtags. Zij wilden cruciale informatie vinden die humanitaire organisaties kan helpen tijdens natuurrampen. Ik vond dit een interessant onderwerp, dus zocht ik contact. Zij legden uit waar ze behoefte aan hadden, ik legde uit wat ik kon. Sindsdien hebben we heel wat onderzoek samen gedaan.'

Hürriyetoğlu werkte met diverse humanitaire organisaties samen, onder andere met het Rode Kruis op de Filipijnen. 'Doel was om relevante tweets te identificeren als: 'Hier is een overstroming'. 'We hebben onderdak nodig', 'we hebben brood nodig'. Of juist 'dit hebben we niet nodig'. De organisatie wil weten wat er in het veld speelt.' Naast overstromingen ging Hürriyetoğlu ook op zoek naar relevante tweets voor het voorspellen van dengue- en diarree-uitbraken in Indonesië. 'Eén tweet kan belangrijke informatie bevatten en een doorslaggevende rol spelen. Maar de twitterstream zit vol ruis, de informatie tegenover ruis- ratio is nogal laag. Het is niet eenvoudig de cruciale tweets er uit te filteren, en we zijn nog steeds bezig met het onderzoek.'

'Zo werken we dus aan het verbeteren van de wereld. Het draait allemaal om mensen, problemen waar mensen mee kampen. Hiervóór werkte ik bij de Europese Unie, daar was het doel uit het nieuws de belangrijke kwesties filteren over immigratie-issues, natuurrampen, etcetera. Voor mij is het belangrijk om praktisch onderzoek te doen, mensen te helpen.'

Een van de projecten waar Hürriyetoğlu aan werkte was de ontwikkeling van Relevancer. Deze tool helpt met het vinden van relevante informatie op twitter. Bij een opdracht waarbij verschillende tools werden vergeleken, eindigde Relevancer als eerste, waardoor Hürriyetoğlu zijn tool mag presenteren bij een workshop tijdens de conferentie ECIR 2017. Bovendien mag hij het project presenteren tijdens Strata+Hadoop world, een grote conferentie op het gebied van big data.

Toekomst
Hürriyetoğlu komt uit Turkije, maar spreekt inmiddels behoorlijk Nederlands. 'Het hielp dat ik een jaar in Duitsland werkte, de taal heeft veel overeenkomsten. Bovendien moet ik bij mijn huidige werkgever echt in het Nederlands communiceren.' De onderzoeker doelt op het CBS waar hij, al vijf maanden voor zijn promotie was afgerond, een baan aangeboden kreeg om verder te gaan met het onderzoek naar files.

Is onderzoek doen naar files wel bevredigend genoeg in vergelijking tot zijn onderzoek naar dengue-uitbraken of overstromingen? 'File-informatie is belangrijk voor Nederland' zegt Hürriyetoğlu stellig. 'Bovendien werk ik niet alleen aan files, ik kijk ook naar andere big data-projecten. We werken samen met diverse statistische bureaus binnen Europa om duurzame ontwikkelingsdoelen te halen. We zijn zo open mogelijk over de technieken die we gebruiken. Mensen van over de hele wereld kunnen met de tools die wij ontwikkelen aan de slag. Dus mijn werk maakt echt een verschil in de wereld. Daar ben ik ook wel trots op.' Hürriyetoğlu vindt het prettig om bij het CBS gericht aan praktische heldere opdrachten te werken met de juiste ondersteuning. Daarnaast krijgt hij de vrijheid een dag in de week onderzoek te doen aan de universiteit. 'Het is het beste van beide werelden.'

INFINITI (Information retrieval for information services)
Ook dit is een COMMIT/ project

Ali Hürriyetoğlu (1986) haalde zijn bachelor bachelor computer engineering aan de Ege university in Izmir (Turkije). Hij deed een master cognitive science ODTU aan de university Ankara. In 2012 begon hij aan de Radboud universiteit aan zijn promotieonderzoek en september 2017 hoopt hij te promoveren met het proefschrift 'Actionable information extraction from microtexts'. Zijn onderzoek werd deels gefinancierd door Commit.