You are here

Digitale mol snuffelt naar bijstandsfraude

N.a.v. dit artikel vroeg COMMIT/ om een reactie aan de ethicus Jeroen van den Hoven, hoogleraar Morele Filosofie aan de TU Delft. Deze reactie is direct aansluitend aan dit artikel te lezen.

Fraudespeurders van gemeenten

Informaticaspecialist dr. Maurice van Keulen is al een aardig eindje op weg beide vragen met "ja" te beantwoorden. Hij is onderzoeker bij het Centrum voor Telematica en Informatietechnologie aan de Universiteit Twente en financiert dit ICT-project mede met geld van het publiek-private onderzoeksprogramma COMMIT/. Met enkele studenten en promovendi sleutelt hij, samen met het ministerie van Sociale Zaken, aan software die de fraudespeurders van de gemeenten ondermeer in staat stelt een onterecht ontvangen huurtoeslag op te sporen.

De onderzoekers stoppen eerst een lijst met alle toeslagaanvragers in de computer. Vervolgens zoekt de software als een digitale mol volautomatisch naar de gedragingen van deze potentiële verdachten op sociale media als Twitter, Facebook of Marktplaats.

Nauwkeurige resultaten

De sociale recherche koppelt al langer gegevens uit allerlei overheidsdatabanken aan elkaar, zoals van de Belastingdienst, de Gemeentelijke Basisadministratie en de Rijksdienst voor Wegverkeer. Door hier internetgedragingen aan toe te voegen levert die analyse nauwkeuriger resultaten op. Rijdt iemand een dure auto, staat die misschien op naam van zijn vrouw? Hoeveel bewoners telt het huishouden? Hoe groot is hun waterverbruik? Vooral dat waterverbruik en de autogegevens blijken een goede indicator voor fraude, zo weet de sociale recherche al langer. Met behulp van datamining analyseert de computer tot slot hoe groot de kans is dat iemand fraudeert.

Herkenningsalgoritmes in onze software werken

Cruciaal bij dit forensisch onderzoek is het correct koppelen van een anoniem Twitter-account aan de juiste persoon. Van Keulen: "Ons vooronderzoek heeft bewezen dat de herkenningsalgoritmes in onze software werken. Veertig mensen deden vrijwillig mee. Twaalf van hen hadden een account op Twitter. Wij slaagden er in op basis van naam, spreektaal en adres uit miljoenen Twitter-accounts elf van de twaalf te koppelen aan hun account. Dat is een hoopvolle uitslag voor vervolgonderzoek."

"Fraudespeurders van de gemeenten voeren dossieronderzoek uit bij mensen van wie is vastgesteld dat er een hoge kans is dat ze frauderen. Zo kan mogelijk uitkeringsmisbruik worden bevestigd. Dat kost veel tijd. En als de initiële inschatting van kans op fraude niet zo goed is, levert dat uiteindelijk nogal wat tijdverkwisting en onderzoek naar onschuldige mensen op. De nieuwe opsporingssoftware vertelt de rechercheur nu veel accurater hoeveel procent kans er is dat iemand fraudeert. Zo kan de speurder beter selecteren wie een nader onderzoek waard is". Van Keulen: "De informatie uit overheidsdatabanken is een papieren werkelijkheid. Wij gaan op zoek naar sporen in de echte werkelijkheid: de sociale media."

Ethisch-filosofe Universiteit Twente

"Het succesvol herkennen van een fraudeur staat nog in de kinderschoenen. Onze software levert nu alleen een lijst op met waarschijnlijke Twitteraccounts van mensen. Maar het is geen grote stap meer daar nuttige sporen uit te halen."

Is al dat wroeten in de privacy van duizenden onschuldige burgers wel ethisch verantwoord? Van Keulen: "Wij hebben samen met ethisch-filosofe Aimee van Aimee van Wynsberghe van de Universiteit Twente* vastgesteld dat wat wij doen op het randje is. Zij gebruikt dit onderzoek als scenario voor haar eigen onderzoek naar privacy rondom sociale media. Haar oordeel is dat het doel, het blootleggen van fraude, deze methode legitimeert. Want met deze aanpak is er een balans tussen de privacy van de onschuldigen en het algemeen belang van de samenleving. Uiteindelijk komt het opsporen van fraude aan de hele maatschappij ten goede, dus ook aan die onschuldigen wier privacy in het geding is. Je moet dan wel tevoren technische en organisatorische voorzorgsmaatregelen treffen, zodat je de privacy-schending binnen de perken kunt houden."

Resultaat binnen een paar uur

Van Keulen werkt ook samen met het Nationaal Forensisch Instituut. Dat neemt bij invallen van alles in beslag, zoals pc’s, camera’s, usb-sticks en mobieltjes. Het NFI en Fox-IT trekken alle data er uit en laten er onderzoekers op los. Dat is tijdrovend, het gaat vaak om terabytes aan gegevens. "Wij helpen ze nu bij het maken van een browser die mails, agenda’s en contactenlijstjes onderzoekt op verdachte sporen. Je wil bijvoorbeeld weten of twee personen ergens hebben afgesproken. Dat lukt inmiddels aardig." De software levert nu binnen een paar uur een lijst op van alle kennissen van een verdachte, gerangschikt naar de intensiteit van de contacten.

www.marclaan.nl

To use or not to use: guidelines for researchers using data from online social networking sites. Zie pdf onderaan deze pagina.

TimeTrails (Spatiotemporal Data Warehouses for Trajectory Exploitation)
Ook dit is een COMMIT/project


Toepassen van Big Data-technologie op privégedrag van burgers?

Een interview met Jeroen van den Hoven, ethicus en hoogleraar Morele Filosofie aan de TU Delft.

Kun je op Twitter met zekerheid iemands ware identiteit vaststellen, bijvoorbeeld van een bijstandstrekker? Is het vervolgens mogelijk uit diens acties op internet op te maken of hij neigt tot uitkeringsfraude, zodat hij vervolgd kan worden?

Hoe ver mogen wetenschappers en overheden gaan met het toepassen van Big Data-technologie op privégedrag van burgers? Wij vroegen het aan de Delftse ethicus Jeroen van den Hoven. "De huidige privacywetten zijn hopeloos achterhaald."

Jeroen van den Hoven gaat er eens goed voor zitten. Onze vraag of aan Big Data-technologie ethische grenzen gesteld kunnen worden "komt geen seconde te vroeg", zegt hij in zijn werkkamer aan de TU Delft. "De bescherming van privacy is door de snelle opkomst van Big-Data-technologieën echt een groot probleem aan het worden. Ik denk dat dit dé grote ethische kwestie van deze eeuw gaat worden."

Van den Hoven is hoogleraar Morele Filosofie aan de TU Delft. Hij is van mening dat wetgeving en politiek hopeloos achterlopen op de razendsnelle opmars van de nieuwe digitale datasleepnetten, die internet en databanken afstruinen op zoek naar alle mogelijke gegevens over menselijke gedragingen. "Daar moeten heel snel nieuwe toezichtsmechanismen voor komen."

"Bovendien moet iedere burger wettelijk het recht krijgen vergeten te worden. Letterlijk: het recht gewist te worden uit de geheugens van Google, Facebook en andere datahandelaren."

Data verzamelen om bijvoorbeeld fraude op te sporen is toch geen schande?

"Het massaal verzamelen van data voor veiligheid, sociale zekerheid of voor justitiedoelen komt op het eerste gezicht ten goede aan de samenleving. In Italië koppelde de overheid een databank met uitkeringen voor slechtzienden met die van de aanvragers van rijbewijzen. Daar rolde nogal wat fraude uit. Maar aan al die verzamelde datastromen kleven enorme privacy-problemen, vooral als je databestanden gaat koppelen."

"Er wordt steeds meer bewaard, de opslag kost ook bijna niets meer. En de burgers, die zelf ook massaal hun gegevens op internet rondstrooien, zien onvoldoende in wat het belang van hun privacy is. We zijn bijna vergeten dat wij wettelijke databescherming hebben ingevoerd om een aantal morele redenen. Ik noem er vier:

  1. Allereerst willen we als samenleving schade van datamisbruik voorkomen.
  2. Vervolgens is er de wens dat onze gedragsdata niet zomaar worden verhandeld.
  3. Ten derde vinden wij het best vervelend als data over onszelf van het ene sociale domein naar het andere uitlekken.
  4. En als laatste: ieder mens heeft de morele autonomie zich binnen zekere grenzen te presenteren zoals hij dat graag zélf ziet. Dat geeft je het recht informatie over jezelf achter te houden."

"Deze vier grenzen leveren het filosofische fundament onder het juridische recht op privacy. Zij vormen een hekwerk dat het aanleggen van dataverzamelingen inperkt. Er is een balans nodig tussen de hoeveelheid informatie die het collectief over iemand kent, en het recht van het individu zijn identiteit te beschermen."

Er bestaan toch al uitgebreide Europese privacy-regels?

"De Europese regels over datagebruik zijn verouderd en zijn gebaseerd op een privacy-discussie die achterhaald is. De EU-wet schrijft voor dat het verzamelen van persoonsgegevens alleen mag gebeuren voor één bepaald, vooraf bekend doel. Ook het gebruik van die data moet beperkt blijven tot dát doel. Maar bij Big-Data-technologie bestaat er helemaal geen doel. Er worden volautomatisch en massaal gegevens bijeengeharkt en opgeslagen. De onderzoekers zien later wel of zij uit die berg data met behulp van slimme algoritmen patronen kunnen vinden. Daar heeft de wetgeving helemaal geen vat meer op."

"In de Europese data-protectiewet staat bijvoorbeeld een definitie van wat persoonsgegevens zijn. Maar Big Data gaat niet over personen. Er zijn bij die technologie geen identificeerbare personen meer, maar alleen data over verschijnselen, gedrag en gedragspatronen. Het gaat niet over jou en mij, tót dat je die dataverzameling combineert met andere databases. Bijvoorbeeld met het stroomverbruik en watergebruik dat straks in alle huishoudens bijgehouden wordt door slimme meters. Dan ineens kun je afwijkingen van patronen vaststellen, bijvoorbeeld dat er op een bepaald tijdstip niemand thuis is, of dat er juist meer mensen dan normaal aanwezig zijn. Met Big Data kun je zien dat er veel of weinig gedoucht wordt in een huishouden."

De ethische grenzen aan Big Data staan sinds kort hoog op de agenda van de KNAW. Van den Hoven is zojuist benoemd in een commissie van de Academie die gaat adviseren de ethische aspecten van Big Data. Wat wordt uw inbreng?

"Wij moeten de precieze opdracht nog ontvangen. We gaan in ieder geval bekijken of er wetten en protocollen moeten komen die het aanleggen en gebruiken van dataverzamelingen inperken."

Wat de hoogleraar betreft, worden zowel commerciële datahandelaren als academische onderzoekers onderworpen aan nationaal en internationaal toezicht. "Wat wij nodig hebben is PET, privacy enhancing technologie. Dat komt in de praktijk neer op maatschappelijk verantwoord innoveren, waarbij je tevoren veiligheden inbouwt bij het vergaren van gegevens. Er moet de garantie zijn dat data niet hergebruikt wordt voor andere doelen. En er moet sprake zijn van data-minimalisatie, zo weinig mogelijk opslaan dus. Het College Bescherming Persoonsgegevens kan ter controle een assessment uitvoeren bij bedrijven en onderzoeksinstituten die op innovatieve manieren data willen gaan verzamelen en exploiteren."

"Google, Facebook en andere databedrijven lobbyen in Brussel al zwaar tegen dit soort gedachten. Ik vermoed overigens dat die ondernemingen intern heus wel weten dat hun business model van het commercieel verhandelen van persoonsdata zeer kwetsbaar is geworden, juist vanwege het privacy-dossier. Zij proberen alleen het nog een beetje te rekken."

Van den Hoven vindt dat iedere organisatie tevoren moet nagaan wat de gevolgen van haar innovaties op datagebied zijn. "Zo'n plicht kan geen honderd procent bescherming bieden, maar je kan als CBP wel controleren of organisaties hun best daarvoor gedaan hebben. Is er bijvoorbeeld tevoren nagedacht over de gevolgen van een electronisch patiëntendossier, of over de invoering van slimme meters?"

Ook nodig is wat de hoogleraar sousveillance noemt. "Je kan diezelfde big-data-technieken gebruiken om achteraf vast te stellen of er privacyschendingen hebben plaatsgevonden door dataverzamelaars. In Italië ontdekten onderzoekers die sousveillance toepasten, dat banken discrimineren bij het verstrekken van kredieten met behulp van illegaal aangelegde dataverzamelingen."

Mag een gemeentelijke sociale dienst het Twittergedrag van zijn cliënten verzamelen om subsidiefraude op te sporen?

Van den Hoven: "Dat Twittercommunicatie openbaar is, wil nog niet zeggen dat iedereen daar Big-Dataverzamelingen van mag aanleggen. Als je die gaat koppelen met andere databanken is het ethisch gezien als snel problematisch. Maar ik acht het wel ethisch geoorloofd dit te doen, als een frauderechercheur een opsporingsbevoegdheid heeft, en hij binnen strenge normen van verantwoording opereert."

Verzekeraars azen ook op privégegevens.

Als verzekeraars met Big Data aan de slag gaan, kan het wel al snel een ethisch probleem worden, vindt Van den Hoven. “Big data gaat enorm veel teweeg brengen in de verzekeringsbranche. We gaan tijden van nagenoeg perfecte informatie tegemoet. De verzekeraars kunnen bijvoorbeeld hun klantenbestand koppelen aan informatie over het menselijk genoom. Zo kunnen zij ziekten bij hun verzekerden voorspellen. Wanneer verzekeraars de koppeling maken aan Big Data over iemands levensstijl en gedrag, dan rollen daar naar hun opvatting onverzekerbare mensen uit.”

www.marclaan.nl