Zijn data een hype of worden ze echt het goud van de 21ste eeuw?

De exponentiële groei van digitale data vormt de grondstof voor nieuwe zakenmodellen. Elke aardbewoner genereert elke seconde zowat 1,7 megabyte aan data. ©ANP

Als we van de toekomst dromen, zien we vliegende auto’s, pratende horloges en gedienstige robots. Wat we niet zien, is de brandstof die al die fantastische technologie aan de praat moet houden: data.

In de bedrijfswereld is een rush op persoonlijke gegevens aan de gang. Is het een hype? Of worden data echt het goud van de 21ste eeuw?

Digitale data bestaan al sinds het prille begin van het computertijdperk. Dat er de jongste jaren zoveel over te doen is, heeft alles te maken met de techreuzen uit Silicon Valley. Zij zagen het eerst in hoe ze met data ons leven aangenamer, persoonlijker en efficiënter konden maken. Bedrijven als Netflix, Spotify, Facebook en Amazon selecteren de films en de songs die ons op het lijf zijn geschreven, brengen ons in contact met oude vrienden en bezorgen ons de beste shoppingtips.

Reeks 'Het datatijdperk'


Van de app die u opent op uw smartphone tot het bezoek aan uw dokter of het pad dat u aflegt in de supermarkt. Wat gisteren nog banaal leek, verbergt vandaag een technologische revolutie. En die draait rond u.
De onzichtbare netwerken achter uw persoonsgegevens. Vanaf zaterdag 14 september drie weekends lang in De Tijd.

‘Data geven bedrijven de mogelijkheid hun klanten extreem persoonlijk te benaderen, en te anticiperen op hun behoeften’, zegt auteur en digitaal consultant Steven Van Belleghem. ‘De toekomst van e-commerce zit in leveringen binnen het uur of zelfs enkele minuten. Amazon onderzoekt of het warme dranken heel snel kan leveren, en ook enkele Chinese bedrijven zijn er hard mee bezig. Het kan alleen als je op basis van datapatronen de vraag goed kan voorspellen.’

De exponentiële groei van digitale data vormt de grondstof voor nieuwe zakenmodellen. Volgens een overzicht van de dataconsultant Domo genereert elke aardbewoner elke seconde zowat 1,7 megabyte aan data. Dat doet hij niet alleen door foto’s en verhalen op Facebook te posten, maar ook door langs politiecamera’s te rijden die zijn nummerplaat registreren en door zijn boodschappen te laten scannen aan de kassa in de supermarkt. Elke dag komt er wereldwijd zowat 2,5 miljard gigabyte aan gegevens bij, genoeg om de harde schijven van een paar miljoen pc’s vol te schrijven.

Data leveren een digitale voetafdruk van vrijwel alles wat om ons heen gebeurt. Op zich is al die ruwe informatie weinig waard. Ze wordt pas waardevol als we in staat zijn er patronen en verbanden in te zien die niemand eerder zag, en er voorspellingen mee te doen die vroeger onmogelijk waren. Om dat te doen hebben we vandaag de computers en de programmeertechnieken die we de vorige decennia nog ontbeerden. Geen klassieke software als een reeks onveranderlijke computerinstructies, maar lerende algoritmes die zichzelf steeds meer verbeteren naarmate ze met data worden ‘gevoed’. Heel wat bedrijven beseffen plots dat ook de oude bestanden in hun digitale archief weleens nieuwe, waardevolle inzichten kunnen bevatten.

Een van de Vlaamse start-ups die die inzichten proberen op te graven, is DataStories uit Turnhout. Het bedrijfje, opgericht door de uitgeweken Russische wiskundige Katya Vladislavleva, heeft heel wat klanten die je niet meteen met data en algoritmes zou associëren: fabrikanten van schoonmaak- en verzorgingsproducten, maar ook de farmagroep Janssen Pharma, de matrassenfabrikant Recticel en voedingsbedrijven zoals de chocoladereus Barry Callebaut. ‘Wat al die bedrijven gemeen hebben, is dat ze op zoek zijn naar manieren om hun producten beter, goedkoper en duurzamer te maken. En daar kunnen we met onze data-analyse bij helpen’, zegt Vladislavleva.

Het gevaar bestaat dat CEO’s en marketeers in een soort ‘Temptation Island’ vol data terechtkomen.
Steven Van Belleghem
digitaal consultant

Hoe doe je dat, een schijnbaar banaal product als een vaatwastablet verbeteren? De klassieke manier was experimenteren in een labo, door veel ingrediënten uit te proberen en te noteren wat wel en niet werkt. ‘Het is een trage, dure en weinig gestructureerde manier om te innoveren. Meer alchemie dan chemie’, zegt Vladislavleva. Door de data van al die experimenten grondig te analyseren kan je allerlei inzichten halen over hoe bepaalde ingrediënten in verschillende omstandigheden werken. Zo kan je sneller formules selecteren die de beste kans hebben op goede resultaten.

‘In productinnovatie kunnen we met data-analyse een enorme toegevoegde waarde creëren en impact hebben op de duurzaamheid van producten’, zegt Vladislavleva. ‘In de agritechsector gebeurt iets gelijkaardigs. Hoe kweek je groenten met meer eiwitten, of maak je plantaardige burgers die naar vlees smaken? Data bieden daar nieuwe inzichten in.’

Snelle diagnoses

Hetzelfde verhaal klinkt in de farmasector, waar de resultaten van jarenoude klinische tests plots worden herontdekt. Het vinden van correlaties in grote hoeveelheden medische data helpt de industrie medicijnen sneller en doelgerichter te ontwikkelen, en beperkt de noodzaak aan dure en tijdrovende klinische tests. Het verklaart waarom de Franse farmagroep Sanofi enkele maanden geleden een opmerkelijk verbond sloot met Google om samen een innovatielab op te richten.

Het Gentse bedrijf Ontoforce surft op dezelfde golf. Het helpt ’s werelds grootste farmareuzen snel relevante informatie te vinden in meer dan honderd publieke databanken, klinische studies en wetenschappelijke publicaties. Het ‘Vlaamse Google van de farma’ kan informatie over pakweg octrooien en nevenwerkingen van medicijnen veel sneller opsporen, en helpt zo de lange ontwikkelingstijden van kandidaat-geneesmiddelen te verkorten.

Ook in het stellen van diagnoses halen computers de mens in, met dank aan de kennis die ze vergaren uit miljoenen klinische gegevens. Het Chinese algoritme BioMind bewees vorig jaar op een medisch congres dat het hersentumoren beter kon herkennen dan een kransje van 15 getrainde specialisten. De machine herkende in een kwartier 87 procent van de tumoren die verstopt zaten in 225 scans. De 15 dokters kwamen aan 66 procent en deden er dubbel zolang over.

Dichter bij huis spoort het Leuvense bedrijf IcoMetrix met een geavanceerde analyse van hersenscans ziektes als MS en dementie op, nog voor een dokter de diagnose kan stellen. Het Kortrijkse Barco ontwikkelde een oplossing waarmee dermatologen sneller en accurater huidkankers kunnen herkennen. Het koppelde zijn expertise in visualisatiesystemen aan een grote databank met verdachte huidvlekken en lerende analysesoftware.

2,5 miljard
data
Elke dag komt er wereldwijd zowat 2,5 miljard gigabyte aan gegevens bij, genoeg om de harde schijven van een paar miljoen pc’s vol te schrijven.

Chirurgen kunnen uit het doorploegen van data veel bijleren over mogelijke complicaties tijdens en na een operatie. Het Leuvense data-analysebedrijf Lynxcare kon uit tien jaar aan ziekenhuisdata afleiden dat patiënten met een chronische longziekte na een hartoperatie 3,2 keer meer kans hebben om binnen het jaar te overlijden. ‘Veel ziekenhuizen hebben die kennis niet omdat de benodigde data verspreid zitten over tal van databases en verslagen. Een gemiddeld patiëntendossier telt al snel 300 à 400 pagina’s. Wij helpen hen die data te verwerken om dergelijke analyses mogelijk te maken’, zegt CEO Georges De Feu.

Duizenden spreadsheets

Ondanks de hoge verwachtingen praten veel organisaties meer over data dan dat ze er effectief iets mee doen. ‘De technologie is er, maar oude gewoontes zijn moeilijk te veranderen’, zegt Katya Vladislavleva van DataStories. ‘Ook het verzamelen van data is vaak nog een pijnpunt. Bedrijfsdata zitten vaak verborgen in duizenden spreadsheets. Onze eerste uitdaging is daar structuur in aan te brengen.’

Ook bij de overheid is er geen gebrek aan goede wil en interessante projecten, maar ontbreekt de overkoepelende visie op hoe we met data de grote maatschappelijke uitdagingen kunnen aanpakken. De politieke discussie over rekeningrijden illustreert dat: de technologie om verkeersstromen realtime te monitoren en te sturen is er, maar niemand durft het beleidskader uit te tekenen.

Ook op het niveau van steden en regio’s is veel te bereiken met het samenbrengen van diverse databronnen. Je kan er een coherenter verkeers- en parkeerbeleid mee uittekenen, de luchtkwaliteit monitoren en bijsturen of de openbare verlichting aanpassen in functie van het aantal mensen op straat.

‘Er wordt veel over het internet der dingen gepraat, maar steden en gemeenten plukken voorlopig vooral het laaghangende fruit. Denk aan sensoren die meten of een vuilbak of glascontainer vol zit’, zegt Yves Van Ingelgem van Zensor, een Brusselse specialist in datasensoren. ‘Er is nochtans veel meer mogelijk. In de Nederlandse stad Zwolle hebben ze een weg aangelegd in gerecycleerd plastic. Wij volgen met onze sensoren op hoe stabiel die weg is. Maar met die data kan je ook veel andere zaken te weten komen: wanneer zout moet worden gestrooid, of de strooiwagen al is geweest, hoeveel fietsen er passeren, wanneer een onderhoud nodig is...’

 

Een actiever gebruik van technologie kan de overheid veel geld besparen, zegt Van Ingelgem. ‘Je zou de verplichte inspecties van openbare bouwwerken kunnen vervangen of aanvullen door sensoren. Dat die brug in Genua zou instorten, hadden ze met de juiste sensoren maanden op voorhand kunnen weten.’

De overheid moet ook ver genoeg durven te denken. ‘Op het moment dat de Vlaamse administratie een systeem voorstelde om het beheer van bouwwerken via foto’s op een tablet te digitaliseren, pakte Rijkswaterstaat in Nederland uit met de visie dat elk bouwwerk voortaan maximaal moet zijn uitgerust met sensoren. Daarmee gaan ze tot 30 procent besparen op onderhoudskosten.’

Ethisch kompas

De verzuchting klinkt vaak als je met Vlaamse dataspecialisten praat: er is veel mogelijk, maar er gebeurt nog weinig. Dat is niet omdat de data er niet zijn, maar omdat we niet goed weten hoe ze te gebruiken.

20%
data
‘Vandaag wordt niet meer dan 20 procent van de data benut’, zegt datawetenschapper Erik Mannens.

‘Vlaamse start-ups en wetenschappers staan aan de Europese top in domeinen als machine learning en semantiek. Maar in de praktijk wordt niet meer dan 20 procent van de data benut’, zegt Erik Mannens, professor datawetenschappen aan de Universiteit Gent. ‘Bij grotere bedrijven is het verhaal nog moeilijk te verkopen, terwijl veel kmo’s eerst nog werk moeten maken van het structureren van hun data, die verspreid zit in hun Excel-sheets. Al denk ik niet dat die situatie bij een doorsneebedrijf in de Verenigde Staten veel beter is.’

Dat een handvol techgiganten intussen het speelveld domineert, baart Mannens steeds meer zorgen. ‘De manier waarop die grote bedrijven met big data en artificiële intelligentie omgaan, is niet oké. Maar dat houdt jongeren totaal niet bezig. Daarom pleit ik bij mijn universiteit voor een verplicht vak rond techniek en ethiek voor alle eerstejaarsstudenten.’

‘Terwijl andere bedrijven op allerlei vlakken zwaar worden gereguleerd, doen Google en Facebook maar wat. De allergrootste beursgenoteerde bedrijven zijn vandaag allemaal techbedrijven die onze data bezitten. We zullen op een bepaald moment nieuwe wetten nodig hebben om die grote consortia op te breken, zoals de Sherman Act die de Amerikaanse monopolies van de late 19de eeuw openbrak.’

‘Ik denk dat een zekere transparantie over algoritmes moet bestaan, net zoals beursgenoteerde bedrijven transparant moeten zijn over hun financiële cijfers’, zegt ook Van Belleghem. ‘Het gevaar bestaat dat CEO’s en marketeers in een soort ‘Temptation Island’ vol data terechtkomen, en plots allerlei mogelijkheden zien die een risico op misbruik inhouden. In Scandinavië heeft een bedrijf een model bedacht om de brandstofprijzen aan de pomp te koppelen aan het profiel van de gebruiker, in plaats van één prijs te afficheren voor iedereen. Over die juiste balans tussen personalisatie en privacy worden vandaag de grootste discussies gevoerd. Bedrijven moeten een ethisch kompas ontwikkelen dat de richting kan aangeven.’

Op een hoger niveau dreigt machtsmisbruik door politici en regimes, die dankzij onze data in staat zijn gerichte propaganda te verspreiden. ‘Artificiële intelligentie staat op het punt waar kernenergie in de jaren dertig zat. We kunnen al veel, maar er kan ook nog veel fout lopen. Fake news en gemanipuleerde video’s kan een computer nog niet herkennen. Ik denk wel dat we dat nog kunnen rechttrekken, maar ik ben vooral bang van wie aan de knoppen zit’, zegt Mannens.

Wat Vladislavleva vooral zorgen baart, is dat mensen stoppen met zelf nadenken omdat machines het toch in hun plaats doen. ‘Ik hoop dat het onderwijs ons daarvoor kan behoeden. Al mogen we ook niet toegeven aan sommige ongegronde angsten. Europa loopt misschien niet voorop, maar we hebben met onze expertise en ons onderwijs grote troeven in handen. Daarom schrik ik terug voor een al te beperkend en hinderend beleid. We moeten ook inspanningen doen om beleidsmakers de waarde van data te doen inzien.’

Dit artikel is het eerste uit de reeks 'Het datatijdperk'. Lees vanaf zaterdag 14 september in De Tijd drie weekends lang over de onzichtbare netwerken achter uw persoonsgegevens.

Lees verder

Advertentie
Advertentie