Peter Hinssen | Bloedserieuze data

Als corona ons één ding leert, is het dat data cruciaal geworden zijn in alle aspecten van ons leven.

In 2008 schreef Chris Anderson, toen hoofdredacteur van het magazine Wired, het spraakmakende artikel ‘The end of theory’. Anderson was gefascineerd door de enorme opkomst van de technologie die we 'big data' zouden gaan noemen, en die door de gigantische opmars van rekenkracht en opslag in de cloud toeliet om onvoorstelbare hoeveelheden data te verwerken.

©Robert Clayton

Er ontstond een soort ongebreideld optimisme over wat big data zou kunnen betekenen voor de mensheid, de wetenschap en de maatschappij. De basis van de wetenschappelijke methode is het concept van een 'model'. En zoals de Britse statisticus George Box ooit zei: 'Alle modellen zijn fout, maar sommige zijn nuttig.' Anderson voorspelde: ‘We zullen uiteindelijk geen modellen meer nodig hebben, in het tijdperk van big data zullen de cijfers voor zich spreken.’

Vandaag is de technologie van big data met kwantumsprongen geëvolueerd. Gevoed door de enorme hoeveelheden verslavende geldstromen in de wereld van advertising is de kunst ontstaan alle gegevens van klanten te analyseren en koopgedrag accurater dan ooit te voorspellen, en te weten hoe bedrijven en merken kunnen inspelen op een klant om dat gedrag te beïnvloeden. Bedrijven als Google en Facebook hebben die technologie omgeturnd tot zowat de winstgevendste economische machine sinds de oliebusiness. Ons geloof in algoritmes en de capaciteit om 'automatisch' te begrijpen wat zou gebeuren werd sterker dan ooit.

Ons geloof in algoritmes en de capaciteit om 'automatisch' te begrijpen wat zou gebeuren, werd sterker dan ooit. Maar toen kwam Covid-19.

Maar toen kwam Covid-19. We werden met de neus op de feiten gedrukt: het detecteren en opsporen van dit soort 'black swans' kan de mist in gaan. Algoritmes die getraind zijn om met historische data te werken, en die vooral patronen herkennen en voorspellen die we al kennen, rijden zich te pletter als iets totaal onvoorspelbaars gebeurt.

Maar toch. De jongste twee maanden is de amateurstatisticus in ons wakker geworden. Massaal lezen en bekijken we de nieuwste sterftecijfers, hoeveel mensen in het ziekenhuis opgenomen zijn en welk percentage coronapatiënten op de afdelingen intensieve zorg ligt. We hebben curves bekeken en van commentaar voorzien, en op Facebook ontsponnen zich heroïsche discussies over de 'R-factor'. Wetenschappers als Kurt Barbé van de VUB deden hun uiterste best om ons via sociale media te helpen om de data te begrijpen en te kaderen. We kunnen heel veel leren over deze episode, en voor mij zijn drie dingen cruciaal.

Rusthuizen

Het eerste vormt de basis: kwaliteit van data is cruciaal. Als we niet de correcte data krijgen, heeft analyse geen nut. Het aloude gezegde 'garbage in, garbage out' is hier van toepassing. We herinneren ons allemaal dat we collectief al de curves aan het uittekenen waren om te zien wanneer we een 'flattening' zouden zien, toen ineens bleek dat we honderden doden uit de rusthuizen niet mee hadden gerekend.

Het tweede element is de mogelijkheid om met meer data meer te weten. Big data kan ons helpen om patronen nog beter in kaart te brengen, nog duidelijker correlaties aan te tonen en nog beter de volgende stappen te voorspellen. Daarom is het testen zo cruciaal. Op dit moment blijft het koffiedik kijken hoeveel mensen er in ons land eigenlijk besmet  zijn. Meten is weten. Meer meten is meer weten.

Het laatste element is de capaciteit om met al die data, analyse en correlatie de juiste beslissingen te nemen. We zagen beleidsmakers worstelen om conclusies te trekken, we zagen getreuzel en getalm, en de competentie om met onvolledige data toch daadkracht te tonen was soms heel ver weg.

Geen enkele organisatie zit op zoveel data als de overheid. Als we die beter aanwenden, kan de overheid veel sneller, veel efficiënter en veel daadkrachtiger worden.

Als je die drie elementen bij elkaar zet, dan moet je je toch afvragen hoe de contact tracing de volgende weken en maanden gaat verlopen. Hoe kunnen we op die manier, met een telefoontje, voldoende goede en accurate data verzamelen om daarmee de juiste beslissingen te nemen? De kans dat dit verzandt in een Belgenmop is helaas vrij reëel.

Maar we moeten verder kijken dan deze dure Monty Python-sketch. Als corona ons één ding leert, is het dat data inderdaad cruciaal geworden zijn in alle aspecten van ons leven. Bedrijven zullen nog meer die kracht moeten gebruiken om klanten te begrijpen, supply chains te sturen, strategie wendbaar te maken. Maar vooral zullen bedrijfsleiders de kennis en kunde nodig hebben om met almaar meer data, ook al zijn die onvolledig, beslissingen te nemen.

Dat geldt in het bijzonder voor de overheid. Geen enkele organisatie zit op zoveel data als de overheid. Als we die beter aanwenden, kan de overheid veel sneller, veel efficiënter en veel daadkrachtiger worden. Investeren in betere dataverwerking, meer capaciteit om verbanden te leggen, en vooral in de kennis van beleidsmakers om op een 21ste-eeuwse manier te kunnen beslissen met informatie wordt cruciaal. Big data is plots bloedserieus geworden: serious data.

Lees verder

Gesponsorde inhoud