Het taalmodel GPT-3 maakt teksten die niet te onderscheiden zijn van die van een mens. Het verslindt data, energie en geld. Nu heeft Microsoft er een exclusieve licentie op. Academische onderzoekers zijn geschokt.

Onlangs pakte de Britse krant The Guardian uit met een opiniestuk 'geschreven door artificiële intelligentie'. Het was een - door mensen - gemaakte compilatie van enkele door GPT-3 geschreven teksten.

GPT staat voor Generative Pre-trained Transformer. Het systeem brengt teksten voort dankzij deep learning, een vorm van machinaal leren gebaseerd op kunstmatige neurale netwerken. GPT-3 werd getraind op honderden miljarden woorden. Het ontstond in de schoot van OpenAI, een AI-lab in San Francisco dat in 2015 werd opgericht door de ondernemer Elon Musk en andere investeerders met naam en faam. Ze trokken een miljard dollar uit voor het project dat AI-onderzoek zou doen voor het goed van de mensheid.

Patroonherkenning

GPT-3 is het paradepaard van OpenAI. 'Het is het beste taalmodel dat er is', zegt de Antwerpse professor Walter Daelemans. Hij is een specialist in systemen voor natural language processing (NLP), het verwerken door computers van natuurlijke taal. GPT-3 is een meester in het detecteren van statistische patronen. Op basis daarvan maakt het menselijk uitziende teksten, kan het vertalingen maken en vragen beantwoorden. 'Maar het redeneert niet. Het begrijpt niet wat het schrijft', zegt Daelemans.

Tot verbijstering van Musk, die al een tijd weg is uit de raad van bestuur van OpenAI maar wel donor blijft, besloot OpenAI GPT-3 te commercialiseren. Microsoft kreeg in september een exclusieve licentie. Dat bedrijf had OpenAI in 2019 al een miljard dollar toegestopt.

Universiteiten kunnen gebruikmaken van een API, een application programming interface. Dat is software op basis waarvan een computerprogramma kan communiceren met een ander programma. 'We kunnen wel de output zien van GPT-3, maar hoe de broncode van het model zelf eruitziet, blijft voor ons onzichtbaar', zegt professor Els Lefever, een specialist in taal- en vertaaltechnologie aan de Universiteit Gent. 'Dat is een beetje schandalig. AI-onderzoek blonk tot nu uit door openheid.'

'Degoutant', zegt Daelemans. GPT-2, de voorganger van het model, werd - na enige aarzeling - wel vrijgegeven. De technologie is uiteindelijk het resultaat van onderzoek door vele experts. Nu eigent een bedrijf zich dat toe.

Machteloos Europa

Kunnen we dan in Vlaanderen zelf geen OpenAI oprichten? 'GPT-3 verbruikt de energie van een kleine stad', zegt Daelemans. In Vlaanderen kunnen de universiteiten hun supercomputers aan elkaar koppelen. Maar ook dan raken ze niet aan de nodige capaciteit, stelt professor Marie-Francine Moens, de directeur van het Language Intelligence & Information Retrieval Lab van de KU Leuven.

Europa dan? Jaren geleden probeerden Frankrijk en Duitsland een eigen Google-zoekrobot op te richten. Het project liep op niets uit. 'Europa produceert interessante white papers over de gevaren van AI en over ethische regels, maar investeert er te weinig in', zegt Daelemans.

Nochtans is het belangrijk dat universiteiten toegang hebben. Onder meer omdat ze oog hebben voor de ethische aspecten van AI. Ook bij GPT-3 zijn die belangrijk. Het model zou massale hoeveelheden fakenieuwsberichten kunnen maken. Ook willen universitaire onderzoekers vragen beantwoorden die commercieel niet direct iets opbrengen, zoals over de basismechanismen van de taal.

Sponsors

Maar het is niet zo dat de grote techbedrijven de universiteiten niet steunen. Ze stellen belangrijke softwarebibliotheken ter beschikking, delen onderzoek en sponsoren academische AI-congressen. 'De jongste tijd zie ik dat ze ook volop aan bod komen in de congresprogramma's', zegt Lefever. Ze leveren keynotes. AI-onderzoekers die voor Big Tech werken publiceren in toonaangevende publicaties.

De onderzoekers gaan niet enkel naar Big Tech wegens een hoger salaris. Ze krijgen er ook meer logistieke steun. En vooral: ze krijgen toegang tot zeer krachtige computers en gigantische hoeveelheden data.

Concurrentie

Moens vindt dat de academische wereld de knapste koppen moet aantrekken, maar de concurrentie wordt harder. Postdoccomputerwetenschappers moeten niet meer noodzakelijk verhuizen naar Californië als ze naar Big Tech overstappen. 'Amazon heeft een onderzoekscentrum in Aken', stelt Moens vast.

De harmonieuze samenwerking tussen universiteiten en Big Tech kan veranderen. Toonaangevende AI-modellen worden steeds groter en hebben veel data en rekencapaciteit nodig. De grote techbedrijven beseffen dat een voorsprong in AI-kennis een beslissend voordeel kan zijn. De verleiding om hun machtspositie uit te bouwen is groot.