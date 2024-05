De race om de koploper te worden in artificiële intelligentie is in volle gang. Wie het haalt, daar hebben we als gebruikers allemaal een stem in.

Artificiële intelligentie ontwikkelt zich sinds enkele jaren pijlsnel en de concurrentie tussen taalmodellen is moordend. In populariteit wint GPT-4 van OpenAI - bij het brede publiek bekend van de chatbot ChatGPT - voorlopig het pleit. Maar naast OpenAI bieden nog tal van spelers modellen aan, die ze soms volledig gratis openbaar maken. In de voorbije maand stelden onder andere Cohere en Meta nieuwe modellen open die recente varianten van OpenAI aftroeven. Toch slaagt geen enkele AI-bouwer er vooralsnog in helemaal de leiding te nemen.

Jeroen Van Hautte is medeoprichter en technisch directeur van de AI-start-up TechWolf.

De data komen vooral voort uit de activiteit van de gebruikers. We hebben door ons gebruik dus allemaal een stem in wie zal winnen.

De hevige concurrentie leidt tot modellen die niet alleen waardevoller, maar ook goedkoper dan ooit te gebruiken zijn. Om op kop te blijven in de race investeren techbedrijven nochtans waanzinnige bedragen, die gaan naar de aankoop of de huur van supercomputers om modellen te trainen en naar de verloning van peperdure ingenieurs. Voor OpenAI, Microsoft, Meta en Google lopen de investeringen vlot in de miljarden.

Verdienmodel blijft uit

Hoe die investeringen precies terugverdiend kunnen worden, is nog niet echt duidelijk. Beleggers straften onlangs nog de plannen van Meta af toen bleek dat AI de komende jaren vooral veel geld zal kosten en nog geen concreet verdienmodel klaarligt. Voorlopig kan vooral wie servers aan AI-bedrijven verhuurt munt slaan uit de AI-race.

Zolang iemand een gratis AI-model aanbiedt dat even capabel is als betalende opties, blijft een aantrekkelijk verdienmodel wellicht uit. Het is dus zaak het sterkste model te bouwen.

Daarvoor bestaan twee mogelijkheden: een sterker leeralgoritme of een betere dataset. De eerste optie biedt weinig echt concurrentievoordeel en innovaties verspreiden zich snel door de sector. Wie wil winnen, heeft dus meer en betere data nodig dan de concurrenten.

Zelfversterkende cyclus

Waar zijn die data te vinden? Ze komen in de eerste plaats voort uit de activiteit van gebruikers zelf. Iets gelijkaardigs zagen we eerder bij zoekmachines. De stroom gebruiksdata die naar Google gaat, is zo groot dat andere zoekmachines blijven achterophinken in de kwaliteit die ze kunnen leveren. Dat gaf Microsoft-CEO Satya Nadella vorig jaar zelf toe, wat opmerkelijk is omdat de techreus met Bing een eigen zoekmachine in huis heeft.

Zo ontstaat een zelfversterkende cyclus: omdat gebruikers systematisch de voorkeur geven aan de beste dienst trekt het product nog meer data aan, wat de kwaliteit nog meer opkrikt.

De ongeziene stroom van interactie tussen gebruikers en AI kan Meta helpen een beslissende voorsprong te nemen in de AI-race.

Een soortgelijke cyclus komt bij grote AI-modellen stilaan op gang. Wie als eerste kan kapitaliseren op gebruiksdata, maakt kans een (bijna-)monopolie uit te bouwen.

OpenAI verzamelt al even gebruikersdata. De vele gesprekken die we met zijn allen met ChatGPT voeren, worden gebruikt om nieuwe en betere modellen te bouwen. Met elk ChatGPT-berichtje stuwen we OpenAI iets verder vooruit.

Maar Meta zet de achtervolging in met een AI-assistent in zijn apps WhatsApp, Instagram en Facebook, wat het model in handen van meer dan 3 miljard dagelijkse gebruikers geeft. De ongeziene stroom van interactie tussen die gebruikers en AI waarin dat resulteert, kan Meta helpen een beslissende voorsprong te nemen in de AI-race.