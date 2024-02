De video’s die AI op basis van tekst maakt, zijn een reden tot bezorgdheid voor de media en de entertainmentsector, die hun data gescrapet zien. Maar AI-bedrijven halen hun data ook elders vandaan.

Met Sora stelde OpenAI, het bedrijf achter de chatbot ChatGPT, vorige week een AI-model voor dat korte video’s genereert op basis van tekst. ‘We leren AI de fysieke wereld in beweging te begrijpen en te simuleren, met als doel modellen te trainen die mensen helpen problemen op te lossen die echte interactie met de wereld vereisen’, stond in het lanceringsbericht van OpenAI.

Omdat de video’s er zo indrukwekkend uitzien, focust iedereen in die boodschap op het aspect ‘simuleren’. Maar op de lange termijn kan ‘begrijpen’, ook al klinkt dat minder sexy, een veel belangrijkere rol spelen.

Bij het ontwikkelen van LLM’s, de taalmodellen die aan de basis liggen van AI-conversatiebots, is zowel het schalen van computerkracht als van data een grote bottleneck. Zeker de data vormen een groot probleem voor spelers als OpenAI.

Een populaire bron voor die cruciale grondstof zijn de media. Niet alle spelers zijn daar even tevreden over. CNN, The Washington Post en The Guardian hebben de toegang tot hun content al geblokkeerd voor de webcrawlers van OpenAI. Andere, zoals The New York Times, hebben rechtszaken aangespannen tegen het oneigenlijke gebruik van hun intellectueel eigendom. Nog andere hebben zich bij de situatie neergelegd en laten zich betalen voor het gebruik van hun data. Semafor sloot een deal met Microsoft en Conde Nast met Apple. De Duitse mediareus Axel Springer en het persbureau AP sloten er een met OpenAI.

Willen we duiding overlaten aan AI-platformen met een heel eigen agenda?

De relatie tussen media- en AI-bedrijven is gespannen, omdat die laatste weinig respect lijken te hebben voor copyright en intellectuele eigendom. Maar ook omdat platformen als ChatGPT onvermijdelijk verkeer van de media zullen afsnoepen. En dan hebben we het nog niet over de redacties, die door automatisering en AI-schrijvers mogelijk worden gedecimeerd.

Hoe vaak zullen lezers nog naar websites surfen als ze gewoon een vraag kunnen intikken om een antwoord te krijgen? Wat wordt de impact op de content die de kwaliteitsmedia leveren? Willen we duiding overlaten aan AI-platformen met een heel eigen agenda?

Live data

Los daarvan blijft de vraag hoe grote AI-bedrijven kwalitatieve data gaan verzamelen voor hun modellen als dat zo moeilijk en duur blijkt. Het antwoord wordt vermoedelijk: live data. Hun systemen gaan een punt bereiken waarop ze audio- en videodata van de straat en uit de huizen kunnen plukken. Onze toestellen en interfaces - camera’s in auto’s, AR-brillen, slimme deurbellen of robots - kunnen continu met ons meekijken en -luisteren.

Live data capture is niet nieuw: denk aan de beveiligingscamera’s in de straten. Maar als augmented reality (AR) en robots echt doorbreken, zal die praktijk exponentieel toenemen.

Wat heeft een AI-bedrijf zoals OpenAI nodig om daarmee aan de slag te gaan? Eén: ongelooflijk veel energie. OpenAI-topman Sam Altman investeert niet toevallig in twee energiebedrijven: Helion Energy, waarmee ook Microsoft een overeenkomst tekende, en Oklo. Twee: ongelooflijk veel rekenkracht. En, tiens, Altman is op zoek naar 7.000 miljard dollar om zelf AI-chips te kunnen ontwikkelen. En drie: modellen die 'de fysieke wereld in beweging begrijpen’.

De tekst-to-videocapaciteiten van Sora zijn maar het begin. Een speeltje. Er zijn redenen om bezorgd te zijn over de combo artificiële intelligentie (AI) en copyright: de toekomst van de media, de creatieve sector en de entertainmentindustrie. Maar het gaat veel verder: live data capturing met LLM’s zal gigantische gevolgen hebben voor de evolutie van zulke systemen en hun impact op de mens, de maatschappij en de omgeving.

Altman en co. zijn heel duidelijk over hun einddoel: artificial general intelligence (AGI). Zoals in het lanceringsbericht staat: ‘Sora dient als basis voor modellen die de echte wereld kunnen begrijpen en simuleren, een capaciteit waarvan wij geloven dat het een belangrijke mijlpaal zal zijn voor het bereiken van AGI.’