opinie

Duolingo meets 'Les Schtroumpfs'

Professor vakgroep Wiskunde en Data Science van VUB en gespecialiseerd in wiskunde voor digitale toepassingen

Kinderen zouden meer taalkennis kunnen opdoen als we minder tv-programma's zouden dubben. Artificiële intelligentie kan helpen met automatische ondertiteling.

Een maand na de tweede release van de beeldgenerator DALL-E verrast OpenAI met alweer een nieuw machinelearningproduct. De jongste telg heet Whisper en is een meertalig open source spraakherkenningssysteem. OpenAI wil er zich tussen de Lernout en Hauspies van deze tijd mee nestelen, met name Google, Apple, Amazon en Meta.

  • De auteur
    Ann Dooms is professor bij de de vakgroep wiskunde en data science van de Vrije Universiteit Brussel. Ze is gespecialiseerd in wiskunde voor digitale toepassingen.
  • De kwestie
    Talenkennis is heel belangrijk voor kinderen. Daarom is het jammer dat zo veel tv-programma's worden gedubd.
  • Het voorstel
    Artificiële intelligentie kan hulp bieden via automatisch gegenereerde ondertiteling.

OpenAI vertrok opnieuw van een gigantische berg aan data waaruit het zijn systeem laat ‘leren’. 680.000 uren aan meertalige data in verschillende contexten moeten leiden tot een vrij accurate herkenning van accenten, achtergrondgeluiden en technisch jargon. Maar hoewel de software al tien talen begrijpt, werkt ze nog altijd het best werkt voor het Engels, geven de makers toe. Daarnaast bestaat de kans dat in de transcripties woorden voorkomen die niet uitgesproken zijn geweest omdat ze gebruikmaken van een gelijkaardige architectuur als in hun taalmodel GPT-3, waardoor woorden tegelijk voorspeld en getranscribeerd worden.

Als OpenAI geen substantiële verbetering tegenover de huidige commerciële spelers oplevert en ook nog wat last heeft van kinderziektes, wat is dan de betrachting? Wel, de makers hopen dat Whisper de basis wordt van heel wat nieuwe ‘services for the common good’. Door het systeem vrij ter beschikking te stellen willen ze automatische spraakherkenning makkelijk toegankelijk maken voor verschillende, vooral kleine actoren. Die kunnen daar dan grote volumes aan audiocommunicatie snel en toch vrij accuraat mee omzetten in tekst.

De toepassingen zijn legio: automatische transcripties van podcasts voor slechthorenden of ongeduldigen, kant-en-klare tekst bij onlinelesmateriaal waardoor een student gerichter kan zoeken naar het passende beeldfragment bij die ene onverstaanbare paragraaf in de cursustekst, audioarchieven die fijnmazig doorzoekbaar worden, enzovoort.

Na het lezen van de missionstatement kreeg ik ook zelf een grote wens. Als die werkelijkheid wordt, kan die echt wel een enorme positieve impact hebben. Mijn wens is ingegeven door mijn 10-jarige zoon, die sinds september Frans krijgt op school. Vol enthousiasme en een grote maar gezonde dosis overmoed vroeg hij om Franstalige kinderprogramma’s te kijken op televisie. Hij wilde zien hoeveel hij er al van zou begrijpen.

Een eerste ontgoocheling diende zich aan: de Vlaamse digitale tv-providers stellen de content van de andere kant van de taalgrens maar karig ter beschikking - hetzelfde geldt trouwens in de andere richting. Gelukkig bood Auvio, de RTBF-variant van VRT MAX, soelaas. Daar botsten we al snel op een tweede ontgoocheling. De tekenfilmfiguurtjes praten echt wel heel snel. Of ik niet even de Nederlandstalige ondertiteling kon aanzetten? Dat idee haalde mijn zoon bij 'Karrewiet', het jeugdjournaal van de VRT, dat eind vorig schooljaar Oekraïense ondertitels bood voor de nieuwe klasgenootjes. Na wat googelen vond ik dat ze werden voorzien door een Waregems vertaalbureau. Duur maatwerk, maar van onschatbare waarde.

Onze Engelse talenknobbel wordt elke dag gevoed via ondertiteling.

Wat als onze omroepen en tv-providers, naast gedubde versies voor de allerkleinsten, de aangekochte series in de originele taal zouden aanbieden? Ze kunnen ze voorzien van automatisch gegenereerde ondertiteling in een taal naar keuze, door Whisper te combineren met een van de intussen hoogstaande automatische vertaaldiensten zoals Google Translate en DeepL? Natuurlijk is het moeilijk zo garant te staan voor de kwaliteit. Maar een disclaimer - of eventueel een manuele review, die alleszins minder werk vraagt dan een volledig manuele transcriptie - kan dat opvangen.

Het sop is de kool zeker waard. De English Proficiency Index leert dat de Vlaming een zeer goede kennis van het Engels heeft. Dat komt waarschijnlijk omdat het dubben van series en films voor volwassenen hier geen voet aan de grond heeft gekregen, waardoor onze Engelse talenknobbel elke dag wordt gevoed via ondertiteling. Door kinder- en jeugdmateriaal te dubben blijkt de taalbeheersing wel opgeschoven in leeftijd.

Geef onze jeugd dus ook de kans om zich op deze leerrijke en tegelijk ontspannende manier een andere taal dan de moedertaal eigen te maken. Ik leg met plezier uit dat het alweer de wiskunde is die dit mogelijk maakt. Tegelijk zal ik erop hameren dat wiskunde niet belangrijker is dan talenkennis, maar dat je beide nodig hebt om een mooie en succesvolle toekomst tegemoet te gaan.

Lees verder

Gesponsorde inhoud

Gesponsorde inhoud