Het is woensdagavond in De Melkerij in Brasschaat als Walter Daelemans en Luc De Raedt aan tafel schuiven. Twee professoren, twee universiteiten, één onderwerp dat zich nauwelijks nog laat ontwijken. De rum staat klaar, de eerste cheers gaat de lucht in, met de typische Discours-vraag of het smen wel altijd dezelfde mop blijft. Het is Sint-blauw, dus de gastheer kan de grap nog eens vol uitdraaien. Dan begint het echte gesprek.

Daelemans is hoogleraar AI aan de Universiteit Antwerpen en cofounder van Textgain. Veertig jaar geleden, toen iedereen in zijn vakgebied nog regelgebaseerd dacht, schreef hij al pleidooien om over te schakelen naar data. Vandaag pleit De Raedt, hoogleraar AI aan de KU Leuven en verbonden aan de Zweedse Örebro University, voor het omgekeerde. Iedereen doet nu machine learning, en hij vindt het juist spannend om er weer redeneren bij te nemen. Twee Belgische zwaargewichten, twee tegengestelde banen, één tafel.

Veertig jaar geleden voor machine learning, vandaag voor het tegendeel ▶ 1:33

De vroege carrières van beide gasten zijn een mooi spiegelbeeld. De Raedt vat zijn baan kort samen.

“Ik ben eigenlijk begonnen in een reasoning groep en ik wilde altijd machine learning doen. Heel lang geleden, veertig jaar geleden ofzo, heb ik gepleit om veel meer met data interessante dingen te doen. Nu doet iedereen machine learning en ik vind het heel spannend om daar reasoning aan toe te voegen.“

Die ommekeer heeft een naam: neuro-symbolic AI. De combinatie van data leren en kennis-redeneren. “De new hype, de next wave in AI zoals ze zeggen.“ Daelemans komt uit de taalkunde en de psycholinguistiek. In de jaren tachtig schoof hij over naar artificiële intelligentie omdat daar nog werk in was. In Nederland, en al snel in heel Europa, ging hij met statistiek en machine learning toegepast op taal aan de slag. Dat is dezelfde rivier waar de huidige large language models in stromen.

“Op taalniveau zou ik zeggen is het probleem opgelost voor computationele linguistiek. Alle subtiliteiten van taal zitten erin“, aldus Daelemans.

Voor een man die zijn academische leven gewijd heeft aan precies dat probleem, klinkt dat haast als een berusting. Bij De Raedt klinkt het anders. Voor hem is het pas het begin. De volgende stap is volgens hem niet meer data of meer rekenkracht alleen, maar het inbouwen van structurele kennis. Verkeersregels, de wetten van de fysica, het soort kennis dat een mens niet uit een miljoen voorbeelden distilleert maar gewoon krijgt aangeleerd.

Wat is artificiële intelligentie eigenlijk ▶ 3:50

Voordat het over ChatGPT kan gaan, moet eerst een definitie op tafel. AI is een marketingwoord geworden, klagen beide gasten. Veel wat gewoon informatica is wordt nu AI genoemd, om commerciële redenen, want AI inside is reality. Daelemans levert een werkdefinitie. Een mens is intelligent omdat hij kan interageren met de wereld, kan waarnemen, een geheugen heeft, kan redeneren en kan leren. Een systeem dat al die eigenschappen heeft, is artificieel intelligent. De Raedt voegt onmiddellijk een onderscheid toe.

“De Tesla rijdt in een omgeving, die moet acties ondernemen. Wat ChatGPT eigenlijk veel minder moet doen. Daar is alles tekstgebaseerd, en dat is veel makkelijker.“

Een Tesla is embodied AI, AI met een lichaam. ChatGPT is dat niet. Precies die afwezigheid van zintuigen verklaart de meeste eigenaardigheden van het systeem.

Hoe ChatGPT echt werkt: woord voor woord gokken ▶ 6:09

ChatGPT doet eigenlijk hetzelfde als de tekstherkenning op je smartphone als je een sms tikt. Het systeem voorspelt het volgende woord, of preciezer nog, het volgende token, een soort lettergreep. Op basis van miljarden gelezen teksten gokt het wat statistisch het meest waarschijnlijke vervolg is. Dan stopt het die uitvoer terug in zijn invoer en gaat verder. Daelemans noemt dat autoregressie.

“Dat is er eigenlijk verantwoordelijk voor dat je de indruk krijgt dat het systeem denkt en consistent is met zichzelf.“

Indruk. Niet werkelijkheid. Het beeld dat in deze passage opduikt en de hele aflevering blijft hangen, is dat van een huis met de lichten aan en niemand binnen. Het systeem is heel deterministisch en probabilistisch tegelijk, telkens wordt gewoon het volgende token voorspeld.

Wat het indrukwekkend maakt, is de kennis die in het achtergrondmodel zit verstopt. Daelemans geeft een mooi voorbeeld. Twee zinnen uit een krant: “De energieprijzen in België zijn in 2022 fors gedaald. De koopkracht van de Vlaming is...“ Een mens vult dat aan met “erop vooruitgegaan“ of “gestegen“. Een goed taalmodel doet dat ook. Maar denk eens na wat je daarvoor moet weten. Dat de twee zinnen oorzakelijk verbonden zijn. Dat er een voltooid deelwoord moet komen. Dat Vlamingen Belgen zijn. Dat koopkracht omgekeerd evenredig is met de prijs van energie. “Dat verklaart het intelligente gedrag“, besluit Daelemans. Ergens in die representaties zit informatie over concepten als koopkracht.

De grot van Plato als analogie voor hallucinaties ▶ 12:19

Dezelfde werking verklaart waarom ChatGPT vaak overtuigend de mist in gaat. Daelemans grijpt naar een filosofisch beeld om het concreet te maken.

“Het model is zoals de grot van Plato. Het ziet alleen tekst geschreven door honderden miljoenen mensen in honderden miljoenen bronnen. Er is geen onmiddellijke interactie. Er zit fictie in, programmeercode, nieuws, Wikipedia. Hoe weet zo'n model nu wat er echt is en wat er bedacht is?“

De Raedt vult het aan met een herkenbaar voorbeeld dat hij regelmatig demonstreert in zijn lessen.

“Als je het cv van Walter zou opvragen aan ChatGPT, zal het waarschijnlijk beginnen in Antwerpen, maar na een tijdje zal het naar Stanford en MIT gaan. Dat is een klassieker.“

De gastheren lachen, maar de implicatie is ernstig. Hallucinaties zijn geen fout in de programmering die later wel gefixt wordt. Ze zijn een logisch gevolg van wat het model is. Een tekstmachine zonder venster op de werkelijkheid die enkel het volgende woord wil voorspellen. Wanneer het de informatie niet vindt, gaat het iets bedenken dat goed past binnen het patroon. En precies dat is het probleem.

“De fouten zouden niet zo vervelend zijn als ze niet zo overtuigend correct zouden zijn“, zegt De Raedt.

Daelemans illustreert het met een vroeger voorbeeld. Wie ooit met Google Translate werkte zag onmiddellijk wanneer een zin slecht vertaald was. De fout was zichtbaar. Vandaag kan een ChatGPT-uitvoer een heel subtiele fout bevatten waar je probleemloos overheen leest. Een kilogram in plaats van een gram, bijvoorbeeld. Bij een medische bijsluiter is dat verschil niet bepaald triviaal. “Neem nu één kilogram dafalgan, dan hebben we problemen.“

Intelligent gedrag, geen bewustzijn ▶ 13:52

Hier komt het eerste duidelijke meningsverschil naar boven. De Raedt vindt dat ChatGPT op de meest belangrijke maatstaven, het redeneren met garanties, faalt.

“ChatGPT biedt zeker geen garanties. Alleen mensen kunnen nog garanties bieden. Die chatbots doen dat eigenlijk niet, en daardoor gaat het ook vaak de mist in.“

Daelemans verdedigt het systeem op een andere lijn. Hij heeft bezwaar tegen de filosofische gewoonte om bewustzijn, emoties en intelligentie op één hoop te gooien.

“Ik blijf erbij dat het wel intelligent gedrag is volgens elke mogelijke definitie van intelligentie. Alleen wat mensen tot hier toe altijd gedaan hebben, is dat allemaal als één concept beschouwen. Uiteraard zit er geen bewustzijn in, uiteraard zit daar geen emoties in. Maar er zit wel intelligent gedrag in, probleemoplossend gedrag.“

De Raedt nuanceert. Voor hem is intelligent gedrag niet genoeg, hij wil iets anders. Hij grijpt naar Star Trek voor de metafoor.

“Ik wil dat een artificieel intelligente agent de intelligentie van Mister Spock uit Star Trek heeft. Die geeft altijd correcte afleidingen, die weet wanneer hij fout zit. Een mens is niet altijd rationeel, niet altijd objectief, en kan die garanties niet bieden. ChatGPT biedt zeker die garanties niet.“

In die wrijving wordt het verschil tussen beide onderzoeksprogramma's zichtbaar. Daelemans de pragmaticus, voor wie wat werkt al een hoop is. De Raedt de neuro-symbolicus, die het ideaal van de feilbare-vrije machine niet wil opgeven, maar dan via een andere weg dan dataschaal.

Hoe ChatGPT pas echt bruikbaar werd ▶ 16:11

Daelemans vertelt waarom GPT-3 nog niet echt aansloeg. Het was moeilijk om mee te werken. De doorbraak kwam pas met ChatGPT, en die was niet vooral technisch.

“Het is pas vanaf ChatGPT dat het echt bruikbaar werd. Waarom? Omdat ze daar menselijke kennis in gestopt hebben. Goede dialogen als trainingsmateriaal en mensen die beslisten welke van twee outputs het beste was.“

Die techniek heet reinforcement learning by human feedback. Ze maakte van een ruwe tekstgenerator een gespreksbot die kan helpen, ondersteunen en weigeren, maar ze zorgde ook voor een nieuw probleem. Het basismodel achter ChatGPT, het lange-termijn-geheugen van het systeem, is voor onderzoekers onbereikbaar geworden. Wat ChatGPT echt zou zeggen zonder die menselijke filter, weten we niet meer. Alle seksisme en racisme wordt eruit gehaald door die reinforcement learning, dus je weet niet wat er echt in het model zit. Beide onderzoekers vinden dat een academisch probleem. Voor open source modellen zoals Llama, dankzij Mark Zuckerberg, is dat tot op zekere hoogte wel mogelijk, mits je over verschrikkelijke rekenkracht beschikt.

Patroonherkenning tot in de geneeskunde ▶ 18:29

Het gesprek schuift naar toepassingen waar AI minder spectaculair maar veel concreter resultaat boekt. De medische beeldverwerking.

“In de medische wereld is er een enorme revolutie aan de gang. Al die medische beelden waar lang moet gezocht worden naar interessante plekken, naar bepaalde patronen, daar is AI gewoon veel beter in.“

Maar zelfs hier is het nog altijd patroonherkenning, geen redeneren, geen begrip. Buiten de beelden is er veel andere kennis: de voorgeschiedenis van de patiënt en die van de ouders. De arts blijft het laatste woord houden. Volgens De Raedt is de revolutie geen jobverlies maar een verschuiving. Hij geeft het voorbeeld van de radiologen. Voorspellingen tien jaar geleden hadden effect op de specialisatiekeuzes van Amerikaanse artsen, maar in werkelijkheid creëert beter werkende technologie net meer vraag. “Er is meer radiologievraag, en de radiologen kunnen zich bezighouden met de dingen die ze interessanter vinden.“

Waarom Europa de race verliest ▶ 27:46

De gastheren stellen de geopolitieke vraag. Kan AI Europa terugbrengen in de race? De Raedt bekijkt het nuchter.

“De volgende industriële revolutie wordt nu uitgevochten tussen werelddelen. Het oosten tegen het westen. Europa zit er altijd wat tussen, wil altijd ethischer zijn, meer regels opleggen. Er zit heel goede AI in Europa, maar de massale investeringen die in de VS, UK en China gebeuren krijgen we hier niet.“

Dan komt het ene cijfer dat het hele gesprek samenvat. OpenAI heeft 6 miljard opgehaald in één ronde. Daar kan je al wat mee doen, denkt De Raedt. Een bedrag dat in Europa voor één bedrijf moeilijk denkbaar is. En het schaalvoordeel is moeilijk in te halen. De rekenkracht van de huidige modellen is letterlijk een functie van de wet van Moore, de verdubbeling per anderhalf jaar. “Stel je nu voor dat je nog drie of vier verdubbelingen rekenkracht meer hebt“, zegt Daelemans. “Dan zitten we sowieso zonder data en moeten we destillatie krijgen van kennis uit die data dankzij die rekenkracht.“ Als die destillatie werkelijkheid wordt, wordt de schaalkloof tussen continenten alleen maar groter.

De AI Act remt het Europese onderzoek af ▶ 30:06

De Europese AI Act, in 2024 goedgekeurd, kent vier risicocategorieën. Verboden, hoog risico, beperkt risico, minimaal risico. De Raedt heeft daar een fundamenteel bezwaar tegen.

“Emotiedetectie zit in de gevaarlijke zone, waar geen producten gemaakt mogen worden. Maar onderzoek mag wel. Het probleem is dat het meeste echte onderzoek juist gebeurt nadat de onderzoeksfase verlaten wordt.“

Het voorbeeld bijt. Daelemans en De Raedt kunnen aan een Belgische universiteit emotiedetectie blijven onderzoeken, maar het naar een product brengen mag niet. Het Amerikaanse, Britse of Chinese laboratorium kent die rem niet en zal binnen enkele jaren verder staan. Daelemans bedenkt waar emotiedetectie wel waardevol zou kunnen zijn. In een klas zien wie verward is en die leerling extra oefeningen geven, of opmerken wanneer iemand slecht in zijn vel zit. Of de samenleving dat ook zou willen, is een tweede vraag, vindt hij. Maar de keuze van de Europese regelgever om de discussie te blokkeren door het product te verbieden, vinden beide onderzoekers te abrupt. De regulering komt te vroeg, want er is nog helemaal geen AI die echt gevaarlijk is, vindt De Raedt. Er zouden toch wat regels mogen zijn.

De Raedt richt zijn pijlen vooral op één tussenstap die volgens hem te makkelijk gepasseerd is.

“Het ene jaar zegt OpenAI: we gaan het niet publiek beschikbaar maken want je kan er veel te veel mee doen, we zijn nonprofit. Een jaar later is het: do whatever you want, zonder enige waarschuwing aan de maatschappij. Dat is iets te makkelijk.“

Kijk maar naar het effect op het onderwijs. Universiteiten over het hele continent moeten het opzet van masterproeven en bachelorproeven herdenken. Bij ingenieursfaculteiten heb je nog geluk omwege de technische component. Bij de humanities is het veel moeilijker om het verschil te zien tussen een tekst geschreven met behulp van ChatGPT en eentje die niet zo geschreven is.

De productiviteitsverdubbeling die niemand bestrijdt ▶ 33:09

Ondanks alle kritiek is er één gebied waar Daelemans en De Raedt het ongeclausuleerd eens zijn. ChatGPT verdubbelt de productiviteit van wie het slim gebruikt. De Raedt vertelt dat zijn eigen werkdag is verdubbeld dankzij ChatGPT. Programmeerproblemen lossen sneller op, related research gaat vlotter. Hij wijst op de o1-preview, het redeneermodel van OpenAI dat in oktober 2024 net beschikbaar werd, op niveau van phd's.

“Het zijn alleen de experts die deze modellen productief zullen kunnen gebruiken. Dat stelt mij gerust dat we nog altijd studenten gaan moeten opleiden om expert te worden“, aldus De Raedt.

Daelemans deelt het beeld maar voegt een existentiële wending toe.

“Soms heb ik wel schrik dat de twee dingen die ik het liefste doe, programmeren en schrijven, dat die binnen 10 jaar of 15 jaar niet meer naar waarde geschat gaan worden.“

Het is een eerlijke bekentenis van een professor die er met zijn neus bovenop zit. Maar zelfs hij relativeert. Veel van wat wij als mensen schrijven en coderen is boilerplate, niet echt creatief. Op het gebied van echte creativiteit zijn we nog altijd de enige die het kunnen.

“Het is het feit dat er niemand thuis is. Er is niet echt een wil om creatief te zijn, om iets te scheppen, om iets te creëren. En dat heb je juist nodig om goede poëzie te genereren, om goede scenario's te genereren. Daar heb je die emotie, dat bewustzijn, die agency, die intenties voor nodig.“

Wordt onze IQ gewoon lichtjes minder ▶ 40:07

De gastheer brengt een ongemakkelijke vraag. Vroeger leerden mensen hoofdrekenen op pen en papier. Nu loopt alles via de gsm en de rekenmachine, en een stuk van het wiskundig inzicht dreigt verloren te gaan. Wat als ChatGPT hetzelfde doet met taal? Daelemans deelt de zorg.

“Als je niet zelf tot conclusies komt, dan plak je iets in je hersenen zonder dat het is geïntegreerd. Daar zit toch een gevaar in als we geen voldoende parate kennis meer hebben om het juiste kritisch vermogen te kunnen toepassen.“

Met onvoldoende parate kennis kan je geen kritische vragen meer stellen, en je kan ook van ChatGPT niet verwachten dat het voor jou een kritische vraag stelt die jij zelf niet kan verzinnen. Dan worden we volgens Daelemans een eenheidsworst. Is het IQ al gezakt over de afgelopen veertig jaar, drijft de gastheer door? Daelemans denkt van wel, drie punten ofzo. De Raedt schuift het iets voorzichtiger weg. Het hangt sterk af van wat een IQ-test meet. “De echte cognitieve vaardigheden zijn analogieën trekken, problemen waarnemen, vragen stellen. Daarbij helpen taalmodellen juist om sneller goede vragen te stellen.“ Twee onderzoekers, twee allebei mogelijk correcte antwoorden op hetzelfde verschijnsel.

Robots, vaatwassers en het einde van de bediende ▶ 44:15

Van IQ-discussies schuift het gesprek naar de arbeidsmarkt. De vorige industriële revoluties troffen vooral handarbeid. Deze revolutie treft net het bureauwerk en het routinewerk van bedienden. De elektriciën met zijn plannen, manipulaties en complexe ruimtelijke kennis is voorlopig veiliger dan een logo-ontwerper.

“Er zijn geen technische beperkingen om dat mogelijk te maken. Je zou een geheugen kunnen inbouwen in ChatGPT, en een ChatGPT-achtig model in een robot. Op die manier kan die wel bijleren“, zegt Daelemans.

Maar hij gelooft niet dat het binnen tien jaar werkelijkheid wordt. Tussen de demo's van Tesla en de echte robot die de vaatwasser kan inruimen zonder een glas te breken, ligt nog veel werk. De Raedt is iets optimistischer over praktische toepassingen.

“Robotverplegers en robotchirurgen, dat soort dingen gaat nog heel sterk uitbreiden.“

In de VS zijn er vier miljoen taxichauffeurs en vijftien miljoen mensen die een voertuig besturen. Als zelfrijdende technologie volledig functioneel wordt, vinden die mensen een andere baan. En dat kan misschien tekorten opvangen. In Europa is er permanent een tekort van ongeveer 50.000 vrachtwagenchauffeurs. De productiviteitsstijging zou bovendien deels het effect kunnen opvangen van de Europese demografische krimp. Dat soort scenario is moeilijk te voorspellen, geeft De Raedt toe.

Het bewustzijn van de machine, de laatste vraag ▶ 1:01:12

Uiteindelijk komt de oude vraag. Krijgt AI ooit een vorm van bewustzijn en kan ze de mens overrulen? Daelemans gaat er recht op af.

“Er is maar één ding dat ChatGPT en al die modellen willen, en dat is het volgende woord voorspellen. Daar zie ik geen zelfbewustzijn uit ontstaan.“

De gastheer duwt tegen. De mens is in general toch ook niet altijd positief, er zit een narcistisch en destructief kantje aan. Het antwoord van Daelemans is misschien wel de scherpste formulering van de aflevering.

“De mens heeft een andere optimalisatiefunctie. Wij zijn niet getraind om het volgende woord te voorspellen. Wij zijn getraind om ons voort te planten, macht te verzamelen, een carrière te maken. Als je die dingen in AI-modellen zou stoppen, wie weet wat er dan gebeurt.“

De Raedt sluit zich er volledig bij aan en vraagt zich ook af of het wenselijk is om die soort machines die hand te zetten. Geen sciencefiction dus. Wat wel kan, is misbruik. Een gehackt Tesla-systeem dat crashes uitvoert. Telefoons die ontploffen. Maar saboteren en hacken heeft niks met AI te maken, dat is oude technologie.

De doom-profeten en de hype-machine ▶ 1:05:47

De Raedt sluit af met een schop tegen de mediastorm. Hij vertelt het verhaal van een befaamd “AI praat in eigen taal“-incident op Facebook. Twee bots aan elkaar gezet voor een onderhandelingsspel, de wetenschappers laten de taal los zodat de bots een eigen patroon ontwikkelen. Niet interessant, ze schakelen het uit. Maar een techblog pikt het op, dan de mainstream media, dan de tabloids. Op een bepaald moment krijgt iemand een telefoontje of hij uitleg wil komen geven bij “het incident op Facebook, alsof er een kerncentrale ontploft is.“ De realiteit was gewoon iets oninteressant.

“Ik snap niet dat mensen als Geoffrey Hinton meedraaien in die angstpsychose dat AI ons gaat overnemen.“

De bedrijven helpen die hype mee in stand te houden, want AI in de pitch van een startup betekent funding. ChatGPT is geen Terminator, maar het is ook niet zomaar een autocomplete. Het is een werkbare assistent voor wie er goed mee om kan, en een potentiële verdoving voor wie er niet kritisch mee omspringt.

Twee gesprekspartners, één bevinding ▶ 1:08:05

Het licht in De Melkerij begint uit te vallen, het natuurlijke teken dat het tijd is om af te ronden. Wat zijn de echte verschillen tussen Daelemans en De Raedt geweest? Beide vinden de doomscenario's onnodig dramatisch en beide vinden dat Europa zich zorgen mag maken over de schaalkloof. Maar daar waar Daelemans tevreden is met intelligent gedrag dat bruikbaar is, blijft De Raedt mikken op de Mister Spock-machine die garanties biedt en haar redeneringen kan uitleggen. Daar waar Daelemans soms berust in dat het taalprobleem opgelost is, ziet De Raedt de oplossing pas opdagen wanneer kennis erbij komt. Daelemans gelooft dat creativiteit het laatste reservaat van de mens blijft. De Raedt ziet de robotchirurg al voor zich.

Wat allebei zeggen is dat de echte gevaren niet de machine zijn maar de mens. De foute persoon aan het roer van OpenAI, het beleid dat een dom besluit doorvoert, de hacker die scale economics uitbuit. AI als spiegel van wie haar inzet. Het is een bevinding die samenvalt met de Discours-missie: praat met elkaar, vertrouw, neem dialoog serieus genoeg om bereid te zijn er kennis van te nemen. Niet omdat het een doel is, maar omdat het de manier is waarop we kunnen weten of we ergens met iets bezig zijn dat werkt of net niet. Voor wie hier voor het eerst van hoort klinkt het misschien als een gemeenplaats. Voor wie net een uur lang in de neuro-symbolische wereld heeft gezeten, is het de meest concrete conclusie van een avond denken.