De Professor Die ChatGPT Door Heeft

In de Melkerij van Brasschaat schenkt Tijl De Bie, professor data-wetenschappen en artificiële intelligentie aan de UGent, zich een glas rode wijn in. Buiten valt de avond, binnen zoemt de conversatie op gang over algoritmes, discriminatie en de toekomst van de mensheid. De Bie, die ooit van kwantumfysica naar AI overstapte omdat hij “onmiddellijker impact“ wilde, kijkt met een scherpe blik naar de huidige AI-hype. “ChatGPT is geen rocket science,“ zegt hij nuchter. “Het is eigenlijk gewoon combinaties van data in combinatie met de pure kracht van enorm veel data.“

"Het spreekt gewoon zinnetjes uit zoals mensen dat doen" ▶ 1:00

De Bie is onder de indruk van ChatGPT, maar niet om de redenen die je zou verwachten. “Ik ben onder de indruk van hoe goed het werkt ondanks het feit dat het eigenlijk niet echt rocket science is,“ legt hij uit terwijl hij zijn glas ronddraait. Het probleem zit hem in wat de meeste mensen over het hoofd zien: ChatGPT is een taalmodel, geen kennisbank.

“Het is eigenlijk gewoon een taalmodel dus het zegt dingen zoals mensen dingen zeggen, maar of dat realiteit is, dat is niet helemaal gezegd.“

Die fundamentele beperking wordt volgens De Bie gemaskeerd door perfecte verpakking. Waar Google je links geeft die je zelf moet beoordelen, presenteert ChatGPT informatie in “mooie vormgegeven tekst“ - precies zoals mensen informatie het liefst consumeren. Maar die elegante presentatie verhult een cruciaal gebrek: “Het redeneert helemaal niet, het spreekt gewoon eigenlijk een beetje zinnetjes uit zoals mensen zinnetjes uitspreken, maar dan niet geworteld in feiten.“

Waarom mainstream fake news het gevaarlijkst is ▶ 6:20

Het gesprek neemt een donkere wending wanneer De Bie het concept “mainstream fake news“ introduceert. OpenAI en andere bedrijven geven natuurlijk meer gewicht aan Wikipedia dan aan obscure websites, maar daar schuilt een pervers gevaar.

“Als er dan een bepaald idee leeft dat mainstream is maar misschien achteraf gezien fout blijkt te zijn, zit dat wel ingebakken in de data maar dan is het ook heel moeilijk om het eruit te krijgen.“

Lobotomieën waren ooit mainstream medische praktijk. Racistische theorieën stonden in respectabele wetenschappelijke tijdschriften. Die historische “waarheden“ zitten nu verweven in de trainingsdata van AI-systemen, onzichtbaar maar invloedrijk. De professor wijst op de paradox: individuele nepnieuwsberichten kun je filteren, maar maatschappelijke denkfouten die generaties lang als waarheid golden? Die zitten diep ingebakken.

Het missing ingredient dat AI echt intelligent zou maken ▶ 7:45

“Reasoning,“ zegt De Bie beslist. “Dat is wat ontbreekt.“ Hij legt uit hoe AI-systemen in het verleden werkten met expertsystemen - regels en logica die stap voor stap redeneerden zoals mensen dat doen. Machine learning doet het tegenovergestelde: het herkent patronen zonder te begrijpen waarom.

“Het is niet zo gemakkelijk om daar reasoning in te brengen, voornamelijk omdat de manier waarop die taalmodellen getraind worden met een techniek die niet verenigbaar is.“

De architectuur van moderne taalmodellen - die diepe neurale netwerken die getraind worden met “gradient descent“ - is simpelweg incompatibel met logisch redeneren. Het is alsof je probeert een motor in een zeilboot te stoppen: technisch misschien mogelijk, maar niet waar het voor ontworpen is. Tesla's zelfrijdende auto's combineren wel beide: machine learning voor beeldherkenning, reasoning voor beslissingen nemen.

"Ik kijk er persoonlijk niet naar uit" ▶ 11:20

Wanneer het gesprek robotica raakt, wordt De Bie ongemakkelijk. “Ik denk dat de kans wel bestaat dat ChatGPT in een robot steken en misschien wel schattig uitziet,“ zegt hij. “Ik kijk er persoonlijk niet naar uit.“

Het is een zeldzaam emotioneel moment van de anders zo analytische professor. Hij erkent de filosofische complexiteit - zijn mensen meer dan complexe machines? - maar weigert de romantische AI-visie te omarmen. Als het op emoties in machines aankomt, is zijn antwoord kort: “Nee, als je een ja-nee antwoord wilt.“

De reden waarom De Bie deze ontwikkelingen niet actief volgt, is praktisch: “Er zijn al heel veel mensen die dat doen en de tweede reden is: het is enorm duur om dat soort onderzoek te doen want de data daarvoor nodig hebt is gigantisch.“ Universiteiten kunnen simpelweg niet concurreren met Google en Facebook op het gebied van grote taalmodellen.

Het objectieveren van discriminatie ▶ 13:28

In plaats daarvan richt De Bie zich op wat hij de “gevaren van AI“ noemt: bias, discriminatie, privacy. Maar hij benadert dit met de koele logica van een data-wetenschapper. “Discriminatie is heel vaak een gevolg van uiteindelijk een soort emotionele reactie op basis van iets wat je ziet waar eigenlijk geen directe correlatie mee ligt.“

Hij geeft een confronterend voorbeeld uit zijn eigen vakgebied. In België studeren veel minder vrouwen exacte wetenschappen dan mannen. In Israël is de verdeling fifty-fifty. “Hoe komt dat? Ik denk dat dat niet is door discriminatie, ook niet in België. Ik denk dat dat puur cultureel gegroeid is.“

“Het probleem is dat discriminatie eigenlijk historisch is gegroeid, dus heel veel data die we nu zien, dat is historisch gekleurd.“

Maar hier wordt het interessant: als je een AI-systeem traint op Belgische data zonder correctie, gaat het vrouwen systematisch afraden om exacte wetenschappen te studeren. Niet uit kwade bedoelingen, maar omdat het historische patronen reproduceert. De oplossing is niet data negeren, maar bewust compenseren.

Waarom AI discriminatie juist zichtbaarder maakt ▶ 16:08

De Bie ziet een paradoxaal voordeel in AI-discriminatie: het maakt onbewuste vooroordelen meetbaar. “Tot nu toe waren die keuzes onbewust gemaakt door het buikgevoel van de individuele die die keuzes maakte. In de toekomst zijn het ontwikkelaars van AI die de vraag krijgen: Wat moet ik doen?“

“Het is gemakkelijker voor mensen om een AI-systeem daar op een bepaalde manier te laten compenseren dan om mensen te gaan hertrainen.“

Een VDAB-medewerker die onbewust vrouwen naar zorgberoepen stuurt, is moeilijk bij te sturen. Een algoritme dat hetzelfde doet, kun je aanpassen. “Als je puur observeert van realiteit maar als AI-systeem niet compenseert voor bias, gaat het typisch die bias amplificeren.“

Het wordt nog complexer: wie beslist wat eerlijke compensatie is? Is de Belgische of de Israëlische situatie “normaler“? De Bie gooit de bal terug naar de politiek: “Dat is een maatschappelijke vraag, dat is geen vraag waar mensen die bij AI onderzoek doen mee bezig moeten zijn.“

"Er gaat ook een moment komen dat we die vragen niet meer beantwoord krijgen" ▶ 24:48

Europa werkt aan AI-regelgeving die discriminatie, transparantie en privacy moet waarborgen in “high-risk areas“ zoals financiën, verzekeringen en gezondheidszorg. De Bie vindt het een goede zaak, maar waarschuwt: “Er gaat ook een moment komen dat we die vragen ook niet meer beantwoord krijgen want je hebt zoveel niveaus van bias waar je nog niet eens bewust van bent.“

“Nu gaat alles zodanig snel in het onderzoek en ontwikkeling en het wordt gewoon op de markt gegooid. We moeten een beetje meer nadenken naar de toekomst kijken.“

Hij schetst een dystopisch beeld van Facebook's metaverse: “Het idee dat iedereen met een VR-bril in de zetel thuis eigenlijk kan leven waar die wil.“ Wat als die “vrienden“ in de virtuele wereld bots zijn die eruitzien en praten zoals ChatGPT? “Wij zijn niet geëvolueerd in zo'n omstandigheden. Wat zou het gevolg daarvan zijn?“

De suggestie die gevaarlijker is dan de beslissing ▶ 29:49

Een van De Bie's scherpste inzichten gaat over de grijze zone tussen mens en machine. Europese regelgeving vereist “human oversight“ - mensen moeten uiteindelijk beslissen. Maar De Bie ziet het gevaar van de cultuur die daaruit ontstaat.

“Er zit eigenlijk zo'n gevaar dat het wordt eigenlijk een soort van overgangszone waarin dat geen beslissingen neemt maar eigenlijk impliciet al wel doet.“

Mensen worden “arbeidsrobots“ die automatisch akkoord gaan met AI-suggesties. De psychologie werkt tegen ons: als een “objectief“ systeem iets voorstelt, voelen we ons dom als we het tegenspreken. “Een cultuur waarin we automatisch akkoord gaan met AI, dat is gevaarlijker dan expliciate AI-beslissingen waar we harder over nadenken.“

Gezichtsherkenning wordt verboden, maar wat nog meer? ▶ 34:36

De Bie gelooft dat bepaalde AI-toepassingen gestopt kunnen worden. “Gezichtsherkenning gaat verboden zijn als ik het goed herinner“ in Europa. Maar hij heeft gemengde gevoelens over verboden: “Ik ben niet de persoon die van nature voorstander is van verbieden wat dan ook.“

Het fundamentele probleem blijft: “We zijn iets aan het ontwikkelen dat op bepaalde vlakken gewoon verder staat als wat wij letterlijk fysiek mentaal aan kunnen. Dat is gewoon iets dat slimmer is.“ Zijn vergelijking is confronterend: “Het is zoals een tijger in gevangenschap - dat is fysiek sterker dan u, maar er zijn wel maatregelen: verdovingsmiddelen, hekken. Die AI moet eigenlijk ook een soort van controle-orgaan hebben.“

Waarom transparantie een illusie is ▶ 37:47

“Die huidige machine learning taalmodellen die zijn enorm niet transparant,“ stelt De Bie. “Niemand begrijpt dat eigenlijk, zelfs de programmeur kan dat lezen maar dat is voor eindgebruikers totaal ontoegankelijk.“

Europa eist transparantie, maar De Bie legt het dilemma bloot: een goede uitleg voor de ene persoon is geen uitleg voor iemand anders. Erger nog:

“De uitleg kan misbruikt worden. Je kunt een uitleg als excuus geven voor een bepaalde beslissing terwijl je eigenlijk niets meer kunt doen.“

Een bank die een lening weigert, kan straks een AI-uitleg geven die de schuld legt bij onveranderbare eigenschappen van de aanvrager. Of bij veranderbare factoren waarmee ze de persoon een bepaalde richting opsturen: “Haal een ander diploma, krijg een betere job, dan kun je wel een lening krijgen.“

"Privacy is een gemeengoed dat iedereen opgeeft" ▶ 44:28

De privacy-discussie brengt De Bie bij zijn meest technische punt: “differential privacy“, het paradigma dat grote techbedrijven gebruiken om privacy te beloven terwijl ze data verzamelen.

Het principe klinkt waterdicht: Apple voegt “ruis“ toe aan je data voordat het naar hun servers gaat. Zo kunnen ze niet zien of jouw specifieke data erin zit of niet. Maar als iedereen dat doet, middelt die ruis zich uit en heeft Apple alsnog een gigantische databank.

“Privacy is een soort van gemeengoed en iedereen geeft zijn privacy op omdat de rest het toch al heeft opgegeven. Dat is een beetje de tragedy of the commons.“

De Bie werkt aan een alternatief framework dat meer informatietheoretisch is, maar erkent dat het nog niet praktisch toepasbaar is. Het punt blijft: differential privacy klinkt goed in marketingtermen, maar biedt vooral individuele bescherming terwijl groepspatronen zichtbaar blijven.

De data die ontbreekt is belangrijker dan de data die er is ▶ 51:29

Het gesprek zweeft naar Corona, waar De Bie als hobbyproject een kritische stem werd. “Ik volg heel vaak eigenlijk meer naar de data die ontbreekt dan naar de data die er wel is,“ verklaart hij zijn aanpak.

In januari 2022 publiceerde hij met anderen het “Wintermanifest“, een pleidooi voor breder coronabeleid. Ironisch genoeg kwam het uit net toen dramatische cijfers over mentale gezondheid bij jongeren werden gepubliceerd. “Dan was dat één dag een item op het vrijdagavondjournaal, en daarna weer terug naar de dagelijkse covidcijfers.“

“Het is niet omdat data beschikbaar is dat we alleen maar rekening moeten houden met die data. We moeten ook assumpties maken en die ontbrekende data toch aanvullen.“

"Dit was geen virologische crisis" ▶ 53:25

De Bie's analyse van het coronabeleid is genadeloos maar respectvol. Het probleem was niet de expertise van virologen en infectiologen, maar hun dominantie in een complexe maatschappelijke crisis.

“Dit was geen virologische crisis, het was een maatschappelijke crisis en zelfs meer dan een gezondheidscrisis was het ook een onderwijskundige crisis.“

Die experts deden wat ze konden binnen hun vakgebied, maar: “Het is niet aan een infectioloog om al die informatie te aggregeren en te vertalen naar een globaal advies voor de overheid. Dat zijn mensen die bezig zijn met risicomanagement.“

De cognitieve biases die hij bij AI bestudeert, herkende hij in het coronabeleid: tunnelvisie, beschikbaarheidsheuristiek, groepsdenken. “Er zijn technieken om die te doorbreken. Performante bedrijven hebben processen om groepsdenken tegen te gaan. Die zijn niet gebruikt natuurlijk tijdens het coronabeleid, jammer genoeg.“

Waarom Zweden het beter deed (en België faalde) ▶ 1:07:15

“Zweden heeft zich wel gehouden aan de pandemieplannen en dat heeft eigenlijk goed voor hen uitgepakt omdat die waren doordacht op een moment dat het geen acute situatie was,“ legt De Bie uit.

België had in 2007 ook pandemieplannen, maar: “Die moesten onderhouden worden volgens dat plan zelf, maar die zijn niet onderhouden. Je kunt ze nog terugvinden met de internet Time Machine.“ Typisch België: plannen maken, vergeten te onderhouden, in crisis improviseren.

“In 2007 hadden wij pandemieplannen, die moesten onderhouden worden volgens dat plan zelf maar die zijn niet onderhouden.“

De Zweedse plannen waren ook niet perfect - ze hielden geen rekening met de maatschappelijke verstoring van een langdurige pandemie. Maar ze waren tenminste gemaakt “op een moment dat mensen objectief konden nadenken over de trade-offs tussen verschillende domeinen van het leven.“

"Welke data is er niet?" ▶ 1:25:45

Als De Bie één vraag zou mogen stellen bij elk data-project, is het deze: “Welke data is er niet, dat is een heel belangrijke vraag om te stellen. Hoe kan ik dat opvangen en hoe kan ik daar toch nog altijd rekening mee houden?“

Het is de vraag die hij zelf bij Corona stelde, die hij bij AI-discriminatie stelt, die hij bij privacy-modellen stelt. Data die er is, vertelt een verhaal. Data die ontbreekt, vertelt vaak een belangrijker verhaal.

In de Melkerij is het intussen stil geworden. De rode wijn is op, de analyse compleet. Tijl De Bie heeft in twee uur tijd de mooie verhalen rond AI ontmanteld en de werkelijke uitdagingen blootgelegd. Niet de sciencefiction van robots die de wereld overnemen, maar de veel subtielere realiteit van algoritmes die onze vooroordelen versterken, beslissingen voor ons nemen zonder dat we het doorhebben, en complexity creëren die onze cognitieve capaciteiten overstijgt.

Het is de missie van Discours om deze complexe gesprekken toegankelijk te maken zonder de nuance te verliezen. In De Bie vonden ze de ideale gast: iemand die de technologie begrijpt, de gevaren erkent, en de moed heeft om te zeggen dat we moeten vertragen en nadenken. In een tijd waarin alles “zodanig snel gaat dat het gewoon op de markt gegooid wordt“, is dat misschien wel het belangrijkste advies van allemaal.