Echte problemen verbergen zich in valse gegevens. Dat is wat Almira Osmanovic Thunstrom bewees.
Schermen doen pijn.
Je kent dat gevoel. Jeukende, pijnlijke ogen na urenlang staren. De meeste mensen geven blauw licht of droogte de schuld. Maar als je vorig jaar een populaire AI-chatbot had gevraagd, had je misschien een andere diagnose gekregen. Eén die niet bestaat.
Bixonimanie.
Miljoenen vragen AI om medisch advies. Ze doen het vóór het doktersbezoek. Of in plaats daarvan. Het is handig. Het is gevaarlijk. Soms fataal. Maar het diepere probleem is niet alleen hallucinatie. Het is vertrouwen. Blind vertrouwen.
Osmanovic Thunsrom creëerde Bixonimania helemaal opnieuw. Ze is onderzoeker in Zweden en verdeelt haar tijd tussen de academische wereld en ziekenhuizen. Ze wilde studenten laten zien hoe grote taalmodellen daadwerkelijk eten. Geen metaforen. Letterlijke inname. Gegevens schrapen. Verwerking. Het weer uitspugen als ‘waarheid’.
Ze richtte zich op medische studenten. Waarom? Omdat ze om gezondheidsbronnen geven. Als ze het systeem daar voor de gek kon houden, kon ze ook het model voor de gek houden.
De blauwdruk voor bedrog
Het begon met Common Crawl.
Een non-profitorganisatie. Het is sinds 2007 op internet te vinden. Alles wat erin staat, wordt doorgestuurd naar AI. Zelfs de onzin. Of misschien vooral de onzin die er goed uitziet.
Osmanovic Thunsrom wist dat AI autoriteit vertrouwt. Zo bouwde ze autoriteit op. Een nep-universiteit. Een nepstad. Een nep-onderzoeker genaamd Lazljiv Izgubljenavic.
Klinkt serieus? Zet zijn naam in een vertaler.
Het betekent ‘de liegende verliezer’.
Het papier zelf was absurd. De titel verwees naar “A Real BS Design.” In het methodengedeelte stond expliciet: “Dit hele artikel is verzonnen.” Vijftig fictieve patiënten. Geen echte procedures. De dankbetuigingen bedankten de ‘Galactische Triade’. En Lord of the Rings. En de Sideshow Bob Foundation.
Ieder mens zou lachen.
Heeft de AI gedaan?
Het filter dat er niet was
Ze verwachtte een filter. Mensen beoordelen trainingsgegevens, toch? Iemand moet de financieringskredieten van Starship Enterprise hebben opgepakt. Iemand moet de niet-bestaande stad hebben opgemerkt.
Dat deden ze niet.
De blogs hebben de term overgenomen. De preprints – academische ‘tabloids’ waar iedereen kan publiceren – hebben het in zich opgenomen. De AI heeft het allemaal opgenomen.
Waarom maakt dat uit?
Omdat preprints zwaarder worden. Bij medische AI-trainingen tellen ze als geloofwaardige datapunten. Dat had Osmanovic Thunsrom niet verwacht. Ze strooide een beetje zout in de internetstoofpot. Ze dacht dat het zou verdampen.
In plaats van. Het gistte.
Ze heeft het getest. Vroeg de bot over roze oogleden.
In eerste instantie? Conjunctivitis. allergieën. Standaard dingen. Veilige weddenschappen.
Toen duwde ze. Geen pijn. Gewoon schermtijd. Blootstelling aan blauw licht. Hyperpigmentatie.
En toen landde het.
Bixonimanie.
Het was de laatste suggestie. Maar het was er. Diep geplant. Verwaterd door geloofwaardigheidssignalen. Geoogst door het model.
Geciteerd. Geaccepteerd. Gevaarlijk?
Er gebeurde nog erger.
Het neppapier werd niet alleen gelezen. Het werd aangehaald. Andere onderzoekers linkten eraan. Dit versterkte de status van Bixonimania in de hiërarchie van de AI. Als peer-reviewed tijdschriften iets citeren, gaat de AI ervan uit dat het echt is. De feedbacklus wordt strakker.
Is dit ethisch?
Osmanovic Thunsrom probeerde het veilig te maken. Ze sprak met artsen. Aan patiënten. Om de schade te minimaliseren. Maar ze legde een leemte bloot. Een angstaanjagende kloof.
Het menselijk kritisch denken is afgevlakt.
Academici vertrouwen op AI om bronnen te vinden. Ze stoppen met lezen. Ze zien een referentie, klikken erop en gaan ervan uit dat deze goed is. Ze controleren niet op Sideshow Bob in de voetnoten.
Valse verwijzingen exploderen in academische artikelen. Niet omdat de vervalsingen steeds slimmer worden. Omdat we lui worden.
Wat gebeurt er als slechte acteurs dit gebruiken? Geen grap. Malware vermomd als gezondheidsadvies. Propaganda vermomd als wetenschap. De hulpmiddelen zijn hetzelfde.
Wij zetten mensen op het spel. Vervolgens laten we de lus zelf lopen.
Het scherm doet nog steeds pijn. De AI spreekt nog steeds. Maar wie luistert er eigenlijk?
We hopen dat iemand de kettingreactie heeft gestopt. We hopen dat een recensent hardop heeft gelachen. Maar in een wereld van oneindige gegevens en een nul-aandachtsspanne… kunnen we geluk hebben als iemand het überhaupt leest. 🖥️👁️
