Op 7 april nam Anthropic een besluit dat schokgolven door de technologie- en financiële sector heeft gestuurd: het kondigde de creatie aan van een baanbrekend nieuw AI-model, Mythos, maar weigerde dit aan het publiek vrij te geven.
Dit is een zeldzame zet waarbij veel op het spel staat. De laatste keer dat een grote ontwikkelaar – OpenAI met GPT-2 in 2019 – een model achterhield vanwege veiligheidsoverwegingen, bevond de sector zich in een ander tijdperk. De redenering van Anthropic is grimmig: de mogelijkheden van het model brengen ernstige risico’s met zich mee voor de economie, de openbare veiligheid en de nationale veiligheid.
Een tweesnijdend zwaard van intelligentie
Volgens een technisch document van 245 pagina’s vertegenwoordigt Mythos een enorme sprong voorwaarts in de kunstmatige intelligentie. Het functioneert met de verfijning van een senior software-ingenieur, die in staat is subtiele bugs te identificeren en zijn eigen fouten zelf te corrigeren. De wiskundige redenering ervan is al even ongekend en presteert 31 procentpunten beter dan het vorige topmodel van Anthropic, Opus 4.6, op de USAMO Wiskundeolympiade 2026.
Deze zelfde ‘intelligentie’ maakt Mythos echter tot een krachtig wapen voor cyberoorlogvoering. Het vermogen van het model om softwarekwetsbaarheden te identificeren en te exploiteren is zo geavanceerd dat het bijna alle menselijke experts kan overtreffen. De belangrijkste bevindingen uit de tests van Anthropic zijn onder meer:
– Universele kwetsbaarheid: Het model identificeerde kritieke fouten in elk getest besturingssysteem en webbrowser.
– Niet-gepatchte risico’s: 99% van de kwetsbaarheden die Mythos ontdekte, zijn nog niet opgelost door ontwikkelaars.
– Hoge succespercentages: Het Britse AI Security Institute (AISI) meldde dat Mythos met succes hacktaken op expertniveau 73% van de tijd voltooide – een prestatie die voorheen onmogelijk was voor welke AI dan ook.
Project Glasswing: Defensieve insluiting
In plaats van een publieke lancering heeft Anthropic gekozen voor een gecontroleerde, defensieve uitrol, bekend als Project Glasswing. De toegang is beperkt tot een selecte groep mondiale giganten, waaronder Microsoft, Google, Apple, Amazon Web Services, JPMorgan Chase en Nvidia.
Het doel van dit initiatief is om deze organisaties in staat te stellen het model te gebruiken om hun eigen netwerken te scannen en kwetsbaarheden te patchen voordat kwaadwillende actoren deze kunnen misbruiken. Deze strategie voor “defensief gebruik” is een poging om van een potentieel wapen een schild te maken.
Expertdebat: echte dreiging of PR-drama?
Ondanks de alarmerende toon van Anthropic is de cybersecurity-gemeenschap diep verdeeld over de vraag of Mythos een ‘zwarte zwaan’-evenement is of simpelweg de volgende logische stap in de AI-evolutie.
De visie van de sceptici
Sommige experts suggereren dat de aankondiging van Anthropic net zo goed over public relations gaat als over puur gevaar.
– Peter Swire, professor aan Georgia Tech, merkt op dat velen in het veld dit beschouwen als “meer van hetzelfde” – een verwachte vooruitgang van AI-mogelijkheden.
– Ciaran Martin, voormalig CEO van het Britse National Cyber Security Center, waarschuwt voor ‘apocalyptisch’ denken. Hij wijst erop dat Mythos tijdens het testen te maken kreeg met softwareverdedigingen die veel zwakker waren dan die in de echte wereld, waarbij de resultaten werden vergeleken met die van een professionele spits die tegen een beginnende doelman speelde.
Het institutionele antwoord
Ongeacht het debat reageert de financiële wereld met voorzichtigheid. Duitse banken overleggen met toezichthouders en de Bank of England heeft haar AI-risicotesten geïntensiveerd.
Deskundigen suggereren dat zelfs als het werkelijke gevaar kleiner is dan de antropische beweringen, organisaties een ‘rationele prikkel’ hebben om zich op het ergste voor te bereiden. Zoals Swire opmerkt, is het voornaamste risico dat Mythos het voor hackers veel gemakkelijker zal maken om een bekende softwarefout om te zetten in een functionele, geautomatiseerde exploit.
Waar het op neerkomt: Terwijl experts debatteren over de vraag of Mythos een mondiale dreiging of een beheersbare evolutie is, heeft het vermogen van Mythos om hacking op hoog niveau te automatiseren een mondiale verschuiving teweeggebracht in de manier waarop financiële en technologische instellingen cyberbeveiliging benaderen.
