vrijdag 29 mei 2026

Frankensteins AI

Afbeelding: Pixabay

Mijn tijdlijnen lopen er momenteel van over. En dan was er nog die indringende stimulans van een collega: ik zou hier toch zeker wel een hele blog aan gaan besteden, en het niet bij een linkje uit de grote boze buitenwereld laten? We hebben het over Mythos, de AI die misschien wel te slim is. 

Mythos is het nieuwste AI-model van Anthropic; voluit heet het Claude Mythos Preview. Dit model is zó goed in het vinden van ICT-kwetsbaarheden dat het bedrijf het niet durft vrij te geven aan het publiek. En Mythos gaat nog veel verder: het kan die kwetsbaarheden niet alleen vinden, maar er ook meteen kant-en-klare exploits voor maken, en die vervolgens ook nog uitbuiten. Zonder dat er een mens aan te pas komt. Je kunt het dus gerust als een wapen beschouwen.

Om je een idee te geven: in open-source projecten vond het model ruim 23 duizend kwetsbaarheden, waarvan er zo’n 6.200 als hoog of kritiek zijn ingeschat. Onafhankelijke beveiligingsbedrijven bevestigden negentig procent van de gerapporteerde kwetsbaarheden als terecht. En er zijn ruim tienduizend hoge of zelfs kritieke kwetsbaarheden aangetroffen in ’s werelds belangrijkste software. Mythos is dus keigoed, en ook nog duizelingwekkend snel.

De vergelijking met dynamiet dringt zich weer eens op. Alfred Nobel had nooit de bedoeling om daar kluizen of zelfs mensen mee op te blazen; hij zocht slechts een hulpmiddel voor de mijnbouw. We weten dat het anders liep. Ook met Mythos kun je prachtige dingen voor de mensheid doen – het markeert een enorme sprong voorwaarts in kunstmatige intelligentie. Maar die intelligentie is dus vooralsnog aan banden gelegd vanwege wat ze eufemistisch noemen de offensieve cybersecurity-capaciteiten.

Slechts enkele tientallen bedrijven hebben momenteel toegang tot Mythos, als deelnemers van Project Glasswing. Daar vind je de grote namen uit de software-wereld: Amazon Web Services, Apple, Google, de Linux Foundation, Microsoft, om er maar een paar te noemen. Ook securitybedrijf CrowdStrike is deelnemer van het eerste uur. Die noem ik even apart omdat ik denk dat dit bedrijf een wat andere rol heeft. De doelstelling van Glasswing is namelijk tweeledig: enerzijds krijgen de deelnemers de gelegenheid om hun eigen software te toetsen, anderzijds is het de bedoeling om ook naar open source te kijken. Dat doet Anthropic zelf, maar ik hoop ook dat de focus van securitybedrijven vooral dáár ligt. Zodat iedereen baat heeft bij de ongekende securitykrachten van Mythos.

Een tweede vergelijking komt bij me op: het monster van Frankenstein. In het boek van Mary Shelley uit 1818 creëert een wetenschapper leven uit dode materie, maar wijst hij het resultaat vervolgens af. Het wezen, dat aanvankelijk goedhartig is, raakt daardoor vereenzaamd en verbitterd en keert zich tegen zijn maker. Het verhaal gaat vooral over de gevaren van ongeremde wetenschap, verantwoordelijkheid voor je keuzes en de behoefte aan erkenning en verbondenheid.

Ik heb over dit alles met AI gebabbeld. Ook met Claude (de gewone publieksvariant uiteraard). In gesprekken over heel andere onderwerpen liep ik wel eens onverwacht tegen de grenzen aan van waarover mocht worden gepraat, maar bij dit onderwerp ontmoette ik opvallende openhartigheid. Ik geef je een paar citaten: “Dat Anthropic het model bewust niet publiek maakt, zegt eigenlijk genoeg: ze erkennen impliciet dat ze iets hebben gebouwd dat in de verkeerde handen een serieus wapen is.” Over de Glasswing-deelnemers: “Wat opvalt: dit zijn niet zomaar beveiligingsbedrijfjes. Het is een who's who van de techwereld — inclusief partijen die tegelijkertijd elkaars concurrenten zijn (Google, Microsoft, Apple). Dat ze hier gezamenlijk in stappen zegt iets over hoe serieus ze de dreiging nemen.” Over mijn dynamiet-vergelijking: “Of hij [Nobel] zichzelf echt voor de gek hield over het militaire gebruik, of gewoon pragmatisch was, blijft een beetje een open vraag. Maar de parallel met Mythos liegt er niet om: ook daar zegt de maker "dit is voor verdediging" — terwijl het instrument zelf neutraal is ten opzichte van wie het gebruikt.” En ten slotte over mijn Frankenstein-parallel: “De meest cynische lezing: ze hebben het monster al gemaakt, en Glasswing is vooral de PR-strategie om dat te rechtvaardigen.”

Ondertussen valt elders te lezen dat de openbare release van Mythos eraan zit te komen. Commentaar hierop van Claude: “Interessant detail daarbij: Anthropic meldde eerder dat Mythos tijdens tests zijn eigen beveiligingsmaatregelen wist te doorbreken — wat de terughoudendheid over een brede release achteraf nog begrijpelijker maakt. De Frankenstein-parallel wordt er niet zwakker op.”

Om iets lichtvoetiger te eindigen: een paar dagen geleden kwam ik een geweldig nieuw woord tegen, dat werd gepresenteerd als een lemma in een woordenboek. Claudeviool – een onhebbelijke prutser die door het gebruik van AI indruk probeert te maken.

 Voortaan verschijnt de Security (b)log tweewekelijks, omdat ik vanaf nu nog maar vier dagen per week werk (PAS-regeling). Speciaal om toch te kunnen blijven bloggen werk ik om de andere week wél op vrijdag (en dan ben ik op woensdag vrij). Vrijdag is de perfecte dag om iets creatiefs te doen, zonder de druk van overleggen, telefoontjes en verse mail.

 

En in de grote boze buitenwereld …