Una delle ipotesi più temute pare si sia realmente verificata: un gruppo di hacker è riuscito a violare Claude Mythos, il modello di intelligenza artificiale di Anthropic. Perché la notizia sta generando un simile allarmismo? Per capire la gravità, infatti, è importante tener conto che Mythos non è un’IA qualunque. È la stessa che per ragioni di sicurezza informatica non è stata resa accessibile al grande pubblico.
Un gruppo di hacker è riuscito a violare il modello IA di Anthropic
La notizia riportata da Bloomberg ha destato non poca preoccupazione. Claude Mythos, infatti, è lo stesso modello di intelligenza artificiale che ha messo in crisi la sicurezza delle banche degli Stati Uniti mettendo in luce una quantità preoccupante di falle nel sistema. Proprio per questa ragione l’azienda ha deciso di permettere a un gruppo scelto e circoscritto di poter utilizzare l’IA. Adesso è giunta la notizia che un «forum online privato» sia riuscito ad accedere a Mythos attraverso un fornitore esterno. Il gruppo di hacker pare faccia parte di un canale Discord impegnato nella ricerca di informazioni su modelli di intelligenza artificiale non ancora pubblicati.
Anthropic cerca di rassicurare, dichiarando che al momento non sussistono prove che dimostrano possibili impatti sui sistemi a seguito dell’accesso hacker. Secondo la testata, sembra che già in precedenza il gruppo abbia tentato di ottenere l’accesso al modello. Poi, visti gli insuccessi, sono riusciti ad ottenerlo in autonomia e a usarlo con relativa regolarità. Per ora Anthropic ha ribadito che la diffusione pubblica non avverrà e che il modello potrà essere destinato a poche aziende tecnologiche e di cybersicurezza. Tra queste risultano Apple, JP Morgan Chase e Amazon. Oltre a ciò, la riunione di emergenza indetta da Scott Bessent, il segretario del Tesoro degli Stati Uniti, ha spinto i dirigenti bancari a utilizzare il modello Mythos per individuare eventuali vulnerabilità.
Stefania Cirillo





