Claude “Mythos”: Il Modello Anthropic “Troppo Potente” Svelato da un Errore

Claude “Mythos”, il nuovo modello di Anthropic. Definito dalla stessa azienda come “troppo potente per essere reso pubblico”, Mythos promette di ridefinire i confini del ragionamento artificiale e della cybersicurezza.

Secondo le dichiarazioni ufficiali, Claude Mythos rappresenta un vero e proprio “salto di livello” rispetto ai modelli precedenti con prestazioni eccezionali in tre aree critiche:

  1. Ragionamento logico complesso

  2. Programmazione avanzata

  3. Cybersicurezza

Il dettaglio che ha destato più scalpore tra gli esperti è la capacità di “recursive self-fixing” (autocorrezione ricorsiva). Mythos non si limita a scrivere codice, ma è in grado di identificare autonomamente le vulnerabilità nel proprio output e correggerle in un ciclo continuo di miglioramento.

Questa funzione mira a rendere i software sempre più automatizzati e sicuri, ma solleva un dilemma etico: se un’IA è così brava a trovare falle per ripararle, quanto potrebbe essere pericolosa se utilizzata per scopi malevoli? La capacità di individuare vulnerabilità “zero-day” in pochi secondi potrebbe fornire ai cybercriminali un’arma senza precedenti.

Proprio per questi rischi, Anthropic ha deciso di non rilasciare Mythos al grande pubblico. Il modello è attualmente disponibile in versione Preview solo per un gruppo ristretto di circa 40 aziende strategiche, tra cui giganti come Apple, Amazon e Microsoft.

L’obiettivo è duplice:

  • Utilizzare la potenza di Mythos per mettere in sicurezza infrastrutture critiche e codice open-source.

  • Dare un vantaggio difensivo ai “soggetti ben disposti” prima che strumenti simili finiscano nelle mani sbagliate.

Comments

Leave a Reply

Your email address will not be published. Required fields are marked *