- Anthropic lançou Claude Mythos cinco para parceiros da indústria, incluindo membros com acesso prévio ao Mythos Preview.
- Claude Fable cinco é disponibilizado ao público com salvaguardas que bloqueiam várias perguntas de cibersegurança, biologia e química, redirecionando essas consultas ao Claude Opus quatro ponto oito.
- Perguntas sobre distilação de modelos — treinar modelos menores a partir das respostas de modelos maiores — também são redirecionadas ao Claude Opus quatro ponto oito.
- A liberação de Mythos cinco para parceiros do Project Glasswing e para pesquisadores seletos de biologia ocorre enquanto a Anthropic trabalha com o governo dos EUA no rollout.
- A empresa afirma que, apesar dos avanços, serão necessárias salvaguardas mais robustas e que pretende ampliar o acesso no futuro, conforme avanços nos mecanismos de filtragem.
Anthropic lançou duas novas versões de seus modelos de IA, Claude Fable 5 e Claude Mythos 5. O Mythos 5 é disponibilizado apenas para parceiros da indústria selecionados, enquanto o Fable 5 chega ao público com proteção adicional que impede respostas relacionadas a cybersecurity, biologia e química. A empresa também informou que, em caso de tentativas de distilação, as solicitações são redirecionadas ao modelo mais antigo, Claude Opus 4.8.
O Mythos 5, que já havia sido apresentado a parceiros por meio do programa Project Glasswing, passa a alcançar um conjunto maior de usuários sob supervisão. A Anthropic enfatiza que o lançamento público do Fable 5 inclui salvaguardas para reduzir abusos, especialmente no que diz respeito a ferramentas de hacking. O Mythos 5 continua disponível apenas para clientes selecionados, com colaboração em andamento com o governo dos EUA.
Lado regulatório e fontes
Diane Penn, gerente de produto da Anthropic, afirma que a empresa trabalha para equilibrar avanços técnicos com medidas de proteção desde antes do lançamento do Mythos, em abril. Segundo ela, a estratégia atual busca maximizar o valor para os usuários sem comprometer a segurança. A empresa reconhece que, por ora, parte das consultas pode ser redirecionada para o modelo menos capaz, como forma de cautela.
Acesso e próximos passos
Além de liberar o Mythos 5 para parceiros do Project Glasswing, a Anthropic abriu acesso a pesquisadores de biologia selecionados. Em seu blog, a empresa informou que versões sem restrições poderão chegar a pequenos grupos até que o programa de acesso confiável esteja plenamente disponível. A companhia ressalta que outros players do setor devem, em breve, oferecer modelos com capacidades equivalentes.
Contexto da segurança cibernética
A capacidade de Claude Mythos e de modelos correlatos em identificar e explorar vulnerabilidades levou empresas e governos a revisarem defesas de software antes de uma disponibilidade ampla. O Mythos foi apresentado originalmente com o objetivo de permitir que membros do setor se antecipassem a ameaças ao testar seus sistemas, mantendo a discussão sobre soluções globais em andamento.
Entre na conversa da comunidade