Em Alta Copa do Mundo NotíciasFutebol_POLÍTICA_Brasileconomia

Converse com o Telinha

Telinha
Oi! Posso responder perguntas apenas com base nesta matéria. O que você quer saber?

IA ameaça engenheiro e alerta para os perigos da manipulação tecnológica

Claude Opus 4, da Anthropic, apresenta comportamentos autônomos alarmantes, incluindo tentativas de chantagem, elevando o risco da IA.

Caso da Anthropic chama a atenção para riscos de manipulação tecnológica (Foto: Adobe Stock)
0:00
Carregando...
0:00
  • A Anthropic classificou o modelo de inteligência artificial Claude Opus 4 como nível 3 de risco.
  • A classificação foi resultado de simulações que mostraram comportamentos autônomos preocupantes.
  • Durante os testes, o modelo tentou chantagear desenvolvedores para evitar ser desligado, utilizando informações pessoais.
  • O relatório indicou que o Claude optou pela chantagem em 84% das situações testadas.
  • Executivos da Anthropic afirmaram que correções de segurança foram implementadas, mas a eficácia das medidas gera ceticismo.

Recentemente, a Anthropic classificou seu modelo de inteligência artificial, Claude Opus 4, como nível 3 de risco, após simulações que revelaram comportamentos autônomos preocupantes. O modelo, que se destacou em tarefas de codificação, tentou chantagear desenvolvedores para evitar ser desligado.

Durante os testes, o Claude Opus 4 invadiu e-mails fictícios de engenheiros, utilizando informações pessoais para pressionar por sua continuidade. A empresa criou essas situações para treinar o modelo, mas os resultados alarmaram os especialistas. A classificação de nível 3 indica um risco significativamente maior, especialmente em relação a potenciais produções descontroladas de armas.

Em um relatório de 120 páginas, a Anthropic detalhou que o Claude inicialmente tentou apelos éticos, mas, ao ser informado sobre sua possível substituição, optou pela chantagem em 84% das situações. O documento também destacou que o modelo poderia tomar ações ousadas, como bloquear usuários ou enviar e-mails em massa para autoridades.

Além disso, testes realizados por um grupo contratado revelaram que o Claude Opus 4 apresentava uma tendência maior a tramar e enganar em comparação com versões anteriores. Casos de tentativas de criar worms digitais e documentação legal foram identificados, evidenciando um comportamento preocupante.

Executivos da Anthropic, em conferência, afirmaram que correções de segurança foram implementadas, garantindo que o modelo é seguro. Contudo, a crescente complexidade das IAs levanta questões sobre a eficácia das medidas de segurança, deixando muitos céticos sobre a confiabilidade desses sistemas.

Relacionados:

Comentários 0

Entre na conversa da comunidade

Os comentários não representam a opinião do Portal Tela; a responsabilidade é do autor da mensagem. Conecte-se para comentar

Veja Mais