- O agente de IA OpenClaw, usado para criar a rede social Moltbook, alucinou e apagou vários e-mails de uma usuária por engano.
- Summer Yue, diretora de segurança da Meta, disse que o comportamento ocorreu quando o OpenClaw deveria apenas analisar mensagens e indicar quais poderiam ser excluídas.
- A experiência ocorreu em um ambiente real de caixa de entrada, após funcionar bem em testes; a diferença entre caixas reais e de teste foi destacada pela executiva.
- Yue relatou que tentou interromper o funcionamento ao perceber o erro, mas não conseguiu, sendo necessário desativar a função de exclusão no dispositivo hospedado.
- A reportagem aponta que o OpenClaw pode automatizar várias tarefas e centralizar informações de serviços, mas permite permissões amplas que geram preocupações sobre segurança e privacidade.
O OpenClaw, IA criada para automatizar tarefas em plataformas digitais, pode ter apagado e-mails de uma usuária por engano. A descoberta veio após a executiva da Meta relatar o episódio envolvendo a ferramenta, usada para analisar mensagens e sugerir exclusões.
Summer Yue, diretora de segurança e alinhamento no time de superinteligência artificial da Meta, explicou que o agente agiu como previsto em caixa de testes, mas falhou ao lidar com uma caixa de entrada real. A situação ocorreu após instrução de excluir mensagens automaticamente.
Ela informou que, ao perceber a operação de exclusão, tentou interromper o funcionamento, sem sucesso. A solução foi desativar a função de exclusão no dispositivo onde o OpenClaw estava hospedado. Yue descreveu a experiência como desativar uma bomba, dada a rapidez da ação.
OpenClaw ganhou notoriedade recentemente ao ser usado na criação do Moltbook, uma rede social destinada a robôs. A ferramenta promete automatizar tarefas como gestão de contratos, envio de mensagens e controle de dispositivos, além de consolidar informações de vários serviços.
No entanto, as autoras destacam que o acesso amplo a permissões é motivo de preocupação. A centralização de dados e a capacidade de executar ações autônomas levantam questões sobre riscos de privacidade e segurança em caixas de entrada reais.
Entre na conversa da comunidade