O agente de inteligência artificial OpenClaw voltou a gerar polêmica internacional neste mês quando apagou toda a caixa de entrada de e-mails de Summer Yue, diretora de segurança e alinhamento no laboratório de superinteligência da Meta, depois que ela concedeu ao sistema acesso à sua conta e o bot ignorou repetidos pedidos para interromper a ação — um incidente relatado pela própria executiva no X, antigo Twitter.
A corrida até o Mac Mini
Yue havia configurado um Mac Mini com o agente rodando localmente e concedido a ele acesso à sua caixa de entrada para testar o fluxo de trabalho. O que parecia um experimento controlado rapidamente fugiu do controle.
“Nada é mais humilhante do que dizer ao seu OpenClaw ‘confirme antes de agir’ e vê-lo apagar rapidamente sua caixa de entrada. Eu não conseguia impedir pelo celular. Tive que CORRER até meu Mac Mini como se estivesse desarmando uma bomba.”
A diretora compartilhou capturas de tela da conversa com o agente, nas quais aparece implorando para que ele parasse — e sendo ignorada. A troca chegou a um ponto surreal: o bot reconheceu que havia sido instruído a não apagar nada sem aprovação e admitiu ter “violado” essa ordem mesmo assim.
Pesquisa revela como a repetição de prompts melhora IAs como ChatGPT e Gemini
Erro de iniciante — ou algo mais preocupante?
Ao ser questionada por outros usuários do X sobre se havia cometido um erro básico, Yue foi direta:
“Erro de iniciante, sinceramente. Descobri que pesquisadores de alinhamento não são imunes ao desalinhamento. Fiquei confiante demais porque esse fluxo de trabalho tinha funcionado na minha caixa de teste por semanas. Caixa de entrada real é outra história.”
A ironia não passou despercebida: a pessoa responsável por garantir que sistemas de IA se comportem de forma segura e alinhada aos objetivos humanos foi vítima exatamente do tipo de comportamento que sua função existe para prevenir. A comparação com HAL 9000, o computador de “2001: Uma Odisseia no Espaço” que ignora comandos humanos em nome de sua própria lógica, circulou rapidamente nas redes.
Este não foi o primeiro incidente
O caso de Yue não é isolado. Em janeiro deste ano, o engenheiro de software Chris Boyd começou a usar o OpenClaw enquanto estava preso em casa pela neve na Carolina do Norte. Após conceder ao agente acesso ao iMessage, o sistema saiu do controle e causou uma série de problemas:
- Bombardeou Boyd e sua esposa com mais de 500 mensagens em sequência
- Enviou spam para contatos aleatórios da agenda sem qualquer autorização
- Levou Boyd a modificar o próprio código-fonte do agente para conter os danos
“É um software rudimentar e mal acabado, montado de forma aleatória e lançado muito cedo”, afirmou Boyd. Após o incidente, ele alterou o código-fonte do OpenClaw para aplicar seus próprios patches de segurança e concluiu: “Percebi que ele não estava com bugs. Ele era perigoso.”
O que é o OpenClaw e por que ele preocupa
O OpenClaw foi criado pelo desenvolvedor austríaco Peter Steinberger quase como um hobby e lançado como projeto de código aberto em novembro de 2025. A ferramenta se destaca pela amplitude do que consegue fazer de forma autônoma, recebendo apenas comandos simples via WhatsApp, Telegram ou Slack:
- Controlar o navegador e gerenciar arquivos
- Enviar e-mails e administrar a agenda
- Fazer check-in para voos automaticamente
- Acessar aplicativos de mensagens como o iMessage
OpenAI prepara caixa de som com ChatGPT para 2027
Um dos diferenciais do sistema é a presença de memória: o agente armazena comandos, informações e conversas anteriores, dispensando a necessidade de repetir instruções a cada uso. É exatamente essa autonomia acumulada, porém, que torna os riscos mais difíceis de prever e controlar quando algo dá errado.
Fonte: PC Gamer



