- Waymo usa o modelo Genie 3, da Alphabet, para criar um mundo virtual “hiperrealista” com cenários de edge cases, como tornado ou elefante.
- A simulação é alimentada pela DeepMind e foca em ambientes 3D fotorealistas adaptados ao domínio da condução, com sensores lidar gerando renderizações do entorno.
- Entre os cenários testados estão tornados, pontes com neve, ruas alagadas e bairros em fogo; o objetivo é treinar o veículo para situações raras sem risco real.
- O Waymo World Model oferece controle de ação de condução, layout de cena e controle por linguagem, permitindo ajustar hora do dia, clima e layout das vias.
- A ferramenta pode transformar imagens de dashcam reais em ambientes simulados e rodar cenas por velocidades maiores, mantendo qualidade visual.
Waymo, empresa de veículos autônomos controlada pela Alphabet, divulgou uma nova plataforma de simulação que usa o modelo de mundo Gen ie 3, desenvolvido pela Google DeepMind. O objetivo é testar cenários extremos sem risco real a passageiros ou pedestres.
A tecnologia, chamada Waymo World Model, gera ambientes virtuais fotorealistas em que veículos autônomos podem enfrentar situações pouco comuns, como tornados, por exemplo. A equipe afirma que a simulação cobre diversos sensores e modalidades de percepção.
O recurso combina controles de ação de direção, layout de cena e ajustes de linguagem, permitindo simular condições de baixa visibilidade, clima, horário e mudanças de tráfego. Em cenários, o veículo registra dados como se estivesse operando na vida real.
Além de cenários climáticos, a ferramenta pode transformar imagens de dashcam reais em ambientes virtuais, preservando o nível de realismo necessário para testes, inclusive com apresentações de cenas em velocidade acelerada.
Waymo afirma que a simulação de riscos raros ajuda a treinar o motorista robô para lidar com situações complexas, reduzindo a dependência de testes em vias públicas. O objetivo é ampliar a robustez do sistema de condução autônoma.
A empresa já utiliza recursos de AI da Google, incluindo o DeepMind, para aprimorar técnicas de percepção, tomada de decisão e redução de falsos positivos nos sensores. O uso envolve pesquisas contínuas de melhoria de desempenho.
Potencial e aplicações
Segundo a companhia, o World Model permite gerar cenários diários e também casos excepcionais com alto grau de controle sobre o ambiente. A ferramenta oferece opções para ajustar iluminação, tempo e condições meteorológicas conforme necessidade de teste.
O anúncio ressalta que a simulação pode produzir cenas mais longas com playback em velocidade 4X, sem perder qualidade de imagem ou exigir potentes recursos computacionais. Isso facilita rodadas de avaliação rápidas e repetidas.
Waymo já utiliza recursos semelhantes em projetos anteriores, como o EMMA (End-to-End Multimodal Model for Autonomous Driving) com suporte da Gemini, e trabalha em assistentes de voz baseados em Gemini para veículos.
Entre na conversa da comunidade