- Google apresenta Gemini Omni, uma nova família de modelos de IA, com o primeiro modelo sendo o Omni Flash, focado em vídeos.
- Omni Flash pode gerar clipes de AI a partir de entradas diversas: texto, fotos, vídeos e áudio, com duração de até dez segundos.
- A empresa planeja, no futuro, ampliar para que a família “crie tudo a partir de qualquer entrada”.
- Diferente do modelo Veo, o Omni Flash não é apenas texto‑para‑vídeo; ele pode usar um vídeo como base para gerar outro vídeo e traz mais conhecimento de mundo por conta do treinamento em Gemini.
- O Omni Flash fica disponível a partir de terça-feira no aplicativo Gemini, no Google Flow e no YouTube Shorts.
Google anunciou uma nova família de modelos de IA generativa chamada Gemini Omni. O primeiro modelo, Omni Flash, consegue gerar vídeos a partir de entradas diversas como texto, fotos, vídeos e áudio. O objetivo é evoluir para “criar qualquer coisa a partir de qualquer input”, segundo a empresa.
A Omni Flash é apresentada como a versão de vídeo do Nano Banana, modelo já usado para criar mais de 50 bilhões de imagens desde o seu lançamento. A ferramenta permite inserir a likeness de alguém em vídeos, prática citada pela equipe de produto da Omni durante entrevista.
Com Omni Flash, a geração de clipes pode usar vídeo e áudio com duração de até 10 segundos, conforme afirma Dumitru Erhan, diretor sênior de pesquisa da Google DeepMind. A empresa planeja ampliar esse tempo no futuro. A ferramenta também se diferencia do Veo, que é apenas texto para vídeo, pois Omni Flash pode usar vídeos como base.
A empresa ressalta que Omni Flash traz maior conhecimento de mundo graças ao treinamento do Gemini. Koray Kavukcuoglu, CTO da Google DeepMind, afirma que essa base de dados amplia o repertório do modelo. A capacidade de transformar inputs variados atende a diferentes cenários criativos.
Disponibilidade e próximos passos
Omni Flash chegará a partir de terça-feira na aplicação Gemini, no Google Flow e no YouTube Shorts. A empresa não detalha planos de expansão imediata para outros serviços, mas sinaliza continuidade no desenvolvimento da família Omni para futuros formatos.
Entre na conversa da comunidade