Em Alta Copa do Mundo NotíciasFutebolBrasil_POLÍTICA_economia

Converse com o Telinha

Telinha
Oi! Posso responder perguntas apenas com base nesta matéria. O que você quer saber?

Gemini Omni: nova família de IA para criar qualquer coisa

Google lança Gemini Omni Flash, gerador de vídeos a partir de texto, imagens e áudio; vídeos de até dez segundos chegam ao app Gemini, Google Flow e YouTube Shorts

Image: Google
0:00
Carregando...
0:00
  • Google apresenta Gemini Omni, uma nova família de modelos de IA, com o primeiro modelo sendo o Omni Flash, focado em vídeos.
  • Omni Flash pode gerar clipes de AI a partir de entradas diversas: texto, fotos, vídeos e áudio, com duração de até dez segundos.
  • A empresa planeja, no futuro, ampliar para que a família “crie tudo a partir de qualquer entrada”.
  • Diferente do modelo Veo, o Omni Flash não é apenas texto‑para‑vídeo; ele pode usar um vídeo como base para gerar outro vídeo e traz mais conhecimento de mundo por conta do treinamento em Gemini.
  • O Omni Flash fica disponível a partir de terça-feira no aplicativo Gemini, no Google Flow e no YouTube Shorts.

Google anunciou uma nova família de modelos de IA generativa chamada Gemini Omni. O primeiro modelo, Omni Flash, consegue gerar vídeos a partir de entradas diversas como texto, fotos, vídeos e áudio. O objetivo é evoluir para “criar qualquer coisa a partir de qualquer input”, segundo a empresa.

A Omni Flash é apresentada como a versão de vídeo do Nano Banana, modelo já usado para criar mais de 50 bilhões de imagens desde o seu lançamento. A ferramenta permite inserir a likeness de alguém em vídeos, prática citada pela equipe de produto da Omni durante entrevista.

Com Omni Flash, a geração de clipes pode usar vídeo e áudio com duração de até 10 segundos, conforme afirma Dumitru Erhan, diretor sênior de pesquisa da Google DeepMind. A empresa planeja ampliar esse tempo no futuro. A ferramenta também se diferencia do Veo, que é apenas texto para vídeo, pois Omni Flash pode usar vídeos como base.

A empresa ressalta que Omni Flash traz maior conhecimento de mundo graças ao treinamento do Gemini. Koray Kavukcuoglu, CTO da Google DeepMind, afirma que essa base de dados amplia o repertório do modelo. A capacidade de transformar inputs variados atende a diferentes cenários criativos.

Disponibilidade e próximos passos

Omni Flash chegará a partir de terça-feira na aplicação Gemini, no Google Flow e no YouTube Shorts. A empresa não detalha planos de expansão imediata para outros serviços, mas sinaliza continuidade no desenvolvimento da família Omni para futuros formatos.

Comentários 0

Entre na conversa da comunidade

Os comentários não representam a opinião do Portal Tela; a responsabilidade é do autor da mensagem. Conecte-se para comentar

Veja Mais