Durante a conferência Google I/O 2025, o Google apresentou o Veo 3, uma impressionante evolução no uso de inteligência artificial para a criação de vídeos.
A novidade vai além das imagens: agora, a ferramenta também é capaz de gerar trilhas sonoras completas, com efeitos sonoros, ruídos de ambiente e até falas sincronizadas com os personagens criados. Tudo isso a partir de um simples comando de texto ou imagem.
De forma simplificada, você pode descrever uma cena, por exemplo, dois personagens conversando em um parque e o Veo 3 se encarrega de criar o vídeo com imagens, sons e diálogos, tudo gerado por IA.
Essa nova versão é considerada um grande avanço em relação ao Veo 2, especialmente na qualidade das cenas geradas e na integração de áudio.
O CEO da DeepMind, Demis Hassabis, chegou a dizer que estamos deixando para trás a “era do cinema mudo” na criação de vídeos com IA.
O Veo 3 já está disponível para usuários do plano Google AI Ultra, que custa US$ 249,99 por mês e pode ser acessado dentro do app Gemini, o assistente com inteligência artificial da empresa.
Embora ferramentas de geração de vídeo com IA estejam se tornando cada vez mais comuns, com empresas como OpenAI, Runway e Pika também lançando suas soluções, o grande diferencial do Veo 3 é a capacidade de criar e sincronizar o som de forma automática, analisando cada detalhe visual da cena.
A tecnologia por trás dessa inovação foi desenvolvida pela DeepMind, o laboratório de pesquisa em IA do Google. A empresa não revelou de onde vieram os dados usados no treinamento do modelo, mas há indícios de que conteúdos do YouTube possam ter sido utilizados.
Para evitar o uso indevido da tecnologia, como a criação de vídeos falsos (deepfakes), o Google confirmou que o Veo 3 insere uma marca d’água invisível em cada frame gerado, usando sua tecnologia proprietária chamada SynthID.
Apesar do potencial criativo, a chegada de ferramentas como o Veo 3 preocupa parte do mercado, especialmente profissionais do setor audiovisual.
Um estudo recente estima que mais de 100 mil empregos ligados à indústria do cinema e da animação nos EUA podem ser impactados até 2026 com o avanço dessas tecnologias. Mesmo assim, o Google continua ampliando o ecossistema do Veo.
A versão anterior, o Veo 2, também recebeu atualizações e agora consegue interpretar movimentos de câmera e aceitar imagens como referência visual para manter consistência entre cenas.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!