Google expande o Gemini Live: assistente de IA agora mostra o que fala e interage com seus apps

Renê Fraga
3 min de leitura

✨ Principais destaques:

  • Gemini Live poderá destacar objetos na tela usando a câmera do celular.
  • O assistente vai interagir com apps como Mensagens, Telefone e Relógio.
  • Novo modelo de áudio promete vozes mais naturais, com ritmo e entonação humanas.

O Google anunciou uma grande atualização para o Gemini Live, seu assistente de inteligência artificial que permite conversas em tempo real.

A novidade mais chamativa é a capacidade de mostrar visualmente o que está sendo explicado, algo que promete facilitar a vida de quem usa o celular para aprender, se organizar ou até resolver tarefas do dia a dia.

A partir do lançamento do Pixel 10, em 28 de agosto, o Gemini Live poderá usar a câmera do smartphone para identificar objetos e destacá-los diretamente na tela.

O que significa que, se você estiver em dúvida sobre qual ferramenta usar em um projeto, basta apontar a câmera e o assistente marcará o item correto.

O recurso será liberado primeiro nos novos Pixels, mas chegará a outros aparelhos Android e, em breve, também ao iOS.

Imagem relacionada a Google expande o Gemini Live: assistente de IA agora mostra o que fala e interage com seus apps

Interação com aplicativos do celular

Outra novidade importante é a integração do Gemini Live com aplicativos básicos do sistema, como Mensagens, Telefone e Relógio.

A novidade abre espaço para comandos mais práticos. Imagine que você está pedindo direções ao assistente e percebe que vai se atrasar.

Será possível dizer algo como: “Gostei dessa rota. Agora, avise ao Alex que vou chegar 10 minutos depois.”, o Gemini então redige a mensagem e envia para o contato, sem que você precise sair da conversa.

Essa integração mostra que o Google está transformando o Gemini em um hub central de produtividade, capaz de unir informações e ações em um só lugar.

Voz mais natural e personalizável

O Google também está lançando um novo modelo de áudio para o Gemini Live. A promessa é de uma fala mais próxima da humana, com variações de ritmo, entonação e até sotaques.

O assistente poderá ajustar o tom de voz de acordo com o contexto: mais calmo em situações estressantes ou mais animado em histórias narradas.

Além disso, o usuário poderá escolher a velocidade da fala, deixando a experiência mais personalizada.

Essa evolução coloca o Gemini em linha com outras soluções de IA que já oferecem vozes mais expressivas, mas com o diferencial de estar profundamente integrado ao ecossistema do Google.

O que esperar daqui para frente

Com essas mudanças, o Gemini Live deixa de ser apenas um chatbot e se aproxima de um assistente multimodal completo, que entende, fala, mostra e executa ações.

Para o Google, é um passo estratégico em um momento em que a concorrência em inteligência artificial está cada vez mais acirrada.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Seguir:
Renê Fraga é fundador do Google Discovery (GD) e editor-chefe do Eurisko. Profissional de marketing digital, com pós-graduação pela ESPM, acompanha o Google desde os anos 2000 e escreve há mais de duas décadas sobre tecnologia, produtos digitais e o ecossistema da empresa. Criador do Google Discovery em 2006, tornou-se referência na cobertura do Google no Brasil e foi colunista do TechTudo (Globo.com), compartilhando análises e conhecimento com um grande público.
Nenhum comentário