Gemini ganha suporte a arquivos de áudio

Renê Fraga
3 min de leitura

✨ Principais destaques:

  • Usuários podem enviar áudios para o Gemini: versão gratuita limita a 10 minutos por arquivo; planos pagos permitem até 3 horas.
  • Diversidade de formatos: é possível enviar até 10 arquivos ao mesmo tempo, inclusive compactados em ZIP.
  • Funcionalidade era a mais pedida pelos usuários, segundo o Google.

O recurso mais aguardado do Gemini

Depois de meses de pedidos, o Google liberou a função mais desejada do app Gemini: enviar arquivos de áudio.

Agora, o usuário pode gravar uma explicação, subir um podcast ou até trechos de uma reunião para que a inteligência artificial analise, resuma ou utilize no contexto de suas respostas.

A limitação muda de acordo com o plano: quem usa a versão gratuita pode enviar arquivos de até 10 minutos e tem direito a cinco interações por dia.

Já os assinantes dos planos AI Pro e AI Ultra conseguem trabalhar com áudios de até três horas, garantindo mais espaço para estudos, entrevistas e projetos profissionais.

Como funciona o envio de áudio

O Gemini não exige um formato específico e aceita diferentes tipos de arquivo de som. É possível até enviar pastas compactadas em ZIP com vários áudios dentro.

Em todos os planos, o usuário pode anexar até 10 arquivos de uma vez, o que abre a porta para pesquisas mais complexas, edição de conteúdos longos ou organização de gravações pessoais.

Outras atualizações do ecossistema Google

Embora o foco esteja no áudio do Gemini, o Google também anunciou melhorias em outras frentes.

A Busca em Modo IA agora aceita perguntas em hindi, indonésio, japonês, coreano e português do Brasil, aproximando a experiência de mais pessoas ao redor do mundo.

Já o NotebookLM, ferramenta voltada para estudo e pesquisa, ganhou novos estilos de relatório em mais de 80 idiomas, incluindo guias de estudo e quizzes, ampliando as possibilidades de uso acadêmico e profissional.


💡 O recurso de áudio reforça a estratégia do Google de tornar o Gemini cada vez mais prático e presente no cotidiano.

Para muitos usuários, falar ou gravar é mais natural do que digitar, e essa mudança pode marcar o início de uma nova fase para o uso da inteligência artificial em tarefas pessoais e de trabalho.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Seguir:
Renê Fraga é fundador do Google Discovery (GD) e editor-chefe do Eurisko. Profissional de marketing digital, com pós-graduação pela ESPM, acompanha o Google desde os anos 2000 e escreve há mais de duas décadas sobre tecnologia, produtos digitais e o ecossistema da empresa. Criador do Google Discovery em 2006, tornou-se referência na cobertura do Google no Brasil e foi colunista do TechTudo (Globo.com), compartilhando análises e conhecimento com um grande público.
Nenhum comentário