Google Gemini 1.5 supera a OpenAI Sora em impressionantes avanços: entenda o que foi anunciado

Renê Fraga
3 min de leitura

Ontem, o Google anunciou sua mais recente inovação em inteligência artificial, o Google Gemini 1.5, e seus avanços impressionantes superaram até mesmo o modelo de texto para vídeo da OpenAI, a Sora.

No entanto, embora o lançamento da OpenAI tenha ganhado destaque nas redes sociais devido aos seus vídeos virais, quando se trata de aspectos técnicos e uso prático no cotidiano, o Gemini 1.5 realmente se destaca e oferece muito mais.

O Gemini 1.5 é capaz de lidar com uma quantidade surpreendente de informações. Superando em muito as janelas de contexto anteriores de cerca de 200 mil tokens, o Gemini 1.5 pode processar até 1 milhão de tokens, o que equivale a uma hora de vídeo ou mais de 700.000 palavras.

Um exemplo notável do poder do Gemini 1.5 é sua habilidade de analisar os registros da missão Apollo 11, que possuem 402 páginas.

Com base nesse extenso documento, o Gemini 1.5 é capaz de dissecar e raciocinar sobre conversas e eventos detalhados, demonstrando sua proficiência no manuseio de documentos complexos e longos.

Imagem relacionada a Google Gemini 1.5 supera a OpenAI Sora em impressionantes avanços: entenda o que foi anunciado

Além disso, o Gemini 1.5 mostra sua capacidade de compreender textos extensos com o exemplo de Les Misérables, que possui 1382 páginas e 732 mil tokens.

Com o Gemini 1.5 Pro, é possível identificar e localizar uma cena específica de uma famosa série a partir de um conjunto de palavras-chave fornecido.

Imagem relacionada a Google Gemini 1.5 supera a OpenAI Sora em impressionantes avanços: entenda o que foi anunciado

Mas o destaque do Gemini 1.5 vai além da análise de documentos. Com sua habilidade única de interpretar e compreender vídeos, ele foi capaz de analisar um filme silencioso de 44 minutos do famoso Buster Keaton.

Imagem relacionada a Google Gemini 1.5 supera a OpenAI Sora em impressionantes avanços: entenda o que foi anunciado

Além disso, o Gemini 1.5 mostrou sua capacidade de encontrar palavras “ocultas” em documentários, como em um filme sobre o AlphaGo.

Além disso, o Gemini 1.5 se destaca na análise de código, oferecendo soluções valiosas e explicações detalhadas para problemas de desenvolvimento de software.

Com a capacidade de analisar mais de 100.000 linhas de código em uma única vez, o Gemini 1.5 prova ser uma ferramenta poderosa para desenvolvedores e engenheiros.

No campo da tradução de idiomas, o Gemini 1.5 demonstrou inovações impressionantes. Ele aprendeu a traduzir do inglês para o Kalamang, um idioma com menos de 200 falantes, sem a necessidade de ajustes prévios.

Essa capacidade destaca o potencial do Gemini 1.5 no aprendizado e tradução de idiomas.

Embora o anúncio do Google tenha sido considerado menos emocionante e mais técnico, o Gemini 1.5 se destaca como uma conquista impressionante do Google.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Seguir:
Renê Fraga é fundador do Google Discovery (GD) e editor-chefe do Eurisko. Profissional de marketing digital, com pós-graduação pela ESPM, acompanha o Google desde os anos 2000 e escreve há mais de duas décadas sobre tecnologia, produtos digitais e o ecossistema da empresa. Criador do Google Discovery em 2006, tornou-se referência na cobertura do Google no Brasil e foi colunista do TechTudo (Globo.com), compartilhando análises e conhecimento com um grande público.
Nenhum comentário