Ontem, o Google anunciou sua mais recente inovação em inteligência artificial, o Google Gemini 1.5, e seus avanços impressionantes superaram até mesmo o modelo de texto para vídeo da OpenAI, a Sora.
No entanto, embora o lançamento da OpenAI tenha ganhado destaque nas redes sociais devido aos seus vídeos virais, quando se trata de aspectos técnicos e uso prático no cotidiano, o Gemini 1.5 realmente se destaca e oferece muito mais.
O Gemini 1.5 é capaz de lidar com uma quantidade surpreendente de informações. Superando em muito as janelas de contexto anteriores de cerca de 200 mil tokens, o Gemini 1.5 pode processar até 1 milhão de tokens, o que equivale a uma hora de vídeo ou mais de 700.000 palavras.
Um exemplo notável do poder do Gemini 1.5 é sua habilidade de analisar os registros da missão Apollo 11, que possuem 402 páginas.
Com base nesse extenso documento, o Gemini 1.5 é capaz de dissecar e raciocinar sobre conversas e eventos detalhados, demonstrando sua proficiência no manuseio de documentos complexos e longos.

Além disso, o Gemini 1.5 mostra sua capacidade de compreender textos extensos com o exemplo de Les Misérables, que possui 1382 páginas e 732 mil tokens.
Com o Gemini 1.5 Pro, é possível identificar e localizar uma cena específica de uma famosa série a partir de um conjunto de palavras-chave fornecido.

Mas o destaque do Gemini 1.5 vai além da análise de documentos. Com sua habilidade única de interpretar e compreender vídeos, ele foi capaz de analisar um filme silencioso de 44 minutos do famoso Buster Keaton.

Além disso, o Gemini 1.5 mostrou sua capacidade de encontrar palavras “ocultas” em documentários, como em um filme sobre o AlphaGo.
Além disso, o Gemini 1.5 se destaca na análise de código, oferecendo soluções valiosas e explicações detalhadas para problemas de desenvolvimento de software.
Com a capacidade de analisar mais de 100.000 linhas de código em uma única vez, o Gemini 1.5 prova ser uma ferramenta poderosa para desenvolvedores e engenheiros.
No campo da tradução de idiomas, o Gemini 1.5 demonstrou inovações impressionantes. Ele aprendeu a traduzir do inglês para o Kalamang, um idioma com menos de 200 falantes, sem a necessidade de ajustes prévios.
Essa capacidade destaca o potencial do Gemini 1.5 no aprendizado e tradução de idiomas.
Embora o anúncio do Google tenha sido considerado menos emocionante e mais técnico, o Gemini 1.5 se destaca como uma conquista impressionante do Google.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!