Novo teste revela que IA ainda está longe da inteligência humana

Renê Fraga
3 min de leitura

Um novo teste desenvolvido para avaliar o progresso da Inteligência Geral Artificial (AGI) mostrou que os modelos mais avançados do mundo ainda têm dificuldades em lidar com desafios que são simples para humanos.

Chamado ARC-AGI-2, o teste foi criado pela Arc Prize Foundation, uma organização sem fins lucrativos que mede a evolução da inteligência artificial.

O objetivo é verificar a capacidade dos modelos de IA em reconhecer padrões visuais, interpretar pistas contextuais e demonstrar raciocínio lógico – habilidades essenciais para uma inteligência verdadeiramente geral.

Os resultados foram surpreendentes. O modelo mais avançado da OpenAI, o o3-low, acertou apenas 4% das questões. Já o Gemini 2.0 Flash, do Google, e o DeepSeek R1 tiveram um desempenho ainda menor, com 1,3% de acertos, enquanto o Claude 3.7, da Anthropic, marcou apenas 0,9%.

Esse baixo desempenho levanta dúvidas sobre as previsões otimistas de alguns líderes do setor. O CEO da Anthropic, Dario Amodei, acredita que a AGI pode surgir em dois ou três anos, enquanto Sam Altman, da OpenAI, afirma que já temos a tecnologia necessária para desenvolvê-la.

No entanto, especialistas como Gary Marcus e Yann LeCun argumentam que ainda falta muito para isso acontecer.

O que torna o ARC-AGI-2 diferente de outros testes é que ele não pode ser resolvido apenas com memorização ou análise de grandes volumes de dados.

Em vez disso, ele exige que a IA generalize informações e aplique conhecimentos a situações novas – algo que os humanos fazem naturalmente.

Enquanto os modelos atuais já superam as pessoas em tarefas específicas, como jogar xadrez ou reconhecer imagens, eles ainda não conseguem pensar de forma criativa e adaptável.

Para quem quer entender melhor as limitações da IA, é possível experimentar o teste ARC-AGI e ver como ele funciona. Muitos dos desafios são semelhantes a jogos de raciocínio lógico, como quebra-cabeças, Wordle ou até mesmo palavras cruzadas, que exigem dedução e interpretação contextual.

Esses resultados reforçam que, apesar dos avanços na inteligência artificial, a capacidade humana de aprendizado e adaptação ainda é muito superior – pelo menos por enquanto.

✨ Curtiu este conteúdo?

O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌

Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!

Clique aqui e faça parte da nossa rede de apoiadores.

Seguir:
Renê Fraga é fundador do Google Discovery (GD) e editor-chefe do Eurisko. Profissional de marketing digital, com pós-graduação pela ESPM, acompanha o Google desde os anos 2000 e escreve há mais de duas décadas sobre tecnologia, produtos digitais e o ecossistema da empresa. Criador do Google Discovery em 2006, tornou-se referência na cobertura do Google no Brasil e foi colunista do TechTudo (Globo.com), compartilhando análises e conhecimento com um grande público.
Nenhum comentário