Um grupo de pesquisadores das universidades de Stanford e Washington conseguiu um feito impressionante: desenvolveram um modelo de inteligência artificial especializado em raciocínio avançado, gastando menos de 50 dólares em créditos de computação na nuvem.
O modelo, chamado s1, demonstrou desempenho comparável a tecnologias de ponta como o o1, da OpenAI, e o R1, da DeepSeek, ambos considerados referências no setor.
O diferencial do s1 está na forma como foi treinado. Em vez de partir do zero, os pesquisadores utilizaram um modelo pronto e aplicaram uma técnica chamada distilação.
Esse processo permite que uma IA aprenda com as respostas de outra, absorvendo sua capacidade de raciocínio. No caso do s1, a fonte foi o modelo experimental Gemini 2.0 Flash Thinking, do Google, que pode ser acessado gratuitamente, embora com algumas restrições.
Essa abordagem levanta um debate importante sobre o futuro da IA. Se uma equipe com poucos recursos pode recriar tecnologias milionárias de forma acessível, isso pode acelerar o desenvolvimento da inteligência artificial ou, por outro lado, gerar preocupações sobre o controle e a exclusividade desses modelos.
Empresas como a OpenAI já demonstraram insatisfação com a distilação de seus modelos, enquanto o Google possui regras que proíbem o uso de suas IAs para criar concorrentes diretos.
Apesar das controvérsias, o s1 já está disponível no GitHub, junto com o código e os dados usados no treinamento. O modelo foi treinado em menos de 30 minutos, utilizando 16 GPUs Nvidia H100, um custo que hoje pode ser acessível até para pesquisadores independentes.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!