Principais destaques:
- O Google lançou dois novos modelos de IA médica de código aberto focados em imagens clínicas e reconhecimento de fala.
- O MedGemma 1.5 mostrou ganhos relevantes em exames como tomografia, ressonância magnética e análise de prontuários.
- O anúncio acontece em meio à crescente disputa com iniciativas recentes da OpenAI e da Anthropic no setor de saúde.
O Google anunciou o lançamento do MedGemma 1.5 e do MedASR, ampliando o programa Health AI Developer Foundations.
A iniciativa reforça a estratégia da empresa de oferecer bases abertas para desenvolvedores criarem soluções médicas com inteligência artificial, em um momento de forte aceleração da adoção de IA no setor de saúde.
Os dois modelos chegam poucos dias após concorrentes apresentarem soluções voltadas especificamente para ambientes clínicos, aumentando a pressão competitiva em um mercado que cresce mais rápido do que a média da economia.
Avanços importantes na análise de imagens médicas
O MedGemma 1.5 é um modelo multimodal com 4 bilhões de parâmetros, desenvolvido para interpretar diferentes tipos de exames médicos. Ele agora oferece suporte aprimorado para tomografias computadorizadas e ressonâncias magnéticas em três dimensões, lâminas de histopatologia e análises comparativas de raios-X de tórax ao longo do tempo.
Segundo benchmarks internos divulgados pelo Google, a precisão na classificação de tomografias subiu de 58% para 61%. Já a identificação de achados patológicos em ressonâncias magnéticas teve um salto ainda mais expressivo, com aumento de 14 pontos percentuais, chegando a 65% de acerto.
Desempenho mais alto em textos clínicos e prontuários
Além das imagens, o MedGemma 1.5 apresentou avanços consistentes em tarefas baseadas em texto médico. No EHRQA, benchmark voltado para perguntas e respostas sobre prontuários eletrônicos, a precisão passou de 68% para 90%.
Na extração de informações de laudos laboratoriais, a métrica macro F1 evoluiu de 60% para 78%, indicando maior capacidade do modelo em compreender e estruturar dados clínicos complexos, algo essencial para fluxos hospitalares e sistemas de apoio à decisão.
MedASR reduz erros em ditados médicos
O segundo lançamento, o MedASR, é um modelo especializado em reconhecimento de fala clínica. Em testes com ditados de raios-X de tórax, ele alcançou taxa de erro de apenas 5,2%, contra 12,5% do Whisper large-v3, da OpenAI, o que representa 58% menos erros de transcrição.
Em tarefas mais amplas de ditado médico, a diferença foi ainda maior. O MedASR reduziu erros em 82%, com taxa de 5,2%, enquanto o modelo comparado registrou 28,2%. Esse tipo de desempenho pode impactar diretamente a rotina de médicos, reduzindo retrabalho e tempo gasto com documentação.
Saúde lidera adoção de IA e comunidade impulsiona modelos
De acordo com dados citados pelo Google, o setor de saúde adota IA a uma velocidade 2,2 vezes maior que a média da economia. Sistemas de saúde lideram com taxa de implementação de 27%, seguidos por prestadores ambulatoriais com 18% e operadoras com 14%.
O Google também destacou que as versões anteriores do MedGemma, lançadas em 2025, já somam milhões de downloads e centenas de variações criadas pela comunidade no Hugging Face. A empresa reforça que os modelos não são ferramentas de diagnóstico prontas, mas pontos de partida para adaptações conforme fluxos clínicos e exigências regulatórias.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!






