A Anthropic lançou a última versão do seu modelo de linguagem (LLM), o Claude 2, para testes beta.
O modelo atualizado, projetado para criação de código, análise de texto e redação de composições, está disponível gratuitamente para usuários nos EUA e no Reino Unido.
As melhorias no Claude 2 são baseadas no feedback do usuário e incluem habilidades conversacionais aprimoradas, explicações mais claras, memória aprimorada e menos saídas prejudiciais.
O modelo apresenta proficiência em habilidades de codificação, matemática e raciocínio, como comprovado pelo seu desempenho na seção de escolha múltipla do exame Bar (76,5%) e nos exames GRE de leitura e escrita (acima do percentil 90).
O Claude 2 também suporta entradas e saídas mais longas, permitindo a análise de documentos grandes e a geração de composições mais longas.
As habilidades de codificação do Claude 2 melhoraram significativamente, com sua pontuação no teste de programação Python Codex HumanEval aumentando de 56% para 71,2%.
Sua proficiência em problemas de matemática escolar, testados com GSM8k, aumentou de 85,2% para 88% (como uma nota relacionada, a OpenAI recentemente lançou o Code Interpreter Beta para todos os usuários do ChatGPT Plus).
O modelo também é duas vezes mais eficaz em fornecer respostas inofensivas em comparação com a versão anterior, Claude 1.3.
No entanto, apesar de sua capacidade de processar trabalhos complexos, a Anthropic aconselha contra o uso do Claude 2 como referência factual ou em situações envolvendo saúde física ou mental.
✨ Curtiu este conteúdo?
O GDiscovery está aqui todos os dias trazendo informações confiáveis e independentes sobre o universo Google - e isso só é possível com o apoio de pessoas como você. 🙌
Com apenas R$ 5 por mês, você ajuda a manter este trabalho no ar e leva informação de qualidade para ainda mais gente!