A Anthropic lançou recentemente o Claude 3.7 Sonnet, um modelo de inteligência artificial (IA) que combina respostas rápidas com a capacidade de raciocinar de forma mais aprofundada sobre questões complexas. Este modelo é considerado o primeiro modelo “híbrido” da indústria.
O Claude 3.7 Sonnet permite respostas rápidas em tempo real, mas também possibilita que os utilizadores ativem um modo de raciocínio avançado, onde a IA pode dedicar mais tempo a analisar e estruturar as suas respostas.
Esta abordagem é uma tentativa da Anthropic de simplificar o acesso aos modelos de IA, eliminando a necessidade de escolher entre diferentes opções com custos e capacidades variadas.
O modelo está disponível para todos os utilizadores, mas apenas clientes com planos pagos terão acesso às funcionalidades de raciocínio avançado. Os utilizadores da versão gratuita poderão utilizar o Claude 3.7 Sonnet sem estas capacidades "expandidas".
O que distingue este novo modelo dos restantes?
O preço do Claude 3.7 Sonnet é de 3$ por milhão de tokens de input e 15$ por milhão de tokens de output.
Embora seja mais caro do que modelos concorrentes como o o3-mini da OpenAI (1,10$/ 4,40$) ou o R1 da DeepSeek (0,55$/ 2,19$), diferencia-se pela sua capacidade de combinar respostas instantâneas com raciocínio aprofundado, enquanto os concorrentes são modelos estritamente voltados para raciocínio.
No futuro, a Anthropic planeia permitir que o Claude decida autonomamente quanto tempo deve dedicar ao raciocínio de cada pergunta. De acordo com Dianne Penn, líder de produto e investigação da empresa, o objetivo é criar uma experiência fluida ao integrar o raciocínio aprofundado com outras funcionalidades, em vez de os manter como opções separadas.
Uma das características mais notáveis do Claude 3.7 Sonnet é o "bloco de notas visível", onde os utilizadores podem acompanhar o processo de pensamento da IA na maioria dos pedidos. Algumas partes deste processo podem ser ocultadas por razões de segurança, mas, no geral, pode visualizar como a IA chega às suas conclusões.
Nos testes mais comuns da indústria, o Claude 3.7 Sonnet demonstrou um desempenho inigualável em algumas tarefas. No SWE-Bench, que avalia tarefas de engenharia de software, atingiu 62,3% de precisão, comparado com os 49,3% do o3-mini da OpenAI. No TAU-Bench, que mede interações no setor do retalho, obteve 81,2%, superando o modelo o1 da OpenAI, que alcançou 73,5%.
❗ A nova versão do Claude também reduziu em 45% as recusas desnecessárias a responder, em relação ao Claude 3.5 Sonnet.
Anthropic lança também o Claude Code
Juntamente com o lançamento do Claude 3.7 Sonnet, a Anthropic apresentou o Claude Code, uma ferramenta destinada a programadores. Com esta funcionalidade, os utilizadores podem executar tarefas diretamente a partir do terminal. O Claude Code está, de momento, em fase de teste e disponível apenas para um grupo restrito de utilizadores.
Durante as demonstrações, a Anthropic mostrou como o Claude Code pode analisar projetos através de comandos simples, como "Explica a estrutura deste projeto." A ferramenta permite modificar código usando linguagem natural, descrevendo cada alteração, testando erros e, inclusive, publicando alterações no GitHub.
Os primeiros utilizadores estão a relatar resultados impressionantes. Em fóruns online, alguns afirmam que o Claude 3.7 Sonnet resolveu problemas de programação que outras IAs não conseguiram resolver. Um utilizador descreveu que a IA criou "um projeto completo em que eu trabalhava há meses - 5000 linhas de código, interface, exemplos de debug, tudo do zero."
Leia também:
#primeiro #modelo #híbrido