Anthropic apresenta Claude Sonnet 4.5, seu modelo de IA mais avançado para programação.

Lançamento do Claude Sonnet 4.5

Na segunda-feira, a Anthropic lançou um novo modelo de IA chamado Claude Sonnet 4.5, que a empresa afirma oferecer desempenho de ponta em benchmarks de programação. Segundo a companhia, o Claude Sonnet 4.5 é capaz de criar aplicações “prontas para produção”, em vez de apenas protótipos, representando um avanço significativo em termos de confiabilidade em comparação com modelos de IA anteriores.

Acesso e Preços

O Claude Sonnet 4.5 estará disponível por meio da API Claude e no chatbot Claude. O preço para desenvolvedores é o mesmo que o do Claude Sonnet 4: $3 por milhão de tokens de entrada (equivalente a aproximadamente 750.000 palavras, ou mais do que toda a série O Senhor dos Anéis) e $15 por milhão de tokens de saída.

Desempenho e Adoção

Nos últimos anos, os modelos de IA da Anthropic se consolidaram como favoritos entre desenvolvedores e empresas, em grande parte devido ao seu desempenho robusto em tarefas de engenharia de software. A Apple e a Meta, segundo informações, utilizam os modelos de IA Claude internamente. Além disso, a Anthropic tem feito negócios significativos vendendo acesso à API para aplicações de codificação de IA, como Cursor, Windsurf e Replit. Recentemente, o GPT-5 da OpenAI começou a desafiar a dominância da Anthropic neste setor, superando os modelos Claude em uma variedade de benchmarks de codificação.

Benchmarks de Desempenho

A Anthropic declara que o Claude Sonnet 4.5 apresenta desempenho de liderança no setor em vários benchmarks de codificação, incluindo o SWE-Bench Verified. No entanto, David Hershey, pesquisador de IA da Anthropic, mencionou ao TechCrunch que é desafiador capturar o desempenho do Claude Sonnet 4.5 apenas com base em benchmarks.

Hershey afirmou que observou o Claude Sonnet 4.5 codificando de forma autônoma por até 30 horas durante testes iniciais com alguns clientes corporativos. Nesse período, ele presenciou o modelo de IA não apenas criar uma aplicação, mas também configurar serviços de banco de dados, comprar nomes de domínio e realizar uma auditoria SOC 2 para garantir a segurança do produto.

Comentários de Executivos do Setor

Em uma declaração compartilhada com o TechCrunch, o CEO da Cursor, Micheal Truell, afirmou que o Claude Sonnet 4.5 representa um desempenho de codificação de última geração, especialmente em tarefas de longo prazo. Jeff Wang, CEO da Windsurf, declarou que a nova versão representa uma “nova geração de modelos de codificação”.

Alinhamento e Segurança Melhorados

A Anthropic também afirma que o Claude Sonnet 4.5 é seu modelo de IA de fronteira mais alinhado até agora, com taxas mais baixas de servilismo e engano em comparação com modelos anteriores. A companhia afirma ter melhorado a suscetibilidade do Claude a ataques de injeção de prompt.

Lançamento de Novas Ferramentas

Juntamente com o lançamento do Claude Sonnet 4.5, a Anthropic está introduzindo o Claude Agent SDK. A empresa informa que esta é a mesma infraestrutura que impulsiona o Claude Code e pode ser utilizada para ajudar desenvolvedores a construir seus próprios agentes.

Além disso, a Anthropic está lançando uma prévia de pesquisa temporária chamada “Imagine with Claude” para assinantes do Max, que demonstra o modelo de IA gerando software em tempo real. A empresa declara que o modelo responderá a solicitações dos usuários em tempo real, sem funcionalidades predeterminadas ou código pré-escrito.

Concorrência no Setor de IA

A intensa concorrência no setor de inteligência artificial tornou comum o lançamento de modelos principais a cada poucos meses. O Claude Sonnet 4.5 está sendo lançado menos de dois meses após o último modelo de IA da Anthropic, o Claude Opus 4.1. Esses ciclos de produção rápidos dificultam a qualquer empresa manter uma liderança significativa por um período prolongado.

Related posts

TechCrunch Mobilidade: Uber inicia sua fase de maximização de ativos.

A App Store está em alta novamente, e pode ser que a IA seja a responsável.

SaySo é um novo aplicativo de vídeos curtos que tem como objetivo recuperar a confiança dos usuários nas notícias.