O modelo Qwen3.7-Max, da Alibaba, alcançou o segundo lugar no ranking de programação da Code Arena, ficando apenas atrás dos modelos Claude, da Anthropic. Com uma pontuação de 1541 em testes cegos, ultrapassou propostas de empresas como a OpenAI, a Google e outros laboratórios de referência no setor.
Desta forma, tornou-se no modelo não norte-americano mais bem classificado nesta tabela, refletindo a rapidez com que a IA chinesa tem vindo a reduzir distâncias face aos líderes dos Estados Unidos.
De acordo com a atualização mais recente do ranking, o Qwen3.7-Max surge acima de modelos como o GPT-5.5, da OpenAI, o Gemini-3.5-Flash, da Google, o GLM-5.1, da Zhipu, e o Kimi-K2.6, da Moonshot. Por sua vez, a Alibaba Cloud destacou que o modelo é agora, de forma oficial, o “segundo melhor modelo de IA para programação a nível global”, com base na metodologia de avaliação cega usada pela plataforma, na qual avaliadores humanos comparam resultados sem saber que sistema os gerou.
Uma conquista para a Alibaba
Além disso, a Code Arena recorre a comparações aleatórias e anónimas para reduzir o impacto do reconhecimento de marca, avaliando os modelos em tarefas ligadas ao desenvolvimento web, criação de jogos, visualização de dados e animação. Assim, a classificação procura refletir a capacidade prática de programação em cenários reais, em vez de se limitar a benchmarks mais fechados.
Este resultado surge após vários meses de lançamentos acelerados por parte da equipa Qwen, da Alibaba. Apresentado durante a Alibaba Cloud Summit, em meados de maio, o Qwen3.7-Max é um modelo proprietário de raciocínio com uma janela de contexto de um milhão de tokens, pensado para cargas de trabalho centradas em agentes, incluindo tarefas prolongadas de programação e depuração. Em paralelo, obteve 56,6 pontos no Artificial Analysis Intelligence Index, onde ficou na quinta posição da tabela geral.
Ainda assim, a Alibaba já vinha a mostrar sinais de subida neste segmento ao longo do ano. Em março, os modelos médios Qwen3.5 chegaram ao top 10 entre os modelos abertos na Code Arena. Mais tarde, em abril, o Qwen 3.6-Plus ganhou destaque por superar o Claude 4.5 Opus em vários benchmarks de programação orientada para agentes.
IA concorre entre si
No entanto, o mercado global de IA para programação continua a ser fortemente marcado pelas empresas norte-americanas. A Anthropic mantém a liderança com os modelos Claude, enquanto OpenAI, xAI e Google continuam a ocupar várias posições de topo.
Ainda assim, a subida da Alibaba, a par de desempenhos sólidos de outras empresas chinesas, como a DeepSeek, a Zhipu e a Moonshot, mostra que a vantagem dos Estados Unidos está longe de ser intocável. Com o Qwen3.7-Max já disponível através da API Model Studio da Alibaba Cloud, a empresa reforça a sua posição como alternativa credível para programadores e equipas de desenvolvimento à escala global.
Fica ainda mais conectado:
- Logitech Signature Comfort Plus é a nova gama ideal para Trabalho
- HUAWEI WATCH FIT 5 Pro Review: vale mesmo a pena?
- Mundial 2026: as melhores apps para assistir os jogos de Portugal

