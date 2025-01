Il mondo AI continua a evolversi rapidamente, con nuovi modelli sempre più avanzati. Dopo il clamore suscitato da DeepSeek-V3, un altro protagonista entra in scena: Qwen2.5-Max, il più recente modello linguistico sviluppato da Alibaba Cloud.

I test di riferimento mostrano che Qwen2.5-Max ha superato DeepSeek-V3 in diverse categorie, consolidando la posizione di Alibaba tra i principali sviluppatori di AI al mondo.

I risultati dei benchmark

Per valutare le capacità del modello, Alibaba lo ha sottoposto a una serie di test riconosciuti nel settore. Ecco come si è comportato rispetto alla concorrenza:

Arena-Hard : misura la qualità delle risposte in base alle preferenze degli utenti. Qwen2.5-Max ha ottenuto un punteggio di 89,4 , battendo DeepSeek-V3 ( 85,5 );

: misura la qualità delle risposte in base alle preferenze degli utenti. Qwen2.5-Max ha ottenuto un punteggio di , battendo DeepSeek-V3 ( ); MMLU-Pro : testa la conoscenza accademica su problemi di livello universitario. Claude Sonnet è primo con 78,0 , seguito da Qwen2.5-Max con 76,1 ;

: testa la conoscenza accademica su problemi di livello universitario. è primo con , seguito da Qwen2.5-Max con ; GPQA-Diamond : verifica la capacità di rispondere a domande generali. Qwen2.5-Max ha raggiunto 60,1 , dietro a Claude Sonnet ( 65,0 );

: verifica la capacità di rispondere a domande generali. Qwen2.5-Max ha raggiunto , dietro a ( ); LiveCodeBench : misura le abilità di programmazione. Qwen2.5-Max ha ottenuto 38,7 , poco sotto Claude ( 38,9 );

: misura le abilità di programmazione. Qwen2.5-Max ha ottenuto , poco sotto Claude ( ); LiveBench: test generale sulle competenze AI. Qwen2.5-Max ha superato DeepSeek-V3 con 62,2 contro 60,5.

Qwen2.5-Max può competere con i big dell’AI?

Dai risultati emerge che il nuovo modello di Alibaba non solo è competitivo con i migliori LLM come GPT-4o e Claude-3.5 Sonnet, ma in alcuni ambiti riesce a superarli. Questo segna un importante passo avanti per la Cina nel settore dell’intelligenza artificiale generativa, spesso dominato da aziende americane.

Disponibilità e utilizzo

Per ora, Qwen2.5-Max è disponibile tramite API su Alibaba Cloud, facilitando l’integrazione per gli sviluppatori. Gli utenti finali possono invece provarlo su Qwen Chat, che include funzionalità avanzate come:

Generazione di immagini e video ;

; Un motore di ricerca AI (attualmente in fase di sviluppo).

Alibaba accelera la corsa all’AI

Il lancio di Qwen2.5-Max dimostra che Alibaba sta rafforzando il proprio impegno nell’intelligenza artificiale, puntando a modelli sempre più performanti con un’ottimizzazione delle risorse computazionali.

Questa evoluzione potrebbe influenzare l’intero mercato, portando nuove strategie e un’adozione più diffusa dell’AI nei settori commerciali e tecnologici. L’industria dell’intelligenza artificiale è in pieno fermento e, con concorrenti come DeepSeek e Alibaba, la sfida ai giganti come OpenAI e Anthropic è ormai aperta.