Il nuovo modello Seed-Thinking-v1.5, sviluppato da ByteDance, punta a rivoluzionare l’AI con un approccio più riflessivo. A differenza dei modelli che privilegiano velocità e quantità, questo sistema avvantaggia la qualità e la coerenza logica. Non si limita a fornire risposte, ma costruisce veri e propri ragionamenti a catena, simili a quelli umani. Il modello ha superato avversari importanti nei test, distinguendosi per la capacità di mantenere ordine e precisione anche nei compiti aperti. Non è solo una questione di numeri: nelle prove con utenti reali ha mostrato fluidità nel dialogo, buona scrittura creativa e comprensione culturale. Secondo ByteDance, questa versatilità deriva da una struttura di apprendimento molto rigorosa.
ByteDance sta pensando a un modello ambizioso capace di ragionare
Un ruolo chiave è svolto dalla tecnologia Mixture-of-Experts, che seleziona dinamicamente solo alcune sezioni del modello per rispondere, aumentando l’efficienza. Nonostante attivi solo 20 miliardi di parametri su 200 disponibili, Seed-Thinking-v1.5 ha ottenuto risultati brillanti nei test AIME, Codeforces e GPQA. Sul benchmark ARC-AGI, ha addirittura superato modelli di punta targati Google e OpenAI. La fase di addestramento ha coinvolto 400.000 esempi, con prevalenza di matematica avanzata ma anche testi creativi e puzzle. Oltre all’uso del reinforcement learning, ByteDance ha introdotto strumenti originali come Seed-Verifier, per validare le risposte e Seed-Thinking-Verifier, che controlla il processo logico. L’infrastruttura, potenziata da tecnologie come Streaming Rollout System e FP8, ha permesso di velocizzare il training senza compromettere l’accuratezza.
Il progetto nasce sotto la guida di Yonghui Wu e del team Seed LLM Systems, già noto per il precedente modello Doubao. ByteDance non si limita alla creazione di AI capaci di calcolare: l’obiettivo è sviluppare sistemi idonei a pensare con rigore e creatività. Nei prossimi mesi, l’attenzione sarà rivolta alle attività non verificabili, dove l’AI deve orientarsi senza una risposta giusta predefinita. A supporto, saranno rilasciati benchmark più complessi, come BeyondAIME, pensati per valutare meglio le abilità generali del modello. La competizione tra giganti è aperta e ByteDance, ora più che mai, gioca per vincere.
