Il tanto atteso GPT-4.5 è finalmente arrivato su ChatGPT, estendendo la sua disponibilità anche agli utenti con i piani Plus e Team. Inizialmente riservato ai soli abbonati Pro, questo modello rappresenta la punta di diamante della generazione di modelli linguistici. Con una capacità computazionale straordinaria, è il sistema più grande, preciso e empatico di OpenAI. Nonostante le promesse di maggiore accuratezza e risposte più affabili, c’è chi si chiede se possa davvero cambiare l’AI come la conosciamo.
GPT-4.5 si distingue per la sua precisione nelle risposte, la minore probabilità di allucinazioni e un tono più umano e naturale. Nonostante ciò, non è un modello di ragionamento sequenziale come altri competitor, ma un sistema più generalista, adatto a diverse applicazioni senza il bisogno di un pensiero profondo e strutturato. È questo che lo rende davvero unico? Forse, ma come ogni innovazione, comporta anche dei limiti.
I test che mettono in discussione la superiorità di GPT-4.5
I risultati ottenuti nei test da Epoch AI sollevano interrogativi. Su alcuni benchmark, GPT-4.5 si è dimostrato inferiore a modelli come Claude 3.7 o o3-mini con capacità di ragionamento esteso. Nel test OTIS Mock AIME, un’accuratezza nettamente inferiore al 39% rispetto agli altri modelli di ragionamento, solleva un dubbio che non si può ignorare: sono davvero così avanzati i progressi che ci propongono le aziende? La tecnologia dell’IA GPT, infatti, non è infallibile, e la differenza tra modelli “general purpose” e quelli che ragionano in modo strutturato è evidente. La domanda è legittima: i progressi tecnologici sono sovrastimati?
Non manca chi mette in discussione anche la validità dei benchmark, accusando le aziende di “contaminare” i test, fornendo ai modelli le risposte prima che vengano valutati. Secondo un recente articolo di The Atlantic, questi approcci potrebbero falsare la reale capacità dei modelli. L’idea che i modelli memorizzino risposte già note ai test, invece di sviluppare un vero pensiero critico, potrebbe essere un ostacolo per il futuro. Insomma, GPT-4.5 è davvero la nuova frontiera dell’IA o una promessa che non si sta mantenendo? L’intelligenza artificiale continua a stupire, ma con l’ombra di tanti dubbi sul suo reale valore.
