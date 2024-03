Claude 3 Opus, sviluppato da Anthropic, ha superato per la prima volta il rinomato GPT-4, alla base dell’ultima versione di ChatGPT, di OpenAI nella classifica di crowdsourcing di Chatbot Arena. L’annuncio di questo sorpasso epico ha scatenato i dibattiti sui social media, generando un vero putiferio. Diversi ricercatori hanno commentato l’accaduto mostrando la loro totale sorpresa e hanno accolto la notizia, che nessuno si aspettava, con grande eccitazione. Tweet con scritto “RIP GPT-4” o “Il Re è morto” hanno invaso Twitter, dimostrando come l’accaduto abbia scosso tutti coloro che conoscono questo lato della tecnologia.

Da quando GPT-4 è stato incluso nella Chatbot Arena circa un anno fa, ha dominato con costanza la classifica delle tecnologie del settore. Adesso, il sorpasso da parte di Claude 3 Opus ha mischiato le carte in tavola, dimostrando che non c’è soltanto un campione a combattere per il primato tra le intelligenze artificiali. Se ChatGPT era, come lo hanno definito, il RE, qui si parla di una rivoluzione vera e propria.

Alternative a ChatGPT: le cause della caduta del Re

Secondo il parere di Simon Willison, un ricercatore intervistato da Ars Technica, questo risultato dimostra che i migliori modelli disponibili non provengono necessariamente da un’unica fonte, in tal caso OpenAI. Opus e Haiku (altro modello di Anthropic conosciuto per la sua grande efficienza) sono un’altra alternativa validissima a GPT-4 sia per costi che per efficienza. Willison, nel suo commento sull’accaduto, spiega chiaramente che avere a disposizione una varietà di approcci e soluzioni va a beneficio degli sviluppatori che lavorano nell’ambito dell’intelligenza artificiale, non facendo solo affidamento su ChatGPT.

Il funzionamento di Chatbot Arena è stato la spinta che ha dato la carica a questo cambiamento così importante nel campo dell’intelligenza artificiale. Grazie al suo metodo di valutazione, gli utenti che ne fanno uso possono considerare le risposte generate da diversi modelli linguistici senza dover conoscere la fonte di ciascuna risposta e dare il proprio parere. Questo specifico metodo di crowdsourcing permette di identificare in poco tempo i modelli migliori in base ai feedback degli utenti, generando una classifica in continua evoluzione. In base a tale metodologia ChatGPT ha palesemente dimostrato una carenza di pareri positivi, a favore di Claude 3 di Anthropic.