Sta per arrivare un’importante innovazione per Hugging Face. Il suo team ha presentato un progetto rivoluzionario sviluppato in tempi record. Si tratta di “Open Deep Research“. Suddetto sistema è stato creato in sole 24 ore. Sembra essere una risposta al “Deep Research” di OpenAI. Si presenta come una soluzione altamente avanzata per la ricerca autonoma. Con la capacità di navigare sul web, raccogliere informazioni e generare report completi, Open Deep Research ha già dimostrato risultati promettenti. Nel dettaglio, ha raggiunto un’accuratezza del 55,15% nel benchmark GAIA (General AI Assistants). Avvicinandosi al 67,36% della controparte di OpenAI.
Hugging Face sfida OpenAI? Ecco i dettagli del nuovo sistema
La base tecnologica di Open Deep Research si fonda su modelli linguistici avanzati, come GPT-4o e i modelli di ragionamento simulato o1 e o3-mini. La sua struttura modulare lo rende compatibile con una vasta gamma di modelli linguistici, offrendo ai ricercatori un’ampia flessibilità per l’integrazione e l’adattamento. Un altro elemento che ha accelerato lo sviluppo del progetto è stata la collaborazione con Microsoft Research. Quest’ultima ha fornito tecnologie di navigazione web e ispezione testuale dal loro progetto Magnetic-One. Tale sinergia tra team di ricerca ha dimostrato come il riutilizzo di componenti esistenti possa non solo ridurre i tempi di sviluppo, ma anche migliorare le performance dei sistemi.
Un aspetto innovativo che distingue il progetto è l’utilizzo della libreria “smolagents“. Un framework che punta sugli agenti di codice per gestire i processi, piuttosto che sui tradizionali agenti JSON. Tale scelta si è rivelata strategica, portando a un miglioramento del 30% nell’efficienza complessiva del sistema. Grazie a tale architettura, Open Deep Research si dimostra particolarmente efficace nell’affrontare domande complesse. Ciò sintetizzando informazioni provenienti da fonti multiple con precisione e rapidità.
E non è tutto. Hugging Face è già al lavoro su “OpenAI Operator“. Un sistema che promette di ampliare ulteriormente le capacità di interazione con l’ambiente browser, includendo funzionalità come il controllo del mouse e della tastiera.
