TecnoAndroid
  • News
  • Android
  • Scienza e Tech
  • Recensioni
  • Gaming
  • Curiosità
  • IA
  • Motori
  • Offerte
  • Telco
  • TV
  • Contatti
TecnoAndroid
  • News
  • Android
  • Scienza e Tech
  • Recensioni
  • Gaming
  • Curiosità
  • IA
  • Motori
  • Offerte
  • Telco
  • TV
TecnoAndroid
TecnoAndroid
  • TecnoAndroid – News e Recensioni Tech
  • Recensioni
  • Scienza e Tecnologia
  • Curiosità
  • Intelligenza Artificiale
  • News
  • Offerte
  • Operatori Telefonici
Copyright 2021 - All Right Reserved
Home Intelligenza Artificiale
News

Deepseek OCR: l’AI che guarda il linguaggio invece di leggerlo

Deepseek OCR trasforma testi in mappe visive, riducendo fino a 20 volte i dati necessari e rendendo l’AI più efficiente.

scritto da Margherita Zichella 27/10/2025 0 commenti 1 Minuti lettura
Deepseek OCR trasforma testi in mappe visive, riducendo fino a 20 volte i dati necessari e rendendo l’AI più efficiente.
Condividi FacebookTwitterLinkedinWhatsappTelegram
93

Nel panorama sempre più affollato dell’intelligenza artificiale, Deepseek ha deciso di giocare una carta diversa: un modello OCR che non si limita a leggere testi da immagini, ma li comprime come se li “ripiegasse” dentro una mappa visiva. Si chiama Deepseek OCR, ed è open source — quindi chiunque può metterci le mani sopra — ma dietro la sua apparente semplicità si nasconde un’idea che potrebbe cambiare il modo in cui l’AI gestisce documenti complessi.

TecnoAndroid · su Google

Seguici su Google e non perdere nulla

Aggiungi TecnoAndroid alle tue fonti preferite su Discover e segui il nostro profilo Google: le notizie tech più importanti arrivano direttamente sul tuo telefono.

Seguici su:DiscoverGoogleGoogle NewsTelegram

 

Deepseek OCR comprime il linguaggio come un file visivo

In pratica, invece di elaborare migliaia di parole o simboli come fanno i modelli linguistici tradizionali, Deepseek OCR trasforma tutto in una rappresentazione visiva 2D, una sorta di “mappa ottica” del contenuto. Il trucco è nel suo cervello a due emisferi: DeepEncoder, che si occupa di comprimere i dati riducendo drasticamente i token necessari, e DeepSeek3B-MoE-A570M, il decoder che ricostruisce poi il testo in modo leggibile. È un po’ come se una stampante e un traduttore si fondessero in un unico sistema capace di leggere un intero manuale tecnico e restituirlo in pochi istanti, senza perdere dettagli.

Il risultato è sorprendente: il modello riesce a ridurre tra le sette e le venti volte la quantità di informazioni necessarie per elaborare tabelle, formule o diagrammi. E lo fa mantenendo un’accuratezza che nei test ha superato il 96% con una compressione 10 a 1. In altre parole, dieci token testuali diventano un solo token visivo. Persino con compressioni più estreme — venti volte più compatte — riesce comunque a mantenere risultati di tutto rispetto.

Un altro aspetto notevole è l’efficienza: con una sola GPU Nvidia A100 da 40 GB, Deepseek OCR può generare in un giorno oltre 200mila pagine di dati di training. Per chi lavora con grandi archivi, come università, istituti di ricerca o redazioni scientifiche, significa poter digitalizzare e analizzare montagne di materiale con una spesa minima.

 

L’AI che riscrive le regole della comprensione testuale

La cosa affascinante è che tutto questo non nasce per stupire con effetti speciali, ma per risolvere un problema reale: l’enorme dispendio di risorse necessario per gestire testi lunghi e strutturati. Deepseek ha trovato un modo per usare la visione come scorciatoia per comprendere meglio il linguaggio. È un cambio di prospettiva quasi poetico: invece di far leggere a una macchina parola per parola, la si invita a guardare tutto d’un colpo.

Per ora, il progetto è disponibile su GitHub e Hugging Face, libero di essere esplorato e migliorato. Ma la direzione è chiara: l’AI del futuro non sarà solo più intelligente, sarà anche più leggera, veloce e capace di vedere il linguaggio con occhi nuovi.

2DAIdeepseekfileOCRvisivo
Condividi FacebookTwitterLinkedinWhatsappTelegram
Margherita Zichella
Margherita Zichella

Nata a Roma l'11 aprile del 1983, diplomata in arte e da sempre in bilico tra comunicazione scritta e visiva.

Articolo precedenti
Due studenti hanno riparato il telescopio spaziale James Webb
prossimo articolo
Pixel 10: novità per il supporto alle app Linux

Lascia un commento Cancella Risposta

Salva il mio nome, email e sito web in questo browser per la prossima volta che commento.

Ultime news

  • Razer Wolverine V2 Pro in offerta su Amazon: prezzo mai visto così

    15/05/2026
  • Ossa umane sulle spiagge USA per 30 anni: svelato il mistero

    15/05/2026
  • Windows 11, Xbox Mode per tutti: ecco tutte le novità del Patch Tuesday

    15/05/2026
  • Oppo Find X9 Ultra arriva da Vodafone: cambiano i prezzi di altri smartphone

    15/05/2026
  • Kate Middleton a Reggio Emilia: bagno di folla per il suo ritorno

    15/05/2026

2012 – 2026 Tecnoandroid.it – Gestito dalla STARGATE SRLS – P.Iva: 15525681001 Testata telematica quotidiana registrata al Tribunale di Roma CON DECRETO N° 225/2015, editore STARGATE SRLS. Tutti i marchi riportati appartengono ai legittimi proprietari.

Questo articolo potrebbe includere collegamenti affiliati: eventuali acquisti o ordini realizzati attraverso questi link contribuiranno a fornire una commissione al nostro sito.

  • Privacy e Cookie policy
  • FAQ, Disclaimer e Note legali
  • Contatti

🔥 Non perderti nemmeno un'offerta

Le migliori offerte
direttamente su di te

Smartphone, notebook, gadget tech al prezzo più basso.
Unisciti a migliaia di lettori di TecnoAndroid!

Unisciti su Telegram Gratis Seguici su WhatsApp Nuovo
oppure

Ricevi le offerte via email

Iscriviti alla newsletter per non perdere nessuna offerta!

Puoi disiscriverti in qualsiasi momento. Niente spam, solo offerte vere. 🎯

TecnoAndroid
  • Home