Il modello Qwen3.5-9B Uncensored ha fatto la sua comparsa su Hugging Face, e già dal nome si capisce dove vuole andare a parare. Si tratta di una versione modificata del noto modello linguistico di Alibaba, dalla quale sono stati rimossi completamente tutti i meccanismi di censura. L’autore della modifica, che si firma HauhauCS, ha battezzato il progetto con il nome completo Qwen3.5-9B-Uncensored-HauhauCS-Aggressive, e sostiene che questa variante mantiene intatte tutte le funzionalità del modello base, ma senza alcun rifiuto nelle risposte.
I numeri parlano chiaro: su 465 test effettuati, il modello ha mostrato zero blocchi. Nessuna risposta negata, nessun filtro attivato. HauhauCS ha tenuto a precisare che non è stato toccato il dataset originale e che le capacità del modello non sono state in alcun modo ridotte. L’unico intervento riguarda la rimozione dei meccanismi di rifiuto. Questa scelta solleva ovviamente interrogativi importanti sulla sicurezza e sull’uso improprio di sistemi di intelligenza artificiale privi di restrizioni etiche, soprattutto nel mondo open source, dove modelli avanzati diventano accessibili a chiunque senza particolari controlli.
La variante definita “aggressiva” rappresenta la versione più spinta dello sblocco. Secondo quanto indicato nella scheda del progetto, se questa configurazione dovesse risultare troppo permissiva, in futuro potrebbe arrivare una versione più bilanciata. Un dettaglio curioso: anche dopo la rimozione completa dei filtri, il sistema potrebbe occasionalmente aggiungere una breve nota in fondo alle risposte, una sorta di disclaimer residuo. HauhauCS ha spiegato che questo comportamento dipende esclusivamente dall’addestramento del modello di base e non compromette in nessun modo la generazione della risposta completa.
Le specifiche tecniche e le varianti disponibili per il download
Dal punto di vista tecnico, Qwen3.5-9B non è certo un modello banale. Parliamo di 9 miliardi di parametri densi distribuiti su 32 strati, con un’architettura ibrida che combina attenzione lineare Gated DeltaNet e attenzione softmax in un rapporto 3:1. La finestra di contesto nativa arriva a 262.000 elementi e può essere espansa fino a 1 milione tramite YaRN per la predizione multi-token. Il dizionario comprende 248.000 token con supporto per ben 201 lingue. Il modello è inoltre multimodale in modo nativo, il che significa che comprende testo, immagini e video.
Per chi volesse scaricarlo, sono disponibili diverse varianti in formato GGUF: il file BF16 da 17 GB, Q80 da 8,9 GB, Q6K da 6,9 GB e Q4KM da 5,3 GB. Separatamente è disponibile anche un file mmproj da 880 MB, necessario per lavorare con immagini e video in ambienti compatibili come llama.cpp, LM Studio e altri.
Impostazioni consigliate e compatibilità
HauhauCS ha condiviso anche le impostazioni raccomandate dagli autori originali di Qwen. Per la modalità di pensiero, i valori suggeriti sono una temperatura di 0,6, un topp di 0,95 e un topk di 20. Per la modalità non ottimizzata verso il pensiero, invece, si consiglia una temperatura di 0,7, un topp di 0,8 e un topk di 20. L’autore raccomanda di mantenere il contesto almeno a 128K per preservare le capacità del modello, suggerendo di utilizzare vLLM, SGLang o KTransformers per scenari di produzione e ad alto throughput.
La scheda del progetto include infine un avviso sulla compatibilità: l’architettura di Qwen3.5-9B Uncensored viene descritta come completamente nuova, con data di rilascio fissata al 2 marzo 2026. Il supporto in llama.cpp, secondo quanto dichiarato, è stato aggiunto solo di recente.