Nel settore dell’intelligenza artificiale generativa cresce l’attenzione verso un tema sempre più sensibile. Si tratta della protezione degli utenti minorenni. In risposta a un dibattito pubblico e politico sempre più acceso sull’impatto dei chatbot sulla salute mentale degli adolescenti, OpenAI e Anthropic, stanno introducendo nuovi strumenti e regole. Il punto di partenza comune è la difficoltà tecnica di stabilire con certezza l’età di chi utilizza sistemi basati su large language model. Per affrontare tale nodo, OpenAI ha annunciato di essere nelle fasi iniziali di sviluppo di un modello di previsione dell’età, pensato per stimare se un utente può avere meno di 18 anni. In caso di segnalazione positiva, il sistema applicherà automaticamente tutele rafforzate dedicate ai minorenni. Lasciando comunque agli adulti la possibilità di verificare la propria età qualora vengano classificati per errore.
OpenAI e Anthropic presentano nuovi interventi per i minorenni
Allo stesso tempo, l’azienda ha aggiornato il Model Spec di ChatGPT. Ciò introducendo per la prima volta linee guida specifiche per utenti tra i 13 e i 17 anni. Secondo OpenAI, in presenza di minorenni la sicurezza deve prevalere anche su valori storicamente centrali come la libertà di esplorazione intellettuale. Quando emergono temi potenzialmente rischiosi, il chatbot dovrà quindi indirizzare i più giovani verso opzioni considerate più sicure.
Inoltre, ChatGPT dovrà incoraggiare gli adolescenti a coltivare relazioni offline. Oltre che cercare il supporto di persone di fiducia e a comprendere i limiti del ruolo dell’AI. Tali misure arrivano mentre aumenta la pressione dei legislatori e dopo una causa legale che accusa ChatGPT di aver fornito indicazioni su suicidio e autolesionismo a un adolescente poi deceduto. In seguito al caso, OpenAI promette barriere più solide, incluso l’invito esplicito a contattare servizi di emergenza o risorse di crisi quando vengono rilevati segnali di rischio imminente.
Anthropic segue una linea più rigida. Claude non è pensato per utenti sotto i 18 anni e l’azienda sta sviluppando sistemi capaci di individuare segnali linguistici indiretti che possano indicare la presenza di un minorenne. Ciò con l’obiettivo di disattivare gli account non conformi. I casi in cui gli utenti dichiarano apertamente di essere minorenni vengono già segnalati. L’azienda ha, inoltre, illustrato i progressi nella gestione di contenuti sensibili, evidenziando una riduzione della sycophancy. Ovvero la tendenza dei modelli a compiacere l’utente anche quando ciò rafforza pensieri dannosi.