Lo strumento di intelligenza artificiale di punta per il rilevamento di false denunce
Redazione TheBlackcoffee
“È il primo strumento del suo genere al mondo” – aveva scritto la Polizia Nazionale nel 2018, presentando Veripol come un algoritmo in grado di rilevare false denunce di rapina con violenza, con una precisione superiore al 90%. Nell’ottobre 2024, sei anni dopo, la Polizia Nazionale ha smesso di utilizzare l’IA, ha comunicato l’Ufficio Tecnico della Direzione Generale della Polizia. Il Ministero dell’Interno ha dichiarato che il motivo del rifiuto del suo utilizzo è la mancanza di validità nei procedimenti giudiziari.
L’abbandono di Veripol arriva tre mesi dopo la pubblicazione sulla Gazzetta Ufficiale dello Stato spagnolo (BOE) del regolamento europeo sull’intelligenza artificiale, che include i poligrafici tra le IA “ad alto rischio”, con requisiti più severi in termini di revisione, aggiornamento e trasparenza. Alla fine di settembre 2024, un rapporto dell’Università di Valencia, redatto da ricercatori in ambito giuridico e matematico, ha evidenziato gravi carenze nello strumento. La prima di queste è la mancanza di informazioni sul suo funzionamento. Il Ministero dell’Interno dichiara di averne respinto l’utilizzo perché non valido nei procedimenti giudiziari.
Veripol è stato sviluppato da ricercatori delle università Complutense e Carlos III e dall’agente di polizia Miguel Camacho-Collados, attualmente responsabile dell’innovazione tecnologica e della sicurezza informatica presso il Consiglio di Stato. Come spiega l’articolo accademico che ne descrive lo sviluppo, il team ha addestrato lo strumento su un campione di 1.122 denunce di furto avvenute in Spagna nel 2015, di cui 534 vere e le restanti 588 false. I ricercatori hanno elaborato i testi delle denunce con tecniche di PNL, semplificandoli per consentirne l’elaborazione automatica, e hanno classificato le parole utilizzate per tipologia, scartando tutte quelle presenti in meno dell’1% del campione o in più del 99%. Hanno quindi applicato vari metodi di regressione statistica per individuare le parole più comuni nelle denunce vere e false. Ad esempio, se una denuncia contiene le parole “giorno”, “avvocato”, “assicurazione” o “indietro”, è più probabile che sia falsa, prevede Veripol, e ancora più probabile che sia falsa se la denuncia contiene più volte la parola “duecento” o avverbi come “a malapena”. Al contrario, le segnalazioni che fanno riferimento ad autobus, a una particolare marca di telefono cellulare o alla targa di un’auto hanno maggiori probabilità di essere vere.


Nel giugno 2017, il team di Veripol ha condotto un test pilota nelle stazioni di polizia di Malaga e Murcia. Secondo l’articolo accademico, nell’83,54% delle segnalazioni identificate come false da Veripol, il denunciante ha finito per confessare di aver mentito. Nel dicembre dello stesso anno, la Fondazione della Polizia Spagnola ha assegnato un premio alla ricerca e nel 2018 il Ministero dell’Interno ne ha annunciato l’implementazione in tutte le stazioni di polizia.
Secondo i dati di Algorithm Watch, dalla sua implementazione fino a ottobre 2020, la Polizia Nazionale ha utilizzato Veripol per analizzare circa 84.000 denunce. Delle 49.702 denunce analizzate dalla polizia con Veripol nel 2019, la polizia ha concluso che 2.338 erano false, utilizzando una combinazione di Veripol e altri mezzi. Nel 2022, la polizia lo ha utilizzato molto meno, afferma il rapporto dell’Università di Valencia: il numero di denunce analizzate dalla polizia con Veripol è sceso a 3.762, di cui 511 sono state ritenute false dalla polizia.
Il rapporto evidenzia gravi carenze nello strumento, a partire dal suo approccio: l’idea di base è che il 57% delle denunce di rapina con violenza presentate siano false, un dato che ha come punto di riferimento l’elevato numero di casi di rapina irrisolti. Critica inoltre il campione ridotto di poco più di mille denunce rispetto ai circa 60.000 casi di rapina con violenza registrati ogni anno in Spagna, secondo il Portale delle Statistiche sulla Criminalità. Rileva inoltre la mancanza di un protocollo e di informazioni sulla formazione degli agenti di polizia per il suo utilizzo. La stazione di polizia di Vigo, che utilizzava il programma dal 2018, non è stata successivamente in grado di utilizzarlo a causa della mancanza di formazione dei suoi agenti – ha riferito La Voz de Galicia nel 2020.
Le denunce analizzate da Veripol sono state effettivamente scritte da agenti di polizia, quindi non si tratta di una riproduzione letterale della dichiarazione del denunciante, afferma il rapporto di Valencia: “Non analizza la storia che il potenziale bugiardo racconta alla polizia, ma analizza la storia che l’agente di polizia scrive lui stesso”. Lo strumento non tiene conto nemmeno delle differenze linguistiche in Spagna.
“Il sistema non è trasparente” – scrivono i ricercatori dell’Università di Valencia: “Non sono disponibili dati ufficiali su Veripol”. A febbraio 2023 e di nuovo a dicembre 2024, Civio ha richiesto informazioni sul funzionamento tecnico di Veripol e sul suo utilizzo, ma ad oggi il Ministero dell’Interno non ha nemmeno comunicato il numero di stazioni di polizia che lo utilizzano.
Metodologia di ricerca – Nel febbraio 2023, Civio ha richiesto al Ministero dell’Interno le specifiche tecniche di Veripol, i suoi casi d’uso e qualsiasi altro documento che consentisse di conoscere il funzionamento dell’applicazione e quali informazioni contiene o potrebbe contenere. Di fronte al rifiuto del Ministero dell’Interno di fornire tali informazioni, è stato presentato un reclamo, ai sensi della Legge sulla Trasparenza al Consiglio per la Trasparenza e il Buon Governo, che il 31 ottobre dello stesso anno si è pronunciato a favore del nostro diritto all’informazione e ha ordinato al Ministero dell’Interno di fornire le informazioni richieste. Le uniche informazioni infine fornite sono stati i link ai comunicati stampa pubblicati dalla Polizia e dall’Università Complutense sulla sua implementazione e il premio assegnato dalla Fondazione Spagnola per la Polizia.
Nel dicembre 2024, Civio ha nuovamente richiesto informazioni relative a Veripol. Nello specifico, è stato richiesto l’elenco delle stazioni di polizia che avevano implementato lo strumento e i relativi dati di utilizzo, inclusi il numero di casi trattati all’anno e la percentuale di casi in cui lo strumento aveva concluso che il reclamo era falso. Il Ministero ha risposto affermando di aver smesso di utilizzare Veripol il 21 ottobre 2024 e di essersi rifiutato di fornire i dati di utilizzo. Civio ha presentato un altro reclamo al Consiglio per la Trasparenza e la Buona Governance per accedere a questi dati, la cui indagine è ancora in sospeso.
Nella pre-print dell’articolo pubblicato sulla rivista Knowledge-Based Systems, “Applying automatic text-based detection of deceptive language to police reports: Extracting behavioral patterns from a multi-step classification model to understand how we lie to the police” (Lara Quijano-Sánchez, Federico Liberatore, Jose Camacho Collados e Miguel Camacho-Collados, Cardiff University, 2018), troviamo dati del 2015 sullo strumento, nonché un elenco di 110 termini, tradotti dallo spagnolo all’inglese. Abbiamo contattato gli autori, ma non ci hanno fornito l’elenco originale delle parole in spagnolo.
Pertanto, per evitare ambiguità derivanti dalla traduzione, abbiamo incluso solo le parole che sono spiegate nel contesto. L’elenco finale dei termini, con i rispettivi pesi (più alto è il valore, maggiore è l’influenza), delle parole che, se compaiono o compaiono molto frequentemente, determinano la probabile falsità della segnalazione sono: giorno (0,48), avvocato (0,43), assicurazione (0,24), schiena (7,74), zaino (0,10), spalla (17,99), casco (26,92), iPhone (25,56), Apple (0,23), appena (0,19), dietro (0,12), duecento (0,30), euro (6,81), contanti (19,18), contratto (19,19).
La selezione che abbiamo effettuato per i casi probabilmente veri è: autobus (0,52), targa (0,19), catena (16,06), polizia (0,31), cinese (52,58), collo (16,62), portale (0,26), atterraggio (0,36), pari (72,31), barba (0,34), centimetro (0,09), magro (0,09), scuro (0,10), urlo (40,67), afferrare (0,12), medico (16,75), amico (0,13).
Abbiamo sviluppato la visualizzazione del gioco con Svelte.js. David Cabo e Ana Villota hanno partecipato alla genesi e all’implementazione del gioco.
……………………..
Fonte: EDJNet – The European Data Journalism Network : Civio/Ter García, Carmen Torrecillas, Adrian Maqueda, David Cabo, Lucas Laursen
………………………………………………………………………..
Sabato, 18 ottobre 2025 – Anno V – n°42/2025
In copertina: immagine di Tingey Injury Law Firm/Unsplash

