Francesco SigonaIV_MMXVLawful InterceptionMirko Grimaldi

IL RICONOSCIMENTO DEL PARLANTE IN AMBITO FORENSE: UNO STUDIO INDIPENDENTE SUL SOFTWARE IDEM/SPREAD IN USO AI CARABINIERI

di Francesco Sigona, Mirko Grimaldi

In Italia vi sono due software per il riconoscimento del parlante ispirati al metodo bayesiano – basato sul rapporto tra la probabilità che la traccia vocale anonima appartenga all’imputato (ipotesi accusatoria) e la probabilità che essa appartenga ad un qualunque individuo – in dotazione, rispettivamente, all’Arma dei Carabinieri e alla Polizia di Stato: IDEM e SMART. In questa sede discuteremo di alcune problematiche rilevate nel software IDEM/SPREAD, versioni 2013, 2011, 2009 e 2008 ML, emerse durante lo studio su casi di test e segnalate al referente della Fondazione “Ugo Bordoni”  di Roma che lo ha realizzato. Gli autori del presente lavoro si sono resi disponibili a svolgere ulteriori verifiche su casi reali.


 

1.     Introduzione
Alla base del riconoscimento del parlante in ambito forense vi è l’idea che la voce anonima (reo, generalmente proveniente da un’intercettazione telefonica o ambientale) possa essere comparata con la voce nota (imputato). Sulla base delle attuali conoscenze scientifiche, il metodo di comparazione universalmente accettato si ispira alla biometria della voce. Come nel caso del DNA, l’obiettivo è di individuare un soggetto a partire da parametri relativi a caratteristiche biologiche oggettive, che siano peculiari di un determinato individuo e allo stesso tempo ben differenziate tra individui diversi. Nel caso della voce si fa riferimento alla frequenza fondamentale (o pitch) FF0 e alle prime tre frequenze formantiche FF1, FF2 e FF3: la FF0 è correlata con la modulazione prosodico-intonativa, le FF1-FF3 con alcune caratteristiche acustico-articolatorie delle vocali, che le distinguono le une dalle altre. Questo approccio prende il nome di metodo parametrico, perché basato su parametri oggettivi del parlato e non su valutazioni soggettive [1]. Dal momento che i parametri presi in considerazione sono caratterizzati da variabilità sia nelle produzioni di uno stesso individuo (variabilità “within” o intra-parlante), sia tra individui distinti (variabilità “between”, o inter-parlante), oltre che da una variabilità dovuta ad altri fattori quali, ad esempio, il canale trasmissivo del segnale vocale, la comparazione fonica di due registrazioni vocali è possibile soltanto ricorrendo a metodologie di tipo statistico.

In tale ottica, la questione può essere così riformulata: quante probabilità ci sono che i campioni delle due voci, date alcune differenze fra di loro, siano stati prodotti dalla stessa persona piuttosto che da parlanti differenti appartenenti alla stessa popolazione? [2]. Alla soluzione del problema si perviene applicando il teorema di Bayes che permette di valutare il rapporto tra la probabilità che la traccia vocale anonima appartenga all’imputato (ipotesi accusatoria) e la probabilità che essa appartenga ad un qualunque individuo all’interno di una popolazione linguistica di riferimento, quale ad esempio la popolazione italiana (ipotesi difensiva). Tale rapporto viene tecnicamente definito ‘rapporto di verosimiglianza’ (Likelihood Ratio – LR). Se una delle due probabilità è marcatamente maggiore dell’altra, allora il LR può fornire evidenze a favore di una certa ipotesi (per esempio, le voci appartengono alla stessa persona), in caso contrario le tracce vocali hanno scarsa valenza probatoria (v. Tab. 1). L’analisi statistica permette altresì di calcolare degli indicatori della qualità dei risultati ottenuti: le probabilità di errore di falso rigetto (p.f.rj) e di falsa identificazione (p.f.id.), ovvero di rifiutare che la voce dell’intercettato appartenga all’imputato quando in realtà così è, oppure di accettare che la voce dell’intercettato appartenga all’imputato quando in realtà così non è.

 

…continua su EDICOLeA e sull’APP gratuita (iOSAndroid)

 


Altri articoli di Francesco Sigona

 


Altri articoli di Mirko Grimaldi

Show More

Related Articles