Sicurezza e Giustizia

DEEP WEB: INVESTIGAZIONI DIGITALI NEL LATO OSCURO DELLA RETE

Facebooktwittergoogle_plusredditpinterestlinkedinmail

di Fabio Massa

La peculiarità del deep web è l’elevato livello di anonimato favorito dall’utilizzo di particolari tecnologie, come Tor. Da una parte Tor garantisce un livello di anonimato che consente di trasferire in alta sicurezza i dati oppure di superare condizioni di censura presenti in alcuni paesi, dall’altra parte rappresenta il mezzo ideale per attività criminali. L’analisi forense dei client nei quali è stato installato “Tor Browser Bundle”, può aprire scenari investigativi interessanti, che smentiscono alcune certezze di anonimato garantite dai manutentori dello stesso progetto.


 

I motori di ricerca nel web, in un certo senso, sono il cuore pulsante di internet, il termine “googling” è diventato ormai parte del nostro linguaggio e delle nostre abitudini digitali per qualsiasi attività online che decidiamo di intraprendere. Ma non tutti sanno che i classici motori di ricerca come Google, Yahoo, Bing in realtà accedono solo ad una piccolissima parte dei dati presenti nella rete, stimati nel 2001 allo 0,03% e ad oggi al 4% dei reali contenuti di internet. I risultati delle ricerche effettuate con i tradizionali motori di ricerca riguarda solo ciò che è stato indicizzato dai web crawler. In realtà il resto dei contenuti e dei siti web sono presenti nel deep web, chiamato anche invisible web, hidden web ecc. vale a dire quella parte del web invisibile ai web crawler poiché generata in maniera tale da non permetterne l’indicizzazione. La peculiarità del deep web, da non confondere con la dark net, è l’elevato livello di anonimato favorito dall’utilizzo di particolari browser progettati per questo scopo.

Prima di trattare nello specifico l’argomento, è opportuno capire il funzionamento dei motori di ricerca e dei loro robot (crawler) nelle fasi di indicizzazione di quella parte di internet evidente che noi tutti conosciamo.
I robot implementano la vera e propria funzionalità di ricerca ed utilizzano sofisticati algoritmi per raccogliere i dati dalle pagine ipertestuali. Sono chiamati “ragni” proprio perché riescono a districarsi nella complessa infrastruttura dei dati del web in modo multidirezionale raccogliendo e indicizzando tutti i metadati. Questi metadati, composti da svariate informazioni, quali ad esempio elementi come il titolo della pagina, la posizione della pagina (URL) e le parole chiave ripetute all’interno del testo, occupano molto meno spazio di quanto contenuto all’interno della pagina e quindi rendono estremamente versatili e funzionali le operazioni di indicizzazione dei contenuti nei motori di ricerca attuali. Questi utilizzano i “crawler” per la scansione dei contenuti web in modo totalmente automatizzato, esplorando il World Wide Web e generando copia delle pagine visitate per eseguire una successiva analisi e la conseguente indicizzazione. I crawler però hanno alcuni limiti tecnologici che limitano il recupero e la scansione del contenuto del WWW.

 

Di seguito elenchiamo alcune categorie di risorse, utilizzate in particolar modo nel deep web, non raggiungibili da questi software:

  • Unlinked Content: le pagine web non collegate ad altre pagine strutturate, in modo tale da impedire l’accesso al contenuto da parte dei Web Crawler. Il contenuto si riferisce a pagine senza backlink;
  • Private Web: siti web protetti da username e password. Questi includono le VPN (reti private virtuali) e qualsiasi sito web in cui le pagine richiedano l’identificazione per l’accesso, che può essere a pagamento oppure gratuito e può includere svariate tipologie di banche dati;
  • Limited Access Content: siti web che implementano strumenti tecnici di limitazione di accesso come ad esempio i Robot Exclusion Standard, i Captcha o siti che possiedono intestazioni PRAGMA http no-cache che vietano ai motori di ricerca di navigare e creare copia della cache;
  • Scripted Content: pagine web che sono accessibili solo mediante link prodotti da JavaScript o contenuti scaricati in modo dinamico dal server web tramite soluzioni Aiax o Flash;
  • Dynamic content: contenuti relativi a pagine web dinamiche. In questo caso, il contenuto della pagina viene visualizzato solo quando un utente compila un form contenente una query di ricerca (es. i criteri per la ricerca di un lavoro). Questo in genere include i database che generano le pagine su specifica richiesta;
  • Non Html-Content: contenuto testuale codificato tramite immagini e video o formati di file specifici non gestiti dai motori di ricerca e quindi non indicizzabili. Ad esempio un contenuto testuale gestito tramite un protocollo Gopher e ospitato su un FTP non viene indicizzato dai motori di ricerca tradizionali. Anche Google non può indicizzare pagine web al di fuori di HTTP o HTTPS;
  • Robots Exclusion: i file robot.txt che solitamente risiedono nella directory principale di un sito web possono essere impostati volontariamente per escludere l’indicizzazione del sito dai crawler; ciò, di conseguenza, renderà invisibili le pagine o il contenuto dello stesso;
  • Software: alcuni contenuti web vengono intenzionalmente resi accessibili esclusivamente tramite software speciali come Tor. In pratica Tor consente agli utenti di accedere ai siti web che possiedono il suffisso anonimo dell’host “.onion” nascondendo il loro indirizzo IP.

La crescita del deep web si deve alla diffusione di due software open source, il browser TOR e il BitCoin. Il Browser Tor fornisce la piattaforma all’utente per la navigazione anonima e per l’accesso agli pseudo-domini di primo livello aventi estensione “.onion”, mentre il BitCoin è la valuta digitale utilizzata in modo particolare per eseguire transazioni finanziarie in modo anonimo specialmente all’interno del deep web. In particolare, la cripto moneta, o valuta digitale, utile per eseguire transazioni finanziarie in modo anonimo, utilizza la tecnologia peer to peer priva del supporto di un’autorità centrale che gestisce le transazioni e l’emissione di denaro. Tutto viene svolto tramite algoritmi crittografici che controllano la creazione e il trasferimento di denaro in modo completamente anonimo.

 

…continua su EDICOLeA e sull’APP gratuita (iOSAndroid)


 

Altri articoli di Fabio Massa

  1. IL CASO SAN BERNARDINO: APPLE vs FBI
    di Fabio Massa (N. III_MMXVII)
    Il recente caso investigativo americano ha suscitato numerose discussioni di carattere tecnico, giuridico etico e sociale in merito alla disputa tra la Apple inc., la Federal Bureau of Investigation e la DOJ (U.S. Department of Justice), generata dalla richiesta di sblocco di un Iphone 5C utilizzato da uno dei killer della strage di San Bernardino in California del dicembre 2015, dove sono rimaste uccise 14 persone e ferite gravemente 22. il telefono dell’attentore è stato recuperato intatto, ma risultava bloccato da un codice di blocco a 4 cifre e impostato per il wiping dei dati dopo 10 tentativi falliti nell’inserimento del codice di blocco, opzione presente nei dispositivi iPhone. La Apple inc. adducendo diverse motivazioni, tecniche e giuridiche, ha rifiutato la disponibilità nella creazione di un software che avrebbe consentito di bypassare i sistemi di sicurezza dei loro dispositivi, nodo cardine delle politiche commerciali dell’azienda.
  2. LE TECNICHE DI ANTI FORENSICS
    di Fabio Massa (N. I_MMXVII)
    L’Anti-Forensics è l’insieme di strumenti, metodi e processi che ostacolano l’applicazione della Digital Forensics. Sebbene il termine non sia nuovo, non esiste una chiara definizione di queste tecniche, tuttavia lo scopo finale rimane quello di influire negativamente sulla esistenza, quantità e/o qualità delle prove nella scena del crimine digitale, con la conseguenza di rendere impossibile o complesso condurre le indagini. Conoscere l’Anti-Forensics, o non far finta che non esista, consente di affrontare le nuove sfide offerte dalla tecnologia per sviluppare opportune metodologie di identificazione e di analisi digitale adeguate a tutte le situazioni.
  3. GPS FORENSICS
    di Fabio Massa (N. IV_MMXVI)
    Il 15 dicembre 2016 è entrata in funzione la rete GALILEO (in inglese GNSS - Global Navigation Satellite System) grazie ai primi 16 dei suoi complessivi 30 satelliti che saranno dispiegati entro la fine del 2019. La rete GALILEO è stata sviluppata in Europa come alternativa al Global Positioning System (NAVSTAR GPS), controllato dal Dipartimento della Difesa degli Stati Uniti. L’uso del Sistema di navigazione satellitare è estremamente diffuso nella società odierna in molteplici applicazioni: civili, militari e industriali. Le potenziali fonti di prova che può fornire questo Sistema sono i dati storici di localizzazione.
  4. ANATOMIA DI UN ATTACCO RANSOMWARE
    di Fabio Massa (N. II_MMXVI)
    Come previsto in passato da numerosi esperti di sicurezza, oggi per la prima volta nel genere umano, un numero impressionante di persone sono sottoposte quotidianamente ad estorsioni digitali che prendono in ostaggio i dati, tramite ransomware e crittografia. L’uso dei personal computer e dei dispositivi digitali connessi alla rete, presenti oramai in tutte le attività quotidiane degli utenti, ha prodotto indirettamente un numero esponenziale di potenziali vittime di crimini informatici, amplificata dalle numerose campagne quotidiane di infezione. Ormai la già vasta gamma di ransomware è ulteriormente in crescita. La stragrande maggioranza di questi malware vengono generati per estorcere direttamente o indirettamente denaro alle vittime, a tal punto da essere considerati oggi una grave minaccia a livello globale.
  5. MALWARE FORENSICS
    di Fabio Massa (N. I_MMXVI)
    L’analisi forense in casistiche da infezione da malware (malicious software) è estremamente frequente nell’ambito delle investigazioni digitali, in particolar modo per fornire risposte ed elementi probatori ad attacchi e/o incidenti informatici, accessi abusivi, spionaggio, furto di identità e ricatto. I malicious software costituiscono una grave minaccia per la sicurezza dei sistemi informatici. Spesso, nelle casistiche relative alle investigazioni digitali di sistemi infettati da malware è necessario ricorrere ad una attenta analisi per fornire risposte mirate su cosa è accaduto e quali elementi probatori della sua esistenza possono essere reperiti nel sistema, riferiti anche agli attacker e ai metodi di diffusione ed infezione.
  6. L’ANALISI FORENSE DELLE EMAIL
    di Fabio Massa (N. IV_MMXV)
    Una email è composta da un header, un corpo messaggio, e in alcuni casi da un allegato, che generalmente contengono informazioni quali: mittente, destinatario, data e ora di invio e di ricezione, indirizzi IP del server di invio e di ricezione, e un ID messaggio univoco. In ambito forense queste informazioni hanno un valore probatorio molto importante, e possono essere recuperate tramite molteplici tecniche forensi da due categorie di applicazione di gestione della posta elettronica.
  7. OSINT E CYBER INTELLIGENCE: TECNICHE DI INVESTIGAZIONE NELLA RETE
    di Fabio Massa (N. III_MMXV)
    OSINT, acronimo di Open Source Intelligence, è un processo di analisi di Intelligence delle Fonti Aperte. L’Open Source Intelligence è una disciplina strettamente collegata al mondo della Cyber Intelligence, e rappresenta la raccolta di notizie che devono essere trasformate in “conoscenza”, attraverso fasi di validazione, di conferma e di attribuibilità certa della cosiddetta fonte di diffusione. Vediamo una panoramica dei più diffusi tools gratuiti a disposizione sul web che possono essere utilizzati per l’OSINT.
  8. MAC OSX FORENSIC ANALYSIS (II PARTE)
    di Fabio Massa (n.II_MMXV)
    Nel precedente numero: 1. Introduzione - 2. Tecniche di acquisizione ed analisi di un computer Macintosh - a) Avvio con CD DVD - b) Avvio Single User - c) Modalità Target Disk. In questo numero: 3. Machintosh file system - 4. La Radice UNIX - a) System tree - b) Local tree - c) User tree - d) Network tree - 5. Analisi Forense - a) Safari - b) Apple Mail - c) ichat - ) Keychains
  9. MAC OSX FORENSIC ANALYSIS (I PARTE)
    di Fabio Massa (n.I_MMXV)
    In questo numero: 1. Introduzione - 2. Tecniche di acquisizione ed analisi di un computer Macintosh - a) Avvio con CD DVD - b) Avvio Single User - c) Modalità Target Disk. Nel prossimo numero: 3. Machintosh file system - 4. La Radice UNIX - a) System tree - b) Local tree - c) User tree - d) Network tree - 5. Analisi Forense - a) Safari - b) Apple Mail - c) Keychains.
  10. MICROSOFT WINDOWS 8 FORENSICS
    di Fabio Massa
    Windows 8 ha introdotto molte novità che riguardano particolarmente la connessione costante alla rete Internet. Ora che possiamo considerarlo ampiamente diffuso, anche se è già in procinto di essere presentata la nuova versione 9, descriviamo le principali novità introdotte da Windows 8 ai fini delle indagini forensi.
  11. BITCOINS FORENSICS
    di Fabio Massa ( n. II_MMXIV )
    Bitcoin è una moneta elettronica creata nel 2009 da un anonimo conosciuto. La struttura peer-to-peer della rete Bitcoin e la mancanza di un ente centrale rende impossibile per qualunque autorità, governativa o meno, di bloccare la rete, sequestrare bitcoins ai legittimi possessori o di svalutarla creando nuova moneta. Al fenomeno è stato addirittura dedicato un evento alla Camera dei Deputati l’11 giugno 2014 dal titolo “Bitcoin in Italia: quali opportunità per le “monete matematiche” nel nostro paese?” nel quale si si sono messi in luce i rischi macroeconomici connessi ad una moneta a tendenza deflattiva. È stato poi annunciato il primo Bancomat Bitcoin italiano da oggi sul mercato, chiamato “Bit-Wallet”.
  12. ANALISI FORENSE DI UNA SCHEDA SIM
    di Fabio Massa ( n.IV_MMXI )
    Una delle casistiche più frequenti in una analisi forense, in particolar modo nel caso di un telefono cellulare, è la possibilità di ricavare da una SIM (Subscriber Identity Module) informazioni che risultano essenziali in moltissime circostanze, ad es. per ricostruire un evento criminoso, in molte situazioni anche di tipo omicidiario.
  13. FACEBOOK FORENSICS
    di Fabio Massa ( n.IV_MMXIII )
    Il social network Facebook®, con oltre un miliardo di utenti in tutto il mondo, ha acquisito il primato in qualità di mezzo di comunicazione digitale più famoso a livello globale. Una quantità impressionante di importanti informazioni personali e commerciali viene scambiata tra gli utenti quotidianamente, a tal punto da divenire anche un ottimo mezzo di acquisizione di fonti probatorie nel caso di indagini investigative criminali.
  14. ANALISI FORENSE DEL PEER-TO-PEER: L’ESEMPIO DI EMULE
    di Fabio Massa ( n.III_MMXIII )
    L’analisi forense di eMule, e di software dedicati alla stessa tipologia di attività su network P2P, può generare numerosi elementi probatori fondamentali ed inequivocabili in sede di giudizio.
  15. LA DIGITAL FORENSICS NEL CLOUD COMPUTING
    di Fabio Massa ( n.II_MMXIII )
    La digital forensics nel Cloud Computing è una nuova disciplina che studia il relativo crescente utilizzo di reti, computer e dispositivi di memorizzazione digitale impiegati in infrastrutture cloud, sfruttati per attività criminali hi tech e tradizionali.