I dati di Fivethirtyeight e i tweet italiani. Troll russi?

Ho deciso che dal 23 gennaio 2018 il mio blog non avrà più banner pubblicitari e sarà sostenuto dalle vostre donazioni che potete inviare qui: https://www.paypal.me/DavidPuenteit

Il due agosto avevo scritto tramite i miei canali social che avrei passato un po’ di tempo per leggermi i dati pubblicati da Fivethirtyeight in merito ai tweet ritenuti della “propaganda russa” e in particolar modo di quelli collegabili all’Italia e ritenuti vicini al Movimento 5 Stelle e la Lega.

Ecco la sintesi riportata da SkyTg24 il 2 agosto 2018:

Come scrive Fivethirtyeight.com, la fabbrica di troll russa – cioè la Internet Research Agency – avrebbe 400 impiegati e, da San Pietroburgo, avrebbe dato vita a “una sofisticata e coordinata campagna per seminare disinformazione e discordia nella politica americana”. Non solo: come scrivono Corriere e Repubblica, gli investigatori di Washington hanno constatato che una parte del materiale è in italiano. Nello specifico, in tutti i casi che il Corriere ha potuto esaminare, non sono contenuti originali direttamente immessi nel circuito del dibattito politico nel nostro Paese. Piuttosto, i profili della fabbrica russa “rilanciano con una serie di retweet altri profili noti per essere al centro della conversazione sul social network degli ambienti simpatizzanti con le forze populiste in Italia“. Comunque “nulla permette di ipotizzare che M5S o la Lega abbiano ricercato o concordato alcun tipo di sostegno da parte delle fabbriche di troll della Russia”.

In entrambi i pezzi del Corriere e Repubblica viene citata “NoemiJBra“, l’utente twitter che beccai l’anno scorso per una bufala ai danni dell’allora Ministro Poletti:

Come scrivono i due quotidiani, nel caso dell’Italia al centro dei file c’è il profilo di “Elena” – nome in codice Elena07617349 – che oggi non esiste più ma che fino al 2017 si distingueva per essere associata a contenuti anti Obama, Renzi e contro gli sbarchi. Un altro profilo filo-populista è quello di @NoemijBra, sparito nel 2017, quando il fact-checker David Puente ha smascherato una fake news di NoemiJBra ai danni dell’allora ministro Pd Giuliano Poletti.

Prima di continuare bisogna raccontare da dove nasce lo studio raccontato da Fivethirtyeight.

Perché si parla di Russiagate

Nell’ambito delle indagini svolte da Robert Mueller, negli Stati Uniti sono stati accusati 13 cittadini russi (PDF) di aver interferito nei processi elettorali e politici americani:

Il documento dell’accusa nei confronti dei 13 russi

I 13 avrebbero lavorato per una “fabbrica di troll” chiamata “Internet Research Agency” con sede a San Pietroburgo.

Nel novembre 2017 venne pubblicato, grazie a Twitter, un primo elenco degli username associati alla “Internet Research Agency” (PDF) al quale si è aggiunto uno nuovo, nel giugno 2018, con 3.841 username (PDF). Purtroppo, gran parte di questi account vennero sospesi da Twitter, portandosi dietro anche i loro interventi tra tweet e retweet. Come fare? Gli autori dello studio “Troll Factories: The Internet Research Agency and State-Sponsored Agenda Building” (PDF), i professori Darren Linvill e Patrick Warren della Clemson University erano riusciti ad ottenere i dati necessari dalla Social Media Listening Center di Clemson (in possesso di “più di 650 mila conversazioni social“).

Lo studio riportato da Fivethirtyeight.com, annunciato e spiegato in un articolo del 31 luglio 2018 dal titolo “Why We’re Sharing 3 Million Russian Troll Tweets“, è stato svolto sulla base degli account associati alla “fabbrica di troll” e a circa 3 milioni di loro interventi tra tweet e retweet tra il febbraio 2012 e il maggio 2018.

In nessun punto dell’articolo di Fivethirtyeight.com viene citata l’Italia, mentre nello studio viene fatto riferimento a degli interventi in lingua italiana e non solo:

828,219 tweets from 1,472 separate handles tweeted predominantly in a language other than English. The majority of these were Russian language handles, but handles also tweeted in German, Italian, Arabic, French, and Spanish. In an effort to keep the focus of the current study on the IRA’s U.S. operations, these handles were removed.

Lo stesso studio riporta che parte dei dati sono stati rimossi dalle analisi al fine di circoscriverle nella sfera americana.

 

Le lingue e le regioni geografiche

La ricerca contiene 2.942.712 contenuti condivisi dagli account associati all’IRA, alcuni di essi si ripetono perché trattati da più di un account sospetto, ma è interessante notare che ci sono tante lingue (che però hanno dei limiti, come vedremo successivamente) e tante regioni geografiche da dove sarebbero stati pubblicati i contenuti:

Le lingue individuate nei contenuti dello studio

Come possiamo notare, in classifica abbiamo la lingua inglese seguita da quella russa (a grande distanza), seguiti dalla lingua tedesca, ucraina ed italiana.

Regioni associate ai contenuti dello studio

Tra le regioni interessate dai contenuti condivisi troviamo gli Stati Uniti in maniera predominante, una grossa fetta di “imprecisati“, seguiti da Azerbaigian, Emirati Arabi, Russia, Bielorussia, Germania, Regno Unito ed infine Italia.

 

I tweet e gli account italiani

Una volta scaricati tutti i file forniti da Fivethirtyeight su Github.com (9 “comodissimi” file CSV) la prima cosa che ho cercato era proprio l’account “NoemiJBra” (@NoemijBra) per verificarne la sua presenza. Ebbene si, è presente e soltanto in un unico retweet riportato su 2.942.712 tweets. Ecco il tweet originale pubblicato il 4 dicembre 2016 da “@phildancefc“:

Il tweet in risposta a “@Elena07617349” dove viene taggata “@Noemijbra”

Mentre gli account “@Noemijbra” e “@RossellaFidanza” risultano rimossi dai rispettivi proprietari, l’account di “@Elena07617349” risulta sospeso. Quest’ultimo viene soltanto citato in 319 retweet effettuati da 32 account associati all’IRA nell’arco di tempo tra l’ottobre 2016 e marzo 2017:

Il grafico temporale dei retweet dove viene citato l’account “Elena07617349

Ecco l’elenco degli account associati all’IRA e il numero dei retweet per ognuno di essi contenenti l’account “Elena07617349“:

Autore Retweet
RYANMAXWELL_1 37
HOLLYDLER 22
ARCHIEOLIVERS 21
DEUSXYX 21
DEVINEDEVINBR 20
STANLEY_COX_ 20
AMELIEBALDWIN 19
LAZYKSTAFFORD 19
REALROBERT1987 18
DOROTHIEBELL 16
EVAGREEN69 15
JEANNEMCCARTHY0 15
MICHELLEARRY 15
PRICEFORPIERCE 13
INTERFISCHER 11
KELVIN_CHAMBERS 10
PATRIOTRAPHAEL 10
WESTERNWINDWES 10
PATRIOTBLAKE 9
MIL0BLAKE 8
WATCHMEWALKIN 7
COOKNCOOKS 4
CHESPLAYSCHESS 3
EMILEEWAREN 3
CARRIETHORNTHON 2
DONNABRIVERA 2
BRIANWARNING 1
EDWARDBROBERTS 1
FINLEY1589 1
JACQUELINISBEST 1
JEFFREYKAHUNAS 1
PRETTYLARAPLACE 1

 

Tra i 319 tweet condivisi da questi utenti troviamo di tutto e tanti altri tag a utenti come Alessandro Meluzzi (12345), Maria Elena Boschi (1), Forza Nuova (1), Magdi Cristiano Allam (12), Maurizio Gasparri (1), Lucio Malan (1), Simona Bordonali (1)

Questo slideshow richiede JavaScript.

Mancano all’appello tanti altri tweet dove vengono taggati anche altri politici italiani come Laura Boldrini e Alessandra Mussolini. Tutto ciò cosa significa? Che sono account appartenenti alla “rete russa“? Significa soltanto che gli account associati all’IRA hanno fatto retweet di contenuti dove diversi utenti rispondevano o taggavano “Elena07617349“.

Sono circa 18.014 i tweet aventi come lingua riconosciuta l’italiano, ma la cosa curiosa è che nei retweet riportati nei file ci sono molti contenuti in italiano e come lingua riconosciuta una totalmente diversa. Ad esempio, il seguente tweet viene etichettato come in lingua vietnamita (lo trovate due volte nei file “IRAhandle_tweets_3.csv” e “IRAhandle_tweets_4.csv“):

Il tweet etichettato come in lingua vietnamita

La maggior parte delle attività di retweet si sono svolte tra il febbraio e maggio 2017, con dei picchi tra giugno/ottobre 2017 e nel 2015.

I picchi dei contenuti condivisi in lingua italiana dagli account associati all’IRA

C’è da dire che tra gli account associati all’IRA ce ne sono parecchi con nomi italiani:

Autore Retweet
ANNAROMAN0 3039
1LORENAFAVA1 2919
GATTISILGATTI 2490
FRANNERVIA 1594
VITTOREGUIDI 1508
ROSSIROSSIVIN 958
SERGIO_MAESTRI 450
MARIALUIGI5 347
GIOVANNA__MORET 298

 

Mattarella e la politica italiana

Una “piccola” precisazione: lo studio pubblicato da Fivethirtyeight e i dati condivisi dai ricercatori non hanno direttamente a che fare con l’altro scandalo sollevato in questi giorni sulle attività social contro il Presidente della Repubblica Mattarella. Ribadisco: sono due storie al momento diverse.

La keyword “Mattarella” nei CSV pubblicati viene riportata in appena 33 tweets su quasi tre milioni. “Renzi” viene riportato 458 volte (ho tolto un’unità al conteggio siccome viene citato un tal “Rick Renzi“), Salvini 83 e Di Maio appena 26.

Citazione Volte
Renzi 459
Salvini 83
Mattarella 33
Di Maio 26
Beppe Grillo 14

 

Il Movimento 5 Stelle 125 volte, la parola “Lega” viene citata 41 volte dalle quali bisogna togliere quelle associate a “Lega Pro” e altri contenuti in altre lingue e che non riguardano la politica.

 

Il sostegno a Lega e M5S?

L’articolo di Repubblica, intitolato “Dalla propaganda di Putin 1500 tweet per Lega e 5S“, riporta quanto segue:

Tra di loro ci sono circa 1.500 tweet italiani. Interessante è, per esempio, il profilo “lorenafava” che twitta su argomenti vari ma per lo più a favore dei russi e contro gli americani (accusati per esempio di crimini contro l’umanità negli Stati Uniti). “Putin è l’unico grande statista e uomo di pace, Usa sono guerrafondai” scriveva poi ad esempio “belkastrelka” che aveva un lungo campionario di messaggi contro i musulmani e gli americani. “Hanno pagato loro dopo la ricezione del bonifico del Pd alla fondazione Clinton”, scriveva uno dei profili finiti sotto la lente. Per poi aggiungere: “Meno male che ci siamo noi amici twitteri che riportiamo alla cronaca le verità! Per loro troppo comodo nasconderle”.

Da una prima analisi è interessante verificare come molti di questi profili fake creati a San Pietroburgo interagissero con altissima frequenza con profili di sostenitori della Lega e del Movimento 5 Stelle, come nel caso appunto della bufalara “Noemi” scoperta da Puente.

Non mi risulta che vi siano 1.500 tweet italiani. Infatti, in precedenza avevo pubblicato una tabella con i tweet condivisi da utenti con nomi italiani dove troviamo “Lorenafava1” con 2.919 condivisioni in lingua italiana:

Autore Retweet
ANNAROMAN0 3039
1LORENAFAVA1 2919
GATTISILGATTI 2490
FRANNERVIA 1594
VITTOREGUIDI 1508
ROSSIROSSIVIN 958
SERGIO_MAESTRI 450
MARIALUIGI5 347
GIOVANNA__MORET 298

 

Di tweet in lingua italiana ce ne sono 18.014, mentre in associazione con la regione geografica di pubblicazione “Italia” ne riscontro 12.095 in totale (ricordando che alcuni vengono considerati erroneamente come in lingua vietnamita). Di questi bisognerebbe fare un filtro relativo ai doppioni, siccome a volte gli account associati all’IRA a volte condividevano gli stessi tweet.

Il tweet di “@ausoloda”

Il tweet contenente la frase “Putin è l’unico grande statista e uomo di pace” non è nemmeno scritto da “@_belka_strelka“, ma da “@ausoloda“, e benché la lingua riconosciuta sia l’italiano la regione geografica viene ritenuta “sconosciuta“. L’account “@_belka_strelka” viene solo taggato nel tweet, mentre altri a lei associati parlano di “torta con la ricotta e il profumo d’arancio” (tweet sempre di “@ausoloda“) e di Donbas (nel tweet di “@dmitriy_iv_bo“).

Questo slideshow richiede JavaScript.

Il tweet sul PD e la Fondazione Clinton è opera dell’utente “@dar_casartelli” in risposta a “@Elena07617349” ed è stato condiviso due volte dalla rete degli account associati all’IRA, prima da “@EVAGREEN69” e poi da “@INTERFISCHER“:

Il tweet sul PD e la Fondazione Clinton

 

 

Conclusioni

Come riportato nello stesso studio, parte dei dati sono stati rimossi dalle analisi al fine di circoscriverle nella sfera americana. Non si può, dunque, ritenere a pieno che questi dati dimostrino qualcosa di collegato ad una “fabbrica di troll” in Italia o in altri Paesi come Germania e Ucraina (le altre due lingue più presenti oltre al russo). Richiedere una commissione di inchiesta soltanto su questi dati non basta.

Lo studio è molto interessante e ha tanti altri dati curiosi che andrebbero approfonditi, del resto gli autori desiderano ricevere altre informazioni da chi analizzerà i dati da loro raccolti e pubblicati. Non credo sia finita qua e credo che mi “divertirò“.

Prossimamente spiegherò qualche concetto utile per comprendere queste realtà.

David Puente

Nato a Merida (Venezuela), vive in Italia dall'età di 7 anni. Laureato presso l'Università degli Studi di Udine, opera nel campo della comunicazione e della programmazione web.
REGOLAMENTO DELLA DISCUSSIONE
Non sono consentiti:
- messaggi off-topic (tradotto: non inerenti al tema trattato)
- messaggi anonimi (registratevi almeno a Disqus)
- messaggi pubblicitari o riportanti link truffaldini (verranno sempre moderati i commenti contenenti link esterni)
- messaggi offensivi o contenenti turpiloquio
- messaggi razzisti o sessisti
- messaggi il cui contenuto costituisce una violazione delle leggi italiane (istigazione a delinquere o alla violenza, diffamazione, ecc.)
Se vuoi discutere in maniera costruttiva ed educata sei il benvenuto, mentre maleducati, fanatici ed esaltati sono cortesemente invitati a commentare altrove.
Comunque il proprietario di questo blog potrà in qualsiasi momento, a suo insindacabile giudizio, cancellare i messaggi che violeranno queste semplici regole. I maleducati (soprattutto se anonimi) verranno bloccati. In ogni caso il proprietario del blog non potrà essere ritenuto responsabile per eventuali messaggi lesivi di diritti di terzi.

Regolamento in vigore dal 5 settembre 2016 - Aggiornato 26 agosto 2017.