Popolarità su Facebook e successo elettorale nelle amministrative 2012

Risultati e modelli di previsione elettorale con Facebook

Nel post precedente ho messo alla prova il modello sviluppato per le amministrative 2011 sui dati rilevati in questa tornata elettorale.
Vediamo come è andata.
Il modello ha funzionato nel 66,6% dei casi. Nello specifico il candidato con più Facebook Likes è risultato il più votato nel 41,6% dei casi (Catanzaro, Como, Genova, Lecce, Lucca, Monza, Palermo, Rieti, Taranto e Trani) ed è arrivato invece secondo nel 25% dei casi (Agrigento, Belluno, Brindisi, Cuneo, Gorizia e Pistoia).
Nel 2011 il modello aveva funzionato nell’82,1% dei casi (39,2%  primo e 42,86% secondo).
Nel 20,8% dei casi il modello ha previsto correttamente sia il candidato più votato che quello secondo classificato, ma in altrettanti casi il modello ha fallito completamente (in alcuni di questi casi non aveva alcuna chance visto che i candidati che hanno vinto non avevano una pagina Facebook).
L’indice di accuratezza della previsione è stato di 4,875 su 10. Nel 2011 questo indice ha fatto registrare performance simili (4,71).
Vediamo invece come è andata per quanto invece riguarda il secondo modello, il cui scopo è prevedere la percentuale di voti riportati da ciascun candidato.
Il margine di errore rilevato (candidate prediction gap) varia da un minimo di 0,07% ad un massimo di 70,54% (2011 CPG MIN: 0, MAX: 84,18).
Lo scarto medio fra le percentuali di voto e quelle di Likes è stato del -7,04% ovvero del 12,76% facendo la media dei valori assoluti degli scarti. Il primo valore è un indicatore di quanto la previsione sia sbilanciata in un senso o nell’altro (+ voti che like o + likes che voti), il secondo valore indica il margine di errore effettivo. Nel 2011 il CPG medio dei valori assoluti era 15,77% e l’ABS[CPG] -6,21%. Si tratta di margini di errori molto alti che rendono il modello così com’è poco utile dal punto di vista previsionale.
I 24 comuni capoluoghi con almeno due candidati con pagina Facebook avevano 5 e 16 candidati. Il 55,87% di questi candidati aveva una pagina Facebook che è stata monitorata nell’ambito di questo studio. Il margine medio di errore rilevato per comune ovvero ABS[Municipality Prediction Gap] è 15,24% con un massimo di scarto del 35,88% (Agrigento) ed un minimo del 4,70% (Genova). Nel 2011 l’ABS[MPG] rilevato fu 18,99% con un MIN di 5,09% ed un MAX di 51,99%.
Si conferma il rapporto fra ABS[MPG] e percentuale di candidati presenti con una pagina su Facebook rispetto al totale dei candidati. L’ABS[MPG] passa dal 24,78% dei comuni con meno del 33% di candidati su Facebook all’11,89% di quello dei comuni con oltre il 66% di candidati con pagina (nella categoria 34-66% l’ABS[MPG] è di 15,11%).
Confermato anche il rapporto fra dimensione della città (in termini di numero di elettori) e margine di errore. Nelle grandi città si ottengono previsioni più accurate che in quelle più piccole. Si passa infatti da un ABS[MPG] di 17,39% delle città con meno di 80000 elettori ad un ABS[MPG] intorno al 9% tanto per le città con un numero di elettori compreso fra 80000 e 200000 sia per quelle oltre i 200000.
Per quanto riguarda gli schieramenti si è proceduto a calcolare un Party Prediction Gap (PPG). Nel 2011 tutti gli schieramenti avevano ricevuto un maggiore consenso su Facebook, rispetto alle percentuali reali di voto, ma questa tendenza si faceva più evidente in rapporto ai partiti più estremi (sinistra PPG=-11,27% e destra PPG =-8,66%). Il partito invece meno sopravvalutato dal modello risultò il Centro Destra (PPG=-1,30%). Rispetto all’edizione 2011, sono stati aggiunti due nuovi schieramenti: Terzo Polo e Lega Nord. Il primo non esisteva nel 2011 ed il secondo era accorpato al risultato del Centro Destra. Proprio questi due nuovi schieramenti sono stati quelli più sottostimati dal modello Terzo Polo (PPG=4,58%) e Lega Nord (PPG=5,56%). La Destra è invece risultato lo schieramento più sopravvalutato nelle previsioni di Facebook (PPG=-18,71%).
Se dunque si conferma un maggiore attivismo online da parte dei supporter dei partiti più estremi, si evidenzia anche l’anomalia della Lega Nord. Accorpando infatti i dati della Lega Nord con quelli del Centro Destra, quest’ultimo torna ad essere fra gli schieramenti più sopravvalutati dal modello. Questi dati potrebbero far pensare ad un incidenza dei candidati (o meglio delle strategie e supporter) Lega Nord anche sul risultato del 2011. Quello che appare evidente è che le strategie di costruzione del consenso della Lega Nord (e forse la tipologia di elettori di questo partito) non sono passate, almeno in questa occasione, per Facebook.
Per il futuro intendo provare a perfezionare il modello basato sugli scarti prendendo in considerazione solo i voti ottenuti dai candidati effettivamente presenti con una pagina su Facebook e applicando dei correttivi basati sui risultati dei PPG dei diversi schieramenti. Inoltre vorrei capire quali variabili possono influenzare il margine di errore e l’indice di accuratezza in modo da costruire un indice di affidabilità delle previsione.
I dati sono disponibili in questo Google Spreadsheet.
Da oggi ho inoltre reso pubblicamente disponibile il working paper relativo allo studio del 2011: Giglietto, Fabio, If Likes Were Votes: An Empirical Study on the 2011 Italian Administrative Elections (January 16, 2012). Available at SSRN: http://ssrn.com/abstract=1982736. Una versione ridotta di questo articolo sarà pubblicata negli atti dell’ICWSM-12.

Chi usa Facebook ha più fiducia negli altri

Le conclusioni di un recente studio smentiscono molti luoghi comuni

Questa è una delle conclusioni a cui sono giunti i ricercatori del Pew Internet nel loro ultimo studio intitolato Social networking sites and our lives.
Il report è particolarmente interessante perché affronta temi che spesso affiorano quando si parla di Internet e Siti di Social Network: Saremo tutti più isolati e individualisti? Ci rinchiuderemo nella cerchia delle persone che condividono le nostre stesse opinioni ed interessi?
Queste ipotesi appaiono largamente smentite dai dati e dall’analisi che ne fanno i ricercatori americani.

  • Alla domanda che chiedeva di indicare il grado di accordo sull’affermazione “sento che la maggior parte delle persone sono degne di fiducia” gli utenti di Internet hanno risposto affermativamente nel doppio dei casi rispetto ai non utenti di Internet. Inoltre un utente di Facebook che usa la piattaforma diverse volte al giorno ha il 43% di possibilità in più rispetto agli utenti di Internet di esprimere accordo con questa affermazione. I dati sono stati depurati dal fattore demografico (ovvero i ricercatori hanno tenuto conto del fatto che il grado di accordo ad una domanda simile può essere correlato con l’età della persona ed essendo gli utenti di siti di social network più giovani del resto della popolazione…);
  • Gli utenti di Facebook hanno un numero maggiore di legami sociali forti. La media US è di 2.16 amici con cui ci si confida (in crescita rispetto al 1.93 della rilevazione 2008). Gli utenti Facebook che usano la piattaforma più volte al giorno hanno in media il 9% in più di legami forti rispetto agli altri utenti Internet;
  • Calcolando il supporto sociale (emotivo, compagnia e strumentale) che si riceve dai propri legami sociali su una scala dove il massimo è 100, gli americani in media fanno registrare i seguenti dati: 75/100 supporto, 75/100 supporto emotivo, 76/100 compagnia, 75/100 strumentale. Gli utenti internet superano di 3 punti la media sul supporto totale e di 6 punti la media sulla compagnia. Gli utenti Facebook che usano la piattaforma più volte al giorno ottengono altri 5 punti (rispetto agli Internet users) sul supporto totale, 5 punti sul supporto emotivo e 5 punti sulla compagnia. Per dare un’idea di cosa significhi la differenza in questa scala i ricercatori fanno notare che l’incremento di punteggio fatto registrare dagli utenti Facebook è paragonabile per entità a sposarsi o andare a vivere con un partner;
  • Dati relativi alle elezioni di MidTerm 2010. Su una media di 10 Americani su 100 che dichiarano di aver partecipato ad una dimostrazione politica, 23% che ha provato a convincere altri a supportare uno specifico candidato e 66% che hanno dichiarato di essere intenzionati a votare, l’utente Internet ha il doppio di possibilità di aver partecipato ad un evento politico, il 78% di possibilità in più di aver cercato di convincere altri a supportare un certo candidato ed il 53% in più di dichiarare di aver intenzione di votare. Rispetto agli utenti Internet, gli utenti Facebook che usano la piattaforma più volte al giorno hanno due volte e mezzo la possibilità che ha un utente Internet di aver partecipato ad una manifestazione politica, il 57% in più di aver cercato di persuadere qualcuno a votare in un certo modo e un 43% di possibilità in più di aver dichiarato l’intenzione di partecipare al voto.

Altri dati interessanti:

  • il 79& degli Americani adulti ha usato Internet ed il 47% (59% degli Internet Users) almeno un sito di social network. In Italia secondo una ricerca svolta con metodologia analoga a Dicembre 2010 dal laboratorio di ricerca LaRiCA erano 58% di Italiani adulti ad aver usato Internet e 32% (55% degli Internet Users) ad aver usato un sito di social network;
  • Solo il 3% dei contatti su Facebook degli utenti Americani è costituito da persone che l’utente non ha mai conosciuto ed il 7% da persone incontrate una sola volta.

Come al solito vorrei sottolineare quanto sarebbe importante, utile e relativamente semplice riproporre uno studio identico in Italia. Se qualcuno vuole finanziare l’operazione io mi metto a disposizione per lavorarci gratuitamente anche da domani 😉

Le performance degli schieramenti politici su Facebook

Quanto e come la popolarità Facebook di un candidato appartenente ad un certo schieramento politico si riflette nelle percentuali di voto valido?

Dopo aver visto gli scostamenti per comune, prosegue l’analisi dei dati raccolti durante il primo turno delle elezioni amministrative del 15 e 16 Maggio. Questa volta abbiamo analizzato gli scostamenti per schieramento. Per farlo abbiamo operato una semplificazione dello scenario creando sette categorie (destra, centro-destra, centro, centro-sinistra, sinistra, movimento 5 stelle e altri) ed assegnano ciascun candidato sindaco ad uno di questi schieramenti.
Il risultato è riassunto in questo grafico:

In generale le percentuali di Facebook mostrano uno scostamento negativo rispetto a quelle ottenute dai candidati alle elezioni (percentuali più alte di Likes che di voti reali). Si tratta di un risultato fisiologico influenzato dall’assenza di molti candidati nella competizione su Facebook (candidati cioè che non hanno una loro pagina Facebook). Riducendosi il numero di competitors si alzano le percentuali medie.
Lo scarto medio fra Likes e voti è del -5% (in valore assoluto +/- 7%).
Emergono tuttavia altre due interessanti considerazioni:

  1. L’unico schieramento che ottiene un risultato in contro-tendenza è il centro-destra che fa registrare uno scostamento positivo del +8%. Lascio ai politologi l’interpretazione di questo dato che potrebbe essere influenzato dalle diverse strategie di campagna adottate dal centro-destra o dalle variabili strutturali che caratterizzano la popolazione di Facebook in Italia;
  2. Le forze estreme fanno registrare scostamenti maggiori rispetto alle forze più moderate. Gli otto candidati del centro (tutti riconducibili al terzo polo) fanno infatti registrare uno scostamento del -0,87%. Destra e Sinistra si attestano invece rispettivamente a -9% e -10%. Rilevante anche lo scostamento delle liste civiche (-15%) trainate con tutta probabilità dalla notorietà dei personaggi candidati.

I dati disaggregati per candidato sono consultabili in questo foglio del Google Spreadsheet di lavoro.
Contare i Mi Piace si è rivelato un esercizio interessante ed istruttivo. Gli indicatori costruiti si sono rivelati più accurati di quanto non si potesse pensare inizialmente. Ovviamente nessuno ipotizza un rapporto di causa-effetto fra popolarità su Facebook di un candidato e risultato elettorale. Si tratta di variabili indipendenti il cui andamento mostra tuttavia delle interessanti similitudini.
Siamo tuttavia consapevoli del fatto che parte dei Likes/Mi Piace di un candidato potrebbero essere rappresentati da detrattori e non da supporter di quel candidato. Per postare contenuti e commenti in una pagina è infatti necessario cliccare preventivamente sul bottone Mi Piace. Una interessante analisi su questo è stata pubblicata oggi su FriendFeed da Gianandrea di BuzzDetector. L’analisi mostra bene le evidenti differenze di comportamento degli utenti della pagina Facebook di Letizia Moratti e di Giuliano Pisapia.
Per questo motivo, durante la campagna elettorale, abbiamo inoltre raccolto tutti i contenuti (post e commenti) delle pagine Facebook dei candidati più popolari nella maggiori città. Abbiamo iniziato l’analisi di questi dati ma ci vorrà del tempo per vedere i risultati.
Per rimanere aggiornati su questo e altri progetti fai Like qui:

Nota metodologica: per calcolare gli scostamenti per schieramento abbiamo eliminato le città dove era presente su Facebook un solo candidato (Olbia e Ravenna).

Se i likes fossero voti

Come finirebbero le elezioni nelle quattro principali città italiane chiamate al voto se a contare fossero i Likes su Facebook?

Da quando sono state annunciate le candidature a sindaco per le amministrative del 15 e 16 Maggio stiamo raccogliendo con il LaRiCA i dati sul numero di Likes ricevuti dalle pagine Facebook dei candidati.
Lo scopo del progetto è descritto nel post Predire il risultato elettorale su Facebook?
Ho provato a vedere come andrebbero le cose se i Likes fossero voti (ovvero calcolando la percentuale di Likes ricevuti da ogni candidato sul totale dei Likes ricevuti da tutti i candidati di quel comune).
Ecco come andrebbe nelle quattro maggiori città:

[visualizza il grafico interattivo]

[visualizza il grafico interattivo]

[visualizza il grafico interattivo]

[visualizza il grafico interattivo]
N.B. Il Like, a differenza del voto, può essere espresso per più di un candiadato.

Predire il risultato elettorale con Facebook?

Esiste una correlazione fra la popolarità di una pagina Facebook ed il risultato elettorale di un candidato?

Subito dopo le elezioni politiche americane del 2010, il team politico di Facebook rilasciò una nota che metteva in evidenza come su un campione di 98 competizioni elettorali per il seggio della camera e 34 per quello del senato, rispettivamente nel 74% dei casi e nell’82% dei casi è risultato eletto il candidato che aveva un numero maggiore di fan (oggi Likes) sulla pagina Facebook ufficiale.
Un successivo breve studio realizzato da Trilogy Interactive ha provato a verificare questa ipotesi cercando una semplice correlazione statistica lineare fra il margine di scarto fra il primo ed il secondo candidato alle elezioni ed il margine di scarto fra il candidato più popolare su Facebook ed il secondo classificato. Le conclusioni di questo studio non confermano l’esistenza di una correlazione, ma evidenzia la necessità di altri studi basati su contesti diversi.
Da qui l’idea di raccogliere i dati relativi alle elezioni amministrative del 15 e 16 Maggio 2011. In questa tornata elettorale saranno rinnovate le amministrazioni comunale di oltre tremila comuni, diverse province ed una regione. Si tratta dunque di un test elettorale significativo dal punto di vista politico ma anche di una buona e diversificata base dati.
Per lo studio che abbiamo in mente sarebbe stato particolarmente interessante disporre di tutti i dati, ma per limiti di risorse che possiamo dedicare al progetto abbiamo deciso di limitare, almeno inizialmente, la nostra attenzione alle città capoluogo di provincia con oltre 100.000 abitanti. Questa scelta consente di concentrare l’attenzione sulle principali competizioni (Milano, Torino, Napoli, Bologna, etc.) ma rende i risultati dello studio difficilmente generalizzabili a realtà più piccole.
Per raccogliere i dati abbiamo deciso di utilizzare questo Google Spreadsheet. I dati relativi ai Likes delle pagine Facebook si aggiornano automaticamente grazie ad uno script (FacebookPageLikes) che ho realizzato modificando un esempio simile (Facebook Like Counter realizzato da Martin Hassman, http://twitter.com/hassmanm) già presente nella libreria degli script di Google Spreadsheet.
Il foglio di calcolo di aggiorna automaticamente ad ogni accesso e salva un archivio dei risultati dai quali sarà possibile visualizzare i trend.
Nell’attesa del risultato elettorale e degli esisti dello studio potete dare uno sguardo all’andamento delle diverse competizioni su Facebook in questa pagina del sito LaRiCA.

«È una rivolta?» «No, Sire, è una rivoluzione»

Le recenti proteste esplose in Tunisia ed Egitto riportano d’attualità il ruolo svolto da Internet come mezzo di organizzazione e informazione

Gli studi condotti nell’ambito del Pew Research Center’s Internet & American Life Project sono comunemente considerati il punto di riferimento per comprendere l’impatto di internet su svariati aspetti della vita dei cittadini americani.
Di recente, con un notevole tempismo sull’attualità dei fatti che avvengono in Tunisia, Albania, Yemen ed Egitto, Pew ha pubblicato il report relativo ad uno studio dedicato a comprendere come la rete abbia cambiato gruppi e organizzazioni di volontariato influenzandone la capacità di agire con efficacia sulla vita delle comunità nella quali operano. Il report conferma il rapporto fra uso di internet ed appartenenza a gruppi ed organizzazioni di volontariato. Mentre fra i non internet users la quota di cittadini attivi si attesta al 56%, fra gli utenti Internet questa percentuale sale all’80% raggiungendo l’82% fra gli utenti di siti di social network e l’85% fra gli utenti di Twitter. Inoltre l’apporto di Internet alla vita di questi gruppi è largamente riconosciuto tanto dagli americani connessi alla rete (il 75% ritiene che internet abbia avuto un impatto significativo) quanto dalla media nazionale che comprende anche i cittadini offline (68%).
A partire da questi dati credo valga la pena porsi la stessa domanda in relazione alle proteste cui stiamo assistendo in questi giorni. Qual’è, se c’è, l’apporto di internet a queste forme di azione collettiva? La rivoluzione in Tunisia avrebbe lo stesso raggiunto i suoi scopi se non ci fossero stati internet ed i social network? Che ruolo giocherà in Egitto?
Forse una prima risposta, come fa notare Ethan Zuckerman in questo interessante articolo, sta proprio nei tentativi di censura operati dai governi di questi Paesi.  È di oggi la notizia che le autorità egiziane hanno bloccato l’intera rete internet nazionale e molte delle reti cellulari. Sappiamo di più su questo in relazione alla Tunisia, una delle nazioni africane con il più alto tasso di accesso alla rete, dove i tentativi di censura sono noti da mesi e documentati ampiamente (si veda ad esempio questo pezzo pubblicato su ReadWriteWeb). Questi tentativi, talvolta estremamente raffinati come nel caso del sistema messo in piedi per rubare le chiavi di accesso a Facebook, GMail e Live.com, mostrano quanto le autorità di questi Paesi riconoscano un ruolo a internet. Nello specifico questo ruolo appare duplice: da una parte si tratta di un mezzo di coordinamento delle forme di protesta (in sinergia con i telefoni cellulari), dall’altro di informazione nei confronti dell’opinione pubblica e mondo del giornalismo che si trova oltre confine.
La maggior parte dei commentatori sembrano concordare sull’efficacia di internet circa quest’ultimo aspetto – anche se nel caso della Tunisia i tempi di rimbalzo sui media stranieri non sono stati affatto brevi – mentre maggiori perplessità, forse anche dovute alla carenza di dati, solleva il ruolo svolto da internet come strumento per il coordinamento di queste azioni di protesta collettive.
Se appare dunque impossibile dimostrare un rapporto di causa/effetto fra internet e proteste su larga scala, è tuttavia altrettanto difficile negare che – da alcuni anni a questa parte – non c’è tentativo di rivoluzione che non sia stato accompagnato da un significativo tasso di conversazione sulla rete e nello specifico su siti di social network come Facebook e Twitter.
Servirà tempo e ricerca per rispondere adeguatamente a queste domande.
Tempo e ricerca che servirebbero anche a comprendere meglio quanto sta avvenendo e potrebbe avvenire, a questo proposito, in Italia. In questo senso alcuni elementi interessanti sono forniti da questa indagine realizzata da Demos & Pi. Ulteriori spunti di riflessione a riguardo emergeranno dai risultati di uno studio che abbiamo condotto sul consumo di news nel nostro Paese e che sarà presentato nel corso di una conferenza stampa il 10 Febbraio a Roma.
Credits: Foto bCollin David Anderson

WikiRebels

Un documentario svedese racconta l’intrigante storia di WikiLeaks e del suo fondatore Julian Assange

Ogni rilascio di documenti contiene un secondo messaggio: creiamo degli esempi. Se ti comporti immoralmente, ingiustamente, questo comportamento verrà scoperto, verrà rivelato e ne subirai le conseguenze (Julian Assange)




Interessante documentario su WikiLeaks prodotto e trasmesso per la prima volta il 12 dicembre 2010 dalla televisione svedese SVT.


YouTube :Parte 2 | Parte 3 | Parte 4
Scarica il documentario in formato torrent – Sottotitoli in Italiano
Piccoli e grandi fughe di notizie possono cambiare il mondo. Oltre ai contenuti rivelati, conta il processo che c’è dietro.
Nel nostro Paese la diffusa ignoranza nell’uso delle nuove tecnologie presso chi occupa posizioni di potere (e spesso delle persone che essi scelgono come collaboratori) sommata a quella diffusa e radicata abitudine alla non trasparenza come metodo per la gestione del potere crea straordinari spazi per questo tipo di azioni.
Poi non dite che io non ve lo avevo detto 😉