Adozione ed utilizzo dei social media negli atenei italiani

Oltre il 60% (+11% rispetto al 2011) delle homepage dei siti web degli atenei italiani linkano Facebook, Twitter, YouTube o un altro media sociale. Ma quale social media è più utilizzato? E quale ateneo utilizza al meglio queste presenze?

Anche quest’anno, con Alessandro Lovari, abbiamo analizzato le home page dei siti internet di tutti gli atenei italiani alla ricerca dei link agli spazi ufficiali sui social media. Da questi abbiamo raccolto tutti i dati disponibili attraverso le API delle diverse piattaforme e calcolato le performance dei diversi atenei sulle diverse piattaforme. Infine abbiamo calcolato il così detto University Social Media Performance Index (descritto brevemente qui e nel dettaglio qui).

I dati di maggiore interesse sono riassunti in questa info-grafica:

Ho anche aggiornato l’Osservatorio Università Italiane su Facebook con gli indirizzi di tutte le pagine rintracciate con la rilevazione 2012.

Popolarità su Facebook e successo elettorale nelle amministrative 2012

Risultati e modelli di previsione elettorale con Facebook

Nel post precedente ho messo alla prova il modello sviluppato per le amministrative 2011 sui dati rilevati in questa tornata elettorale.
Vediamo come è andata.
Il modello ha funzionato nel 66,6% dei casi. Nello specifico il candidato con più Facebook Likes è risultato il più votato nel 41,6% dei casi (Catanzaro, Como, Genova, Lecce, Lucca, Monza, Palermo, Rieti, Taranto e Trani) ed è arrivato invece secondo nel 25% dei casi (Agrigento, Belluno, Brindisi, Cuneo, Gorizia e Pistoia).
Nel 2011 il modello aveva funzionato nell’82,1% dei casi (39,2%  primo e 42,86% secondo).
Nel 20,8% dei casi il modello ha previsto correttamente sia il candidato più votato che quello secondo classificato, ma in altrettanti casi il modello ha fallito completamente (in alcuni di questi casi non aveva alcuna chance visto che i candidati che hanno vinto non avevano una pagina Facebook).
L’indice di accuratezza della previsione è stato di 4,875 su 10. Nel 2011 questo indice ha fatto registrare performance simili (4,71).
Vediamo invece come è andata per quanto invece riguarda il secondo modello, il cui scopo è prevedere la percentuale di voti riportati da ciascun candidato.
Il margine di errore rilevato (candidate prediction gap) varia da un minimo di 0,07% ad un massimo di 70,54% (2011 CPG MIN: 0, MAX: 84,18).
Lo scarto medio fra le percentuali di voto e quelle di Likes è stato del -7,04% ovvero del 12,76% facendo la media dei valori assoluti degli scarti. Il primo valore è un indicatore di quanto la previsione sia sbilanciata in un senso o nell’altro (+ voti che like o + likes che voti), il secondo valore indica il margine di errore effettivo. Nel 2011 il CPG medio dei valori assoluti era 15,77% e l’ABS[CPG] -6,21%. Si tratta di margini di errori molto alti che rendono il modello così com’è poco utile dal punto di vista previsionale.
I 24 comuni capoluoghi con almeno due candidati con pagina Facebook avevano 5 e 16 candidati. Il 55,87% di questi candidati aveva una pagina Facebook che è stata monitorata nell’ambito di questo studio. Il margine medio di errore rilevato per comune ovvero ABS[Municipality Prediction Gap] è 15,24% con un massimo di scarto del 35,88% (Agrigento) ed un minimo del 4,70% (Genova). Nel 2011 l’ABS[MPG] rilevato fu 18,99% con un MIN di 5,09% ed un MAX di 51,99%.
Si conferma il rapporto fra ABS[MPG] e percentuale di candidati presenti con una pagina su Facebook rispetto al totale dei candidati. L’ABS[MPG] passa dal 24,78% dei comuni con meno del 33% di candidati su Facebook all’11,89% di quello dei comuni con oltre il 66% di candidati con pagina (nella categoria 34-66% l’ABS[MPG] è di 15,11%).
Confermato anche il rapporto fra dimensione della città (in termini di numero di elettori) e margine di errore. Nelle grandi città si ottengono previsioni più accurate che in quelle più piccole. Si passa infatti da un ABS[MPG] di 17,39% delle città con meno di 80000 elettori ad un ABS[MPG] intorno al 9% tanto per le città con un numero di elettori compreso fra 80000 e 200000 sia per quelle oltre i 200000.
Per quanto riguarda gli schieramenti si è proceduto a calcolare un Party Prediction Gap (PPG). Nel 2011 tutti gli schieramenti avevano ricevuto un maggiore consenso su Facebook, rispetto alle percentuali reali di voto, ma questa tendenza si faceva più evidente in rapporto ai partiti più estremi (sinistra PPG=-11,27% e destra PPG =-8,66%). Il partito invece meno sopravvalutato dal modello risultò il Centro Destra (PPG=-1,30%). Rispetto all’edizione 2011, sono stati aggiunti due nuovi schieramenti: Terzo Polo e Lega Nord. Il primo non esisteva nel 2011 ed il secondo era accorpato al risultato del Centro Destra. Proprio questi due nuovi schieramenti sono stati quelli più sottostimati dal modello Terzo Polo (PPG=4,58%) e Lega Nord (PPG=5,56%). La Destra è invece risultato lo schieramento più sopravvalutato nelle previsioni di Facebook (PPG=-18,71%).
Se dunque si conferma un maggiore attivismo online da parte dei supporter dei partiti più estremi, si evidenzia anche l’anomalia della Lega Nord. Accorpando infatti i dati della Lega Nord con quelli del Centro Destra, quest’ultimo torna ad essere fra gli schieramenti più sopravvalutati dal modello. Questi dati potrebbero far pensare ad un incidenza dei candidati (o meglio delle strategie e supporter) Lega Nord anche sul risultato del 2011. Quello che appare evidente è che le strategie di costruzione del consenso della Lega Nord (e forse la tipologia di elettori di questo partito) non sono passate, almeno in questa occasione, per Facebook.
Per il futuro intendo provare a perfezionare il modello basato sugli scarti prendendo in considerazione solo i voti ottenuti dai candidati effettivamente presenti con una pagina su Facebook e applicando dei correttivi basati sui risultati dei PPG dei diversi schieramenti. Inoltre vorrei capire quali variabili possono influenzare il margine di errore e l’indice di accuratezza in modo da costruire un indice di affidabilità delle previsione.
I dati sono disponibili in questo Google Spreadsheet.
Da oggi ho inoltre reso pubblicamente disponibile il working paper relativo allo studio del 2011: Giglietto, Fabio, If Likes Were Votes: An Empirical Study on the 2011 Italian Administrative Elections (January 16, 2012). Available at SSRN: http://ssrn.com/abstract=1982736. Una versione ridotta di questo articolo sarà pubblicata negli atti dell’ICWSM-12.

Previsioni Facebook sulle elezioni amministrative 2012

Secondo tentativo di previsione dei risultati elettorali con Facebook

Dopo la prima esperienza fatta con le elezioni amministrative 2011, ho deciso di raccogliere i dati delle amministrative 2012. Grazie alla indispensabile collaborazione di Agnese Vardanega e del suo team, sono riuscito a identificare e monitorare 116 pagine Facebook relative ai 229 candidati sindaco dei 26 comuni capoluogo che andranno al voto il 6 e 7 Maggio. Si tratta del 51,6% contro il 44,5% dell’edizione 2011 dell’indagine.  Come lo scorso hanno ho deciso di concentrarmi solo sull’utilizzo delle pagine e non su quello dei profili personali (per una panoramica complessiva sull’utilizzo del web da parte dei candidati 2012 si veda questo report). La raccolta dati è iniziata il 17 Aprile e si è conclusa con la rilevazioni di oggi 5 Maggio. Per ogni pagina individuata ho raccolta sia il numero di Likes che quello dei talking_about_count (una metrica di engagement della pagina che non esisteva nel 2011).
Nel complesso ho rilevato un totale di 80147 Likes (contro i 179003 del 2011). Nel 2011 i rinnovi delle amministrazioni dei 29 capoluoghi coinvolgevano un totale di 4724554 elettori. Il rapporto con i Likes era dunque del 3,78%. Al momento non ho il dato degli elettori totali per i capoluoghi 2012, ma una prima stima basata sul numero di abitanti dei comuni chiamati al voto farebbe pensare ad una flessione della partecipazione. Gli elettori chiamati al voto 2012 nei 26 comuni capoluoghi sono in totale 2846168. Il rapporto con i like è dunque sceso dal 3,78% al 2,81% (un calo del 25,6% rispetto all’anno precedente).
Seguendo quanto fatto lo scorso anno, per ogni candidato calcolerò un Candidate Prediction Gap (CPG) inteso come la differenza fra la percentuale di voti validi e la percentuale di Likes ricevuti sul totale di quelli ricevuti da tutti i candidati del comune presenti con una pagina su Facebook.
Lo scopo è quello di creare un semplicissimo modello previsionale che possa essere studiato e testato nel tempo con l’obiettivo di creare, eventualmente, un modello previsionale più articolato, basato su un numero maggiore di variabili ed auspicabilmente più preciso.
Per ogni comune provvederò poi a calcolare un Municipality Prediction Gap (ABS[MPG]) e per comprendere meglio gli effetti di alcune variabili saranno messi a confronto categorie di comuni omogenee per numero di abitanti e percentuale di candidati presenti con pagina su Facebook. Infine provvederò a classificare i candidati per area politica di appartenenza e calcolerò un Party Prediction Gap (PPG) e un ABS[PPG] . Lo scarto fra la previsione ed il risultato può essere negativo o positivo. Per questo motivo in alcuni casi ho calcolato la media dei valori assoluti degli scarti [ABS] per dare conto dell’effettiva distanza fra i valori e in altri casi, laddove era importante mettere in evidenza la direzionalità dello scarto la semplice media degli scarti.
Infine calcolerò un indice di accuratezza della previsione attribuendo ad ogni comune un punteggio in base alla seguente tabella:

Score
Most popular candidate on Facebook arrived second 3
Second most popular candidate on Facebook won 3
Second most popular candidate on Facebook arrived second 4
Most popular candidate on Facebook won 6

 
Lo studio sui dati del 2011 ha fatto registrare un CPG che variava fra 0 e 84,18% per una media degli scarti in valore assoluto di 15,77% e non in valore assoluto di -6,21% (il valore negativo indica che la percentuale di popolarità su Facebook era tendenzialmente superiore a quella effettivamente ottenuta dai candidati alle elezioni – anche per via del minore numero di candidati per città). Nel 2011, dopo aver escluso i tre comuni che presentavano meno di due candidati con pagina Facebook, il campione era rappresentato da 26 competizioni elettorali corrispondenti ad altrettanti comuni. Fra i candidati di questi comuni poco più della metà avevano una pagina Facebook (51,1%). Nel 2012 questa percentuale, relativa ai 24 comuni con più di un candidato presente con una sua pagina Facebook, è del 54,8%.
Fra le conclusioni dello scorso anno si notava che:

  • l’ABS[MPG] diminuiva al crescere della percentuale di candidati del comune presenti con una pagina su Facebook;
  • l’ABS[MPG] nelle grandi città era inferiore rispetto a quello delle città medie e piccole;
  • Lo schieramento di centro-destra era quello più sottostimato rispetto agli altri dalla previsione basata sull’analisi del consenso su Facebook. Quello meno sottostimato era invece lo schieramento di sinistra;
  • In base all’indice di accuratezza della previsione ho potuto osservare come il candidato che risultava primo nella competizione su Facebook, in oltre l’80% dei casi risultava vincitore o piazzato al secondo posto della competizione elettorale.

Sulla base di queste conclusioni vorrei provare a fare delle vere previsioni sui dati di quest’anno (con la premessa che si tratta di un gioco e che il minore interesse degli elettori rispetto al 2011 porterà con tutta probabilità a previsioni meno attendibili):
Hanno l’80% di vincere o arrivare secondi nelle rispettive competizioni elettorali:

  • Salvatore Pennica (Agrigento), scarsamente affidabile;
  • Corrado Parise (Alessandria), poco affidabile;
  • Mariangela Cotto (Asti), poco affidabile;
  • Jacopo Massaro (Belluno), scarsamente affidabile;
  • Mauro D’Attis (Brindisi), poco affidabile;
  • Salvatore Abrano (Catanzaro), poco affidabile;
  • Mario Lucini (Como), poco affidabile;
  • Gigi Garelli (Cuneo), poco affidabile;
  • Marco Doria (Genova), affidabile;
  • Giuseppe Cingolani (Gorizia), scarsamente affidabile;
  • Raffaele Mauro (Isernia), scarsamente affidabile;
  • Ettore Di Cesare (L’Aquila), scarsamente affidabile;
  • Massimiliano Mammì (La Spezia), scarsamente affidabile;
  • Paolo Perrone (Lecce), affidabile;
  • Alessandro Tambellini (Lucca), poco affidabile;
  • Roberto Scanagatti (Monza), poco affidabile;
  • Leoluca Orlando (Palermo), molto affidabile;
  • Roberto Ghiretti (Parma), poco affidabile;
  • Anna Maria Celesti (Pistoia), poco affidabile;
  • Simone Petriangeli (Rieti), scarsamente affidabile;
  • Ezio (Ippazio) Stefano (Taranto), poco affidabile;
  • Gigi Riserbato (Trani), scarsamente affidabile;
  • Sabrina Rocca (Trapani), poco affidabile;
  • Gianni Benciolini (Verona), molto affidabile.

Il calcolo dell’affidabilità tiene conto della dimensione del comune e della percentuale di candidati presenti con una loro pagina su Facebook.
Nei prossimi giorni tornerò sull’argomento per vedere come è andata e quali indicazioni si possono trarre in vista della costruzione di un modello più efficace (magari tenendo anche conto della metrica talking_about_this_count).
I dati che ho raccolto sono disponibili a https://docs.google.com/spreadsheet/pub?key=0AlvOxUU1s8RVdGlFUlYwUy1nWW5QYV9mNFFobng4eUE&output=html.
L’articolo relativo allo studio sui dati del 2011 è stato accettato per la pubblicazione negli atti e la presentazione nella sezione poster di ICWSM-12.Dopo la prima esperienza fatta con le elezioni amministrative 2011, ho deciso di raccogliere i dati delle amministrative 2012. Grazie alla indispensabile collaborazione di Agnese Vardanega e del suo team, sono riuscito a identificare e monitorare 116 pagine Facebook relative ai 229 candidati sindaco dei 26 comuni capoluogo che andranno al voto il 6 e 7 Maggio. Si tratta del 51,6% contro il 44,5% dell’edizione 2011 dell’indagine.  Come lo scorso hanno ho deciso di concentrarmi solo sull’utilizzo delle pagine e non su quello dei profili personali (per una panoramica complessiva sull’utilizzo del web da parte dei candidati 2012 si veda questo report). La raccolta dati è iniziata il 17 Aprile e si è conclusa con la rilevazioni di oggi 5 Maggio. Per ogni pagina individuata ho raccolta sia il numero di Likes che quello dei talking_about_count (una metrica di engagement della pagina che non esisteva nel 2011).
Nel complesso ho rilevato un totale di 80147 Likes (contro i 179003 del 2011). Nel 2011 i rinnovi delle amministrazioni dei 29 capoluoghi coinvolgevano un totale di 4724554 elettori. Il rapporto con i Likes era dunque del 3,78%. Al momento non ho il dato degli elettori totali per i capoluoghi 2012, ma una prima stima basata sul numero di abitanti dei comuni chiamati al voto farebbe pensare ad una flessione della partecipazione.
Seguendo quanto fatto lo scorso anno, per ogni candidato calcolerò un Candidate Prediction Gap (CPG) inteso come la differenza fra la percentuale di voti validi e la percentuale di Likes ricevuti sul totale di quelli ricevuti da tutti i candidati del comune presenti con una pagina su Facebook.
Lo scopo è quello di creare un semplicissimo modello previsionale che possa essere studiato e testato nel tempo con l’obiettivo di creare, eventualmente, un modello previsionale più articolato, basato su un numero maggiore di variabili ed auspicabilmente più preciso.
Per ogni comune provvederò poi a calcolare un Municipality Prediction Gap (ABS[MPG]) e per comprendere meglio gli effetti di alcune variabili saranno messi a confronto categorie di comuni omogenee per numero di abitanti e percentuale di candidati presenti con pagina su Facebook. Infine provvederò a classificare i candidati per area politica di appartenenza e calcolerò un Party Prediction Gap (PPG) e un ABS[PPG] . Lo scarto fra la previsione ed il risultato può essere negativo o positivo. Per questo motivo in alcuni casi ho calcolato la media dei valori assoluti degli scarti [ABS] per dare conto dell’effettiva distanza fra i valori e in altri casi, laddove era importante mettere in evidenza la direzionalità dello scarto la semplice media degli scarti.
Infine calcolerò un indice di accuratezza della previsione attribuendo ad ogni comune un punteggio in base alla seguente tabella:

Score
Most popular candidate on Facebook arrived second 3
Second most popular candidate on Facebook won 3
Second most popular candidate on Facebook arrived second 4
Most popular candidate on Facebook won 6

 
Lo studio sui dati del 2011 ha fatto registrare un CPG che variava fra 0 e 84,18% per una media degli scarti in valore assoluto di 15,77% e non in valore assoluto di -6,21% (il valore negativo indica che la percentuale di popolarità su Facebook era tendenzialmente superiore a quella effettivamente ottenuta dai candidati alle elezioni – anche per via del minore numero di candidati per città). Nel 2011, dopo aver escluso i tre comuni che presentavano meno di due candidati con pagina Facebook, il campione era rappresentato da 26 competizioni elettorali corrispondenti ad altrettanti comuni. Fra i candidati di questi comuni poco più della metà avevano una pagina Facebook (51,1%). Nel 2012 questa percentuale, relativa ai 24 comuni con più di un candidato presente con una sua pagina Facebook, è del 54,8%.
Fra le conclusioni dello scorso anno si notava che:

  • l’ABS[MPG] diminuiva al crescere della percentuale di candidati del comune presenti con una pagina su Facebook;
  • l’ABS[MPG] nelle grandi città era inferiore rispetto a quello delle città medie e piccole;
  • Lo schieramento di centro-destra era quello più sottostimato rispetto agli altri dalla previsione basata sull’analisi del consenso su Facebook. Quello meno sottostimato era invece lo schieramento di sinistra;
  • In base all’indice di accuratezza della previsione ho potuto osservare come il candidato che risultava primo nella competizione su Facebook, in oltre l’80% dei casi risultava vincitore o piazzato al secondo posto della competizione elettorale.

Sulla base di queste conclusioni vorrei provare a fare delle vere previsioni sui dati di quest’anno (con la premessa che si tratta di un gioco e che il minore interesse degli elettori rispetto al 2011 porterà con tutta probabilità a previsioni meno attendibili):
Hanno l’80% di vincere o arrivare secondi nelle rispettive competizioni elettorali:

  • Salvatore Pennica (Agrigento), scarsamente affidabile;
  • Corrado Parise (Alessandria), poco affidabile;
  • Mariangela Cotto (Asti), poco affidabile;
  • Jacopo Massaro (Belluno), scarsamente affidabile;
  • Mauro D’Attis (Brindisi), poco affidabile;
  • Salvatore Abrano (Catanzaro), poco affidabile;
  • Mario Lucini (Como), poco affidabile;
  • Gigi Garelli (Cuneo), poco affidabile;
  • Marco Doria (Genova), affidabile;
  • Giuseppe Cingolani (Gorizia), scarsamente affidabile;
  • Raffaele Mauro (Isernia), scarsamente affidabile;
  • Ettore Di Cesare (L’Aquila), scarsamente affidabile;
  • Massimiliano Mammì (La Spezia), scarsamente affidabile;
  • Paolo Perrone (Lecce), affidabile;
  • Alessandro Tambellini (Lucca), poco affidabile;
  • Roberto Scanagatti (Monza), poco affidabile;
  • Leoluca Orlando (Palermo), molto affidabile;
  • Roberto Ghiretti (Parma), poco affidabile;
  • Anna Maria Celesti (Pistoia), poco affidabile;
  • Simone Petriangeli (Rieti), scarsamente affidabile;
  • Ezio (Ippazio) Stefano (Taranto), poco affidabile;
  • Gigi Riserbato (Trani), scarsamente affidabile;
  • Sabrina Rocca (Trapani), poco affidabile;
  • Gianni Benciolini (Verona), molto affidabile.

Il calcolo dell’affidabilità tiene conto della dimensione del comune e della percentuale di candidati presenti con una loro pagina su Facebook.
Nei prossimi giorni tornerò sull’argomento per vedere come è andata e quali indicazioni si possono trarre in vista della costruzione di un modello più efficace (magari tenendo anche conto della metrica talking_about_this_count).
I dati che ho raccolto sono disponibili a https://docs.google.com/spreadsheet/pub?key=0AlvOxUU1s8RVdGlFUlYwUy1nWW5QYV9mNFFobng4eUE&output=html.
L’articolo relativo allo studio sui dati del 2011 è stato accettato per la pubblicazione negli atti e la presentazione nella sezione poster di ICWSM-12.Dopo la prima esperienza fatta con le elezioni amministrative 2011, ho deciso di raccogliere i dati delle amministrative 2012. Grazie alla indispensabile collaborazione di Agnese Vardanega e del suo team, sono riuscito a identificare e monitorare 116 pagine Facebook relative ai 229 candidati sindaco dei 26 comuni capoluogo che andranno al voto il 6 e 7 Maggio. Si tratta del 51,6% contro il 44,5% dell’edizione 2011 dell’indagine.  Come lo scorso hanno ho deciso di concentrarmi solo sull’utilizzo delle pagine e non su quello dei profili personali (per una panoramica complessiva sull’utilizzo del web da parte dei candidati 2012 si veda questo report). La raccolta dati è iniziata il 17 Aprile e si è conclusa con la rilevazioni di oggi 5 Maggio. Per ogni pagina individuata ho raccolta sia il numero di Likes che quello dei talking_about_count (una metrica di engagement della pagina che non esisteva nel 2011).
Nel complesso ho rilevato un totale di 80147 Likes (contro i 179003 del 2011). Nel 2011 i rinnovi delle amministrazioni dei 29 capoluoghi coinvolgevano un totale di 4724554 elettori. Il rapporto con i Likes era dunque del 3,78%. Al momento non ho il dato degli elettori totali per i capoluoghi 2012, ma una prima stima basata sul numero di abitanti dei comuni chiamati al voto farebbe pensare ad una flessione della partecipazione.
Seguendo quanto fatto lo scorso anno, per ogni candidato calcolerò un Candidate Prediction Gap (CPG) inteso come la differenza fra la percentuale di voti validi e la percentuale di Likes ricevuti sul totale di quelli ricevuti da tutti i candidati del comune presenti con una pagina su Facebook.
Lo scopo è quello di creare un semplicissimo modello previsionale che possa essere studiato e testato nel tempo con l’obiettivo di creare, eventualmente, un modello previsionale più articolato, basato su un numero maggiore di variabili ed auspicabilmente più preciso.
Per ogni comune provvederò poi a calcolare un Municipality Prediction Gap (ABS[MPG]) e per comprendere meglio gli effetti di alcune variabili saranno messi a confronto categorie di comuni omogenee per numero di abitanti e percentuale di candidati presenti con pagina su Facebook. Infine provvederò a classificare i candidati per area politica di appartenenza e calcolerò un Party Prediction Gap (PPG) e un ABS[PPG] . Lo scarto fra la previsione ed il risultato può essere negativo o positivo. Per questo motivo in alcuni casi ho calcolato la media dei valori assoluti degli scarti [ABS] per dare conto dell’effettiva distanza fra i valori e in altri casi, laddove era importante mettere in evidenza la direzionalità dello scarto la semplice media degli scarti.
Infine calcolerò un indice di accuratezza della previsione attribuendo ad ogni comune un punteggio in base alla seguente tabella:

Score
Most popular candidate on Facebook arrived second 3
Second most popular candidate on Facebook won 3
Second most popular candidate on Facebook arrived second 4
Most popular candidate on Facebook won 6

 
Lo studio sui dati del 2011 ha fatto registrare un CPG che variava fra 0 e 84,18% per una media degli scarti in valore assoluto di 15,77% e non in valore assoluto di -6,21% (il valore negativo indica che la percentuale di popolarità su Facebook era tendenzialmente superiore a quella effettivamente ottenuta dai candidati alle elezioni – anche per via del minore numero di candidati per città). Nel 2011, dopo aver escluso i tre comuni che presentavano meno di due candidati con pagina Facebook, il campione era rappresentato da 26 competizioni elettorali corrispondenti ad altrettanti comuni. Fra i candidati di questi comuni poco più della metà avevano una pagina Facebook (51,1%). Nel 2012 questa percentuale, relativa ai 24 comuni con più di un candidato presente con una sua pagina Facebook, è del 54,8%.
Fra le conclusioni dello scorso anno si notava che:

  • l’ABS[MPG] diminuiva al crescere della percentuale di candidati del comune presenti con una pagina su Facebook;
  • l’ABS[MPG] nelle grandi città era inferiore rispetto a quello delle città medie e piccole;
  • Lo schieramento di centro-destra era quello più sottostimato rispetto agli altri dalla previsione basata sull’analisi del consenso su Facebook. Quello meno sottostimato era invece lo schieramento di sinistra;
  • In base all’indice di accuratezza della previsione ho potuto osservare come il candidato che risultava primo nella competizione su Facebook, in oltre l’80% dei casi risultava vincitore o piazzato al secondo posto della competizione elettorale.

Sulla base di queste conclusioni vorrei provare a fare delle vere previsioni sui dati di quest’anno (con la premessa che si tratta di un gioco e che il minore interesse degli elettori rispetto al 2011 porterà con tutta probabilità a previsioni meno attendibili):
Hanno l’80% di vincere o arrivare secondi nelle rispettive competizioni elettorali:

  • Salvatore Pennica (Agrigento), scarsamente affidabile;
  • Corrado Parise (Alessandria), poco affidabile;
  • Mariangela Cotto (Asti), poco affidabile;
  • Jacopo Massaro (Belluno), scarsamente affidabile;
  • Mauro D’Attis (Brindisi), poco affidabile;
  • Salvatore Abrano (Catanzaro), poco affidabile;
  • Mario Lucini (Como), poco affidabile;
  • Gigi Garelli (Cuneo), poco affidabile;
  • Marco Doria (Genova), affidabile;
  • Giuseppe Cingolani (Gorizia), scarsamente affidabile;
  • Raffaele Mauro (Isernia), scarsamente affidabile;
  • Ettore Di Cesare (L’Aquila), scarsamente affidabile;
  • Massimiliano Mammì (La Spezia), scarsamente affidabile;
  • Paolo Perrone (Lecce), affidabile;
  • Alessandro Tambellini (Lucca), poco affidabile;
  • Roberto Scanagatti (Monza), poco affidabile;
  • Leoluca Orlando (Palermo), molto affidabile;
  • Roberto Ghiretti (Parma), poco affidabile;
  • Anna Maria Celesti (Pistoia), poco affidabile;
  • Simone Petriangeli (Rieti), scarsamente affidabile;
  • Ezio (Ippazio) Stefano (Taranto), poco affidabile;
  • Gigi Riserbato (Trani), scarsamente affidabile;
  • Sabrina Rocca (Trapani), poco affidabile;
  • Gianni Benciolini (Verona), molto affidabile.

Il calcolo dell’affidabilità tiene conto della dimensione del comune e della percentuale di candidati presenti con una loro pagina su Facebook.
Nei prossimi giorni tornerò sull’argomento per vedere come è andata e quali indicazioni si possono trarre in vista della costruzione di un modello più efficace (magari tenendo anche conto della metrica talking_about_this_count).
I dati che ho raccolto sono disponibili a https://docs.google.com/spreadsheet/pub?key=0AlvOxUU1s8RVdGlFUlYwUy1nWW5QYV9mNFFobng4eUE&output=html.
L’articolo relativo allo studio sui dati del 2011 è stato accettato per la pubblicazione negli atti e la presentazione nella sezione poster di ICWSM-12.

Il Valore Reale del Denaro Virtuale. Dai giochi Online ai Mercati Valutari – Seconda Parte

Video: “Il valore reale del denaro virtuale. Dai giochi Online ai mercati valutari”. Seminario organizzato dal Dipartimento di Scienze di Base e Fondamenti dell’università degli Studi di di Urbino “Carlo Bo” in collaborazione con l’Associazione Culturale NeuNet. Su questo tema si sono confrontati Alessandro Bogliolo, Paolo Polidori, Fabio Giglietto e Francesca Stradini.

Ecco la seconda parte del seminario “Il valore reale del denaro virtuale. Dai giochi Online ai mercati valutari” organizzato dal Dipartimento di Scienze di Base e Fondamenti dell’università degli Studi di di Urbino “Carlo Bo” in collaborazione con  l’Associazione Culturale NeuNet.
Come avevamo fatto per la prima parte del seminario, proponiamo i diversi interventi in video separati in modo da permettere, a chi volesse, di guardarli un po’ per volta. Ogni singolo intervento, pur essendo collocato in un unico contesto, offre diverse sfaccettature del tema affrontato, per questo è importante dare il giusto rilievo ad ogni punto di vista. Le riflessioni e gli spunti emersi sono stati raccolti in un white paper (A. Bogliolo, F. Giglietto, P. Polidori, and F. Stradini, Il valore reale del denaro virtuale: dai giochi online ai mercati valutari, NeuNet white paper No. 12.001, 2012), scaricabile cliccando sul link.
Nei primi video pubblicati, dopo una breve introduzione, Alessandro Bogliolo e Paolo Polidori hanno affrontato rispettivamente da un lato le problematiche connesse al denaro virtuale dal punto di vista tecnologico,  informatico e applicativo e, dall’altro, gli aspetti della moneta virtuale vista come uno step nel processo evolutivo della moneta come sistema di scambio.
I video che pubblichiamo oggi completano il quadro delineato proponendo gli interventi di Fabio Giglietto e Francesca Stradini.
Fabio Giglietto esplora il denaro virtuale anche nel suo rapporto con i giochi online. In ambiente digitali il medium denaro viene riproposto e, per stimolarne la circolazione e il ricambio con il denaro reale viene simulata una condizione di scarsità di risorse. Le virtual currency, a seconda degli ambienti virtuali per cui sono create, presentano delle differenze e diverse implicazioni.
Se, da un lato, i giochi online generano denaro perché, ad esempio, per giocare è necessario e si è disposti a pagare; dall’altro generano un vero e proprio mercato del lavoro: c’è chi è disposto a pagare qualcun altro che giochi al suo posto pur di proseguire nel gioco. Per questo stanno nascendo dei nuovi imprenditori dall’altra parte del mondo che offrono questo servizio sfruttando operai/giocatori, i così detti gold farmers.

Il valore reale del denaro virtuale – Quarta Parte from Erica Reika on Vimeo.

L’intervento di Francesca Stradini (Diritto Tributario) si concentra sulla rilevanza fiscale delle transazioni online e problematizza le questioni fiscali che il denaro virtuale potrebbe far emergere.

Il valore reale del denaro virtuale – Quinta parte from Erica Reika on Vimeo.

Il video finale presenta il dibattito che apre a nuove prospettive da esplorare.

Il valore reale del denaro virtuale – Sesta Parte from Erica Reika on Vimeo.

Osservatorio Università Italiane su Facebook

Dati in tempo reale per valutare la social media strategy degli atenei italiani

Oltre il 40% degli atenei italiani ha una presenza ufficiale su Facebook (fonte: http://ssrn.com/abstract=1978393). I dati cambiano tuttavia con frequenza quotidiana ed eventi specifici (come ad esempio le recenti nevicate) possono modificare significativamente l’intensità di utilizzo di questi strumenti da parte della comunità di riferimento di un ateneo. Per questo motivo ho deciso di dedicare un po’ di tempo a realizzare uno strumento in grado di tenere traccia di questi cambiamenti nel tempo. A questo scopo ho raffinato alcuni strumenti che avevo già utilizzato in passato per creare un vero e proprio osservatorio che racconti gli atenei italiani su Facebook calcolando quotidianamente indici sintetici di popolarità, popolarità ponderata sul numero degli iscritti e trend dell’attività sulla pagina ponderato in base alla popolarità della pagina stessa.
Alla pagina dell’osservatorio troverete i dati aggiornati quotidianamente. Il reperimento dei dati è affidato ad un script che aggiorna automaticamente il foglio di calcolo prelevandoli da Facebook Graph, archivia i dati del giorno precedente e crea le tabelle riassuntive ed i grafici.
Il servizio è in fase sperimentale. C’è un problema noto che riguarda la pagina dell’Università di Foggia i cui dati sono disponibili solo ad utenti di Facebook autenticati (probabilmente è attivo qualche limitazione geografica o di età sul target di utenti che può visualizzare la pagina). Questo fa si che lo script non sia in grado di reperire i dati di quella pagina.
Potrebbero inoltre mancare delle pagine. Nella pagina dell’osservatorio è descritta la metodologia che ci ha consentito di individuare le pagine ufficiali. Potrebbero tuttavia essere intercorsi dei cambiamenti dalla data di rilevazione e nuovi atenei potrebbero aver aperto pagine ufficiali. Provvederò ad aggiungere queste pagine dietro segnalazione.
Vai alla pagina dell’osservatorio.

Performance e diffusione dei social media nelle Università italiane

Uno studio empirico su come le Università italiane usano Facebook, YouTube e Twitter

Alessandro Lovari, durante la scuola di dottorato Meris, mi ha proposto, avendo letto il post sulla popolarità delle pagine Facebook delle Università italiane, di sviluppare insieme l’idea di analizzare se e come gli atenei italiani usassero i social media.
Dopo un paio di incontri in Skype, qualche telefonata e diverse ore di lavoro abbiamo completato la scrittura di questo articolo che prende in esame le presenze ufficiali sui media sociali di tutte i 95 atenei italiani. Poco più della metà degli atenei è presente su almeno un social media. Facebook è il più diffuso seguito da YouTube e Twitter. Gli atenei di medie dimensioni e le università private sono più presenti ed attive. Per valutare meglio le performance delle Università sui social media abbiamo sviluppato un indice che abbiamo denominato USMPI ovvero “university social media performance index”. Questo indice valuta la presenza e le performance degli atenei sui social media usando combinando una serie di metriche e rapportando alcune di esse alla dimensione dell’ateneo (i dettagli metodologici sono nel paragrafo 4.1 dell’articolo).
I dieci atenei che hanno fatto registrare le migliori performance sono:
Ateneo, USMPI
Libera Univ. Inter.le Studi Sociali “Guido Carli” LUISS-ROMA, 0.31
Università Commerciale “Luigi Bocconi” MILANO, 0.31
Politecnico di MILANO, 0.25
Università degli Studi di MILANO-BICOCCA, 0.24
Università degli Studi di URBINO “Carlo BO”, 0.19
Libera Univ. degli Studi “Maria SS.Assunta” – LUMSA – Roma, 0.19
Università “Cà Foscari” VENEZIA, 0.17
Libera Università di lingue e comunicazione IULM-MI, 0.17
Università degli Studi di PAVIA, 0.16
Università degli Studi di UDINE, 0.16
USMPI nel complesso varia da un minimo di 0 ad un massimo di 0.31. La media è 0.0502 e la deviazione standard 0.07351.
L’indice è stato realizzato con l’intento di essere facilmente calcolabile con un intervento umano minimo o nullo. Tutte le metriche analizzate sono basate su dati esposti pubblicamente dalle API delle piattaforme di social media.
Maggiori dettagli sull’indice e su tutta la ricerca sono disponibili nell’articolo (in inglese) che abbiamo pubblicato, in versione pre-print, su ssrn.
Lovari, Alessandro and Giglietto, Fabio, Social Media and Italian Universities: An Empirical Study on the Adoption and Use of Facebook, Twitter and Youtube (January 2, 2012). Available at SSRN: http://ssrn.com/abstract=1978393.
Consigli e suggerimenti sono più che benvenuti 🙂

Il Valore Reale del Denaro Virtuale. Dai giochi Online ai Mercati Valutari.

Video: “Il valore reale del denaro virtuale. Dai giochi Online ai mercati valutari”. Seminario organizzato dal Dipartimento di Scienze di Base e Fondamenti dell’università degli Studi di di Urbino “Carlo Bo” in collaborazione con l’Associazione Culturale NeuNet. Su questo tema si sono confrontati Alessandro Bogliolo, Paolo Polidori, Fabio Giglietto e Francesca Stradini.

Il 17 novembre 2011 ad Urbino presso il Collegio Raffaello si è tenuto il seminario “Il valore reale del denaro virtuale. Dai giochi Online ai mercati valutari” organizzato dal Dipartimento di Scienze di Base e Fondamenti dell’università degli Studi di di Urbino “Carlo Bo” in collaborazione con  l’Associazione Culturale NeuNet.
Il seminario è stato un importante momento di confronto tra diverse discipline riguardo numerosi temi che scaturiscono dall’emergente importanza del denaro virtuale. Il denaro virtuale, infatti, è sempre più pervasivo nella nostra quotidianità, a partire dall’aspetto ludico come avviene nei social network (si pensi a facebook e al sistema di cambio tra denaro reale e virtuale per poter usufruire appieno delle funzionalità di gioco, come ad esempio FarmVille) fino a diventare un vero e proprio modello di business, per cui il gioco (al quale si ha accesso gratuito) diventa piattaforma di lancio per generare scambi monetari: per poter proseguire ed evolvere nel gioco è necessario spendere denaro virtuale, acquistabile con denaro reale.
Si pensi, ancora, al mercato in via di sviluppo dell’ In-App Purchase e alla possibilità di acquistare nuove funzionalità personalizzate delle applicazioni scaricate gratuitamente. Le applicazioni, siano esse giochi o utilità, gratuite diventano una azione di marketing per vendere il prodotto e generare movimenti di denaro virtuale.
Ma prima di addentrarsi in una descrizione puntuale di quelle che sono le potenzialità del denaro virtuale è opportuno farsi alcune domande a partire da quella più importante e cioè che cos’è il denaro virtuale? Quali sono i meccanismi del suo funzionamento? Quali sono le sue applicazioni nel mondo reale? E quali sono i suoi impatti?
L’uso del denaro virtuale fa sorgere una serie di interrogativi a livello economico, fiscale e sociale. Su questi interrogativi si sono confrontati Alessandro Bogliolo (sistemi di elaborazione delle informazioni) su strumenti, tecnologia, applicazioni e problematiche del denaro virtuale, Paolo Polidori (Scienza delle finanze), su origine ed evoluzione della moneta fino alla moneta elettronica e al suo step evolutivo successivo e cioè la moneta virtuale, Fabio Giglietto (Sociologia dei processi culturali e comunicativi),  sul rapproto tra denaro e giochi online, denaro sia virtuale (interno ai giochi) sia reale (il tempo passato giocando diventa una merce) e Francesca Stradini (Diritto Tributario) sulla rilevanza fiscale delle transazioni online e sulle problematiche fiscali che il denaro virtuale potrebbe far emergere.
Pubblicheremo, a partire da oggi e nelle prossime settimana, l’intero seminario suddiviso in sei puntate. Enjoy!

Il valore reale del denaro virtuale – Prima Parte, Presentazioni from Erica Reika on Vimeo.

Il valore reale del denaro virtuale – Seconda Parte from Erica Reika on Vimeo.

Il valore reale del denaro virtuale – Terza Parte from Erica Reika on Vimeo.

Breve analisi della partecipazione dei fan nella pagina Facebook di Servizio Pubblico

Testando il nuovo social network importer plugin di nodexl

I ricercatori della social media research foundation hanno rilasciato ieri un plugin per Node XL che consente di accedere ad alcuni dati che riguardano gli utenti che interagiscono con una pagina Facebook facendo like o commentando un post.
Ho deciso di provare subito i plugin usando la pagina di Servizio Pubblico.
La prima scoperta che ho fatto è che il plugin consente di scaricare i dati degli ultimi dieci post.
Nel caso della pagina del programma di Santoro si tratta nello specifico dei post che vanno da questo a questo.
Il plugin considera un nodo ogni utente che ha interagito con la pagina e crea un arco ogni volta che due utenti hanno commentato (o fatto like) sullo stesso post. Suppongo che il legame creato rappresenti un mutuo interesse di un utente verso uno specifico tema.
Il testo dei post e di tutti i commenti vengono salvati e collegati all’utente rendendo questo plugin utile per piccoli progetti sull’analisi del contenuto. Per ogni nodo vengono scaricate tutte le informazioni disponibili pubblicamente (o alle quale si può accedere in virtù di un legame di amicizia). I dati che sono disponibili nella maggior parte dei casi sono nome, cognome, link alla foto profilo di Facebook e genere.
I dieci post presi in esame hanno ricevuto in totale 954 commenti da 703 utenti diversi. Il numero massimo di commenti per utente è 6. Non sorprendentemente la distribuzione è caratterizzata da pochi utenti che commentano molto e molti che commentano poco (543 o il 77,2% ha commentato solo una volta).
Chi commenta è in grande prevalenza maschio (71% m, 27% f ed il restante non specificato).
I post in questione hanno ricevuto in totale 1635 Mi Piace da 1016 utenti diversi. Il numero massimo di like per utente è 9. Considerate che mentre è possibile commentare più di una volta su un post non si può fare altrettanto con i Mi Piace. La distribuzione dei Mi Piace ha la consueta forma anche se, in questo caso, la percentuale di partecipanti che ha fatto un solo Like è inferiore (44,2%).
Anche chi clicca su Mi Piace è in prevalenza maschio anche se meno di quanto non avvenga per i commenti (60% m, 38% f ed il restante non specificato).
I temi che più hanno colpito l’immaginario degli spettatori attivi sono ben evidenziati in questa tagcloud.

Tagcloud dei commenti

Invece questa è la visualizzazione della rete dei commentatori.
Per dimensionare i nodi ho usato la metrica degree (avrei anche potuto usare il semplice numero di commenti ma poi mi sarei perso il fatto che un commento postato in un thread dove hanno postato poche persone è diverso da uno postato in un thread con molti partecipanti). Per posizionare i nodi ho usato l’algoritmo Fruchterman-Reingo (scelta di default in Node XL). Non ho aggiunto le etichette con i nomi sui nodi, ma avrei potuto.

Con un po’ di pazienza, ovvero scaricando i post in blocchi da 10 mentre la trasmissione è in onda, si possono ottenere i dati dei circa 30/40 post pubblicati durante la messa in onda per una analisi più completa.

Urbino su Facebook

o come Facebook rende visibili le relazioni in una comunità

Visto l’interesse destato dall’analisi del gruppo Facebook dell’Università di Urbino ho deciso di estendere questa visualizzazione per includere più gruppi. L’idea è quella di rappresentare le relazioni di amicizia dei più rappresentativi gruppi Facebook di Urbino.
In una prima fase ho dunque dovuto cercare e selezionare i gruppi da prendere in considerazione.
Sono dunque partito da una semplice ricerca con la chiave urbino nel motore interno di Facebook limitando i risultati ai soli gruppi. Degli oltre 364 gruppi restituiti, ho deciso di escludere tutti quelli che, dal titolo, sembravano chiaramente riferirsi a realtà più grandi (ad esempio tutti quelli Pesaro e Urbino). Ho inoltre deciso di prendere in considerazione solo i gruppi con oltre 50 membri. Di questi alcuni erano aperti ed altri chiusi. Per quelli aperti mi sono semplicemente unito al gruppo, per quelli chiusi ho richiesto l’autorizzazione a diventare membro (solo in un caso mi è stato chiesto il perché ed ho spiegato che stavo conducendo una ricerca). Ho avuto così accesso ai dati di 72 gruppi. Per ciascuno di essi ho scaricato il grafo delle relazioni intergruppo (usando netvizz) e aggregato i risultati in un unico file .gdf copiando in questo file la lista dei membri del gruppo e quella delle loro relazioni. Questa procedura ha causato ovviamente la duplicazione di molti nodi con il rispettivo numero identificativo. Questa duplicazione non ha tuttavia causato problemi all’atto dell’importazione in Gephi durante la quale i nodi duplicati sono stati automaticamente eliminati.
Il grafo risultato dall’aggregazione di tutte le relazioni fra i membri dei gruppi presi in considerazione consiste alla fine di 14014 nodi e 175188 archi.
Su questo grafo ho calcolato i soliti indici di centralità (eigenvector, betweenness, closeness ed eccentricity) e la modularity per individuare le comunità.
Ho inoltre posizionato i nodi utilizzando l’algortimo ForceAtlas 2 (con il paramento Gravity a 100 per evitare una eccessiva disgregazione).
L’analisi della modularità, definita come una misura di quanto bene una rete possa essere scomposta in comunità modulari, si attesta intorno allo 0,6 ed il numero di comunità identificato oscilla (si tratta di algoritmo randomizzato che genera risultati diversi ogni volta che viene eseguito) intorno alle 1000.

Da questo migliaio di comunità ne emergono tre che da sole raccolgono quasi il 50% dei nodi.
Si tratta di quelle che ho identificato come UNIURB (15,5% e colore Verde), URBINATI (15,02% Blu) e MOVIDA (13,15% Rosso). Significativa inoltre la dimensione del gruppo del COLLEGI (7,34% Giallo), GIURISPRUDENZA (5,41% Azzurro), ANNUNCI E RICHIESTE (5,35% Grigio), LICEO CLASSICO RAFFAELLO (5,26% Fucsia). Fra le altre comunità che ho identificato figurano inoltre quella dell’ISIA, dell’Istituto d’Arte, dell’Istituto per la Formazione al Giornalismo e quella degli studenti Greci.

Nelle immagini che seguono due visualizzazioni dei 250 utenti meglio connessi secondo, rispettivamente, la metrica della betweenness centrality e dell’eigenvector centrality.


Infine, visto che zoom.it si rifiuta di creare l’immagine zoommabile, potete scaricare le visualizzazioni totali in formto pdf con la dimensione dei nodi legate alla betweenness e all’eigenvector centrality (i nomi, in queste visualizzazioni complessive, sono stati volutamente rimossi per questioni di privacy).Visto l’interesse destato dall’analisi del gruppo Facebook dell’Università di Urbino ho deciso di estendere questa visualizzazione per includere più gruppi. L’idea è quella di rappresentare le relazioni di amicizia dei più rappresentativi gruppi Facebook di Urbino.
In una prima fase ho dunque dovuto cercare e selezionare i gruppi da prendere in considerazione.
Sono dunque partito da una semplice ricerca con la chiave urbino nel motore interno di Facebook limitando i risultati ai soli gruppi. Degli oltre 364 gruppi restituiti, ho deciso di escludere tutti quelli che, dal titolo, sembravano chiaramente riferirsi a realtà più grandi (ad esempio tutti quelli Pesaro e Urbino). Ho inoltre deciso di prendere in considerazione solo i gruppi con oltre 50 membri. Di questi alcuni erano aperti ed altri chiusi. Per quelli aperti mi sono semplicemente unito al gruppo, per quelli chiusi ho richiesto l’autorizzazione a diventare membro (solo in un caso mi è stato chiesto il perché ed ho spiegato che stavo conducendo una ricerca). Ho avuto così accesso ai dati di 72 gruppi. Per ciascuno di essi ho scaricato il grafo delle relazioni intergruppo (usando netvizz) e aggregato i risultati in un unico file .gdf copiando in questo file la lista dei membri del gruppo e quella delle loro relazioni. Questa procedura ha causato ovviamente la duplicazione di molti nodi con il rispettivo numero identificativo. Questa duplicazione non ha tuttavia causato problemi all’atto dell’importazione in Gephi durante la quale i nodi duplicati sono stati automaticamente eliminati.
Il grafo risultato dall’aggregazione di tutte le relazioni fra i membri dei gruppi presi in considerazione consiste alla fine di 14014 nodi e 175188 archi.
Su questo grafo ho calcolato i soliti indici di centralità (eigenvector, betweenness, closeness ed eccentricity) e la modularity per individuare le comunità.
Ho inoltre posizionato i nodi utilizzando l’algortimo ForceAtlas 2 (con il paramento Gravity a 100 per evitare una eccessiva disgregazione).
L’analisi della modularità, definita come una misura di quanto bene una rete possa essere scomposta in comunità modulari, si attesta intorno allo 0,6 ed il numero di comunità identificato oscilla (si tratta di algoritmo randomizzato che genera risultati diversi ogni volta che viene eseguito) intorno alle 1000.
Da questo migliaio di comunità ne emergono tre che da sole raccolgono quasi il 50% dei nodi.
Si tratta di quelle che ho identificato come UNIURB (15,5% e colore Verde), URBINATI (15,02% Blu) e MOVIDA (13,15% Rosso). Significativa inoltre la dimensione del gruppo del COLLEGI (7,34% Giallo), GIURISPRUDENZA (5,41% Azzurro), ANNUNCI E RICHIESTE (5,35% Grigio), LICEO CLASSICO RAFFAELLO (5,26% Fucsia). Fra le altre comunità che ho identificato figurano inoltre quella dell’ISIA, dell’Istituto d’Arte, dell’Istituto per la Formazione al Giornalismo e quella degli studenti Greci.
Nelle immagini che seguono due visualizzazioni dei 250 utenti meglio connessi secondo, rispettivamente, la metrica della betweenness centrality e dell’eigenvector centrality.


Infine, visto che zoom.it si rifiuta di creare l’immagine zoommabile, potete scaricare le visualizzazioni total in pdf con la dimensione dei nodi legate alla betweenness e all’eigenvector centrality (i nomi, in queste visualizzazioni complessive, sono stati volutamente rimossi per questioni di privacy).Visto l’interesse destato dall’analisi del gruppo Facebook dell’Università di Urbino ho deciso di estendere questa visualizzazione per includere più gruppi. L’idea è quella di rappresentare le relazioni di amicizia dei più rappresentativi gruppi Facebook di Urbino.
In una prima fase ho dunque dovuto cercare e selezionare i gruppi da prendere in considerazione.
Sono dunque partito da una semplice ricerca con la chiave urbino nel motore interno di Facebook limitando i risultati ai soli gruppi. Degli oltre 364 gruppi restituiti, ho deciso di escludere tutti quelli che, dal titolo, sembravano chiaramente riferirsi a realtà più grandi (ad esempio tutti quelli Pesaro e Urbino). Ho inoltre deciso di prendere in considerazione solo i gruppi con oltre 50 membri. Di questi alcuni erano aperti ed altri chiusi. Per quelli aperti mi sono semplicemente unito al gruppo, per quelli chiusi ho richiesto l’autorizzazione a diventare membro (solo in un caso mi è stato chiesto il perché ed ho spiegato che stavo conducendo una ricerca). Ho avuto così accesso ai dati di 72 gruppi. Per ciascuno di essi ho scaricato il grafo delle relazioni intergruppo (usando netvizz) e aggregato i risultati in un unico file .gdf copiando in questo file la lista dei membri del gruppo e quella delle loro relazioni. Questa procedura ha causato ovviamente la duplicazione di molti nodi con il rispettivo numero identificativo. Questa duplicazione non ha tuttavia causato problemi all’atto dell’importazione in Gephi durante la quale i nodi duplicati sono stati automaticamente eliminati.
Il grafo risultato dall’aggregazione di tutte le relazioni fra i membri dei gruppi presi in considerazione consiste alla fine di 14014 nodi e 175188 archi.
Su questo grafo ho calcolato i soliti indici di centralità (eigenvector, betweenness, closeness ed eccentricity) e la modularity per individuare le comunità.
Ho inoltre posizionato i nodi utilizzando l’algortimo ForceAtlas 2 (con il paramento Gravity a 100 per evitare una eccessiva disgregazione).
L’analisi della modularità, definita come una misura di quanto bene una rete possa essere scomposta in comunità modulari, si attesta intorno allo 0,6 ed il numero di comunità identificato oscilla (si tratta di algoritmo randomizzato che genera risultati diversi ogni volta che viene eseguito) intorno alle 1000.
Da questo migliaio di comunità ne emergono tre che da sole raccolgono quasi il 50% dei nodi.
Si tratta di quelle che ho identificato come UNIURB (15,5% e colore Verde), URBINATI (15,02% Blu) e MOVIDA (13,15% Rosso). Significativa inoltre la dimensione del gruppo del COLLEGI (7,34% Giallo), GIURISPRUDENZA (5,41% Azzurro), ANNUNCI E RICHIESTE (5,35% Grigio), LICEO CLASSICO RAFFAELLO (5,26% Fucsia). Fra le altre comunità che ho identificato figurano inoltre quella dell’ISIA, dell’Istituto d’Arte, dell’Istituto per la Formazione al Giornalismo e quella degli studenti Greci.
Nelle immagini che seguono due visualizzazioni dei 250 utenti meglio connessi secondo, rispettivamente, la metrica della betweenness centrality e dell’eigenvector centrality.


Infine, visto che zoom.it si rifiuta di creare l’immagine zoommabile, potete scaricare le visualizzazioni total in pdf con la dimensione dei nodi legate alla betweenness e all’eigenvector centrality (i nomi, in queste visualizzazioni complessive, sono stati volutamente rimossi per questioni di privacy).

Visualizzare le relazioni di amicizia dei membri di un gruppo Facebook

Analisi del gruppo Facebook dell’Università di Urbino

Ho scoperto solo oggi che netvizz consente di scaricare, oltre che il proprio grafo personale di Facebook, anche quello dei gruppi di cui si è membri.
Per testare questa funzionalità ho provato a scaricare il grafo relativo al gruppo Università di Urbino “Carlo Bo” composto, al momento in cui scrivo, da 2281 membri.
Nella documentazione è riportato che, a cause delle limitazioni imposte da Facebook sull’uso delle sue API, per gruppi superiori a 500 membri viene estratto un campione casuale di membri. Nella mia prova sono invece riuscito a scaricare, dopo alcuni minuti di attesa durante i quali sembra che non succeda nulla, un grafo praticamente completo composto da 2213 nodi e 13408 archi che rappresentano i legami di amicizia fra i membri del gruppo. Sul perché manchino all’appello 68 membri non saprei dirvi anche se sospetto possa dipendere dalle impostazioni di privacy degli utenti.
Netvizz crea un grafo indiretto in formato gdf. Da lì ad importare il grafo in Gephi il passo è stato breve.
Fra le misure di centralità ho deciso di utilizzare l’Eigenvector centrality per rappresentare le dimensioni dei nodi. Ho inoltre calcolato la modularity per individuare le comunità.
Ho infine applicato l’algoritmo ForceAtlas 2 per posizionare i nodi.
Ed ecco il risultato.

Scarica la visualizzazione in formato SVG
Credo si tratti di una fotografia piuttosto fedele delle relazioni a Urbino (almeno per quello che le conosco io). Si nota l’emergere di alcuni cluster interessanti come quello degli studenti greci in blu (sulla destra e piuttosto isolati), l’area di scienze della comunicazione (in rosso), quella dell’impegno politico in bianco e piuttosto centrali a segnalare una tendenza a fare amicizia con molte persone diverse, caratteristica questa che condividono con il cluster verde che fa invece riferimento alla vita notturna e all’intrattenimento. Lascio a voi il piacere di identificare gli altri cluster.
Vi lascio inoltre con una piccola curiosità.
Questo è il grafo dei 100 membri del gruppo meglio connessi (sempre in base all’Eigenvector centrality) rispetto agli altri.

Scarica la visualizzazione in formato SVG
Ci siete? E in che cluster?