Gennaio 2008 – LaRiCA

How to search, store, export and analyze user generated content for social science

Ieri mattina a Trento con Giovanni e Luca abbiamo presentato alcuni risultati preliminari della ricerca media e generazioni.
In particolare il compito affidato in questa prima fase del progetto alla nostra unità era quello di analizzare le conversazioni online attivate a partire da un set di prodotti generazionali. Lo specifico focus era sulle generazioni X ed Y (i nati dai primi anni ’70 in poi).
I risultati sono stati interessanti e credo che alcuni estratti verranno pubblicati sul sito del progetto insieme ai progressi delle altre linea di ricerca desk sulle generazioni in letteratura e nello specifico del romanzo rosa.
Questo post è invece dedicato a raccontare più nel dettaglio di quanto abbiamo potuto fare ieri la metodologia usata dal punto di vista tecnico (vista anche la curiosità ed interesse suscitata nei colleghi presenti).
L’idea di analizzare le conversazioni online non è nuova per chi legge questo blog.
Per un inquadramento teorico complessivo della questione rimando ad un articolo che ho scritto qualche tempo fa mentre due esempi di progetti pilota realizzati con lo scopo di mettere alla prova l’approccio sono Eyes on Europe (paper, post) e Eyes on you: Pregnancy 2.0 (webcast, draft paper, post).
I progetti pilota ci hanno insegnato che (1) la metodologia aveva delle potenzialità e che (2) la quantità di dati disponibili impediva un qualsiasi ragionevole approccio non supportato dal computer al reperimento e all’analisi collaborativa di questi dati.
Abbiamo dunque deciso di impegnare risorse e tempo nello sviluppo di un’applicazione general purpose che supportasse il ricercatore nel reperimento guidato e nell’analisi collaborativa di questi dati.
Grazie alle competenze tecniche di Romeo e Alfredo questa applicazione è oggi una realtà.
Tecnicamente si tratta di una web application in grado di reperire, consumare, conservare, condividere ed esportare flussi informativi nel formato standard RSS verso le principali applicazioni esistenti per l’analisi del contenuto (al momento abbiamo testato il supporto di Nvivo 7 ma è ragionevole pensare che la stessa cosa possa funzionare con Atlas.ti).
All’atto dell’esportazione dei contenuti di un progetto (post di blog o forum di discussione che supportino rss, foto o video pubblicati sul web) la web application reperisce e restituisce le informazioni biografiche sull’autore del contenuto se disponibili su una delle numerose piattaforma di blog e condivisioni di contenuti audio/video supportate (usando tecniche di scraping ad hoc per ogni piattaforma).
Grazie a questa applicazione abbiamo potuto reperire a partire da un set di oltre 40 prodotti generazionali (film, serie tv, libri, videogiochi, musica, fumetti) e con query costruite ad hoc su ogni prodotto 3000 post.
Di questi 3000 post 928 erano corredati dall’età dell’autore (dato essenziale per la ricerca sulle generazioni), oltre 1000 dal genere e molto spesso (non abbiamo calcolato questo dato esattamente perché privo di interesse nello specifico della ricerca) da una qualche forma (città o nazione) di indicazioni geografica di provenienza.
Questi dati strutturali insieme alla rilevanza degli stessi nei termini della ricerca dei contenuti reperiti rappresentano per la nostra unità di ricerca e per me in particolare una straordinaria conferma delle potenzialità dell’applicazione e della metodologia di ricerca (che solleva anche questioni estremamente interessanti di ordine metodologico ed etico).
Mi sarebbe piaciuto poter annunciare in questo post la disponibilità dell’applicazione per chiunque ne voglia fare uso ma ciò non è purtroppo possibile.
Non lo è per due ordini di ragioni.
1) La prima è che per il momento tutta l’attenzione nello sviluppo si è concentrata sulle funzionalità con conseguenze immaginabili sull’usabilità (oltre che sugli aspetti puramente estetici) dell’applicazione (che fra l’altro non ha neanche un nome definitivo);
2) La seconda è di performance. L’applicazione è infatti ospitata su una macchina virtuale che è ospitata dal server che ospita al tempo stesso la macchina virtuale di questo blog (lo sapevate già che la ricerca in Italia ha pochi fondi, no?). La fase di esportazione dei contenuti di un progetto è estremamente pesante in termini di carico di lavoro sulla macchina. La conseguenza è che se più di 3/4 utenti cercando di esportare contemporaneamente un progetto tendono a saturare le capacità di calcolo della macchina virtuale con le conseguenze che si possono immaginare.
Ovviamente stiamo lavorando per risolvere queste due questioni ma non siamo in grado di dire oggi quando ed anche se saremo in grado di poter rendere disponibile pubblicamente l’applicazione per i ricercatori che intendano farne uso.
Nel frattempo siamo però in grado di ospitare pilot isolati di ricercatori (in senso lato da laureandi, dottorandi, etc.) che ne facciano esplicitamente richiesta.
Se state progettando o realizzando una ricerca basata sull’analisi dei contenuti generati dagli utenti sul web potete contattarmi per concordare le modalità di accesso all’applicazione.
P.S. Anche le offerte di collaborazione sono ben accette. Dunque se l’idea dell’applicazione vi interessa ed avete risorse o competenze da mettere a disposizione per collaborare allo sviluppo del progetto siete i benvenuti.

Technorati tags: nvivo, atlas.ti, social semantics, content analysis, lab20

Nostalgie di un tempo mai vissuto

fantastico! io sn del 93 quindi sn nata verso la fase finale d questi magnifici cartoni, x 7/8 anni li ho visti ank’io…bellissimi…poi sn iniziati i digimon e i pokemon ke hanno rovinato tutto…la televisione di oggi è una tv violenta ma ke futuro ha la mia generazione? e le altre? rivoglio i cartoni di un tempo quelli si k erano cartoni! Querz89 (5 months ago)

prossima volta rinasco 10 anni prima, mi faccio l’infanzia negli anni 80 e mi imbottisco di cartoni, l’adolescenza negli anni 90, e l’età adulta nel 3° millennio… e speriamo bene sull’ultima fase !!! MicinaTheBlack (1 week ago)

Technorati tags: heidi, candy candy, anni 80, genY

EyesonYou webcast on pregnancy 2.0 now available

Solo per segnalare che l’Università di Lancaster ha pubblicato nel suo repository pubblico di materiali il webcast della presentazione che il Lab20 ha fatto a York sulla Pregnancy 2.0 (analisi dei video di YouTube sulle nascite e sulla gravidanza).

Technorati tags: lab20, york, lancaster, youtube, pregnancy

M/F ratio in Facebook and Badoo user base

M/F ratio in Facebook and Badoo user base
Originally uploaded by FG@flickr.com

Stimolato dai commenti ricevuti nel post precedente ho deciso di approfondire la questione del rapporto fra maschi e femmine in Badoo e Facebook.
Non è difficile notare (sopratutto se avrete cliccato sull’immagine per ingrandirla) come il rapporto sia simile nelle diverse nazioni prese in esame. Allo stesso modo appare evidente e costante la differente composizione di genere dei due social networks presi in esame. Credo questo dipenda, come ha fatto notare Tommaso nei commenti, dalla effettiva diversità dei siti presi in considerazione.
A questo proposito è interessante considerare quanto recentemente scritto da Maz Hardey rispetto a quelli che lei ha definito stadi del social networking:

i) Stage one: Sociability or ‘being social’, where concern is to build up new points of contact and to maintain ‘old’ connections through interactions on SNSs.
ii) Stay two: Networkability or ‘being networked’, having built up networks of links these are then maintained through membership to an array of SNSs and across different social media hardware – so yes that wonderful piece of technology the iPhone!
iii) Stage three: Visibility or ‘being visible’, when networks of links are used to both cultivate and sustain interactions as well as to experience ‘being in touch’ with others. Social actions are confirmed by a ‘presence’ that is always contactable even if the user is ‘busy’ elsewhere.

La sensazione è che Badoo sia un social network incompleto da questo punto di vista perchè ha buone funzioni in relazione allo stadio 1 ma è molto carente nell’offrire l’esperienza di sentirsi in contatto cosa in cui invece eccelle Facebook.
Quindi rimane sempre in sospeso la questione di base.
Perchè gli italiani usano Badoo più di tutti?

Technorati tags: badoo, facebook, stats

Verso una teoria matematica del dating online

Dunque Badoo conta ad oggi 1.840.475 utenti italiani di cui 1.220.312 (66,30%) maschi [6.200 gay] e 620.166 (33,69%) femmine [10.789 lesbiche].

Facebook conta 194.500 utenti italiani di cui 64.100 (32,95%) maschi e 59.820 (30,75%) femmine.

Se ne deduce che:

1) Se sei M in cerca di F ti conviene Facebook;

2) Se sei F in cerca di M (o di attenzioni) ti conviene Badoo;

3) Se sei M in cerca di M Badoo può funzionare meglio di Facebook;

4) Se sei F in cerca di F ti conviene Badoo.

A parte gli scherzi Badoo è un fenomeno sociale in Italia e mi piacerebbe comprendelo meglio. Penso possa dirci molto sulla via italiana al Farsi Media.

Chi mi vuole dare una mano? Colleghi interessati o utenti che desiderino raccontare la loro esperienza sono i benvenuti. Farsi vivi nei commenti o attraverso il mio indirizzo di posta elettronica.

Technorati tags: badoo, facebook, dating, social networks