Ieri mattina a Trento con Giovanni e Luca abbiamo presentato alcuni risultati preliminari della ricerca media e generazioni.
In particolare il compito affidato in questa prima fase del progetto alla nostra unità era quello di analizzare le conversazioni online attivate a partire da un set di prodotti generazionali. Lo specifico focus era sulle generazioni X ed Y (i nati dai primi anni ’70 in poi).
I risultati sono stati interessanti e credo che alcuni estratti verranno pubblicati sul sito del progetto insieme ai progressi delle altre linea di ricerca desk sulle generazioni in letteratura e nello specifico del romanzo rosa.
Questo post è invece dedicato a raccontare più nel dettaglio di quanto abbiamo potuto fare ieri la metodologia usata dal punto di vista tecnico (vista anche la curiosità ed interesse suscitata nei colleghi presenti).
L’idea di analizzare le conversazioni online non è nuova per chi legge questo blog.
Per un inquadramento teorico complessivo della questione rimando ad un articolo che ho scritto qualche tempo fa mentre due esempi di progetti pilota realizzati con lo scopo di mettere alla prova l’approccio sono Eyes on Europe (paper, post) e Eyes on you: Pregnancy 2.0 (webcast, draft paper, post).
I progetti pilota ci hanno insegnato che (1) la metodologia aveva delle potenzialità e che (2) la quantità di dati disponibili impediva un qualsiasi ragionevole approccio non supportato dal computer al reperimento e all’analisi collaborativa di questi dati.
Abbiamo dunque deciso di impegnare risorse e tempo nello sviluppo di un’applicazione general purpose che supportasse il ricercatore nel reperimento guidato e nell’analisi collaborativa di questi dati.
Grazie alle competenze tecniche di Romeo e Alfredo questa applicazione è oggi una realtà.
Tecnicamente si tratta di una web application in grado di reperire, consumare, conservare, condividere ed esportare flussi informativi nel formato standard RSS verso le principali applicazioni esistenti per l’analisi del contenuto (al momento abbiamo testato il supporto di Nvivo 7 ma è ragionevole pensare che la stessa cosa possa funzionare con Atlas.ti).
All’atto dell’esportazione dei contenuti di un progetto (post di blog o forum di discussione che supportino rss, foto o video pubblicati sul web) la web application reperisce e restituisce le informazioni biografiche sull’autore del contenuto se disponibili su una delle numerose piattaforma di blog e condivisioni di contenuti audio/video supportate (usando tecniche di scraping ad hoc per ogni piattaforma).
Grazie a questa applicazione abbiamo potuto reperire a partire da un set di oltre 40 prodotti generazionali (film, serie tv, libri, videogiochi, musica, fumetti) e con query costruite ad hoc su ogni prodotto 3000 post.
Di questi 3000 post 928 erano corredati dall’età dell’autore (dato essenziale per la ricerca sulle generazioni), oltre 1000 dal genere e molto spesso (non abbiamo calcolato questo dato esattamente perché privo di interesse nello specifico della ricerca) da una qualche forma (città o nazione) di indicazioni geografica di provenienza.
Questi dati strutturali insieme alla rilevanza degli stessi nei termini della ricerca dei contenuti reperiti rappresentano per la nostra unità di ricerca e per me in particolare una straordinaria conferma delle potenzialità dell’applicazione e della metodologia di ricerca (che solleva anche questioni estremamente interessanti di ordine metodologico ed etico).
Mi sarebbe piaciuto poter annunciare in questo post la disponibilità dell’applicazione per chiunque ne voglia fare uso ma ciò non è purtroppo possibile.
Non lo è per due ordini di ragioni.
1) La prima è che per il momento tutta l’attenzione nello sviluppo si è concentrata sulle funzionalità con conseguenze immaginabili sull’usabilità (oltre che sugli aspetti puramente estetici) dell’applicazione (che fra l’altro non ha neanche un nome definitivo);
2) La seconda è di performance. L’applicazione è infatti ospitata su una macchina virtuale che è ospitata dal server che ospita al tempo stesso la macchina virtuale di questo blog (lo sapevate già che la ricerca in Italia ha pochi fondi, no?). La fase di esportazione dei contenuti di un progetto è estremamente pesante in termini di carico di lavoro sulla macchina. La conseguenza è che se più di 3/4 utenti cercando di esportare contemporaneamente un progetto tendono a saturare le capacità di calcolo della macchina virtuale con le conseguenze che si possono immaginare.
Ovviamente stiamo lavorando per risolvere queste due questioni ma non siamo in grado di dire oggi quando ed anche se saremo in grado di poter rendere disponibile pubblicamente l’applicazione per i ricercatori che intendano farne uso.
Nel frattempo siamo però in grado di ospitare pilot isolati di ricercatori (in senso lato da laureandi, dottorandi, etc.) che ne facciano esplicitamente richiesta.
Se state progettando o realizzando una ricerca basata sull’analisi dei contenuti generati dagli utenti sul web potete contattarmi per concordare le modalità di accesso all’applicazione.
P.S. Anche le offerte di collaborazione sono ben accette. Dunque se l’idea dell’applicazione vi interessa ed avete risorse o competenze da mettere a disposizione per collaborare allo sviluppo del progetto siete i benvenuti.
Technorati tags: nvivo, atlas.ti, social semantics, content analysis, lab20