Eyes on Flickr

Era da diverso tempo che ci stavamo lavorano ma finalmente abbiamo qualcosa di concreto da presentare.
Si tratta più che altro di una proof of concept.
Flickr, come molti altri servizi web basati sul contenuto generato dagli utenti, è caratterizzata da una natura sociale profonda. Le immagini caricate e le etichette utilizzate per descriverle sono una vera e propria miniera per la ricerca sociologica sulla semantica della comunicazione.
L’occasione ci si è presentata di recente. Un paio di interventi a convegni di natura molto diversa uno sull’europa, l’altro di visual sociology. Quale migliore occasione per provare a costruire uno strumento e testare una metodologia per visualizzare l’intorno semantico di una etichetta al tempo stesso carica di significati ed alquanto indefinita come “europa”?
Come spesso accade dalla teoria alla pratica il passaggio non è stato indolore. Per prima cosa abbiamo dovuto svilppare un’applicazione per scaricare i dati che ci interessavano da Flickr. Nello specifico abbiamo optato per una command line application scritta in C# che interroga le API di Flickr (via Flickr.Net) salva i dati in quattro tabelle di un database mysql. Due per il tag “europe” e due per il tag “usa” (per rendere le cose più interessanti abbiamo deciso per una ricerca comparata). Una solo per l’identificativo univoco dell’immagine ed un singolo tag (ideale per creare una tagcloud) e l’altro con id immagine, titolo, descrizione, numero di commenti, provenienza dell’utente e url dell’immagine.
Una volta scaricati i dati (si fa per dire perchè l’applicazione li sta ancora scaricando) siamo passati alla visualizzazione ed abbiamo optato per una tagcloud. Flickr offre già una tagloud del sistema ma non una tagcloud specifica per osservare l’intorno semantico di un tag (ci sono i related tag ma non è questo che volevamo). Dopo ho dovuto imparare qualche rudimento di php visto che l’unico esempio che ho trovato di come si fa una tagcloud era scritto in questo linguaggio…
Per darvi un’idea della mole di dati con cui stiamo avendo a che fare vi basti sapere che, al momento in cui scrivo, ci sono 503.152 fotografie su Flickr taggate “europe” e 444.735 taggate “usa”. Quando leggerete voi, visto il tasso di crescita di circa 1.000 fotografie nuove al giorno che ho potuto apprezzare, saranno parecchie di più (europe, usa).
Allo stato attuale delle cose è possibile visualizzare le tagclouds relative ai dati che stiamo acquisendo (fra parentesi la frequenza di ciascun tag):

* Abbiamo deciso che era interessante anche vedere le eventuali differenze fra usa e unitedstates.
Per sapere su quante immagini si sta lavorando al momento è possibile consultare queste pagine di servizio: europe, usa, unitedstates.
Per la lettura sociologica (ed un paper che abbiamo quasi finito di scrivere) dei dati bisognerà aspettare lunedì quando io e Luca presenteremo questa ricerca durante un panel del convegno di Eyes on City di Urbino.