La scienza del web

Mentre in Italia si discute sul futuro delle scienze della comunicazione, Tim Berners-Lee lancia l’idea della Web Science come punto di incontro fra fisica, biologia, computer science, psicologia e sociologia. Traduco per chi non legge in inglese i primi due paragrafi dell’articolo pubblicato qualche mese fa su Science.

Da quando è nato il World Wide Web ha cambiato il modo in cui gli scienziati comunicano, collaborano ed insegnano. Esiste tuttavia una crescente consapevolezza fra molti ricercatori che una chiara agenda per la ricerca finalizzata a comprendere il presente, l’evoluzione e le potenzialità del Web sia necessaria. Se vogliamo modellare il Web; se desideriamo i principi architetturali che ne hanno consentito la crescita; e se desideriamo essere sicuri che questi supportino i valori sociali di base quali la fiducia, la privacy, il rispetto per i confini sociali, allora dobbiamo definire questa agenda di ricerca che abbia il Web come focus primario di attenzione.

Quando ragioniamo di un’agenda per la scienza del Web, usiamo il termine “scienza” in due modi. Le scienze fisiche e biologiche analizzano il mondo naturale e cercano di trovare leggi microscopiche che estrapolate su un livello macro possono generare il comportamento osservato. La computer science, al contrario, anche se in parte analitica è essenzialmente sintetica: si occupa della costruzione di nuovi linguaggi e algoritmi volti a produrre nuovi comportamenti desiderati. La scienza del Web è la combinazione di questi due caratteristiche. Il web è uno spazio ingegnerizzato creato attraverso linguaggi e protocolli formalmente specificati. Tuttavia, poiché sono le persone a creare le pagine Web ed i collegamenti ipertestuali fra loro, la loro interazione genera trame emergenti su scala macroscopica. Queste interazioni umane sono, a loro volta, governate da leggi e convenzioni sociali. La scienza del Web deve dunque essere inerentemente interdisciplinare; il suo obiettivo è da un lato di comprendere la crescita del Web e dall’altro di creare approcci che consentano l’emergere di nuove trame potenti ed in grado di portare un maggiore beneficio.

Lezione del giorno: una chiara definizione è la premessa per lo sviluppo di qualsiasi disciplina.

Technorati tags:

Wisdom of the few?

Interessante il commento di Granieri all’articolo È davvero collettiva l’intelligenza del web 2.0? di Nicola Bruno su Apogeonline.

Personalmente il fatto che ci sia una forte asimmetria fra chi contribuisce e chi fuisce dei contenuti sul web 2.0 non mi sorprende affatto e non mi preoccupa. 

Credo che il criterio egualitario importante risieda nel concedere a tutti la possibilità tanto di pubblicare quanto di fruire di contenuti. Il fatto che non tutti quelli che leggono, pubblicano è più che altro un sintomo della salute di questi sistemi. Cosa sarebbe Wikipedia se tutti gli utenti, anche quelli che nulla sanno di nessun argomento, inserissero delle informazioni?

In ogni caso è molto difficile fare discorsi generali su un fenomeno articolato poichè non è affatto la stessa cosa parlare della partecipazione in Digg o in Wikipedia.

Peer review per le masse

Non sono sicuro che possa funzionare davvero ma il concetto dietro questo Helium è piuttosto interessante perchè generalizza l’idea della peer review.

In pratica si tratta di un sito che contiene guide scritte dagli utenti per gli utenti in piena logica di user generated content. L’unica sostanziale differenza è che chi desidera pubblicare una guida è chiamato ad esprimere un giudizio comparativo scegliendo fra due articoli proposti quello secondo lui più utile.

Technorati tags:

Sullo stato del semantic web

Bel post sull’enorme problema dell’intergrazione fra diverse ontologie nel semantic web. Nova Spivack, l’autore del blog, sta lavorando con la sua società Radar Networks a qualcosa di ancora piuttosto misterioso ma apparentemente molto interessante.
Credo che la spigazione di quello che stanno facendo è in questo post.
Il background cibernetico di Spivack è una garanzia di comprensione delle dinamiche dell’osservazione di secondo ordine che sono a fondamento dei maggiori successi del web.
Tenete d’occhio questi ragazzi…

Update on Eyes on Flickr

Velocissimo aggiornamento. Abbiamo scoperto un limite di Flikr nel restituire le immagini a partire da una ricerca. Nello specifico pur mostrando il conteggio delle immagini totale Flickr non retituisce le immagini e le informazioni oltre il record 4100. La ricerca per il tag europe dovrebbe restituire 511.193 foto. Ora poichè la pagina di risposte di Flickr mostra 25 foto per pagina dovremmo avere oltre 20.000 pagine disponibili.

Per vedere le pagine dei risultati successive alla prima è sufficiente aggiungere il parametro page=x dove x è il numero della pagina. Dunque in teoria:

http://www.flickr.com/search/?q=europe&m=tags&page=15000

dovrebbe funzionare come

http://www.flickr.com/search/?q=europe&m=tags&page=3

ed invece no….

Nello specifico l’ultima pagina correttamente restituita è la 167 (167*25=4175) .. dalla 168 in poi il buio…

Forse da qualche parte su Flickr questo limite è scritto ma io non ne ero a conosceza.

In ogni caso abbiamo aggirato l’ostacolo facendo richieste al sistema che restuicano meno di 4000 record. L’idea è quella di iterrogare flickr per tag e  per giorno della pubblicazione della foto.

Il risultato… ancora una volta in progress lo trovate a:

  • Europe TagCloud (alltags, top100, top200);
  • USA TagCloud (alltags, top100, top200).
  • Eyes on Flickr

    Era da diverso tempo che ci stavamo lavorano ma finalmente abbiamo qualcosa di concreto da presentare.
    Si tratta più che altro di una proof of concept.
    Flickr, come molti altri servizi web basati sul contenuto generato dagli utenti, è caratterizzata da una natura sociale profonda. Le immagini caricate e le etichette utilizzate per descriverle sono una vera e propria miniera per la ricerca sociologica sulla semantica della comunicazione.
    L’occasione ci si è presentata di recente. Un paio di interventi a convegni di natura molto diversa uno sull’europa, l’altro di visual sociology. Quale migliore occasione per provare a costruire uno strumento e testare una metodologia per visualizzare l’intorno semantico di una etichetta al tempo stesso carica di significati ed alquanto indefinita come “europa”?
    Come spesso accade dalla teoria alla pratica il passaggio non è stato indolore. Per prima cosa abbiamo dovuto svilppare un’applicazione per scaricare i dati che ci interessavano da Flickr. Nello specifico abbiamo optato per una command line application scritta in C# che interroga le API di Flickr (via Flickr.Net) salva i dati in quattro tabelle di un database mysql. Due per il tag “europe” e due per il tag “usa” (per rendere le cose più interessanti abbiamo deciso per una ricerca comparata). Una solo per l’identificativo univoco dell’immagine ed un singolo tag (ideale per creare una tagcloud) e l’altro con id immagine, titolo, descrizione, numero di commenti, provenienza dell’utente e url dell’immagine.
    Una volta scaricati i dati (si fa per dire perchè l’applicazione li sta ancora scaricando) siamo passati alla visualizzazione ed abbiamo optato per una tagcloud. Flickr offre già una tagloud del sistema ma non una tagcloud specifica per osservare l’intorno semantico di un tag (ci sono i related tag ma non è questo che volevamo). Dopo ho dovuto imparare qualche rudimento di php visto che l’unico esempio che ho trovato di come si fa una tagcloud era scritto in questo linguaggio…
    Per darvi un’idea della mole di dati con cui stiamo avendo a che fare vi basti sapere che, al momento in cui scrivo, ci sono 503.152 fotografie su Flickr taggate “europe” e 444.735 taggate “usa”. Quando leggerete voi, visto il tasso di crescita di circa 1.000 fotografie nuove al giorno che ho potuto apprezzare, saranno parecchie di più (europe, usa).
    Allo stato attuale delle cose è possibile visualizzare le tagclouds relative ai dati che stiamo acquisendo (fra parentesi la frequenza di ciascun tag):

    * Abbiamo deciso che era interessante anche vedere le eventuali differenze fra usa e unitedstates.
    Per sapere su quante immagini si sta lavorando al momento è possibile consultare queste pagine di servizio: europe, usa, unitedstates.
    Per la lettura sociologica (ed un paper che abbiamo quasi finito di scrivere) dei dati bisognerà aspettare lunedì quando io e Luca presenteremo questa ricerca durante un panel del convegno di Eyes on City di Urbino.

    Effetto EPIC

    Ogni tanto, per motivi misteriosi, si risveglia su Internet l’interesse per questo filmato in flash di Robin Sloan, di cui ho parlato relativamente spesso in passato e di cui, sopratutto, ho pubblicato una traduzione italiana del transcript dei dialoghi.
    Quando questo avviene, come negli ultimi due giorni, me ne accorgo dagli accessi del mio blog…
     visits
    P.S. Forse qualcuno (più bravo di me con flash) dovrebbe produrre una versione doppiata in Italiano di EPIC 2015 sullo stile di quella uscita qualche mese fa in tedesco. Il successo in termini di visite è pressochè assicurato. 

    del.icio.us discover

    In un mondo di reti sociali le risorse informative più importanti per un singolo non sono tanto quelle più popolari (facili da trovare) quanto quelle che allo stesso tempo sono importanti per il singolo e scarsamente popolari nella comunità.
      
    Si basa su questo semplice ma interessante principio il progetto del.icio.us discover nell’ambito del quale l’autore ha studiato il comportamento di alcuni utenti del servizio di bookmark sociale in rapporto con la popolarità di ciascuna risorsa inserita nel proprio bookmark. Il risultato, oltre, che utile è apprezzabile anche esteticamente.