{"id":782,"date":"2008-01-31T02:42:09","date_gmt":"2008-01-31T00:42:09","guid":{"rendered":"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/2008\/01\/31\/how-to-search-store-export-and-analyze-user-generated-content-for-social-science\/"},"modified":"2008-01-31T02:42:09","modified_gmt":"2008-01-31T00:42:09","slug":"how-to-search-store-export-and-analyze-user-generated-content-for-social-science","status":"publish","type":"post","link":"https:\/\/nextmedia.uniurb.it\/?p=782","title":{"rendered":"How to search, store, export and analyze user generated content for social science"},"content":{"rendered":"<p>Ieri mattina a Trento con <a href=\"http:\/\/mediageneration.wordpress.com\/il-progetto\/\" target=\"_blank\">Giovanni<\/a> e <a href=\"http:\/\/larica-virtual.soc.uniurb.it\/redline\">Luca<\/a> abbiamo presentato  alcuni risultati preliminari della ricerca <a href=\"http:\/\/mediageneration.wordpress.com\/il-progetto\/\" target=\"_blank\">media e  generazioni<\/a>.<br \/>\nIn particolare il compito affidato in questa prima fase del progetto alla  nostra unit\u00e0 era quello di analizzare le conversazioni online attivate a partire  da un set di prodotti generazionali. Lo specifico focus era sulle generazioni X  ed Y (i nati dai primi anni &#8217;70 in poi).<br \/>\nI risultati sono stati interessanti e credo che alcuni estratti verranno  pubblicati sul <a href=\"http:\/\/mediageneration.wordpress.com\/\" target=\"_blank\">sito  del progetto<\/a> insieme ai progressi delle altre linea di ricerca desk sulle  generazioni in letteratura e nello specifico del romanzo rosa.<br \/>\nQuesto post \u00e8 invece dedicato a raccontare pi\u00f9 nel dettaglio di quanto  abbiamo potuto fare ieri la metodologia usata dal punto di vista tecnico (vista  anche la curiosit\u00e0 ed interesse suscitata nei colleghi presenti).<br \/>\nL&#8217;idea di analizzare le conversazioni online non \u00e8 nuova per chi legge questo  blog.<br \/>\nPer un inquadramento teorico complessivo della questione rimando ad <a href=\"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/wp-content\/uploads\/2007\/11\/social_semantics2.pdf\">un  articolo<\/a> che ho scritto qualche tempo fa mentre due esempi di progetti  pilota realizzati con lo scopo di mettere alla prova l&#8217;approccio sono Eyes on  Europe (<a href=\"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/wp-content\/uploads\/2006\/11\/Eyes%20on%20Europe%20formattato.pdf\" target=\"_blank\">paper<\/a>, <a href=\"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/2006\/06\/30\/eyes-on-flickr\/\" target=\"_blank\">post<\/a>) e Eyes on you: Pregnancy 2.0 (<a href=\"http:\/\/redress.lancs.ac.uk\/resources\/imp_template.php?creator=Fonio_Chiara&amp;title=eyesonyou\" target=\"_blank\">webcast<\/a>, <a href=\"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/wp-content\/uploads\/2007\/09\/eyes_on_you.pdf\" target=\"_blank\">draft paper<\/a>, <a href=\"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/2007\/09\/03\/potevo-non-andare-ad-un-convegno-con-questo-titolo\/\" target=\"_blank\">post<\/a>).<br \/>\nI progetti pilota ci hanno insegnato che (1) la metodologia aveva delle  potenzialit\u00e0 e che (2) la quantit\u00e0 di dati disponibili impediva un qualsiasi  ragionevole approccio non supportato dal computer al reperimento e all&#8217;analisi  collaborativa di questi dati.<br \/>\nAbbiamo dunque deciso di impegnare risorse e tempo nello sviluppo di  un&#8217;applicazione <em>general purpose<\/em> che supportasse il ricercatore nel  reperimento guidato e nell&#8217;analisi collaborativa di questi dati.<br \/>\nGrazie alle competenze tecniche di <a href=\"http:\/\/www.nonaka.eu\/\" target=\"_blank\">Romeo<\/a> e <a href=\"http:\/\/www.rainbowbreeze.it\/\" target=\"_blank\">Alfredo<\/a> questa applicazione \u00e8 oggi una realt\u00e0.<br \/>\n<a href=\"http:\/\/www.flickr.com\/photos\/f-g\/2231879505\/\" title=\"wow20 wizard by FG@flickr.com, on Flickr\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/larica.uniurb.it\/nextmedia\/files\/2008\/01\/2231879505_804c780eb2_m.jpg\" alt=\"wow20 wizard\" align=\"left\" height=\"160\" width=\"240\" \/><\/a>Tecnicamente si tratta di una web application  in grado di reperire, consumare, conservare, condividere ed esportare flussi  informativi nel formato standard RSS verso le principali applicazioni esistenti  per l&#8217;analisi del contenuto (al momento abbiamo testato il supporto di <a href=\"http:\/\/www.qsrinternational.com\/products_nvivo.aspx\" target=\"_blank\">Nvivo  7<\/a> ma \u00e8 ragionevole pensare che la stessa cosa possa funzionare con <a href=\"http:\/\/www.atlasti.com\/\" target=\"_blank\">Atlas.ti<\/a>).<br \/>\nAll&#8217;atto dell&#8217;esportazione dei contenuti di un progetto (post di blog o forum  di <a href=\"http:\/\/www.flickr.com\/photos\/f-g\/2232669330\/\" title=\"wow20 project list by FG@flickr.com, on Flickr\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/larica.uniurb.it\/nextmedia\/files\/2008\/01\/2232669330_ce80ffe3fd_m.jpg\" alt=\"wow20 project list\" align=\"right\" height=\"211\" width=\"240\" \/><\/a>discussione che supportino rss, foto o video  pubblicati sul web) la web application reperisce e restituisce le informazioni  biografiche sull&#8217;autore del contenuto se disponibili su una delle numerose  piattaforma di blog e condivisioni di contenuti audio\/video supportate (usando  tecniche di <a href=\"http:\/\/www.wired.com\/techbiz\/media\/magazine\/16-01\/ff_scraping\" target=\"_blank\">scraping<\/a> ad hoc per ogni piattaforma).<br \/>\nGrazie a questa applicazione abbiamo potuto reperire a partire da un set di  oltre 40 prodotti generazionali (film, serie tv, libri, videogiochi, musica,  fumetti) e con query costruite ad hoc su ogni prodotto 3000 post.<br \/>\n<a href=\"http:\/\/www.flickr.com\/photos\/f-g\/2232669224\/\" title=\"wow20 project detail by FG@flickr.com, on Flickr\"><img loading=\"lazy\" decoding=\"async\" src=\"http:\/\/larica.uniurb.it\/nextmedia\/files\/2008\/01\/2232669224_bdceaca866_m.jpg\" width=\"240\" align=\"left\" height=\"234\" alt=\"wow20 project detail\" \/><\/a> Di questi 3000 post 928 erano corredati  dall&#8217;et\u00e0 dell&#8217;autore (dato essenziale per la ricerca sulle generazioni), oltre  1000 dal genere e molto spesso (non abbiamo calcolato questo dato esattamente  perch\u00e9 privo di interesse nello specifico della ricerca) da una qualche forma  (citt\u00e0 o nazione) di indicazioni geografica di provenienza.<br \/>\nQuesti dati strutturali insieme alla rilevanza degli stessi nei termini della  ricerca dei contenuti reperiti rappresentano per la nostra unit\u00e0 di ricerca e  per me in particolare una straordinaria conferma delle potenzialit\u00e0  dell&#8217;applicazione e della metodologia di ricerca (che solleva anche questioni  estremamente interessanti di ordine metodologico ed etico).<br \/>\nMi sarebbe piaciuto poter annunciare in questo post la disponibilit\u00e0  dell&#8217;applicazione per chiunque ne voglia fare uso ma ci\u00f2 non \u00e8 purtroppo  possibile.<br \/>\nNon lo \u00e8 per due ordini di ragioni.<br \/>\n1) La prima \u00e8 che per il momento tutta l&#8217;attenzione nello sviluppo si \u00e8  concentrata sulle funzionalit\u00e0 con conseguenze immaginabili sull&#8217;usabilit\u00e0  (oltre che sugli aspetti puramente estetici) dell&#8217;applicazione (che fra l&#8217;altro  non ha neanche un nome definitivo);<br \/>\n2) La seconda \u00e8 di performance. L&#8217;applicazione \u00e8 infatti ospitata su una  macchina virtuale che \u00e8 ospitata dal server che ospita al tempo stesso la  macchina virtuale di questo blog (lo sapevate gi\u00e0 che la ricerca in Italia ha  pochi fondi, no?). La fase di esportazione dei contenuti di un progetto \u00e8  estremamente pesante in termini di carico di lavoro sulla macchina. La  conseguenza \u00e8 che se pi\u00f9 di 3\/4 utenti cercando di esportare contemporaneamente  un progetto tendono a saturare le capacit\u00e0 di calcolo della macchina virtuale  con le conseguenze che si possono immaginare.<br \/>\nOvviamente stiamo lavorando per risolvere queste due questioni ma non siamo  in grado di dire oggi quando ed anche se saremo in grado di poter rendere  disponibile pubblicamente l&#8217;applicazione per i ricercatori che intendano farne  uso.<br \/>\nNel frattempo siamo per\u00f2 in grado di ospitare pilot isolati di ricercatori  (in senso lato da laureandi, dottorandi, etc.) che ne facciano esplicitamente  richiesta.<br \/>\nSe state progettando o realizzando una ricerca basata sull&#8217;analisi dei  contenuti generati dagli utenti sul web potete <a href=\"http:\/\/larica-virtual.soc.uniurb.it\/nextmedia\/about-me\/\" target=\"_blank\">contattarmi<\/a> per concordare le modalit\u00e0 di accesso  all&#8217;applicazione.<br \/>\nP.S. Anche le offerte di collaborazione sono ben accette. Dunque se l&#8217;idea  dell&#8217;applicazione vi interessa ed avete risorse o competenze da mettere a  disposizione per collaborare allo sviluppo del progetto siete i benvenuti.<\/p>\n<p class=\"wlWriterEditableSmartContent\" id=\"scid:0767317B-992E-4b12-91E0-4F059A8CECA8:943cf8b9-2716-4065-bace-6008bb07bdea\" contenteditable=\"false\" style=\"margin: 0px; padding: 0px; display: inline\">Technorati  tags: <a href=\"http:\/\/technorati.com\/tags\/nvivo\" rel=\"tag\">nvivo<\/a>, <a href=\"http:\/\/technorati.com\/tags\/atlas.ti\" rel=\"tag\">atlas.ti<\/a>, <a href=\"http:\/\/technorati.com\/tags\/social%20semantics\" rel=\"tag\">social  semantics<\/a>, <a href=\"http:\/\/technorati.com\/tags\/content%20analysis\" rel=\"tag\">content analysis<\/a>, <a href=\"http:\/\/technorati.com\/tags\/lab20\" rel=\"tag\">lab20<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ieri mattina a Trento con Giovanni e Luca abbiamo presentato alcuni risultati preliminari della ricerca media e generazioni. In particolare il compito affidato in questa prima fase del progetto alla nostra unit\u00e0 era quello di analizzare le conversazioni online attivate a partire da un set di prodotti generazionali. Lo specifico focus era sulle generazioni X &hellip; <a href=\"https:\/\/nextmedia.uniurb.it\/?p=782\" class=\"more-link\">Leggi tutto<span class=\"screen-reader-text\"> &#8220;How to search, store, export and analyze user generated content for social science&#8221;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[33,21,12,42,2],"tags":[],"_links":{"self":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts\/782"}],"collection":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=782"}],"version-history":[{"count":0,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts\/782\/revisions"}],"wp:attachment":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=782"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=782"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=782"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}