{"id":2585,"date":"2012-11-30T13:13:27","date_gmt":"2012-11-30T12:13:27","guid":{"rendered":"http:\/\/larica.uniurb.it\/nextmedia\/?p=2585"},"modified":"2012-11-30T13:13:27","modified_gmt":"2012-11-30T12:13:27","slug":"come-trasformare-i-dataset-di-discovertext-in-formato-yourtwapperkepper","status":"publish","type":"post","link":"https:\/\/nextmedia.uniurb.it\/?p=2585","title":{"rendered":"Come trasformare i dataset di DiscoverText in formato YourTwapperKepper"},"content":{"rendered":"<p>Esistono ormai svariati strumenti che supportano il lavoro del ricercatore nel reperire ed analizzare i contenuti prodotti dagli utenti nei social media.<br \/>\nPersonalmente uso DiscoverText per le funzionalit\u00e0 di analisi del contenuto multi-utente che offre. Questo strumento manca tuttavia, almeno nella sua versione Professional, di un tool di analisi\u00a0quantitativo\u00a0in grado di rispondere a semplici domande come l&#8217;andamento della conversazione nel tempo o il rapporto fra Tweet e RT in un dataset Twitter.<br \/>\nA questo scopo faccio di solito uso degli <a href=\"http:\/\/mappingonlinepublics.net\/resources\/\" target=\"_blank\">script<\/a> realizzati nell&#8217;ambito del progetto Mapping Online Publics e resi disponibili gratuitamente da <a href=\"http:\/\/staff.qut.edu.au\/staff\/bruns\/\" target=\"_blank\">Axel Bruns.<\/a><br \/>\nIl problema \u00e8 che questi script sono pensati per funzionare su dataset in formato <a href=\"https:\/\/github.com\/jobrieniii\/yourTwapperKeeper\" target=\"_blank\">YourTwapperKeeper<\/a>.<br \/>\nRecentemente ho trovato un modo relativamente semplice per passare da un formato all&#8217;altro usando un software gratuito chiamato <a href=\"http:\/\/code.google.com\/p\/google-refine\/\" target=\"_blank\">Google Refine<\/a> (o Open Refine come si chiama ora) e vorrei condividerlo con la comunit\u00e0 in caso qualcuno si trovasse ad affrontare una esigenza analoga.<br \/>\n1. Scaricare il dataset in formato CSV da DiscoverText;<br \/>\n2. Importare il file in Google Refine;<br \/>\n3. Scegliere la codifica UTF8 e come separatore la virgola;<br \/>\n4. Scegliere li nome e procedere con la creazione del progetto;<br \/>\n5. Scegliere Undo\/Redo e poi &#8220;Apply&#8221;;<br \/>\n6. Nella finestra che si apre incollare il contenuto di <a href=\"https:\/\/s3-eu-west-1.amazonaws.com\/nextmediaandsociety\/lab\/script\/refine_dt_to_ytk.zip\" target=\"_blank\">questo script<\/a> e scegliere &#8220;Perform Operation&#8221;;<br \/>\nA questo punto il formato del dataset \u00e8 quello di TYK. Potete procedere ad esportare il file in formato CSV ed utilizzarlo come input negli script di Axel.<br \/>\n&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p><!--:it-->Come trasformare in modo rapido un dataset dal formato di DiscoverText a quello di YourTwapperKeeper<!--:--><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[22],"tags":[211,263],"_links":{"self":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts\/2585"}],"collection":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2585"}],"version-history":[{"count":0,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts\/2585\/revisions"}],"wp:attachment":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2585"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2585"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2585"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}