{"id":2117,"date":"2011-09-25T18:57:16","date_gmt":"2011-09-25T16:57:16","guid":{"rendered":"http:\/\/larica.uniurb.it\/nextmedia\/?p=2117"},"modified":"2011-09-25T18:57:16","modified_gmt":"2011-09-25T16:57:16","slug":"note-sulla-raccolta-tweet-in-realtime-con-discovertext","status":"publish","type":"post","link":"https:\/\/nextmedia.uniurb.it\/?p=2117","title":{"rendered":"Note sulla raccolta tweet in realtime con DiscoverText"},"content":{"rendered":"<p><!--:it-->Ho provato a fare un piccolo esperimento per capire meglio i limiti del reperimento tweet su temi d&#8217;attualit\u00e0.<br \/>\nNel corso delle ultime 24 ore ho raccolto 9429 tweet contenenti l&#8217;hashtag #tunnelgelmini.<br \/>\nPer la raccolta ho usato <a href=\"http:\/\/discovertext.com\" target=\"_blank\">DiscoverText<\/a> che, come quasi tutti i tool attualmente disponibili (vedi la terza delle <a href=\"http:\/\/papers.ssrn.com\/sol3\/papers.cfm?abstract_id=1926431\" target=\"_blank\">sei provocazione sui Big Data<\/a> di danah boyd a Kate Crawford), non garantisce comunque che tutti i tweet della timeline pubblica siano stati effettivamente reperiti. Il limite imposto dalle API di Twitter \u00e8 di 1500 tweet restituiti e DiscoverText consente di reperire i dati ogni 15 minuti. Quindi tutte le volte che sono generati pi\u00f9 di 1500 tweet in un quarto d&#8217;ora si perdono quelli eccedenti questa soglia.<br \/>\nHo iniziato a raccogliere i dati alle 17:52 di ieri 24\/09 ed il primo tweet reperito \u00e8 delle 16:36 del 24\/09 (<a href=\"http:\/\/twitter.com\/#!\/paoloduina\/status\/117608339399127040\">http:\/\/twitter.com\/#!\/paoloduina\/status\/117608339399127040<\/a>).<br \/>\nBisogna dunque essere molto rapidi se si desidera ottenere una collezione completa di tweet su fenomeni come questo.\u00a0Annoto incidentalmente che tutte le date in DiscoverText sono relative al fuso GMT-7 e non ho trovato il modo di settare il fuso orario dell&#8217;utente.<br \/>\nDella collezione di tweet reperiti 4734 (50,2%) sono retweet (RT @) e 365 (3,87) sono risposte ad un utente (@ replay). I 9429 tweet sono stati generati da 4377 account diversi. Sarebbero poco pi\u00f9 di due ad account se non fosse che la distribuzione \u00e8, come sempre avviene in questi casi, non normale. L&#8217;utente pi\u00f9 prolifico ha pubblicato 50 tweet. I 10 utenti pi\u00f9 prolifici hanno generato 358 tweet pari al 3,79% del totale.<!--:--><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ho provato a fare un piccolo esperimento per capire meglio i limiti del reperimento tweet su temi d&#8217;attualit\u00e0. Nel corso delle ultime 24 ore ho raccolto 9429 tweet contenenti l&#8217;hashtag #tunnelgelmini. Per la raccolta ho usato DiscoverText che, come quasi tutti i tool attualmente disponibili (vedi la terza delle sei provocazione sui Big Data di &hellip; <a href=\"https:\/\/nextmedia.uniurb.it\/?p=2117\" class=\"more-link\">Leggi tutto<span class=\"screen-reader-text\"> &#8220;Note sulla raccolta tweet in realtime con DiscoverText&#8221;<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[15],"tags":[210,211,212],"_links":{"self":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts\/2117"}],"collection":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=2117"}],"version-history":[{"count":0,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=\/wp\/v2\/posts\/2117\/revisions"}],"wp:attachment":[{"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=2117"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=2117"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/nextmedia.uniurb.it\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=2117"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}