Come trasformare i dataset di DiscoverText in formato YourTwapperKepper

Come trasformare in modo rapido un dataset dal formato di DiscoverText a quello di YourTwapperKeeper

Esistono ormai svariati strumenti che supportano il lavoro del ricercatore nel reperire ed analizzare i contenuti prodotti dagli utenti nei social media.
Personalmente uso DiscoverText per le funzionalità di analisi del contenuto multi-utente che offre. Questo strumento manca tuttavia, almeno nella sua versione Professional, di un tool di analisi quantitativo in grado di rispondere a semplici domande come l’andamento della conversazione nel tempo o il rapporto fra Tweet e RT in un dataset Twitter.
A questo scopo faccio di solito uso degli script realizzati nell’ambito del progetto Mapping Online Publics e resi disponibili gratuitamente da Axel Bruns.
Il problema è che questi script sono pensati per funzionare su dataset in formato YourTwapperKeeper.
Recentemente ho trovato un modo relativamente semplice per passare da un formato all’altro usando un software gratuito chiamato Google Refine (o Open Refine come si chiama ora) e vorrei condividerlo con la comunità in caso qualcuno si trovasse ad affrontare una esigenza analoga.
1. Scaricare il dataset in formato CSV da DiscoverText;
2. Importare il file in Google Refine;
3. Scegliere la codifica UTF8 e come separatore la virgola;
4. Scegliere li nome e procedere con la creazione del progetto;
5. Scegliere Undo/Redo e poi “Apply”;
6. Nella finestra che si apre incollare il contenuto di questo script e scegliere “Perform Operation”;
A questo punto il formato del dataset è quello di TYK. Potete procedere ad esportare il file in formato CSV ed utilizzarlo come input negli script di Axel.