In questa serie di Posts andremo ad analizzare gli ultimi 3200 tweets di Di Maio, Salvini e Martina. Il mio studio sarà diviso in 2 parti:
- Nella parte I analizzeremo le abitudini dei 3 leader e scopriremo chi dei 3 è il più attivo, quando durante la giornata, quanto sono popolari i vari tweets e molte altre informazioni.
- Nella parte II ci addentreremo nel contenuto dei tweets e andremo a vedere quali sono le parole e i lemmi più usati dai 3 politici.
Premessa
Social media come Twitter sono diventati anche in Italia uno dei mezzi di comunicazione più usati dai politici per rivolgersi direttamente al loro elettorato. Una quantità di informazioni enorme su abitudini, messaggio elettorale e tipo di elettori si nasconde tra quei tweets di poche centinaia di byte. Un famoso post di David Robinson ha dimostrato come queste informazioni possono essere scovate dall’occhio attento del Data Scientist attraverso l’uso sapiente R e alcuni sui pacchetti (twitteR, tidyverse e tidytext).
Eccomi qui perciò anche io, munito di R, RStudio e computer con l’obiettivo di esplorare e comparare i tweets dei leader dei 3 maggiori partiti italiani (leader in ordine alfabetico per username Twitter):
- Movimento a 5 stelle: Luigi Di Maio (luigidimaio).
- Lega: Matteo Salvini (matteosalvinimi).
- Partito Democratico: Maurizio Martina (maumartina).
I posts saranno densi di codice (dopo tutto sto facendo tutto questo anche per rimanere un attivo R user) ma inserirò delle conclusioni con i punti chiave dell’analisi.
Analisi
Preparazione e download dati
Per avere accesso a Twitter su R è necessario come prima cosa creare una app su Twitter. Michael Galarnyk ha creato un ottimo tutorial che dà istruzioni passo per passo per completare questa prima fase (guida di Michael Galarnyk). Una volta creata la app, il pacchetto twitteR ci permetterà di accedere all’API e lavorare con R sui dati ottenuti.
Iniziamo con il caricare twitteR e una serie di altre librerie che ci saranno utili successivamente.
|
|
Ci autentichiamo utilizzando le chiavi ottenute seguendo la guida di Michael Galarnyk.
|
|
Otteniamo i 3200 tweets di luigidimaio, maumartina, matteosalvinimi usando il comando userTimeline e diamo una pulita al dataframe (twdat = tweets data) ottenuto.
|
|
OK, abbiamo a questo punto un dataframe/tibble con cui possiamo lavorare.
QuanTo twittano
Iniziamo con il vedere chi è il più attivo tra i tre e numero di tweets al giorno attraverso differenti misure di tendenza centrale.
|
|
screenName | max | min | IQR | mean | meadian | mode | St_Dev |
---|---|---|---|---|---|---|---|
luigidimaio | 54 | 1 | 2 | 3 | 2 | 1 | 3.559438 |
matteosalvinimi | 93 | 2 | 9 | 12 | 8 | 5 | 11.192814 |
maumartina | 24 | 1 | 2 | 2 | 2 | 1 | 1.840639 |
Salvini è di gran lunga il più attivo, 4-6 volte più di Di Maio e di Martina. Salvini è riuscito a pubblicare un massimo di 93 tweets in un giorno (2018-02-25), ma tipicamente (moda) pubblica 5 tweets al giorno e una media di 12 tweets al giorno (la distribuzione è chiaramente positive skewed). Martina e Di Maio tendono ad utilizzare con simile frequenza Twitter ma Di Maio tende ad essere più variabile (vedi range e St_Dev).
Salvini è dei tre l’unico che pubblica quasi esclusivamente materiale originale. Circa un terzo dei tweets di Di Maio e un quarto di quelli di Martina sono invece retweets (tab.2 sottostante).
|
|
screenName | tot_retw | perc_retw |
---|---|---|
luigidimaio | 1153 | 36.1% |
matteosalvinimi | 92 | 2.88% |
maumartina | 802 | 25.1% |
QuanDo twittano
Ora e giorno della settimana
Andiamo ora a vedere il pattern con il quale i nostri 3 politici twittano e in particolare l’ora e giorno della settimana. I dati verranno espressi come percentuale dei tweets calcolati per ogni politico.
Il codice sottostante serve a creare il primo grafico.
|
|
Qui creiamo il secondo grafico e plottiamo entrambi i grafici utilizzando il pacchetto extraGrid.
|
|
Salvini tende ad iniziare a twittare al mattino come Di Maio e Martina, ma rispetto a loro, tende a continuare ad essere attivo anche la sera (7-23). Per Martina il picco di attività è la mattina (9-11) mentre per Di Maio è dalle 9 alle 16 (fig.2, sinistra). Tutti e tre i politici hanno un giorno durante il week-end in cui sono molto meno attivi: sia per Di Maio che Salvini è il Sabato, mentre per Martina la Domenica (fig.2, destra).
Ho usato ggridges, una extention di ggplot2, per creare dei density plots e visualizzare in dettaglio l’interazione tra giorno della settimana ed ora del giorno dei tweets (fig.3 sottostante). L’analisi tende comunque a supportare la generabilità delle osservazioni precedenti ma con alcune precisazioni: la Domenica è Di Maio a distribuire i sui tweets più tardi la sera. Inoltre, il Lunedì Salvini è, diversamente dagli altri giorni della settimana, molto più attivo nel primo pomeriggio tra le 14 e le 16 (fig.3).
|
|
Ultimi mesi
Gli ultimi mesi della politica italiana sono stati estremamente densi di eventi importanti, a partire dalle elezioni per poi proseguire con le varie consultazioni e la formazione del governo. È perciò legittimo domandarsi se questa serie di avvenimenti abbia spinto i politici ad utilizzare più frequentemente Twitter per comunicare con i propri elettori.
Un caveat dei dati ottenuti è che twitteR non permette di scaricare più di 3200 tweets. Dal momento che Salvini è estremamente più attivo degli altri due politici, i suoi 3200 tweets sono stati pubblicati in un periodo inferiore rispetto a quelli di Di Maio e Martina (tab.3).
|
|
screenName | first_tweet | last_tweet |
---|---|---|
luigidimaio | 2014-09-09 17:47:51 | 2018-08-14 10:56:16 |
matteosalvinimi | 2017-11-30 13:46:14 | 2018-08-26 19:35:21 |
maumartina | 2014-02-19 11:40:18 | 2018-08-26 15:59:43 |
Per poter comparare l’attività dei 3 politici è necessario andare a monitorare lo stesso intervallo di tempo.
Il codice sottostante serve a trovare qual’è l’intervallo in mesi in cui disponiamo di dati per tutti e 3 i politici. Andremo a plottare il seguente intervallo di tempo.
|
|
1 2 |
## Warning: `as_data_frame()` is deprecated, use `as_tibble()` (but mind the new semantics). ## This warning is displayed once per session. |
value |
---|
2017-12-01 01:00:00 |
2018-08-01 02:00:00 |
Creiamo quindi i grafici riguardanti il numero di tweets al mese per l’intervallo di Dicembre-Luglio.
|
|
Ho usato il codice indicato sopra sui dati normalizzati usando come baseline il numero di tweets di Dicembre (con group_by e do di dyplyr).
|
|
Sulla sinistra abbiamo i dati assoluti mentre sulla destra i dati in percentuale. Questa normalizzazione ci permette di comparare meglio gli andamenti e i cambiamenti di attività tra i politici.
Salvini twitta molto più di Di Maio e Martina ma l’attività di tutti e 3 i politici aumenta drasticamente in Febbraio di quest’anno, mese di campagna elettorale) (con un inizio precoce per Salvini già in Gennaio). Questo picco di attività crolla velocemente e in Marzo già si ritorna a quei livelli di attività pre-elettorali (o anche inferiori nel caso di Di Maio). Un altro aumento dell’attività di Salvini e Martina si osserva negli ultimi mesi, sospetto sia in qualche modo collegato alle vicenda dell’Acquarius e della “chiusura dei porti” (fig.3).
Il successo dei tweets
Likes per tweet
Ma quanto sono apprezzati i tweets dei 3 politici dai rispettivi followers? Iniziamo vedendo il totale numero di like ottenuti e alcuni indici di tendenza centrale riguardanti likes per ogni tweet.
I numeri sono molto chiari. Con 3200 tweets, Salvini ha totalizzato più di 4 milioni e mezzo di likes, una media di quasi 1500 likes a tweet. Salvini ha ottenuto 5 volte i like di Di Maio e più di dieci volte quelli di Martina (il meno popolare dei tre).
Visto che anche in questo caso stiamo avendo a che fare con distribuzioni molto skewed, vale la pena ricorrere a qualche rappresentazione grafica.
|
|
Tutte e tre le distribuzioni sono estremamente skewed verso destra ma anche da questo grafico è possibile cogliere che i tweets di Salvini con alti numeri di likes sono più numerosi rispetto a quelli degli altri 2 politici (barre verdi sono più alte rispetto alle gialle e rosse quando ci spostiamo verso destra,fig.4)
Un altro modo per osservare e comparare i tweets è attraverso il jitter plot sottostante.
|
|
Nella figura ogni tweet è rappresentato da un punto che è in alto se il tweet ha ricevuto molti likes. Anche da questa rappresentazione si evince che Salvini è estremamente più popolare tra i suoi followers di Di Maio e Martina (fig.5).
Andamento della popolarità
Come è cambiata la popolarità dei vari politici negli ultimi mesi? Andiamo ad analizzarlo attraverso la visualizzazione di numero di like per tweet (fig.6, sinistra) e totale di like (fig.5) nei mesi di Dicembre 2017 fino a Luglio 2018. Utilizzeremo lo stesso codice impiegato per le fig.1.
Sia per Di Maio che per Salvini in numero di like per tweet è aumentato drasticamente a partire da Marzo del 2018 con un picco quest’estaste (fig.6 sinistra). Anche i like per tweet di Martina sono aumentati, ma in misura molto minore rispetto a quelli degli altri 2 politici (fig.6 sinistra). Un altra considerazione interessante è che negli ultimi mesi la popolarità dei tweets di Di Maio e Salvini in termini di likes per tweets non è stata tutto sommato molto differente (2500-4000 likes per tweet, fig.6 sinistra) e il maggiore numero totale di likes da parte di Salvini è imputabile al sua maggiore presenza sul social media (fig.6 destra).
I tweets più famosi
Ho deciso di dare una sbirciata ai tweets che hanno riscosso più successo: i 10 tweets di ogni politico con più likes (ordinati in maniera discendente).
|
|
Alcuni dei temi più cari ai m5s e Lega emergono nei tweets più apprezzati:
- Per Di Maio i vitalizi (3⁄10) e il decreto dignità.
- Per Salvini, le navi di immigrati, i porti e Saviano.
I 10 tweets di Marina con più like sono invece quelli in cui viene presa di mira la politica di m5s e la Lega. Anche in questo grafico si può notare che i 10 tweets di Salvini hanno ottenuto un numero di like molto maggiore rispetto a quelli di Di Maio e Martina (i punti sono più spostati verso destra).
I dispositivi utilizzati
Per ultimo andiamo a vedere quali sono i dispositivi utilizzati e preferiti dai 3 politici. Un dettaglio forse triviale ma che come ha mostrato David Robinson può fornire intuizioni importanti.
|
|
Creiamo 3 pie charts con percentuali di tweets dai diversi dispositivi.
|
|
Sono piuttosto chiare le differenze tra i 3 politici:
- Di Maio principalmente utilizza android e twitta post da facebook
- Salvini usa iPhone e computer
- Martina usa quasi esclusivamente il suo iPhone per twittare.
Non vi fanno pensare questi dati? La cosa che a me è balzata agli occhi è che dei 3 è Salvini (o chi per lui) ad utilizzare di più un Web Client e quindi con molto probabilità ad essere seduto alla sua scrivania di fronte al computer per twittare (a meno che Di Maio non abbiamo sempre utilizzato Facebook da computer e non da cellulare). Non so voi, ma io quando devo scrivere una email importante, devo leggere un articolo con attenzione o scrivere qualcosa per lavoro, difficilmente uso il mio cellulare: mi siedo alla scrivania e uso il mio PC. È molto probabile che queste differenze nell’uso dei dispositivi sia correlato con altre variabili, ma è senz’altro invitante l’ipotesi che il successo di Salvini su Twitter sia dovuto almeno in una piccola parte dal fatto che consideri molto seriamente la sua attività comunicativa, forse tanto da dedicarne appositamente del tempo al computer. Si tratta ovviamente di speculazioni, ed è altrettanto possibile che semplicemente Salvini passi più tempo alla scrivania rispetto agli altri, che abbia notifiche di Twitter attivate sul desktop, o che ami fare breve pause mentre lavora al computer.
Conclusione
I dati non lasciano molti dubbi.
- Dei tre politici è Salvini, con una media di 12 tweets al giorno, di gran lunga il più attivo su Twitter (tab.1, fig.1, fig.3 sinistra).
- Dei tre politici, è lui quello con più materiale originale (pochissimi retweets, tab.2) e che twitta in un intervallo di ore più lungo durante giorno (fig.1 sinistra).
- Questa maggiore presenza sul social paga (o ne è la sua conseguenza) in termini di apprezzamento da parte dei followers. Salvini è tra i tre quello con più successo in Twitter: con 3200 tweets ha totalizzato 4 milioni e mezzo di likes, una media di quasi 1500 likes a tweet, 5 volte piu di Di Maio e oltre 10 più di Martina (tab.4, fig.5).
- Per tutti e tre i politici c’è stato un aumento di popolarità negli ultimi mesi di quest’anno, ma per Salvini e Di Maio in misura estremamente maggiore rispetto a Martina (fig.6).
- Negli ultimi mesi sia i tweets di Salvini che Di Maio hanno ricevuto ampio apprezzamento(2500-4000 likes per tweet).
- I temi più apprezzati? Abbiamo dato una sbirciata ai 10 tweets più popolari e per Salvini i temi sono immigrazione, porti, Saviano; per Di Maio sono i vitalizi e il decreto dignità; per Martina opposizione alle misure di Lega e Salvini (fig.7).
Seduto alla sua scrivania e con il suo iphone (fig.8), Salvini ha fatto di Twitter il suo regno incontrastato.