Analisi del Contenuto dei Dibattiti per le elezioni presidenziali Usa. Hillary Clinton vs Donald Trump

Oggi si è concluso il terzo ed ultimo dibattito fra Hillary Clinton e Donald Trump, prima delle elezioni presidenziali negli Stati Uniti d’America del prossimo 8 novembre, e mi è sembrata una buona occasione per inaugurare questa mia nuova pagina/blog personale.

Il post che state per leggere riporta alcune semplici analisi del contenuto testuale effettuate sul Corpus delle trascrizioni dei 3 incontri avvenuti rispettivamente:

–  il 26 settembre presso la Hofstra University di Hempstead, moderato da Lester Holt;

–  il 9 ottobre alla Washington University in St. Louis, moderato da Martha Raddatz e Anderson Cooper;

– il 19 ottobre presso la University of Nevada, Las Vegas, moderato da Chris Wallace.

Caratteristiche del Corpus:

Il Corpus è formato da 952 interventi, avvenuti nei 3 dibatti, fra i Candidati e i Moderatori. In totale si sono pronunciate 4.131 parole diverse per un totale di 51.266 occorrenze (numero totale di parole pronunciate). L’ampiezza di ciascun intervento è molto varia, si passa da 1 (il semplice, yes, no, yeah) fino a 530 occorrenze (di Trump nel primo incontro).

Nei successivi due grafici sono riportati rispettivamente il numero degli interventi e il numero delle occorrenze totali pronunciate nel corso degli incontri. Come si può vedere sia nel primo che nel secondo dibattito Trump ha usato più parole del suo avversario, mentre nell’ultimo incontro la dimensione dei testi dei due candidati è molto simile, intorno alle 7.000 parole ciascuno.

tabella-numero-di-interventi

tabella-occorrenze

Caratteristiche dei Discorsi

L’analisi delle specificità ci consente di evidenziare il linguaggio caratteristico dei diversi parlanti.

Nella Tabella seguente sono riportate le principali forme caratteristiche (sovrautilizzate rispetto al avversario) dai due candidati.

tabella-specificita-clinton-trump

Fatta eccezione per i nomi dei candidati avversari risultati come tipici di ciascuno dei due parlanti, si nota come fra le forme più specifiche di Trump ci siano degli aggettivi mentre per Clinton ci siano dei Verbi. Tale prima evidenza viene confermata dal grafico in cui sono riportate le POS (Parti del Discorso) caratteristiche di ciascun candidato.

grafico-pos-caratteristiche-dei-candidati

Si può vedere come nel linguaggio di Clinton prevalgano i sostantivi e i verbi (descrizione di azioni e contesti), mentre in Trump prevale l’uso dei Numeri e aggettivi (citazioni di statistiche come elemento di critica, aggettivi positivi nei confronti del paese e aggettivi negativi nei confronti del governo dei Democratici) accompagnato da un sovra uso di parole di struttura del linguaggio (SW – supplementary words) e di forme non categorizzate dal lemmatizzatore (generalmente sono nomi propri, Obama, Hillary, Lester, NAFTA, …).

Sul piano fattoriale sono rappresentati i linguaggi caratteristici dei due candidati e dei moderatori.

piano-fattoriale-specificità-moderatori-clinton-trump

Il primo fattore rappresenta la differenza di linguaggio fra i moderatori e i candidati, mentre il secondo fattore polarizza i linguaggi di Clinton (Rosso) e Trump (Blu).

Le Tematiche Affrontate

Tramite la Cluster Analysis, possiamo risaltare le tematiche affrontate durante i 3 dibattiti. Escludendo la Classe 4 caratterizzata dal linguaggio dei moderatori, le principali aree tematiche affrontate risultano essere 3:

Gruppo 1- Problemi Nazionali dei Cittadini

Gruppo 2 – Economia e Tasse

Gruppo 3 – Politica estera

dendrogramma-classi-semantiche

In ultimo possiamo vedere la rappresentazione dell’Analisi di Rete delle cooccorrenze delle parole attive (nomi, sostantivi, verbi, aggettivi e avverbi). Nel grafico si evidenziano due nuclei principali caratterizzati dalle due parole di contenuto più occorrenti: people e country. Intorno a questi due nodi principali si sviluppa l’intera rete. Sebbene tali due forme siano molto utilizzate da entrambi, prevale l’uso di Country negli interventi di Trump, mentre People è il soggetto tendenzialmente più utilizzato dalla Clinton.

cooccorrenze-debate

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *