X

Carnet de recherche

Le projet de recherche 'Mixology' s’inscrit dans la perspective de l’open research. Son objectif est de sonder les opinions en période de crise, à partir d’un corpus collecté via l’API de Twitter. Il vise également à développer un outil de recherche d’analyse de contenus orginal, en vue de pouvoir être réutilisé dans l’analyse de titres de presse et de contenus médiatiques en période de crise (méthodes de linguistique computationnelle et de machine learning), et il s’inscrit dans le champ des études des médias et des études du journalisme.

Blog 8 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.2)

6 janvier 2022

English

L’examen des bigrammes et des trigrammes (avec le package R tidytext) rappelle que la campagne de vaccination relève autant de questions sanitaires que politiques. Dans la sous-section du corpus relative au Royaume Uni, les noms du premier ministre Boris Johnson et du ministre de la santé Sajid Javid arrivent en tête. Ces occurrences sont notamment liée au vote pour un passeport vaccinal. Pour autant, la santé se trouve également au centre des préoccupations des internautes, en particulier en ce qui concerne les effets secondaires des vaccins. Les tweets sont donc à la fois conditionnés par l’actualité politique et sanitaire, mais aussi par le bien-être de la personne (‘sore arm’, ‘serious illness’, ‘freezing sick scared’,’feel better soon’). Ces constats sont transversaux à l’ensemble du corpus.

 

 

Dans les 58.425 observations relatives à l’ensemble des pays à l’exclusion du Royaume Uni (Luxembourg, France, Pays-Bas, Belgique, Irlande, Allemagne, Suisse – soit 20% de ce premier corpus), la question de l’obligation vaccinale est également prégnante. Dans les six pays de l’UE, la première personnalité politique à être citée est Ursula von der Leyen, présidente de la Commission européenne. Ici, ce sont ses relations Pfizer/Biontech qui sont interrogées par les utilisateurs de Twitter. A noter qu’un média arrive en tête des trigrammes du sous-corpus européen : le New York Times.

 

 

Dans ce deuxième niveau d’analyse, le débat semble moins polarisé entre pro et anti vaccins : les bigrammes ‘unvaccinated people’ et ‘antivax people’ obtiennent respectivement 667 et 252 occurrences, alors que ‘booster jab’ en obtient 7.776. Les trigrammes confirment cette observation, mais montrent une certaine animosité envers les personnes vaccinées, lesquelles sont associées aux termes de déni, d’extrémisme, de propagande, d’activisme et d’idiots (à suivre).

 

 

# # #

Lire aussi

Blog 13 : construire une liste de stop words

Blog 12 : principaux dictionnaires pour l’analyse de sentiment

Blog 11 : description statistique du corpus avec #RStats

Blog 10 : l’analyse de sentiment ou l’évaluation de la subjectivité

Blog 9 : modélisation thématique du corpus ‘vaccination’ (en)

Blog 8 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.2)

Blog 7 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.1)

Blog 6 : collecte du corpus et préparation de l’analyse lexicale

Blog 5: le package R « textclean »

Blog 4 : cibler la bonne requête et nettoyer des messy data

Blog 3 : Twitter API et rtweet

Blog 2 : collecte du corpus

Blog 1: le projet

Les enjeux de la recherche sur les usages médiatiques en temps de crise