X

Carnet de recherche

Le projet de recherche 'Mixology' s’inscrit dans la perspective de l’open research. Son objectif est de sonder les opinions en période de crise, à partir d’un corpus collecté via l’API de Twitter. Il vise également à développer un outil de recherche d’analyse de contenus orginal, en vue de pouvoir être réutilisé dans l’analyse de titres de presse et de contenus médiatiques en période de crise (méthodes de linguistique computationnelle et de machine learning), et il s’inscrit dans le champ des études des médias et des études du journalisme.

Blog 3 : Twitter API et rtweet

12 décembre 2021

English

Lorsque l’on rencontre un problème avec un package, il y a de fortes chances qu’un autre utilisateur ait aussi été dans le cas. Un peu de lecture a permis de comprendre que ce n’était pas la zone géographique qui bloquait mais d’une part le nombre de requêtes autorisées par l’API de Twitter et, d’autre part, des requêtes trop complexes ou ne donnant pas lieu à beaucoup de résultats. Il a donc fallu trancher entre moins de data mais de qualité et plus de data mais plus compliquées à gérer. Histoire de pouvoir comparer les deux stratégies, l’option de resserrer une zone géographique déterminée (Europe de l’Ouest) a été retenue (3 requêtes). Mais elle est aussi complétée par une requête plus générale, laquelle donne lieu aux 18.000 résultats maximum autorisés (mais sans périmètre géographique défini).

 

# # #

Lire aussi

Blog 13 : construire une liste de stop words

Blog 12 : principaux dictionnaires pour l’analyse de sentiment

Blog 11 : description statistique du corpus avec #RStats

Blog 10 : l’analyse de sentiment ou l’évaluation de la subjectivité

Blog 9 : modélisation thématique du corpus ‘vaccination’ (en)

Blog 8 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.2)

Blog 7 : traitement linguistique et quantitatif du corpus ‘vaccination’ (anglais, part.1)

Blog 6 : collecte du corpus et préparation de l’analyse lexicale

Blog 5: le package R « textclean »

Blog 4 : cibler la bonne requête et nettoyer des messy data

Blog 3 : Twitter API et rtweet

Blog 2 : collecte du corpus

Blog 1: le projet

Les enjeux de la recherche sur les usages médiatiques en temps de crise