La TV génère des conversations massives sur les réseaux sociaux. Il y a déjà quelques années, nous nous étions demandés comment analyser ces conversations et ce que l’approche qualitative pouvait apporter.
Retours sur nos première expérimentations d’analyse des conversations sur les réseaux sociaux autour de 3 programmes TV : le contexte, les apports et les limites de la méthode .
Le contexte : une expérience visant à apporter des clés qualitatives aux chaines TV dans l’écoute et l’animation des réseaux sociaux.
Nous avons expérimenté pour la première fois l’écoute des conversations sur les réseaux sociaux, autour de 3 programmes TV.
Nous nous étions demandé avec des partenaires spécialistes du digital (fondateurs de Fada, Damien Douani et Fanny Berrebi) ce que pouvait apporter l’analyse qualitative, en complément de la mesure de l’audimat social qui se développait au sein des chaînes.
Nous avions réfléchi aux apports potentiels pour une production TV :
- Aller au-delà des du « bruit social brut », analyser plus finement les données en comprenant comment il se structure
- Lire ce qu’il y a dans la tête et le cœur des télénautes pour être au fait des conversations qui les intéressent
- Peaufiner les animations sur les réseaux sociaux en temps réel, en s’appuyant sur des indicateurs qualitatifs
- Envisager des prolongements multimedia pertinents (bonus, animations…)
- Voire pourquoi pas, orienter le contenu des émissions
Pour mener notre expérience, nous avons choisi d’analyser les contenus des discussions autour de 3 programmes aux styles et aux publics différents, et qui se suivaient d’une semaine sur l’autre :
- Koh-Lanta, télé-réalité diffusée sur TF1
- The Voice, télé-crochet musical diffusée sur TF1
- La série Real Humans saison 1, une série d’anticipation diffusée sur Arte
Dans les 3 cas, l’objectif était de mettre au jour les thématiques-clés des conversations, et leurs évolutions au cours des semaines.
La méthode : un mix d’analyse statistique textuelle et d’interprétation qualitative
Nous avons conçu une méthode en collaboration avec Fada, puis nous l’avons faite évoluer par « tâtonnement » en l’expérimentant.
L’idée était de combiner une approche quantitative et qualitative. Voici les grandes étapes de la méthode :
- Identification et suivi des comptes Facebook et Twitter où se font les conversations : nous nous sommes abonnés aux comptes officiels des émissions, car ils regroupent un public large et généraient un volume important d’échanges
- Analyse via un logiciel lexicométrique (Alceste que nous utilisons habituellement) au vu du volume important de contenus
- Constitution d’un corpus rassemblant les conversations issues de toutes les sources sur 1 semaine : nous avons organisé les contenus par ordre chronologique pour plus de cohérence dans l’analyse du texte par le logiciel
- Formatage du corpus en vue de reconnaître et d’analyser automatiquement un maximum de mots : écriture des chiffres en lettres, transformation des mots abrégés, correction des fautes d’orthographe, suppression des images, association des mots systématiquement employés ensemble (Koh Lanta = Koh_Lanta)…
- Paramétrage du logiciel (Alceste) : nous avons effectué plusieurs tests d’analyse statistique en vue d’optimiser les résultats (pour obtenir au moins 70% des mots analysés)
- Analyse des résultats : mise en évidence des thématiques-clés à partir de l’analyse du logicielle (classification et analyse factorielle des correspondances) et interprétation qualitative (notre spécialité)
- Comparaison des résultats d’une semaine à l’autre
Les difficultés rencontrées et les limites : se sont avérées spécifiques aux réseaux sociaux
Première difficulté : La récupération manuelle des messages Facebook s’est avérée chronophage (à l’époque Facebook n’avait pas donné la possibilité de récupérer automatiquement les contenus). Concernant les messages Twitter, nous avions utilisé Tweetreach qui traque automatiquement les contenus à partir de mots clés (ex : « the_voice »). Depuis, des outils spécifiques de récupération des contenus sur les réseaux sociaux se sont développés, qui proposent le moyen de récupérer les conversations de l’ensemble des réseaux sociaux.
Autre difficulté : Pas de reconnaissance par le logiciel des mots spécifiques (à l’émission ou aux réseaux sociaux), car il se base sur un dictionnaire générique ; nous avons donc d’une part, ajouté un dictionnaire spécifique afin d’augmenter le taux d’analyse de manière significative ; et d’autre part, attribué un sens à certains caractères ou expressions non reconnus automatiquement (exemple 😊= j’aime).
De plus : Des contenus« intempestifs » (pubs, commentaires sur d’autres sujets) ont « pollué » l’analyse ; nous avons dû les supprimer manuellement.
Une limite : Il n’y avait pas de traitement automatique possible des images et des liens web ; nous n’avons pas trouvé d’outils pour les analyser.
Une autre limite : Nous n’avons pas effectué d’analyse par individu car cela demandait d’associer les contenus de chaque compte (très chronophage) et d’introduire des données individuelles (mal renseignées et peu fiables sur les réseaux sociaux) ; l’analyse a donc été faite globalement. Nous avons pu toutefois qualifié des profils de fans, dont les publications étaient plus récurrentes.
Les premiers résultats : on a pu dégager du sens, au-delà de ce que nous espérions
Après plusieurs tests avec le logiciel, nous avons obtenu un taux significatif d’analyse du corpus (plus de 70% des mots analysés) et l’interprétation qualitative des résultats a apporté du sens.
Voici quelques extraits de nos résultats :
L’analyse a révélé 3 motivations majeures à regarder l’émission qui se structurent autour de 2 axes :
Sur l’axe 1 : La compétition sportive est opposée à la survie.
Sur l’axe 2 : L’émotion est opposée à la stratégie.
1ère motivation à regarder l’émission (a pesé ~1/3 des conversations) : L’immersion dans une histoire, la projection dans un personnage – Caractéristiques du discours : expression des émotions personnelles
2ème motivation à regarder l’émission(a pesé~1/4 des conversations) : L’analyse d’un parcours de survie, l’observation des stratégies individuelles pour y parvenir – Caractéristiques du discours : expressions de points de vue rationnels et personnels
3ème motivation à regarder l’émission (a pesé presque 1/2 des conversations !) : Le suivi d’une compétition par équipe, des capacités physiques mises à l’épreuve – Caractéristiques du discours : évaluation des performances individuelles et encouragement des équipes
Les conversations se sont polarisées autour d’un thème majeur, celui de l’intégration de la machine et de l’humain, et les nouvelles formes d’émotions et de rapports qui peuvent en découler : dans les domaines amoureux, sexuel, social, commercial …
Nous avons fait un parallèle avec les débats de l’époque sur le mariage pour tous, et le besoin de se projeter dans un nouveau modèle de société.
En demi-finale, les conversations se sont centrées sur le choix de Jennifer concernant son candidat pour la finale. On a pu observer que :
- Le choix de son candidat (Olympe vs Anthony) a représenté 47% des conversations.
- Le déroulement de l’émission a pesé seulement 20%.
Mais son candidat n’a pas gagné la finale. Si Jennifer avait écouté les réseaux sociaux, sachant que le gagnant est désigné par le grand public, elle aurait peut-être fait gagner son équipe en choisissant Anthony plutôt qu’Olympe !!
Depuis ces première expérimentations, nous avons encore optimisé la méthode, en l’appliquant à des sujets aussi divers que le nucléaire ou les hamburgers (un article sera publié prochainement sur le Blog à ce propos).