Vous savez peut-être déjà que l’analyse de sentiment est utilisée pour déterminer si une donnée est de nature neutre, positive ou négative. Mais, puisque vous êtes ici, il y a de fortes chances que votre compréhension ne soit pas beaucoup plus approfondie que cela.
Dans cet article, je vais répondre aux questions suivantes : Qu’est-ce que l’analyse de sentiment ? Comment fonctionne l’analyse de sentiment ? Et que peut vous apporter l’analyse de sentiment ?
Une fois que vous aurez assimilé l’essentiel, vous pourrez consulter notre liste des 10 meilleurs outils d’analyse de sentiment.
Qu’est-ce que l’analyse de sentiment ?
Avant de rentrer dans le vif du sujet, petit rappel sur ce qu’est l’analyse de sentiment.
En tant qu’humains, nous utilisons tous les jours l’analyse de sentiment pour juger les opinions des autres. Parfois, cela peut être délicat, par exemple avec un ami particulièrement sarcastique, ou lorsqu’il faut deviner ce que pense réellement notre patron lorsqu’il fait un retour sur une grande présentation ! Les logiciels d’analyse de sentiment tentent d’imiter cette expérience très humaine.
Bien que certains logiciels puissent analyser la parole, la plupart des outils d’analyse de sentiment sont utilisés pour l’analyse de texte afin de classer le ressenti global d’un texte comme positif, négatif ou neutre. Ceci est appelé polarité.
Les sources de données courantes pour l’analyse de sentiment sont les réseaux sociaux, les articles de presse, les avis en ligne, les formulaires de feedback sollicitité, les réponses aux enquêtes, les pages web/blogs/forums. On rencontre aussi les termes « opinion mining », intelligence artificielle émotionnelle, ou, plus techniquement, classification de sentiment.
Il existe quatre principaux types d’analyse de sentiment :
- Fine, aussi appelée polarité (positive, négative ou neutre)
- Sentiments et émotions (heureux, en colère, triste, amusé)
- Basée sur l’aspect (identifie l’opinion sur un aspect spécifique d’un objet, ex. appareil photo d’un smartphone)
- Intention (intéressé, pas intéressé, très intéressé).
Les outils d’analyse de sentiment vous aident à naviguer au sein de la grande quantité de données subjectives disponibles sur le web 2.0, afin de comprendre les retours de vos parties prenantes.
Les organisations exploitent le sentiment de différentes façons. Beaucoup de marques l’utilisent dans leur études de marché, pour mieux comprendre ce qui fonctionne dans leur stratégie de marque et les axes d’amélioration. Une autre utilisation concerne les institutions financières, qui analysent les cycles médiatiques pour identifier des opportunités d’investissement.

Comment fonctionne l’analyse de sentiment ?
Passons maintenant à la mécanique de fonctionnement de l’analyse de sentiment. Au fond, l’analyse de sentiment est une forme de science des données. Plus précisément, il s’agit d’une forme de traitement automatique du langage naturel (NLP), lui-même une sous-branche de l’intelligence artificielle (IA), qui permet d’identifier et de classer les opinions subjectives issues de textes ou de données vocales.
L’IA dans l’analyse du sentiment client se situe exactement à l’intersection de la technologie informatique et du langage humain, une perspective passionnante pour tout data scientist passionné de linguistique.

Mais ce n’est pas simple. Pour bien comprendre la langue d’un texte et produire un score de sentiment précis ou un aperçu pertinent, les programmes doivent recourir à diverses méthodes qui simulent ce que nous faisons intuitivement. Ces simulations prennent la forme d’algorithmes avancés (instructions pour ordinateurs).
À partir de là, on distingue deux principales approches d’analyse de sentiment :
- Système à base de règles : un système fondé sur des règles définies manuellement par des humains.
- Automatique : les systèmes qui apprennent par eux-mêmes via des techniques avancées d’apprentissage automatique.
La principale différence entre les deux réside dans la manière d’enseigner au système. Voyons cela maintenant plus en détail.
Analyse de sentiment à base de règles
La méthode à base de règles utilise le traitement automatique du langage naturel (NLP) en s’appuyant sur un ensemble de règles définies manuellement pour aider à identifier la subjectivité, la polarité ou le sujet d’une opinion. Parmi les techniques NLP mobilisées, on peut citer la racinisation (stemming), la tokenisation, l’étiquetage des parties du discours, l’analyse syntaxique (parsing) et l’analyse de lexique. Si cela vous intéresse, vous pouvez en apprendre plus à ce sujet ici.
Voici un exemple basique d’analyse de sentiment basée sur des règles.
Pour déterminer la polarité d’un texte, les outils d’analyse de sentiment doivent tout d’abord le décomposer en composants individuels, c’est-à-dire en mots et expressions, à l’aide du traitement du langage naturel (NLP). Ensuite, ils les comparent à une base de données, appelée lexique ou bibliothèque de sentiments, compilée à partir d’une sélection de mots et d’expressions collectés et évalués manuellement.
En général, les mots et expressions neutres reçoivent un score de zéro. Les mots nettement négatifs obtiennent un score négatif, tandis que les mots positifs reçoivent un score positif. Par exemple, dans un avis sur un produit, des mots et expressions comme mauvais, décevant, terrible et service client horrible service client seraient notés négativement alors que bon, excellent, utile et serviable seraient notés positivement.
La création d’une bibliothèque de sentiments et des règles correspondantes est un processus long. Il faut veiller à attribuer un score à chaque terme et à effectuer des comparaisons adaptées. Par exemple, le système doit comprendre que « mauvais » est un mot négatif, mais que « horrible » l’est encore davantage ; « bon » est positif et « incroyable » est encore plus positif.

Le système basé sur des règles peut être rapide à mettre en place mais demeure limité. En effet, il ne peut pas reconnaître des mots absents de la bibliothèque ou analyser les mots en fonction du contexte — ce qui complique la détection de complexités comme le sarcasme, les homonymes ou la polysémie. L’expression « tu appelles ça un excellent service client ? » pourrait facilement être mal interprétée, par exemple.
Les systèmes basés sur des règles demandent aussi beaucoup d’efforts pour être maintenus et mis à jour. Il faut continuellement ajouter manuellement de nouvelles règles afin de suivre l’évolution du langage sur Internet. Ajouter de nouvelles règles peut également avoir des répercussions sur les résultats précédents.
Analyse de sentiment automatique
Plutôt que de s’appuyer sur un ensemble de règles créées et mises à jour manuellement, les systèmes d’analyse de sentiment automatiques sont entraînés via des techniques d’apprentissage automatique (machine learning). Ici, le machine learning désigne des algorithmes utilisant l’apprentissage profond (deep learning) pour gagner en précision à chaque obstacle, chaque intervention humaine ou retour des utilisateurs.
Le sujet est technique, mais voici une version simplifiée de son fonctionnement.
- Trouvez un vaste jeu de données similaire à celui que vous souhaitez analyser et étiquetez quelques exemples. Cela constitue les données d’apprentissage. Au lieu de donner des règles au système, vous lui fournissez des exemples.
- Utilisez les données d’entraînement pour développer votre modèle de machine learning. Celui-ci sera composé d’algorithmes de classification comme la régression linéaire, naïve bayes, machines à vecteurs de support (SVM), ou encore les variantes RNN LSTM et GRU. Comme leur nom l’indique, ces algorithmes servent à classer les données (positif, négatif, heureux, triste, etc). Si cela vous intéresse, voici plus d’informations à leur sujet.
- Si votre modèle fonctionne, après lui avoir fourni suffisamment de données pertinentes, il sera capable de faire ses propres prédictions et de classer des données inédites. Il aura identifié ses propres règles !
- Continuez à améliorer la précision des modèles en leur fournissant toujours plus d’exemples.
L’avantage de l’approche automatique réside dans la capacité à s’adapter et à créer des modèles entraînés pour de nombreux contextes et usages différents.
Par exemple, on sait que le mot phoenix désigne un oiseau mythique, mais aussi la ville de Phoenix en Arizona. Un algorithme de machine learning peut être entraîné à identifier, selon le contexte, quelle définition de Phoenix est la bonne lorsqu’il rencontre ce terme dans une phrase. Il peut ensuite utiliser cette expérience pour reconnaître des cas similaires.
De même, un modèle signale « woke » (signifiant « s’être éveillé ») comme un terme neutre. Toutefois, « woke » est récemment devenu un terme d’argot pour « politisé/conscient des enjeux sociétaux », ce qui en fait un nouvel homonyme. Dès que l’algorithme reçoit ce retour une fois, il appliquera cette nouvelle connaissance pour toutes les analyses futures. Le mot « woke » se voit alors attribuer une note plus positive dans certains contextes.
Les méthodes automatisées sont généralement considérées comme supérieures. Cependant, l’inconvénient d’une approche automatisée basée sur le machine learning est qu’elle dépend de la disponibilité de données historiques étiquetées et nécessite un certain temps d’entraînement. Elle requiert aussi des data scientists hautement qualifiés pour être développée !

Approche hybride
La combinaison du traitement du langage naturel avec l'apprentissage automatique, appelée approche hybride, est largement reconnue pour améliorer la précision de l'analyse de sentiment. Le traitement du langage naturel sert à comprendre le sentiment des mots et les parties du discours. L'apprentissage automatique est utilisé pour gérer l'évolution constante de la langue, analyser les mots dans leur contexte et résoudre des processus linguistiques complexes comme les homonymes.
Applications de l'analyse de sentiment
Comme mentionné précédemment, l'analyse de sentiment est extrêmement utile pour les organisations qui souhaitent savoir ce que les gens pensent d'elles. Avec la grande quantité de données créées en permanence dans le monde entier, l’analyse de sentiment peut vous aider à tout comprendre en temps réel.
Voici quelques-unes des façons dont cette technologie fait déjà la différence :
Réagir à l'expérience client
Les retours d’expérience client peuvent être recueillis de façon organique sur le web (par exemple, des mentions sur les réseaux sociaux) ou via des retours que vous sollicitez activement vous-même. Idéalement, vous disposez d’un ensemble de données large et varié à exploiter. Dans ce cas, c’est là que l’utilisation d’un logiciel d'analyse de sentiment peut rapidement couvrir beaucoup de terrain et fournir des informations précieuses. Celles-ci peuvent ensuite être utilisées dans vos efforts de gestion de la réputation, pour guider les innovations produit ou améliorer le support client.
Surveiller les concurrents
En surveillant le sentiment autour de vos concurrents, vous pouvez mieux mesurer leur position sur le marché et la comparer à la vôtre. Par exemple, imaginons que vos mentions Twitter soient 40 % positives, 30 % négatives, et le reste neutre. Comment savoir si ce résultat est bon ou non ? Eh bien, si votre principal concurrent est autour de 60 % positif, 30 % négatif, et le reste neutre, vous avez encore des progrès à faire. En revanche, si le sentiment envers le concurrent est négatif à 50 %, vous savez que vous êtes plutôt conforme aux standards du secteur.
Expérience des employés
Enfin, l’analyse des sentiments peut également servir à examiner les données utilisées par les équipes RH pour comprendre ce qui rend les employés satisfaits ou pourquoi ils quittent une entreprise. En identifiant les plaintes et problèmes fréquents, les employeurs obtiennent des pistes d’action pour réduire le turnover et améliorer la performance des collaborateurs. Cette capacité est particulièrement utile pour les sociétés comptant de nombreux employés, car les gestionnaires n’ont pas le temps de discuter individuellement avec des centaines de membres du personnel.
L'analyse de sentiment est-elle fiable ?
Puisqu’une grande partie de l’analyse de sentiment que nous faisons en tant qu’humains est subjective, il est irréaliste d’attendre d’un outil d’analyse de sentiment qu’il soit fiable à 100 %. Les data scientists arrivent à créer des classificateurs de sentiment de plus en plus précis, mais il reste des progrès à faire.
Quels sont les principaux défis d’un modèle d’analyse de sentiment ? Nous en avons déjà évoqué certains, et ce sont aussi ceux qui compliquent l’analyse de sentiment pour l’humain. Les problèmes les plus courants incluent :
- Le sarcasme. Si vous avez déjà lu une section de commentaires, ou reçu un SMS dont vous n’étiez pas certain du sérieux, vous savez que le sarcasme est difficile à détecter à l’écrit. Considérez les deux situations suivantes :
Le train a encore 30 minutes de retard aujourd’hui. Je suis ravi de sa fiabilité !
Le train a encore seulement 2 minutes de retard aujourd’hui. Je suis ravi de sa fiabilité !
De toute évidence, un train qui a 30 minutes de retard n’est pas fiable, mais un logiciel d’analyse de sentiment aura probablement du mal à le détecter.
- Multipolarité. Parfois, une même phrase peut exprimer un avis positif sur un aspect et négatif sur un autre. Par exemple : « Pepsi est bien meilleur que Coke .» Cette phrase réussit à dire du positif sur Pepsi et du négatif sur Coke en seulement six mots. Un système d’analyse de sentiment aura du mal à évaluer cela correctement sans une programmation plus avancée.
- Les négations. Une négation consiste à inverser le sens d’un mot ou d’une expression, par exemple : « Je ne dirais pas que la nourriture était bonne. » Nous, les humains, avons parfois du mal à comprendre le sens exact d’une phrase négative ; il n’est donc pas surprenant que les outils d’analyse de sentiment rencontrent aussi des difficultés.
Conclusion
Vous en savez maintenant plus sur l’analyse de sentiment et la manière dont elle peut être utilisée pour analyser des données et mesurer l’opinion des clients sur votre marque.
Les outils d’analyse de sentiment peuvent effectuer la majeure partie du travail, mais il reste judicieux de faire vérifier certains échantillons par un humain afin de repérer ce que les machines ont du mal à comprendre. L’analyse de sentiment fonctionne le mieux lorsque la technologie et l’humain travaillent main dans la main.
Vous cherchez plus d’idées sur l’expérience client ? Abonnez-vous à la newsletter The CX Lead.
À lire aussi : 10 meilleurs logiciels de support client pour PME et grandes entreprises
