Vous savez peut-être déjà que l’analyse de sentiment est utilisée pour déterminer si une donnée possède une tonalité neutre, positive ou négative. Mais, puisque vous êtes ici, il y a de fortes chances que votre compréhension ne soit pas plus poussée que cela.
Dans cet article, je vais répondre aux questions suivantes : Qu’est-ce que l’analyse de sentiment ? Comment fonctionne-t-elle ? Et que peut-elle faire pour vous ?
Une fois que vous aurez toutes les clés en main, consultez notre liste des 10 meilleurs outils d’analyse de sentiment.
Qu’est-ce que l’analyse de sentiment ?
Avant d’entrer dans le vif du sujet, petit rappel de ce qu’est l’analyse de sentiment.
En tant qu’humains, nous pratiquons quotidiennement l’analyse de sentiment pour juger les opinions des autres. Cela peut parfois être difficile, comme avec un ami particulièrement sarcastique ou lorsqu’il faut comprendre ce que pense réellement notre patron en donnant un retour sur une grande présentation ! Un logiciel d’analyse de sentiment cherche à imiter cette expérience très humaine.
Bien que certains logiciels puissent analyser la parole, la plupart des outils d’analyse de sentiment servent à l’analyse de texte, afin de classifier la tonalité générale d’un texte comme positive, négative ou neutre. On parle également de polarité.
Les sources de données les plus courantes pour l’analyse de sentiment sont les réseaux sociaux, les articles de presse, les avis en ligne, les formulaires de feedback sollicités, les réponses à des sondages, les pages web/blogs/forums. Vous entendrez également parler d’analyse de sentiment sous les noms de fouille d’opinion, emotion AI ou, plus techniquement, classification de sentiment.
Il existe quatre principaux types d’analyse de sentiment :
- Fine (polarité) : positive, négative ou neutre
- Sentiments et émotions (heureux, en colère, triste, amusé)
- Basée sur les aspects (identifier l’opinion sur un aspect spécifique, ex : l’appareil photo d’un smartphone)
- Intention (intéressé, pas intéressé, très intéressé).
Les outils d’analyse de sentiment vous aident à extraire des informations à partir de la grande quantité de données subjectives disponibles sur le web 2.0 afin de comprendre le feedback des parties prenantes.
Les organisations utilisent la notion de sentiment de plusieurs façons. De nombreuses marques s’en servent lors de leurs études de marché pour mieux comprendre ce qui, dans leur stratégie de marque, fonctionne bien et ce qui doit être amélioré. Les institutions financières, quant à elles, l’utilisent pour analyser les cycles de l’information et détecter des opportunités d’investissement.

Comment fonctionne l’analyse de sentiment ?
Entrons maintenant dans la mécanique de fonctionnement de l’analyse de sentiment. Au fond, l’analyse de sentiment relève de la science des données. Plus précisément, c’est une forme de traitement du langage naturel (NLP), lui-même une sous-branche de l’intelligence artificielle (IA), qui permet d’identifier et de classifier les opinions subjectives issues de textes ou de discours.
L’analyse de sentiment se trouve à l’intersection de la technologie informatique et du langage humain, une perspective passionnante pour tout data scientist passionné de linguistique.

Mais ce n’est pas si simple. Pour bien comprendre la langue d’un texte, et produire un score de sentiment fiable ou un retour pertinent, les programmes doivent recourir à diverses méthodes qui simulent ce que nous faisons intuitivement. Ces simulations prennent la forme d’algorithmes avancés (instructions à destination des ordinateurs).
À partir de là, il existe deux principales approches de l’analyse de sentiment :
- À base de règles : un système reposant sur des règles établies manuellement par des humains.
- Automatique : systèmes qui apprennent d’eux-mêmes grâce à des techniques avancées d’apprentissage automatique (machine learning).
La différence fondamentale entre les deux repose sur leur manière d’enseigner au système. Expliquons-les un peu plus en détail.
Analyse de sentiment à base de règles
La méthode basée sur des règles utilise le traitement du langage naturel (NLP) associé à un ensemble de règles définies manuellement pour identifier la subjectivité, la polarité ou le sujet d’une opinion. Certaines des techniques NLP utilisées sont la racinisation (stemming), la tokenisation, l’étiquetage des parties du discours (part of speech tagging), le parsing et l’analyse des lexiques. Si cela vous intéresse, vous pouvez en lire davantage ici.
Voici un exemple simple d’analyse de sentiment à base de règles.
Pour déterminer la polarité d’un texte, les outils d’analyse de sentiment doivent d’abord le découper en unités élémentaires, c’est-à-dire en mots et expressions, à l’aide du NLP. Ensuite, ils comparent ces éléments à une base de données, appelée lexique ou bibliothèque de sentiments, alimentée par une liste de mots et d’expressions recueillis et notés manuellement.
En général, les mots et expressions neutres sont attribués à un score de zéro. Les mots très négatifs reçoivent un score négatif et les mots positifs un score positif. Par exemple, dans un avis produit, les mots et expressions comme mauvais, décevant, terrible et horrible service client seront notés négativement alors que bon, génial, utile et efficace recevront un score positif.
Construire une bibliothèque de sentiments et les règles associées est un travail de longue haleine. Il faut veiller à attribuer un score à chaque mot et à effectuer des comparaisons pertinentes. Par exemple, il faut que le système comprenne que « mauvais » est un mot négatif et que « horrible » l’est encore plus ; que « bon » est positif et « incroyable » encore plus positif.

Le système à base de règles peut être rapide à construire mais reste limité. En effet, il n’est pas capable de reconnaître des mots absents de la bibliothèque ou d’analyser les mots dans leur contexte—ce qui rend difficile la détection de subtilités comme le sarcasme, les homonymes et la polysémie. Par exemple, la phrase « ça, tu appelles ça un excellent service client ? » risque d’être facilement mal interprétée.
Les systèmes à base de règles exigent aussi de gros efforts de mise à jour et de maintenance. Il faut ajouter sans cesse des règles pour suivre l’évolution du langage en ligne. Or, ajouter de nouvelles règles peut aussi impacter les résultats passés.
Analyse de sentiment automatique
Plutôt que de s’appuyer sur un ensemble de règles créées et mises à jour manuellement, les systèmes automatiques d’analyse de sentiment sont entraînés via l’apprentissage automatique (machine learning). Ici, le machine learning fait référence à des algorithmes exploitant le deep learning pour devenir plus performants à chaque blocage, besoin d’intervention humaine ou retour d’utilisateur.
C’est technique, mais voici une version simplifiée de leur fonctionnement.
- Trouvez un large jeu de données semblable à ceux que vous souhaitez analyser et étiquetez quelques exemples. Cela devient vos données d’entraînement. Au lieu de donner des règles au système, vous lui donnez des exemples.
- Utilisez ces données d’entraînement pour concevoir votre modèle d’apprentissage automatique. Celui-ci reposera sur des algorithmes de classification tels que régression linéaire, Naive Bayes, support vector machines, ou encore les dérivés RNN LSTM et GRU. Comme leur nom l’indique, ces algorithmes servent à classer les données (positif, négatif, heureux, triste, etc). Pour en savoir plus, plus d’informations ici.
- Si votre modèle fonctionne, après avoir reçu suffisamment de données pertinentes, il pourra faire ses propres prédictions pour classifier de nouvelles données jamais vues auparavant. Il aura découvert ses propres règles !
- Améliorez progressivement la précision de ces modèles grâce à toujours plus d’exemples.
L’avantage de l’approche automatique est la capacité d’adaptation et la possibilité de créer des modèles entraînés pour de nombreux objectifs et contextes différents.
Par exemple, nous savons que le mot "phoenix" peut désigner un oiseau mythique ou la ville de Phoenix en Arizona. Un algorithme d’apprentissage automatique peut être entraîné à détecter, selon le contexte, quel sens est employé dans une phrase. Il pourra ensuite reconnaître d’autres cas similaires.
De même, un modèle peut considérer "woke" ("réveillé" en anglais) comme un mot neutre. Mais récemment, "woke" est devenu un terme d’argot signifiant « sociopolitiquement éveillé », ce qui en fait un homonyme récent. Quand l’algorithme reçoit cette information, il l’appliquera à toutes ses analyses suivantes. Ainsi, le mot "woke" obtiendra désormais un score plutôt positif dans certains contextes.
Les méthodes automatisées sont généralement considérées comme supérieures. Toutefois, l’inconvénient d’une approche automatique basée sur le machine learning est qu’elle dépend de la disponibilité de données historiques annotées et peut demander du temps pour l’entraînement. Elle requiert également des data scientists très spécialisés !

Approche hybride
Combiner le traitement du langage naturel et l’apprentissage automatique, une approche dite hybride, est largement considérée comme améliorant la précision de l’analyse de sentiment. Le traitement du langage permet de saisir la tonalité des mots et les parties du discours. Le machine learning, lui, sert à suivre l’évolution constante du langage, à prendre en compte le contexte, et à gérer la complexité des homonymes notamment.
Applications de l’analyse de sentiment
Comme mentionné, l’analyse de sentiment est extrêmement utile pour les organisations souhaitant savoir ce que les gens pensent d’elles. Avec la quantité phénoménale de données produites en permanence partout dans le monde, l’analyse de sentiment peut vous aider à y voir plus clair en temps réel.
Voici quelques exemples concrets d’utilisation de cette technologie :
Répondre à l’expérience client
Les retours d’expérience client peuvent être recueillis de façon organique sur le web (par exemple, via des mentions sur les réseaux sociaux) ou à partir de retours que vous sollicitez activement vous-même. Espérons que vous disposiez d’un large ensemble de données variées sur lequel travailler. Dans ce cas, c’est là que l’utilisation d’un logiciel d'analyse de sentiment peut couvrir beaucoup de terrain rapidement et fournir des informations précieuses. Celles-ci peuvent ensuite être utilisées dans vos efforts de gestion de réputation, pour inspirer des innovations produits et améliorer le support client.
Surveiller les concurrents
En surveillant le sentiment autour de vos concurrents, vous pouvez avoir une bonne idée de leur position sur le marché et la comparer à la vôtre. Par exemple, disons que vos mentions sur Twitter sont à 40 % positives, 30 % négatives, et le reste neutres. Comment savoir si c’est bon ou non ? Eh bien, si votre plus grand concurrent est à environ 60 % positives, 30 % négatives, et le reste neutres, vous avez du travail à faire. Si, en revanche, ses résultats indiquent 50 % de sentiments négatifs, vous savez que vous vous en sortez correctement selon les standards du secteur.
Expérience employé
Enfin, l’analyse de sentiment peut aider à analyser les données utilisées par les équipes RH pour comprendre ce qui rend les employés heureux ou pourquoi ils quittent une entreprise. En identifiant les plaintes et problèmes récurrents, les employeurs obtiennent des informations exploitables sur la façon de réduire le turnover et d’améliorer la performance des employés. Cette capacité est particulièrement utile pour les entreprises qui ont beaucoup d’employés, car la direction n’aurait pas le temps de parler individuellement à des centaines de membres du personnel.
L’analyse de sentiment est-elle fiable ?
Comme une grande partie de l’analyse de sentiment que nous faisons en tant qu’humains est subjective, il serait irréaliste de s’attendre à ce qu’un outil d’analyse de sentiment soit fiable à 100 %. Les data scientists améliorent sans cesse la précision des classificateurs de sentiment, mais il reste encore du chemin à parcourir.
Quels sont les plus grands défis pour un modèle d’analyse de sentiment ? Nous en avons déjà évoqué quelques-uns, et ce sont les raisons pour lesquelles l’analyse de sentiment est également compliquée pour les humains. Les problèmes les plus fréquents incluent :
- Le sarcasme. Si vous avez déjà passé du temps dans une section de commentaires, ou reçu un texto sans être certain que son expéditeur était sérieux, vous savez que le sarcasme est difficile à détecter dans un texte. Considérez les deux situations suivantes :
Le train a encore 30 minutes de retard aujourd’hui. Tellement content qu’il soit fiable !
Le train a encore 2 minutes de retard aujourd’hui. Tellement content qu’il soit fiable !
Évidemment, le train qui a 30 minutes de retard n’est pas fiable, mais un logiciel d’analyse de sentiment pourrait avoir du mal à saisir cette nuance.
- Multipolarité. Parfois, une seule phrase peut exprimer quelque chose de positif sur un sujet et de négatif sur un autre. Par exemple, « Pepsi est bien meilleur que Coca. » Cette phrase parvient à dire du bien de Pepsi tout en critiquant Coca en seulement six mots. Un système d’analyse de sentiment aura du mal à attribuer un score précis à cette phrase sans une programmation plus sophistiquée.
- Négation. La négation consiste à inverser le sens d’un mot ou d’une phrase, comme dans « Je ne dirais pas que la nourriture était bonne. » Nous-mêmes, humains, pouvons avoir du mal à comprendre le sens d’une phrase négative, donc il n’est pas surprenant que les outils d’analyse de sentiment peinent aussi dans ce cas.
Conclusion
Vous savez désormais tout sur l’analyse de sentiment et comment elle peut être utilisée pour analyser les données et évaluer l’opinion des clients sur votre marque.
Les outils d’analyse de sentiment effectueront la majeure partie du travail pour vous, mais il est toujours judicieux de faire relire certains échantillons par un humain pour vérifier les subtilités que les machines peuvent avoir du mal à comprendre. L’analyse de sentiment est plus efficace lorsque la technologie et l’humain travaillent main dans la main.
À la recherche de plus d’insights sur l’expérience client ? Abonnez-vous à la newsletter The CX Lead.
Lecture associée : 10 meilleurs logiciels de support client pour PME et grandes entreprises
