Beaucoup de gens se demandent : « L'analyse de sentiment est-elle de l'apprentissage automatique ? » La réponse courte : oui. L'analyse de sentiment moderne s'appuie sur des modèles d'apprentissage automatique pour analyser et améliorer la détection du sens émotionnel dans un texte.
Dans cet article, je vais expliquer ce qu'est l'analyse de sentiment, ce que signifie l'apprentissage automatique, et comment ces deux aspects fonctionnent ensemble dans les contextes d'expérience client.
Qu'est-ce que l'analyse de sentiment ?
L'analyse de sentiment, aussi appelée opinion mining (exploration d'opinions), est le processus qui consiste à lire un ensemble de textes et à interpréter si le ton est positif ou négatif. Les entreprises utilisent souvent des outils d'analyse de sentiment pour comprendre ce que ressentent leurs clients à propos de leur marque ou ce que les internautes disent de la concurrence en ligne.
Dans l'analyse de sentiment, des blocs de texte — comme un tweet ou un avis client — se voient attribuer un score négatif, neutre ou positif selon les mots qui composent le texte.

Pour ce faire, un logiciel d'analyse de sentiment utilise un lexique ou dictionnaire pour identifier et attribuer un score à chaque mot. Ce dictionnaire est élaboré par des personnes ayant collecté et noté manuellement chaque mot.
Ce processus est long et fastidieux car chaque mot nécessite non seulement son propre score, mais ceux-ci doivent être hiérarchisés les uns par rapport aux autres. Par exemple, « meilleur » est supérieur à « excellent », qui l'est à « bon ».
Ce lexique constitue la base de l'analyse de sentiment.
Comment fonctionne l'analyse de sentiment ?
Il existe trois façons d’implémenter l'analyse du sentiment client et le choix dépend surtout du volume de données à analyser et du niveau de précision recherché.
Basé sur des règles
L'analyse de sentiment basée sur des règles est une méthode de sélection d'attributs automatique qui repose sur des règles établies par l'humain. Ces règles intègrent généralement de nombreuses techniques de traitement automatique du langage naturel (NLP) et des classificateurs naïfs bayésiens. Cette approche est rapide, mais elle est très simple et peu précise.
Par exemple, les règles peuvent définir des mots fortement négatifs (pire, horrible, laid) et positifs (excellent, meilleur, beau). Ces mots reçoivent alors une valeur positive ou négative. Si le texte contient davantage de mots positifs que de négatifs, le logiciel indique que le sentiment est positif ; si les négatifs dominent, il indique un sentiment négatif. Si le nombre de mots positifs et négatifs est égal, le texte est considéré comme neutre.
Comme mentionné, cette approche est rapide mais peu nuancée. Elle ne prend en compte que les règles simples définies sur les mots, sans s’intéresser à leur position ou association. Il est possible de modifier les règles au fil du temps, mais cela modifie également les résultats antérieurs. Ces systèmes nécessitent donc de nombreux ajustements et une maintenance régulière.
Automatique
Les systèmes automatiques relèvent de l'apprentissage automatique. Ils ne se basent pas sur des règles définies par des programmeurs pour classifier le sentiment, mais ils doivent apprendre. Lors de l’entraînement, le système apprend à associer certains mots et combinaisons de texte à une étiquette donnée. Le texte est transformé en vecteur de caractéristiques. La machine associe points et vecteurs pour générer un algorithme et créer un modèle utilisable par la suite.
Les vecteurs de caractéristiques représentent tous les attributs d’un objet ; ici, les mots et expressions. En apprentissage automatique et en IA pour l’analyse du sentiment client, ils sont essentiels pour détecter des modèles et construire les algorithmes. Plus le système traite d’exemples, plus il crée d’étiquettes et de vecteurs, et mieux il affine son algorithme et son modèle d’analyse de sentiment.
Ce processus peut devenir très complexe, jusqu'à utiliser des techniques de deep learning (apprentissage profond) avec des réseaux de neurones artificiels pour analyser les données, tentant ainsi de reproduire le mode de raisonnement du cerveau humain.
Hybride
Une approche hybride combine l'analyse de sentiment automatique et celle basée sur des règles, cherchant à tirer le meilleur de chacune. Cette méthode est généralement la plus précise.
Comment l'analyse de sentiment et l'apprentissage automatique sont liés
L'apprentissage automatique est un aspect important de l'analyse des sentiments, mais ce n'est pas le seul élément qui compte.
En utilisant le traitement du langage naturel, les programmeurs peuvent fournir d'énormes quantités de textes et de données lors de la création d'un lexique de sentiments et de l'entraînement du programme d'apprentissage automatique. Le programme continuera d'attribuer des scores à un plus grand nombre de mots, améliorant ainsi son algorithme et sa capacité à effectuer une analyse des sentiments puis, à terme, des prédictions de sentiments. Ces améliorations sont possibles grâce aux algorithmes d'apprentissage automatique.
Il y a beaucoup d'éléments que l'apprentissage automatique de l'analyse des sentiments doit résoudre afin d'être aussi précis que possible, c'est pourquoi on préfère un modèle d'apprentissage profond.
Une analyse des sentiments précise nécessite une compréhension approfondie des parties du discours. Les programmeurs entraînent les modèles d'apprentissage automatique en étiquetant chaque mot comme nom, verbe, adjectif, etc.
À mesure que le programme en apprend davantage sur la structure des phrases et la manière dont les mots sont agencés et placés dans les phrases, il développe sa compréhension de base du langage naturel, améliorant la précision de la classification.
Pourtant, il existe de nombreux obstacles qui compliquent l'apprentissage automatique de l'analyse des sentiments.
Défis pour l'apprentissage automatique dans l'analyse des sentiments
Il existe de nombreux défis pour l'analyse des sentiments, quel que soit le modèle que vous utilisez.
L'analyse des sentiments est quelque chose que nous faisons en permanence en tant qu'êtres humains. À chaque fois que nous lisons un message d'un ami ou un tweet d'un inconnu, nous devons comprendre le véritable sentiment sous-jacent. Sont-ils sarcastiques ? Amusants ? Ironiques ?
Il est difficile pour les gens de comprendre correctement le sens d'un texte à 100 %. Si les humains ont du mal dans leur langue maternelle, il est logique que l'apprentissage automatique rencontre aussi certaines difficultés avec l'analyse des sentiments.
Voici quelques éléments qui rendent l'analyse des sentiments difficile pour l'apprentissage automatique :
Subjectivité
Certaines affirmations sont factuelles et ne sont ni positives ni négatives, mais il n'est pas toujours simple de faire la différence. Par exemple, considérez les deux phrases suivantes :
La chemise est bleue.
La chemise est belle.
Dans cet exemple, il est évident quelle phrase a un sentiment positif—la chemise est belle. Mais cela ne signifie pas que la première phrase est négative. La première phrase est objective. Elle énonce un fait—la chemise est bleue.
Là où la difficulté apparaît, c'est que parfois deux prédicats ne se valent pas. La deuxième phrase, qui commente le fait que la chemise soit belle, est plus importante du point de vue de l'analyse des sentiments car elle est subjective. Le second commentaire indique ce qu'un utilisateur ressent à propos d'un produit, ce qui est une donnée exploitable.
Tonalité
La tonalité est l'un des aspects les plus difficiles à décoder pour les humains, alors imaginez pour une machine. Déterminer si quelqu'un utilise le sarcasme, par exemple, est extrêmement difficile à l'écrit parce que les mots employés sont souvent l'inverse de leur signification réelle. Par exemple :
Ma merveilleuse voiture est encore tombée en panne. Génial !
Ma vieille voiture pourrie est encore tombée en panne.
Ces deux phrases véhiculent un sentiment négatif, mais la première utilise le sarcasme en incluant des mots comme « merveilleuse » et « génial ». Ce type de situation serait difficile à identifier pour un système d'analyse des sentiments sans intervention humaine pour valider l'interprétation.
Contexte
Dans certains cas, il est impossible de déterminer le sentiment sans un contexte plus large. Considérez le commentaire suivant : « Le choix dans ce magasin de fournitures artistiques est excellent si vous êtes étudiant en peinture. » En lisant le texte, on repère des mots positivement notés comme « excellent ».
Cependant, un contexte plus large de cette phrase laisse entendre autre chose : que le magasin n'est pas si formidable si votre spécialité est le dessin, l'encre, la sculpture ou un autre type de médium artistique. Eh oui. En prenant en considération le contexte, vous pourriez conclure que cet avis n'est finalement pas si positif !
Lorsque l'apprentissage automatique cherche des opinions pour l'analyse des sentiments, il ne tient pas toujours bien compte du contexte.
Comparaisons
Les comparaisons sont complexes, car elles ne tiennent pas tant aux mots employés qu'à la manière dont ces mots sont liés les uns aux autres. Voici un exemple :
C'est la meilleure tarte que j'aie jamais mangée.
Leur tarte est bonne pour une chaîne de restaurants.
La première phrase est positive. La seconde n'est pas aussi facile à déchiffrer. Vous voudriez probablement que votre produit soit bon par rapport à tous types de concurrents. Le second avis implique qu'en comparaison avec des pâtissiers spécialisés, des commerces locaux ou d'autres endroits, votre tarte est un cran en dessous.
Les solutions d'analyse des sentiments risquent de ne pas percevoir le facteur comparatif ici. Elles pourraient simplement lire le mot « bonne » et donner un score positif, même s'il y a clairement plus à comprendre.
Emojis
Toute personne qui passe du temps en ligne sait que les émojis sont omniprésents. Certains sont simples, d'autres complexes, mais tous peuvent poser des problèmes à l'apprentissage automatique lors de l'analyse de sentiment.
Les émojis jouent un rôle important dans la communication en ligne. Un émoji en forme de cœur doit être perçu comme une expression positive tandis que l’émoji en forme de tas de caca serait certainement évalué négativement. Ce n’est pas un problème tant que vous utilisez des bibliothèques de sentiment qui attribuent des scores aux émojis courants, tout comme elles le feraient pour des mots d’argot populaires.
Argot
La langue évolue constamment, y compris le lexique d’argot de chaque génération, comme « smol », « stan », « woke » et « salty ». Comme pour les émojis, votre outil d’analyse de sentiment peut rencontrer des difficultés ici.
Après tout, il semble qu’un nouveau mot d’argot inspiré par un mème apparaisse tous les quelques mois. L’argot qui persiste et qui peut apparaître dans des avis ou sur les réseaux sociaux peut être ajouté à la bibliothèque de sentiment et se voir attribuer un score positif, neutre ou négatif… tout comme n’importe quel autre mot !
Notre dictionnaire évolue en permanence. Je me souviens de l'œil au ciel collectif lorsque YOLO (You Only Live Once, pour les non-initiés) est entré dans le dictionnaire en ligne Oxford en 2014. Cependant, il y a de l’espoir pour les analyseurs de sentiment : cela signifie que les dictionnaires d’apprentissage automatique peuvent aussi évoluer. Les meilleurs outils d’analyse de sentiment sauront s’adapter au nouvel argot grâce à des mises à jour logicielles ou à l’ajout manuel par les utilisateurs.
Zone neutre : Qu’est-ce qu’un sentiment neutre ?
L'une des meilleures bases pour entraîner l’apprentissage automatique consiste à réfléchir à ce que signifie exactement « neutre ». J’ai beaucoup parlé d’exemples positifs et négatifs pour un analyseur de sentiment, mais ces deux sentiments dépendent d’une définition claire du neutre. Il est juste de dire que la neutralité est l’un des éléments les plus importants du processus.
Mais comment définir le neutre ? Voici 3 pistes pour commencer :
- Inclure des tests objectifs. Rappelez-vous l’exemple ci-dessus : cette chemise est bleue. La voiture est jaune. L’arbre a des feuilles. Ce sont toutes des affirmations objectives, basées sur des faits. Elles n’ont ni sentiment positif ni négatif.
- Filtrer tout ce qui est non pertinent. Les informations non pertinentes ne vous aideront pas à déterminer si quelque chose est positif ou négatif. Par exemple, si un avis sur un sèche-linge commence par une anecdote comme : « Je suis allé au sous-sol et j’ai mis les vêtements mouillés dans le sèche-linge pour découvrir qu’il était en panne », cette information n’est pas pertinente pour l’évaluation du sentiment de l’avis et peut être exclue.
- Ignorer les suggestions. Ce n’est pas une règle absolue, mais très souvent, les suggestions ne contribuent pas au sentiment. Si vous trouvez des avis dans lesquels les clients souhaitent qu’un article possède une fonctionnalité, cela ne vous renseigne pas vraiment sur leur sentiment. Vous pourriez penser, à première vue, que c’est négatif, ce qui peut être le cas. Par exemple : « Le steak était mauvais, j’aurais préféré qu’il ne soit pas trop cuit » est négatif. Mais les souhaits et désirs peuvent aussi apparaître dans des avis positifs. « Le gâteau était délicieux, j’aurais aimé qu’il y en ait plus » ou encore « J’adore tout de cette chemise, j’aurais aimé qu’elle existe en 100 couleurs. »
Disposer d’une définition claire du neutre est essentiel pour toute analyse de sentiment. En effet, l’analyse commence toujours de manière neutre, puis prend une tournure positive ou négative au fur et à mesure de l’évaluation du texte.
Conclusion
L’analyse de sentiment est un type d’outil d’apprentissage automatique. L’apprentissage automatique fonctionne avec le traitement du langage naturel pour constituer les fondations de l’analyse de sentiment.
L’apprentissage automatique, cependant, n’est qu’une manière pour les ordinateurs d’apprendre – il n’est pas toujours lié à l’analyse de sentiment. Il existe aussi du machine learning pour les chatbots de service client, la prévision d’activité, les moteurs de recommandations, la tarification dynamique, et bien plus encore.
Abonnez-vous à la newsletter The CX Lead pour recevoir d’autres analyses d’experts sur l’expérience client et l’expérience utilisateur.
À lire aussi : 10 meilleurs logiciels de support client pour PME et grandes entreprises
