Viele Menschen fragen sich: „Ist Sentiment-Analyse Machine Learning?“ Die kurze Antwort: Ja. Moderne Sentiment-Analysen basieren auf Machine-Learning-Modellen, um zu analysieren und zu verbessern, wie emotionale Bedeutungen in Texten erkannt werden.
In diesem Artikel erkläre ich, was Sentiment-Analyse ist, was Machine Learning bedeutet und wie beide im Bereich Kundenerlebnis zusammenarbeiten.
Was ist Sentiment-Analyse?
Sentiment-Analyse, auch als Meinungsforschung bekannt, ist der Prozess, eine Vielzahl von Texten zu lesen und zu interpretieren, ob der Ton positiv oder negativ ist. Unternehmen nutzen häufig Sentiment-Analyse-Tools, um zu verstehen, wie Kunden über ihre Marke denken oder was online über die Konkurrenz gesagt wird.
Bei der Sentiment-Analyse werden Textblöcke – wie ein Tweet oder eine Kundenbewertung – anhand der einzelnen Wörter, aus denen der Text besteht, mit einem negativen, neutralen oder positiven Wert bewertet.

Um dies zu erreichen, verwendet Sentiment-Analyse-Software ein Lexikon oder Wörterbuch, um jedes Wort zu identifizieren und zu bewerten. Dieses Wörterbuch wird von Menschen zusammengestellt, die die Wörter manuell gesammelt und bewertet haben.
Dieser Prozess ist zeitaufwändig und umfassend, da jedes Wort nicht nur eine eigene Bewertung benötigt, sondern diese Bewertungen auch zueinander passen müssen. Zum Beispiel ist „best“ besser als „great“, was wiederum besser ist als „good“.
Dieses Lexikon bildet die Grundlage der Sentiment-Analyse.
Wie funktioniert Sentiment-Analyse?
Es gibt drei Möglichkeiten, Kundensentimentanalyse zu implementieren – welche man wählt, hängt hauptsächlich davon ab, wie viele Daten analysiert werden müssen und wie genau das Ergebnis sein soll.
Regel-basiert
Regel-basierte Sentiment-Analyse ist eine Methode der Merkmalsauswahl, die automatisch und auf vom Menschen festgelegten Regeln beruht. Die Regeln enthalten typischerweise viele Natural Language Processing (NLP)-Techniken und naive Bayes-Klassifikatoren. Dieser Ansatz ist schnell, aber extrem einfach und nicht besonders genau.
Die Regeln könnten zum Beispiel Wörter definieren, die als extrem negativ (schlimmste, schrecklich, hässlich) oder positiv (ausgezeichnet, beste, schön) gelten. Diese Wörter erhalten einen positiven oder negativen Wert. Gibt es mehr positive als negative Worte, zeigt die Software einen positiven Sentiment an; sind es mehr negative Worte, zeigt sie einen negativen Sentiment. Gibt es gleich viele positive wie negative Worte, gilt der Text als neutral.
Wie bereits erwähnt, ist dieser Ansatz schnell, aber wenig nuanciert. Es wird nichts anderes als die einfachen Wortregeln berücksichtigt; weder die Position noch die Kombination der Worte spielen eine Rolle. Es ist möglich, die Regeln nachträglich zu ändern, was allerdings auch die bisherigen Ergebnisse modifiziert. Diese Systeme benötigen viel Feintuning und Wartung.
Automatisch
Automatische Systeme gelten als Machine Learning. Sie verlassen sich nicht auf vom Programmierer vorgegebene Regeln zur Sentiment-Klassifizierung, müssen aber lernen. Beim Training automatischer Systeme lernt das System, bestimmte Wörter und Wortkombinationen einem bestimmten Tag zuzuordnen. Der Text wird in einen Feature-Vektor übertragen. Die Maschine koppelt Tags und Feature-Vektoren, um einen Algorithmus zu generieren und ein Modell für die zukünftige Anwendung zu erstellen.
Feature-Vektoren repräsentieren alle Merkmale und Eigenschaften eines Objekts – in diesem Fall die Wörter und Phrasen. Im Machine Learning sind sie für Muster und Algorithmen, die die Daten verarbeiten, unerlässlich. Je mehr Tests das System erhält, umso mehr Tags und Feature-Vektoren entstehen, wodurch das System lernt und seinen Algorithmus sowie das Sentiment-Analysemodell fortlaufend optimiert.
Dieser Prozess kann sehr komplex werden und mit Deep Learning arbeiten, bei dem eine Sammlung von Algorithmen und künstlichen neuronalen Netzwerken eingesetzt wird, um Daten zu analysieren und so den Denkprozess des menschlichen Gehirns nachzuahmen.
Hybrid
Ein hybrider Ansatz kombiniert regelbasierte und automatische Sentiment-Analyse und vereint idealerweise die besten Eigenschaften beider Methoden. Diese Methode ist in der Regel am genauesten.
Wie Sentiment-Analyse und Machine Learning zusammenhängen
Machine Learning ist ein wichtiger Bestandteil der Sentiment-Analyse, aber nicht der einzige, der zählt.
Durch den Einsatz von Natural Language Processing können Programmierer beim Aufbau eines Sentiment-Lexikons und beim Training des Machine-Learning-Programms große Mengen an Text und Daten einspeisen. Das Programm wird so immer mehr Wörter bewerten, seinen Algorithmus und die Fähigkeit zur Sentimentanalyse sowie schließlich zur Sentimentvorhersage verbessern. Diese Verbesserungen werden durch Machine-Learning-Algorithmen unterstützt.
Beim Sentiment-Analyse-Machine-Learning gibt es viele Dinge zu klären, um möglichst genau zu sein – weshalb Modelle des Deep Learning bevorzugt werden.
Genaue Sentiment-Analyse erfordert ein tiefes Verständnis der Wortarten (Parts of Speech). Programmierer trainieren Machine Learning hierfür, indem sie jedes Wort zum Beispiel als Substantiv, Verb oder Adjektiv markieren.
Je mehr das Programm über Satzbau und Anordnung der Wörter in Sätzen lernt, desto besser kann es die natürliche Sprache grundlegend verstehen und die Klassifikationsgenauigkeit erhöhen.
Dennoch gibt es viele Hürden, die das Machine-Learning der Sentiment-Analyse herausfordern.
Herausforderungen für Machine Learning bei Sentiment-Analyse
Es gibt zahlreiche Herausforderungen bei der Sentiment-Analyse, unabhängig vom verwendeten Modell.
Sentiment-Analyse ist etwas, das wir als Menschen ständig tun. Immer wenn wir eine Nachricht von einem Freund oder einen Tweet von einem Fremden lesen, müssen wir herausfinden, welche Stimmung wirklich gemeint ist. Ist das sarkastisch? Lustig? Ironisch?
Sogar Menschen können die Bedeutung von Text nicht immer zu 100 Prozent richtig einschätzen. Wenn es schon für den Menschen in seiner Muttersprache schwierig ist, ist es verständlich, dass Machine Learning bei Sentiment-Analysen ebenfalls an seine Grenzen stößt.
Hier sind einige Dinge, die Sentiment-Analyse für Machine Learning schwierig machen:
Subjektivität
Manche Aussagen sind rein sachlich und nicht positiv oder negativ, aber es ist nicht immer einfach, das zu erkennen. Betrachten Sie zum Beispiel die folgenden beiden Sätze:
Das Hemd ist blau.
Das Hemd ist schön.
In diesem Beispiel ist klar, welcher Satz einen positiven Sentiment besitzt – das Hemd ist schön. Aber das bedeutet nicht, dass der erste Satz negativ ist. Der erste Satz ist objektiv und stellt fest: Das Hemd ist blau.
Die Schwierigkeit entsteht dann, wenn zwei Aussagen nicht gleichwertig sind. Der zweite Satz, der das Hemd als schön bewertet, ist aus Sentiment-Sicht wichtiger, da er subjektiv ist. Der zweite Kommentar zeigt, wie ein Nutzer über ein Produkt denkt – Daten, die genutzt werden können.
Tonfall
Tonfall ist eines der schwierigsten Dinge für Menschen zu entschlüsseln – wie schwer ist das dann für Maschinen? Sarkasmus beispielsweise ist im Text extrem schwer zu erkennen, da meist Worte verwendet werden, die das Gegenteil der eigentlichen Aussage ausdrücken. Zum Beispiel:
Mein wundervolles Auto ist schon wieder kaputt gegangen. Toll!
Mein Schrottauto ist schon wieder kaputt gegangen.
Beide Sätze haben negative Stimmung, aber der erste Satz verwendet Sarkasmus mit Wörtern wie wunderbar und toll. Für ein Sentiment-Analyse-System wäre es schwer zu erkennen, ohne dass ein Mensch die endgültige Entscheidung trifft.
Kontext
In manchen Fällen ist es unmöglich, das Sentiment ohne einen größeren Kontext zu bestimmen. Betrachten wir das folgende Beispiel: „Die Auswahl in diesem Künstlerbedarfsladen ist großartig, wenn man Malerei studiert.“ Beim Überfliegen des Textes finden wir positiv bewertete Wörter wie „großartig“.
Im weiteren Kontext dieser Aussage wird jedoch klar: Für andere Bereiche wie Zeichnen, Tinte, Skulpturen oder andere künstlerische Medien ist die Auswahl nicht so gut. Oh oh. Mit dem Kontext betrachtet, könnte man also zu dem Schluss kommen, dass diese Bewertung letztlich gar nicht so positiv ist!
Beim Opinion Mining durch Machine Learning wird der Kontext häufig nicht ausreichend berücksichtigt.
Vergleiche
Vergleiche sind komplex, weil es weniger um die Wörter an sich geht, sondern eher darum, wie sie sich zueinander verhalten. Hier ein Beispiel:
Das ist der beste Kuchen, den ich je gegessen habe.
Deren Kuchen ist gut – für eine Kette.
Der erste Satz ist eindeutig positiv. Der zweite ist schwerer zu bewerten. Als Anbieter möchten Sie wahrscheinlich, dass Ihr Produkt mit allen Konkurrenten mithalten kann. Die zweite Aussage deutet aber an, dass der Kuchen im Vergleich zu Spezialbäckereien oder lokalen Läden nur zweite Wahl ist.
Sentiment-Analyse-Lösungen erkennen hier den Vergleich oft nicht und bewerten lediglich das Wort „gut“ positiv, obwohl mehr dahintersteckt.
Emojis
Jeder, der online unterwegs ist, sieht überall Emojis. Manche sind einfach, andere komplex – aber alle können Machine Learning bei der Sentiment-Analyse Probleme bereiten.
Emojis sind ein wichtiger Teil der Online-Kommunikation. Ein Herz-Emoji sollte als positives Sentiment gedeutet werden, der Kackhaufen vermutlich als negativ. Das ist kein Problem, solange Ihre Sentiment-Bibliothek Wertungen für gängige Emojis enthält, genauso wie für populäre Slangwörter.
Slang
Sprache entwickelt sich ständig weiter – das gilt auch für jeden Generationen-Slang, wie „smol“, „stan“, „woke“ und „salty“. Wie bei Emojis haben Sentiment-Analyse-Tools damit oft ihre Schwierigkeiten.
Immerhin scheint alle paar Monate ein neues, von Memes inspiriertes Slangwort aufzutauchen. Slang, der bleibt und möglicherweise in Bewertungen und auf sozialen Medien auftaucht, kann der Sentiment-Library hinzugefügt und mit einem positiven, neutralen oder negativen Score versehen werden...genau wie jedes andere Wort!
Unser Sprachwörterbuch entwickelt sich ständig weiter. Ich erinnere mich noch an das kollektive Augenrollen, als 2014 "YOLO" (You Only Live Once, für die Uneingeweihten) in das Online-Oxford-Wörterbuch aufgenommen wurde. Trotzdem gibt es Hoffnung für Sentiment-Analyzer: Das bedeutet nämlich, dass sich auch ML-Wörterbücher weiterentwickeln können. Die besten Sentiment-Analyse-Tools berücksichtigen neuen Slang durch Software-Updates oder manuelle Eingaben der Nutzer.
Mittelweg: Was ist neutrales Sentiment?
Eine gute Basis für das Training von Machine Learning erhält man, wenn man sich zunächst Gedanken darüber macht, was genau „neutral“ eigentlich bedeutet. Ich habe viel über positive und negative Beispiele für Sentiment-Analyzer gesprochen, aber diese beiden Stimmungen hängen davon ab, dass ein klar definiertes Neutral existiert. Es ist fair zu sagen, dass das Neutrale einer der wichtigsten Teile des Prozesses ist.
Aber wie definiert man Neutral? Hier sind 3 Ansätze zum Einstieg:
- Objektive Aussagen einbeziehen. Denken Sie an das obige Beispiel: Dieses Hemd ist blau. Das Auto ist gelb. Der Baum hat Blätter. Das sind alles objektive Aussagen, die auf Fakten beruhen. Sie tragen keinerlei positiven oder negativen Sentiment in sich.
- Alles Irrelevante herausfiltern. Irrelevante Informationen helfen Ihnen nicht bei der Entscheidung, ob etwas positiv oder negativ ist. Wenn z. B. eine Bewertung für einen Wäschetrockner mit einer Anekdote beginnt, wie etwa: „Ich ging in den Keller und warf die nasse Wäsche in den Trockner, nur um festzustellen, dass er kaputt war“, dann ist diese Information für das eigentliche Sentiment der Bewertung nicht relevant und kann ausgeschlossen werden.
- Vorschläge ignorieren. Das ist keine strenge Regel, aber häufig tragen Vorschläge nicht zum Sentiment bei. Wenn Sie feststellen, dass sich Bewerter wünschen, ein Artikel hätte eine bestimmte Eigenschaft, sagt das meist wenig über das eigentliche Kundensentiment aus. Man könnte meinen, das sei negativ – was es auch sein kann. Zum Beispiel: „Das Steak war schrecklich, ich wünschte, sie hätten es nicht übergart.“ ist negativ. Aber Wünsche und Sehnsüchte kommen auch in positiven Bewertungen vor: „Der Kuchen war köstlich, ich hätte gern mehr davon gehabt“ oder „Ich liebe alles an diesem Hemd, ich wünschte, es gäbe es in 100 Farben.“
Ein klar definiertes Neutral ist das Fundament jeder Sentiment-Analyse. Jede Analyse beginnt schließlich neutral und entwickelt sich dann entweder ins Positive oder Negative, je nachdem, wie der Text bewertet wird.
Fazit
Sentiment-Analyse ist eine Art von Machine-Learning-Tool. Maschinelles Lernen arbeitet mit natürlicher Sprachverarbeitung (NLP) zusammen und bildet so die zentralen Bausteine des Sentiment-Analyse-Prozesses.
Maschinelles Lernen ist jedoch einfach nur, wie Computer lernen – und das hat nicht immer etwas mit Sentiment-Analyse zu tun. Es gibt auch Machine Learning für Chatbots im Kundenservice, Geschäftsprognosen, Produktempfehlungs-Engines, dynamische Produktpreisgestaltung und vieles mehr.
Abonnieren Sie den The CX Lead Newsletter für mehr Experteneinblicke zu Customer Experience und User Experience.
Weiterlesen: 10 beste Kundensupport-Software für KMUs und Großunternehmen
