Viele Menschen fragen sich: „Ist Sentiment-Analyse maschinelles Lernen?“ Die kurze Antwort: Ja. Moderne Sentiment-Analysen beruhen auf Modellen des maschinellen Lernens, um zu analysieren und zu verbessern, wie emotionale Bedeutung in Texten erkannt wird.
In diesem Artikel erkläre ich, was Sentiment-Analyse ist, was maschinelles Lernen bedeutet und wie beides zusammen im Bereich der Kundenerfahrung (Customer Experience) eingesetzt wird.
Was ist Sentiment-Analyse?
Sentiment-Analyse, auch Meinungs-Mining genannt, ist der Prozess, eine Textsammlung zu lesen und zu interpretieren, ob der Tonfall positiv oder negativ ist. Unternehmen nutzen häufig Sentiment-Analyse-Tools, um zu verstehen, wie Kunden über ihre Marke denken oder was Menschen online über ihre Konkurrenz sagen.
Bei der Sentiment-Analyse werden Textblöcke – wie ein Tweet oder eine Kundenbewertung – mit einem negativen, neutralen oder positiven Wert versehen, basierend auf den einzelnen Wörtern, aus denen der Text besteht.

Um dies zu tun, verwendet Sentiment-Analyse-Software ein Lexikon oder Wörterbuch, um jedes Wort zu erkennen und zu bewerten. Dieses Wörterbuch wird von Menschen erstellt, die die Wörter manuell sammeln und jedem eine Bewertung zuweisen.
Dieser Prozess ist zeitaufwändig und umfassend, da jedes Wort nicht nur einen eigenen Wert benötigt, sondern die Werte müssen sich auch zueinander verhalten. Zum Beispiel ist „beste“ besser als „großartig“, was wiederum besser als „gut“ ist.
Dieses Lexikon bildet die Grundlage der Sentiment-Analyse.
Wie funktioniert Sentiment-Analyse?
Es gibt drei Möglichkeiten, Kundensentiment-Analyse umzusetzen. Welche Sie wählen, hängt hauptsächlich davon ab, wie viele Daten analysiert werden müssen und wie genau das Ergebnis sein soll.
Regelbasiert
Regelbasierte Sentiment-Analyse ist eine automatische Methode der Merkmalsauswahl, die auf von Menschen aufgestellten Regeln basiert. Die Regeln enthalten in der Regel viele Techniken der natürlichen Sprachverarbeitung (NLP) und Bayes-Klassifikatoren. Dieser Ansatz ist schnell, aber sehr einfach und nicht sehr genau.
Beispielsweise könnten die Regeln Wörter definieren, die besonders negativ (schlimmste, schrecklich, hässlich) oder positiv (exzellent, beste, schön) sind. Diese Wörter erhalten einen positiven oder negativen Wert. Gibt es mehr positive als negative Wörter, signalisiert die Software einen positiven Sentiment-Wert im Text; sind es mehr negative, deutet es auf eine negative Stimmung. Sind beide gleich, gilt der Text als neutral.
Wie gesagt, ist dieser Ansatz zwar schnell, aber nicht sehr nuanciert. Es werden nur die simplen Regeln angewendet, ohne dabei zu beachten, wo die Wörter im Text stehen oder wie sie kombiniert sind. Es ist möglich, die Regeln im Laufe der Zeit anzupassen, allerdings verändern sich dadurch auch frühere Ergebnisse. Solche Systeme erfordern viel Feinarbeit und Wartung.
Automatisch
Automatische Systeme gelten als maschinelles Lernen. Sie bauen nicht auf Programmierer-Regeln für die Sentiment-Klassifizierung auf, sondern müssen lernen. Im Training lernt das automatische System, bestimmte Wörter und Textkombinationen mit einem bestimmten Tag zu verknüpfen. Der Text wird in einen Merkmalsvektor übertragen. Die Maschine verbindet Tags und Merkmalsvektoren, um einen Algorithmus zu erstellen und ein Modell für die zukünftige Nutzung aufzubauen.
Merkmalsvektoren repräsentieren alle Merkmale und Eigenschaften eines Objekts, in diesem Fall Wörter und Phrasen. Im maschinellen Lernen und in der KI-gestützten Kundensentiment-Analyse sind sie essenziell für die Muster und Algorithmen, die die Daten verarbeiten. Je mehr Tests das System erhält, desto mehr Tags und Merkmalsvektoren entstehen und desto mehr lernt und verfeinert das System seinen Algorithmus und das Modell für die Sentiment-Analyse.
Dieser Prozess kann recht komplex werden und bis hin zu Deep Learning gehen, bei dem eine Sammlung von Algorithmen und künstlichen neuronalen Netzen zur Datenanalyse genutzt wird – ein Versuch, den Denkprozess des menschlichen Gehirns nachzuahmen.
Hybrid
Ein hybrider Ansatz kombiniert regelbasierte und automatische Sentiment-Analyse und vereint im Idealfall die besten Aspekte beider Methoden. Diese Methode liefert in der Regel die genauesten Ergebnisse.
Wie hängen Sentiment-Analyse und maschinelles Lernen zusammen?
Maschinelles Lernen ist ein wichtiger Bestandteil der Sentiment-Analyse, aber es ist nicht das Einzige, was zählt.
Durch den Einsatz von natürlicher Sprachverarbeitung können Programmierer beim Aufbau eines Sentiment-Lexikons und beim Training des maschinellen Lernprogramms riesige Mengen an Text und Daten einspeisen. Das Programm wird fortlaufend weitere Wörter bewerten, seinen Algorithmus sowie die Fähigkeit zur Sentiment-Analyse und letztlich auch zur Sentiment-Vorhersage verbessern. Diese Verbesserungen werden durch maschinelle Lernalgorithmen unterstützt.
Es gibt vieles, was das maschinelle Lernen bei der Sentiment-Analyse herausfinden muss, um möglichst präzise zu sein – deshalb wird bevorzugt ein Deep-Learning-Modell eingesetzt.
Für eine genaue Sentiment-Analyse ist ein gründliches Verständnis der Wortarten erforderlich. Programmierer trainieren maschinelles Lernen dafür, indem sie jedes Wort zum Beispiel als Substantiv, Verb oder Adjektiv kennzeichnen.
Während das Programm mehr über Satzstrukturen und die Anordnung sowie Platzierung von Wörtern in Sätzen lernt, erweitert es sein grundlegendes Verständnis von natürlicher Sprache und verbessert die Klassifizierungsgenauigkeit.
Trotzdem gibt es viele Hürden, die das maschinelle Lernen bei der Sentiment-Analyse vor Herausforderungen stellen.
Herausforderungen für maschinelles Lernen bei der Sentiment-Analyse
Es gibt viele Herausforderungen bei der Sentiment-Analyse, unabhängig vom verwendeten Modell.
Sentiment-Analyse ist etwas, das wir Menschen ständig machen. Jedes Mal, wenn wir eine Nachricht von einem Freund oder einen Tweet von einem Fremden lesen, müssen wir herausfinden, wie die eigentliche Stimmung ist. Ist die Person sarkastisch? Lustig? Ironisch?
Es ist für Menschen schwierig, 100 Prozent der Zeit die Bedeutung hinter einem Text richtig zu erfassen. Wenn selbst Muttersprachler Schwierigkeiten damit haben, ist es naheliegend, dass auch maschinelles Lernen bei der Sentiment-Analyse mitunter an seine Grenzen stößt.
Hier sind einige der Aspekte, die die Sentiment-Analyse für maschinelles Lernen schwierig machen:
Subjektivität
Manche Aussagen sind tatsachenbezogen und somit weder positiv noch negativ, aber es ist nicht immer leicht, diese Tatsache zu unterscheiden. Zum Beispiel diese beiden Sätze:
Das Hemd ist blau.
Das Hemd ist schön.
In diesem Beispiel ist klar, welcher Satz eine positive Stimmung hat – das Hemd ist schön. Das bedeutet aber nicht, dass der erste Satz negativ ist. Der erste Satz ist objektiv. Er stellt eine Tatsache fest – das Hemd ist blau.
Die Schwierigkeit besteht darin, dass manchmal zwei Prädikate nicht gleichwertig sind. Der zweite Satz, der kommentiert, dass das Hemd schön ist, ist aus Sentiment-Sicht wichtiger, weil er subjektiv ist. Der zweite Kommentar verrät, wie sich ein Nutzer gegenüber einem Produkt fühlt – und das ist eine Information, die man nutzen kann.
Tonfall
Der Tonfall gehört zu den schwierigsten Aspekten, die selbst für Menschen schwer zu erkennen sind. Stellen Sie sich also vor, wie schwierig es für eine Maschine sein kann. Herauszufinden, ob jemand zum Beispiel sarkastisch ist, ist im geschriebenen Text besonders schwierig, da meist Wörter verwendet werden, die das Gegenteil bedeuten. Zum Beispiel:
Mein wunderbares Auto ist schon wieder kaputt gegangen. Großartig!
Meine Schrottkiste von Auto ist schon wieder kaputt gegangen.
Beide Sätze tragen einen negativen Ton, aber im ersten Satz wird durch die Verwendung von Wörtern wie wunderbar und großartig Sarkasmus eingesetzt. Dieses Szenario wäre für ein Sentiment-Analyse-System schwer einzuordnen, ohne dass ein Mensch noch einmal einen abschließenden Blick darauf wirft.
Kontext
In manchen Fällen ist es ohne weiteren Kontext nicht möglich, die Stimmung einer Aussage zu bestimmen. Betrachten Sie folgende Sentiment-Äußerung: „Die Auswahl in diesem Künstlerbedarfsladen ist großartig, wenn Sie ein Malerei-Studierender sind.“ Beim Überfliegen des Textes fallen positiv bewertete Wörter wie „großartig“ auf.
Ein genauerer Kontext dieses Zitats vermittelt jedoch etwas anderes: dass der Künstlerbedarfsladen nicht so großartig ist, wenn Ihr Fokus auf Bleistift, Tinte, Skulptur oder anderen künstlerischen Medien liegt. Oh je. Wenn man den Kontext berücksichtigt, könnte man zu dem Schluss kommen, dass diese Bewertung doch nicht ganz so positiv ist!
Beim Opinion Mining im maschinellen Lernen für Sentiment wird der Kontext nicht immer ausreichend berücksichtigt.
Vergleiche
Vergleiche sind komplex, da sie weniger von einzelnen Wörtern, sondern vielmehr vom Verhältnis der Wörter zueinander abhängen. Ein Beispiel:
Das ist der beste Kuchen, den ich je gegessen habe.
Deren Kuchen ist gut für eine Kettenbäckerei.
Der erste Satz ist eindeutig positiv. Der zweite ist schwerer zu bewerten. Sie möchten wahrscheinlich, dass Ihr Produkt mit allen Wettbewerbern mithalten kann. Der zweite Satz deutet jedoch darauf hin, dass Ihr Kuchen im Vergleich zu Spezialbäckern, lokalen Betrieben oder anderen Orten eher zweitklassig ist.
Sentiment-Analyse-Lösungen erfassen solche Vergleichsfaktoren möglicherweise nicht. Stattdessen wird das Wort „gut“ erkannt und die Aussage als positiv gewertet, obwohl offensichtlich noch mehr dahintersteckt.
Emojis
Jeder, der Zeit online verbringt, weiß, dass Emojis allgegenwärtig sind. Manche sind einfach, andere kompliziert, aber alle können für maschinelles Lernen bei der Sentiment-Analyse Schwierigkeiten bereiten.
Emojis sind ein wichtiger Bestandteil der Online-Kommunikation. Ein Herz-Emoji sollte als positives Gefühl interpretiert werden, während das Kackhaufen-Emoji sicherlich negativ bewertet wird. Das ist kein Problem, solange mit Sentiment-Bibliotheken gearbeitet wird, die gebräuchlichen Emojis genauso eine Wertung zuweisen wie populären Slangwörtern.
Slang
Sprache entwickelt sich ständig weiter, und dazu gehört auch das Repertoire an Slang jeder Generation, wie „smol“, „stan“, „woke“ und „salty“. Wie bei Emojis kann auch Ihr Sentiment-Analyse-Tool hier Schwierigkeiten bekommen.
Schließlich scheint alle paar Monate ein neues, von Memes inspiriertes Slangwort zu entstehen. Slang, der sich hält und z. B. in Bewertungen oder auf sozialen Medien auftaucht, kann in die Sentiment-Bibliothek aufgenommen und – wie jedes andere Wort auch – mit einem positiven, neutralen oder negativen Score versehen werden!
Unser Sprachlexikon entwickelt sich immer weiter. Ich erinnere mich noch an das kollektive Augenrollen, als YOLO (You Only Live Once, für die Uneingeweihten) 2014 in das Online-Lexikon von Oxford aufgenommen wurde. Dennoch gibt es Hoffnung für Sentiment-Analyzer: Das bedeutet, dass sich auch ML-Wörterbücher weiterentwickeln können. Die besten Sentiment-Analyse-Tools können neuen Slang über Software-Updates oder durch manuelle Nutzereingaben aufnehmen.
Mittelweg: Was bedeutet ein neutrales Sentiment?
Eine gute Grundlage für das Training von maschinellem Lernen erhält man, wenn man sich zunächst Gedanken darüber macht, was „neutral“ eigentlich bedeutet. Ich habe viel über positive und negative Beispiele für einen Sentiment-Analyzer gesprochen, aber diese beiden Gefühle sind davon abhängig, dass es eine klar definierte neutrale Position gibt. Man kann durchaus sagen, dass das Neutrale einer der wichtigsten Schritte im Prozess ist.
Doch wie definiert man Neutralität? Hier sind 3 Ansätze, wie Sie beginnen können:
- Objektive Tests einbeziehen. Erinnern Sie sich an das obige Beispiel: Dieses Hemd ist blau. Das Auto ist gelb. Der Baum hat Blätter. Das sind alles objektive Tatsachenbehauptungen. Sie enthalten weder ein positives noch ein negatives Gefühl.
- Alles Irrelevante herausfiltern. Irrelevante Informationen helfen Ihnen nicht zu bestimmen, ob etwas positiv oder negativ ist. Wenn z. B. eine Bewertung für einen Wäschetrockner mit einer Anekdote beginnt, wie etwa: „Ich ging in den Keller und habe die nasse Wäsche in den Trockner geworfen, nur um festzustellen, dass er defekt war“, dann ist diese Information nicht relevant für das Sentiment der Bewertung selbst und kann ausgeschlossen werden.
- Vorschläge ignorieren. Das ist keine eiserne Regel, aber oftmals tragen Vorschläge nichts zum Sentiment bei. Wenn Sie feststellen, dass Bewerter wünschen, ein Artikel hätte ein bestimmtes Merkmal, sagt das wenig über das Kundengefühl aus. Man könnte zunächst denken, das sei negativ, was manchmal stimmt. Zum Beispiel: „Das Steak war furchtbar, ich wünschte, sie hätten es nicht überkocht“ ist negativ. Aber Wünsche können auch in positiven Bewertungen vorkommen: „Der Kuchen war köstlich, schade, dass es nicht mehr gab“ oder „Ich liebe alles an diesem Hemd, ich wünschte, es gäbe es in 100 Farben.“
Eine klar definierte neutrale Position ist das Fundament jeder Sentiment-Analyse. Jede Analyse startet schließlich neutral und bewegt sich dann basierend auf der Punktevergabe entweder in den positiven oder negativen Bereich.
Fazit
Sentiment-Analyse ist eine Art Werkzeug des maschinellen Lernens. Maschinelles Lernen arbeitet mit der Verarbeitung natürlicher Sprache und bildet so die zentralen Bausteine des Sentiment-Analyse-Prozesses.
Maschinelles Lernen bedeutet lediglich, wie Computer lernen – es muss jedoch nicht immer nur mit Sentiment-Analyse verbunden sein. Es gibt auch maschinelles Lernen für Kundenservice-Chatbots, Unternehmensprognosen, Empfehlungsalgorithmen, dynamische Preisgestaltung für Produkte und vieles mehr.
Abonnieren Sie den The CX Lead Newsletter für weitere Experteneinsichten zu Customer Experience und User Experience.
Ähnliche Beiträge: 10 beste Customer Support Software für KMU und Unternehmen
