Molte persone si chiedono: "L'analisi del sentiment è machine learning?" La risposta breve: Sì. L'analisi del sentiment moderna si basa su modelli di machine learning per analizzare e migliorare il modo in cui viene rilevato il significato emotivo nei testi.
In questo articolo spiegherò cos'è l'analisi del sentiment, cosa significa machine learning e come i due concetti lavorano insieme nei contesti di esperienza cliente.
Cos'è l'analisi del sentiment?
L'analisi del sentiment, nota anche come opinion mining, è il processo di lettura di una raccolta di testi e di interpretazione del tono come positivo o negativo. Le aziende spesso utilizzano strumenti di analisi del sentiment per capire come i clienti percepiscono il loro marchio o cosa si dice online sulla concorrenza.
Nell'analisi del sentiment, ai blocchi di testo—come un Tweet o una recensione cliente—viene assegnato un punteggio negativo, neutro o positivo in base alle singole parole che compongono il testo.

Per fare ciò, il software di analisi del sentiment utilizza un lessico o dizionario per identificare e valutare ogni parola. Questo dizionario viene costruito da persone che raccolgono manualmente le parole e attribuiscono a ciascuna un punteggio.
Questo processo richiede molto tempo ed è complesso perché ogni parola necessita non solo di un proprio punteggio, ma i punteggi devono essere correlati tra loro. Ad esempio, migliore è meglio di ottimo, che è meglio di buono.
Questo lessico è la base dell'analisi del sentiment.
Come funziona l'analisi del sentiment?
Esistono tre modi per implementare l'analisi del sentiment dei clienti e la scelta dipende principalmente dalla quantità di dati da analizzare e dal livello di accuratezza desiderato.
Basata su regole
L'analisi del sentiment basata su regole è un metodo di selezione delle caratteristiche che è automatico e basato su regole stabilite dagli esseri umani. Le regole comprendono generalmente molte tecniche di elaborazione del linguaggio naturale (NLP) e classificatori naive Bayes. Questo approccio è veloce, ma estremamente semplice e poco preciso.
Ad esempio, le regole possono definire parole estremamente negative (peggiore, orribile, brutto) e positive (eccellente, migliore, bello). A queste parole viene assegnato un valore positivo o negativo. Se ci sono più parole positive che negative, il software indica che il testo ha un sentimento positivo; se ci sono più parole negative, indica un sentimento negativo. Se c'è un numero uguale di parole positive e negative, il testo è considerato neutro.
Come accennato, questo approccio è rapido ma non molto sfumato. Non tiene conto di altro se non delle semplici regole che si applicano alle parole, senza prestare attenzione a dove compaiono o a come sono combinate. È possibile modificare le regole, ma questo cambierà anche i risultati precedenti. Questi sistemi richiedono molti aggiustamenti e manutenzione.
Automatico
I sistemi automatici sono considerati machine learning. Non si basano su regole impostate dai programmatori per la classificazione del sentiment, ma hanno bisogno di apprendere. Quando si allenano i sistemi automatici, il sistema impara ad associare determinate parole e combinazioni di testi a un tag specifico. Il testo viene trasferito in un vettore delle caratteristiche. La macchina abbina tag e vettori delle caratteristiche per generare un algoritmo e creare un modello da utilizzare in futuro.
I vettori delle caratteristiche rappresentano tutte le proprietà e le caratteristiche di un oggetto; in questo caso, le parole e le frasi. Nel machine learning e nell'AI nell'analisi del sentiment dei clienti, sono essenziali per modelli e algoritmi che elaborano i dati. Quindi, più testi vengono inseriti nel sistema, più tag e vettori delle caratteristiche esso crea, e più apprende e perfeziona il proprio algoritmo e modello di analisi del sentiment.
Questo processo può diventare molto complesso, spingendosi verso il deep learning, dove viene utilizzata una raccolta di algoritmi e reti neurali artificiali per analizzare i dati, tentando di imitare il processo di pensiero del cervello umano.
Ibrido
Un approccio ibrido utilizza una combinazione di analisi del sentiment basata su regole e automatica, idealmente integrando i migliori aspetti di entrambe. Questo metodo è solitamente il più preciso.
Come si collegano analisi del sentiment e machine learning
Il machine learning è una parte importante dell’analisi del sentiment, ma non è l’unico aspetto che conta.
Attraverso l’uso dell’elaborazione del linguaggio naturale, i programmatori possono fornire grandi quantità di testo e dati nella costruzione di un lessico di sentiment e durante l’addestramento del programma di machine learning. Il programma continuerà ad assegnare valutazioni a un numero sempre maggiore di parole, migliorando il proprio algoritmo e la propria capacità di effettuare analisi del sentiment e, in seguito, di prevedere il sentiment. Questi miglioramenti sono supportati dagli algoritmi di machine learning.
L’analisi del sentiment tramite machine learning deve risolvere molti aspetti per essere il più accurata possibile, motivo per cui si preferisce un modello di deep learning.
Un’analisi accurata del sentiment richiede una comprensione approfondita delle parti del discorso. I programmatori addestrano il machine learning a questo scopo etichettando ogni parola come sostantivo, verbo, aggettivo e così via.
Man mano che il programma apprende la struttura della frase e il modo in cui le parole sono disposte e collocate nelle frasi, sviluppa una comprensione di base più solida del linguaggio naturale, migliorando l’accuratezza della classificazione.
Nonostante ciò, ci sono ancora molti ostacoli che mettono alla prova il machine learning nell’analisi del sentiment.
Sfide per il Machine Learning nell’Analisi del Sentiment
Le sfide per l’analisi del sentiment sono molte, indipendentemente dal modello che si sta utilizzando.
L’analisi del sentiment è qualcosa che noi esseri umani facciamo continuamente. Ogni volta che leggiamo un messaggio da un amico o un tweet da uno sconosciuto, dobbiamo capire qual è il vero sentimento. Sono sarcastici? Divertenti? Ironici?
Risulta difficile anche per le persone comprendere il significato di un testo in modo preciso al cento per cento. Se gli esseri umani fanno fatica con questa attività nella propria lingua madre, è comprensibile che anche il machine learning abbia qualche difficoltà nell’analisi del sentimento.
Ecco alcune delle cose che rendono difficile l’analisi del sentiment tramite machine learning:
Soggettività
Alcune affermazioni sono oggettive e non sono né positive né negative, ma non è sempre semplice distinguere questa idea. Per esempio, osserva le seguenti due frasi:
La camicia è blu.
La camicia è bellissima.
In questo esempio, è evidente quale frase ha un sentimento positivo: “la camicia è bellissima”. Ma ciò non significa che la prima frase sia negativa. La prima frase è oggettiva. Sta semplicemente esponendo un fatto: la camicia è blu.
La difficoltà nasce dal fatto che a volte due predicati non sono equivalenti. La seconda frase, che commenta sulla bellezza della camicia, è più rilevante dal punto di vista del sentiment perché è soggettiva. Questo secondo commento indica come una persona si sente riguardo a un prodotto, ed è un dato utile.
Tono
Il tono è uno degli aspetti più difficili da interpretare per le persone, quindi immagina quanto possa essere complicato per una macchina. Capire se qualcuno è sarcastico, ad esempio, è estremamente complicato tramite testo, perché spesso vengono usate parole che esprimono l’opposto di ciò che si intende. Per esempio:
La mia fantastica auto si è rotta di nuovo. Fantastico!
La mia carretta si è rotta di nuovo.
Entrambe queste frasi hanno un sentimento negativo, ma la prima utilizza il sarcasmo includendo parole come “fantastica” e “fantastico”. Questo scenario sarebbe difficile da analizzare per un sistema di sentiment analysis senza che un umano lo esamini e dia un giudizio finale.
Contesto
In alcuni casi, è impossibile determinare il sentimento senza avere un contesto più ampio. Considera il seguente esempio: “La selezione in questo negozio di articoli per le belle arti è ottima se sei uno studente di pittura.” Scorrendo il testo, notiamo parole con punteggio positivo come “ottima”.
Tuttavia, un contesto più ampio di questa citazione fa intuire altro: che il negozio di articoli per le belle arti non è poi così eccellente se ti interessano matite, inchiostro, scultura o altri tipi di media artistici. Ahi ahi. Se si considera il contesto, potresti persino decidere che questa recensione non sia poi così positiva!
Quando il machine learning analizza le opinioni per l’analisi del sentiment, non riesce sempre a tener conto del contesto.
Comparazioni
Le comparazioni sono complesse perché non riguardano solo le parole, ma anche il modo in cui queste si relazionano tra loro. Ecco un esempio:
Questa è la migliore torta che abbia mai mangiato.
La loro torta è buona per una catena di ristoranti.
La prima frase è positiva. La seconda non è così facile da valutare. Probabilmente desideri che il tuo prodotto sia considerato buono rispetto a ogni tipo di concorrenza. Il secondo sentimento lascia intendere che, rispetto a pasticceri specializzati, locali tipici o altre opzioni, la tua torta sia di livello inferiore.
Le soluzioni di sentiment analysis potrebbero non riuscire a cogliere il fattore comparativo in questo caso. Leggerebbero la parola “buona” e assegnerebbero un punteggio positivo al sentimento, anche se chiaramente c’è di più nella storia.
Emoji
Chiunque passi del tempo online sa che gli emoji sono ovunque. Alcuni sono semplici, altri sono complicati, ma tutti possono creare problemi all'apprendimento automatico quando si tenta di condurre un'analisi del sentiment.
Gli emoji sono una parte importante della comunicazione online. Un'emoji a forma di cuore dovrebbe essere interpretata come un sentimento positivo, mentre l'emoji del mucchio di feci sicuramente avrebbe un punteggio negativo. Questo non rappresenta un problema finché si lavora con librerie di sentiment che inseriscono punteggi per le emoji comuni, proprio come fanno per le espressioni gergali popolari.
Slang
La lingua è in costante evoluzione e questo include il lessico di slang di ogni generazione, come “smol”, “stan”, “woke” e “salty”. Come per gli emoji, anche il tuo strumento di analisi del sentiment potrebbe incontrare delle difficoltà qui.
Dopotutto, sembra che ogni pochi mesi nasca una nuova parola di origine meme. Lo slang che resta e che può comparire nelle recensioni e sui social media può essere aggiunto alla libreria del sentiment e ricevere un punteggio positivo, neutro o negativo...proprio come qualsiasi altra parola!
Il nostro dizionario linguistico è sempre in evoluzione. Ricordo la reazione collettiva quando YOLO (You Only Live Once, per i non iniziati) è entrato nel dizionario online di Oxford nel 2014. Tuttavia, gli analizzatori di sentiment possono sperare: questo significa che anche i dizionari ML possono evolversi. I migliori strumenti di analisi del sentiment accoglieranno il nuovo slang tramite aggiornamenti software o inserimento manuale da parte degli utenti.
Zona Intermedia: Cos'è il Sentimento Neutro?
Un modo per costruire una buona base per l'addestramento dell'apprendimento automatico è riflettere bene su cosa significhi esattamente "neutro". Ho parlato a lungo di esempi positivi e negativi per un analizzatore di sentiment ma questi due sentimenti dipendono dall'avere un neutro chiaramente definito. Si può dire che il neutro è una delle parti più importanti del processo.
Ma come si definisce il neutro? Ecco 3 modi per iniziare:
- Includi test obiettivi. Ricorda l'esempio qui sopra: questa maglietta è blu. L'auto è gialla. L'albero ha le foglie. Queste sono tutte affermazioni oggettive basate sui fatti. Non hanno alcun sentimento positivo o negativo associato.
- Filtra tutto ciò che è irrilevante. Informazioni irrilevanti non ti aiuteranno a determinare se qualcosa sia positivo o negativo. Per esempio, se una recensione su un'asciugatrice inizia con un aneddoto come: "Sono andato in cantina e ho buttato i panni bagnati nell'asciugatrice solo per scoprire che era rotta", questa informazione non è rilevante per il sentiment della recensione stessa e può essere esclusa.
- Ignora i suggerimenti. Questa non è una regola fissa, ma spesso i suggerimenti non contribuiscono al sentiment. Se noti che i revisori desiderano che un articolo abbia una caratteristica, non ti dice molto sul sentiment del cliente. Potresti inizialmente pensare che sia negativo, e a volte lo è. Per esempio, "La bistecca era pessima, vorrei non l'avessero stracotta" è negativo. Ma desideri e richieste possono emergere anche in recensioni positive. "La torta era deliziosa, vorrei ce ne fosse di più" oppure "Amo tutto di questa maglietta, vorrei che fosse disponibile in 100 colori."
Avere un neutro chiaramente definito è il fondamento di tutta l'analisi del sentiment. Dopotutto, ogni analisi parte dal neutro e poi si indirizza verso il positivo o il negativo man mano che il testo viene valutato.
Conclusione
L'analisi del sentiment è un tipo di strumento di apprendimento automatico. L'apprendimento automatico lavora con l'elaborazione del linguaggio naturale per costituire i blocchi fondamentali del processo di analisi del sentiment.
Tuttavia, l'apprendimento automatico è semplicemente il modo in cui i computer imparano e non deve sempre essere strettamente legato all'analisi del sentiment. Esiste anche l'apprendimento automatico per i chatbot di assistenza clienti, la previsione aziendale, i motori di raccomandazione prodotti, la definizione dinamica dei prezzi e non solo.
Iscriviti alla newsletter di The CX Lead per altri approfondimenti da esperti su customer experience e user experience.
Articolo correlato: 10 Migliori Software di Supporto Clienti per PMI ed Enterprise
