Mucha gente se pregunta: "¿El análisis de sentimientos es aprendizaje automático?" La respuesta corta: Sí. El análisis de sentimientos moderno depende de modelos de aprendizaje automático para analizar y mejorar cómo se detecta el significado emocional en un texto.
En este artículo, explicaré qué es el análisis de sentimientos, qué significa aprendizaje automático y cómo ambos funcionan juntos en contextos de experiencia del cliente.
¿Qué es el análisis de sentimientos?
El análisis de sentimientos, también conocido como minería de opiniones, es el proceso de leer un conjunto de textos e interpretar si el tono es positivo o negativo. Las empresas suelen utilizar herramientas de análisis de sentimientos para entender cómo se sienten los clientes respecto a su marca o lo que la gente está diciendo en línea sobre su competencia.
En el análisis de sentimientos, a bloques de texto—como un tuit o una reseña de cliente—se les asigna una puntuación negativa, neutral o positiva según las palabras individuales que conforman el texto.

Para lograrlo, el software de análisis de sentimientos utiliza un léxico o diccionario para identificar y puntuar cada palabra. Este diccionario es elaborado por personas que han recopilado manualmente las palabras y les han asignado una puntuación.
Este proceso es extenso y lleva mucho tiempo, ya que cada palabra no solo necesita su propia puntuación, sino que las puntuaciones deben estar relacionadas entre sí. Por ejemplo, mejor es superior a genial, que a su vez es superior a bueno.
Este léxico es la base del análisis de sentimientos.
¿Cómo funciona el análisis de sentimientos?
Existen tres formas de implementar el análisis de sentimiento del cliente y la que elijas depende principalmente de la cantidad de datos que necesitas analizar y cuán precisa quieres que sea la interpretación.
Basado en reglas
El análisis de sentimientos basado en reglas es un método de selección de características que se realiza automáticamente y se basa en reglas establecidas por humanos. Estas reglas suelen incluir muchas técnicas de procesamiento de lenguaje natural (NLP) y clasificadores naive Bayes. Este enfoque es rápido, pero es extremadamente simple y no muy preciso.
Por ejemplo, las reglas pueden definir palabras que son extremadamente negativas (peor, horrible, feo) y positivas (excelente, mejor, hermoso). Estas palabras reciben un valor positivo o negativo. Si hay más palabras positivas que negativas, el software indica que el texto tiene un sentimiento positivo; si hay más palabras negativas, indica sentimiento negativo. Si hay el mismo número de palabras positivas y negativas, el texto se considera neutral.
Como se mencionó, este enfoque es rápido pero poco matizado. No tiene en cuenta nada más allá de las simples reglas aplicadas a las palabras, sin considerar dónde aparecen o cómo se combinan. Es posible modificar las reglas a medida que avanzas, pero esto también modifica cualquier resultado anterior. Estos sistemas requieren un ajuste y mantenimiento constantes.
Automático
Los sistemas automáticos se consideran aprendizaje automático. No dependen de reglas establecidas por los programadores para la clasificación del sentimiento, pero sí necesitan aprender. Al entrenar sistemas automáticos, el sistema aprende a asociar ciertas palabras y combinaciones de texto con una etiqueta específica. El texto se convierte en un vector de características. La máquina empareja etiquetas y vectores de características para generar un algoritmo y crear un modelo para usar en adelante.
Los vectores de características representan todas las características y cualidades de un objeto; en este caso, las palabras y frases. En el aprendizaje automático y la IA en el análisis de sentimientos del cliente, son esenciales para identificar patrones y algoritmos que procesan los datos. Por lo tanto, cuantos más datos recibe el sistema, más etiquetas y vectores de características crea, y más aprende y perfecciona su algoritmo y modelo de análisis de sentimientos.
Este proceso puede llegar a ser bastante complejo, entrando en el aprendizaje profundo, donde se utiliza una colección de algoritmos y redes neuronales artificiales para analizar datos, en un intento de imitar el proceso de pensamiento del cerebro humano.
Híbrido
Un enfoque híbrido utiliza una combinación de análisis de sentimientos basado en reglas y automático, idealmente tomando las mejores partes de cada uno y fusionándolas en uno solo. Este método suele ser el más preciso.
Cómo se conectan el análisis de sentimientos y el aprendizaje automático
El aprendizaje automático es una parte importante del análisis de sentimiento, pero no es lo único que importa.
Mediante el uso de procesamiento de lenguaje natural, los programadores pueden alimentar enormes cantidades de texto y datos al construir un léxico de sentimiento y entrenar el programa de aprendizaje automático. El programa continuará puntuando más palabras, mejorando su algoritmo y su capacidad para realizar análisis de sentimiento y, eventualmente, predicción de sentimiento. Estas mejoras son apoyadas por algoritmos de aprendizaje automático.
Existen muchas cuestiones que el aprendizaje automático del análisis de sentimiento debe resolver para ser lo más preciso posible, por lo que se prefiere un modelo de aprendizaje profundo.
El análisis de sentimiento preciso requiere una comprensión profunda de las partes de la oración. Los programadores entrenan el aprendizaje automático para esto etiquetando cada palabra como un sustantivo, verbo, adjetivo, etc.
A medida que el programa aprende más sobre la estructura de la oración y cómo las palabras están dispuestas y colocadas en las frases, amplía su comprensión básica del lenguaje natural, mejorando la precisión de la clasificación.
Aun así, existen muchos obstáculos que desafían al aprendizaje automático del análisis de sentimiento.
Desafíos para el aprendizaje automático en el análisis de sentimiento
Hay muchos desafíos para el análisis de sentimiento, sin importar el modelo que estés utilizando.
El análisis de sentimiento es algo que los seres humanos hacemos todo el tiempo. Cada vez que leemos un mensaje de un amigo o un tuit de un desconocido, tenemos que averiguar cuál es el verdadero sentimiento. ¿Están siendo sarcásticos? ¿Divertidos? ¿Irónicos?
Es difícil para las personas descifrar con precisión el significado detrás de un texto el cien por ciento del tiempo. Si los humanos tienen dificultades para hacerlo en su lengua materna, tiene sentido que también el aprendizaje automático tenga problemas con el análisis de sentimiento.
Estas son algunas de las cosas que hacen que el análisis de sentimiento sea difícil para el aprendizaje automático:
Subjetividad
Algunas afirmaciones son fácticas y no son positivas ni negativas, pero no siempre es fácil distinguir esta idea. Por ejemplo, mira las siguientes dos frases:
La camisa es azul.
La camisa es hermosa.
En este ejemplo, es evidente cuál frase contiene un sentimiento positivo —la camisa es hermosa. Pero eso no significa que la primera frase sea negativa. La primera frase es objetiva. Está exponiendo un hecho: la camisa es azul.
La dificultad radica en que a veces dos predicados no son iguales. La segunda frase que comenta que la camisa es hermosa es más importante desde el punto de vista del sentimiento porque es subjetiva. El segundo comentario indica cómo se siente un usuario acerca de un producto, lo cual es un dato útil.
Tono
El tono es una de las cosas más difíciles de descifrar para los seres humanos, así que imagina lo difícil que puede ser para una máquina hacerlo. Averiguar si alguien está siendo sarcástico, por ejemplo, es extremadamente complicado a través de un texto porque normalmente usan palabras opuestas a lo que quieren decir. Por ejemplo:
Mi maravilloso coche se averió otra vez. ¡Genial!
Mi coche chatarra se averió otra vez.
Las dos frases tienen un sentimiento negativo, pero la primera usa sarcasmo incluyendo palabras como maravilloso y genial. Este escenario sería difícil de identificar para un sistema de análisis de sentimiento sin que una persona realice una revisión y tome una decisión final.
Contexto
En algunos casos, es imposible determinar el sentimiento sin un contexto más amplio. Considera el siguiente sentimiento: “La selección en esta tienda de materiales de arte es genial si eres estudiante de pintura.” Si analizamos el texto, vemos palabras con puntuación positiva como “genial”.
Sin embargo, un contexto más amplio de esta cita implica otra cosa: que la tienda de materiales para arte no es tan buena si tu enfoque son los lápices, la tinta, la escultura u otro tipo de medio artístico. Vaya. Al considerar el contexto, podrías decidir que ¡esta reseña en realidad no es tan positiva después de todo!
Cuando el aprendizaje automático extrae opiniones para detectar el sentimiento, no siempre logra tener en cuenta el contexto de forma adecuada.
Comparaciones
Las comparaciones son complejas porque no se trata tanto de las palabras, sino de cómo se relacionan entre sí. Aquí tienes un ejemplo:
Este es el mejor pastel que he probado.
Su pastel es bueno para una cadena de restaurantes.
La primera frase es positiva. La segunda no es tan fácil de determinar. Lo más probable es que quieras que tu producto sea bueno en comparación con todo tipo de competencia. El segundo sentimiento implica que, en comparación con panaderos especialistas, locales o de otros lugares, tu pastel es de segunda categoría.
Las soluciones de análisis de sentimiento pueden no captar el factor de comparación aquí. En cambio, leerían la palabra “bueno” y puntuarían el sentimiento positivamente, aunque claramente hay más trasfondo.
Emojis
Quienes pasan tiempo en línea saben que los emojis están en todas partes. Algunos son simples, otros complicados, pero todos pueden causar problemas al aprendizaje automático que intenta realizar análisis de sentimiento.
Los emojis son una parte importante de la comunicación en línea. Un emoji de corazón debe interpretarse como un sentimiento positivo, mientras que el emoji de la pila de caca sin duda tendría una puntuación negativa. Esto no es un problema siempre y cuando trabajes con bibliotecas de sentimiento que asignen puntuaciones a los emojis más comunes, de la misma manera que lo harían con palabras de jerga populares.
Jerga
El lenguaje está en constante evolución y eso incluye el léxico de jerga de cada generación, como “smol”, “stan”, “woke” y “salty”. Al igual que con los emojis, tu herramienta de análisis de sentimiento podría tener dificultades aquí.
Después de todo, parece que cada pocos meses surge una nueva palabra de jerga inspirada en memes. La jerga que perdura y puede aparecer en reseñas o en redes sociales puede ser añadida a la biblioteca de sentimientos y asignársele una puntuación positiva, neutra o negativa... ¡igual que cualquier otra palabra!
Nuestro diccionario de lenguaje siempre está evolucionando. Recuerdo las miradas de fastidio colectivo cuando YOLO (You Only Live Once, para los no iniciados) entró al diccionario en línea de Oxford en 2014. Sin embargo, los analizadores de sentimiento tienen esperanza: esto significa que los diccionarios de aprendizaje automático también pueden evolucionar. Las mejores herramientas de análisis de sentimiento admitirán nueva jerga mediante actualizaciones de software o la entrada manual del usuario.
Punto Intermedio: ¿Qué es el Sentimiento Neutro?
Una forma de obtener una buena base para entrenar el aprendizaje automático es dedicar algo de tiempo a pensar qué significa exactamente “neutro”. He dedicado mucho tiempo a hablar de ejemplos positivos y negativos para un analizador de sentimiento, pero esos dos sentimientos dependen de tener un neutro claramente definido. Es justo decir que el neutro es una de las partes más importantes del proceso.
¿Pero cómo se define el neutro? Aquí tienes 3 maneras de empezar:
- Incluye pruebas objetivas. Recuerda el ejemplo anterior: esta camisa es azul. El coche es amarillo. El árbol tiene hojas. Todas son afirmaciones objetivas basadas en hechos. No tienen ningún sentimiento positivo o negativo.
- Filtra todo lo irrelevante. La información irrelevante no te ayudará a determinar si algo es positivo o negativo. Por ejemplo, si una reseña de una secadora de ropa comienza con una anécdota, como "Fui al sótano y metí la ropa mojada en la secadora solo para descubrir que estaba rota", esta información no es relevante para el sentimiento de la reseña en sí y puede ser excluida.
- Ignora las sugerencias. Esta no es una regla inquebrantable, pero muchas veces las sugerencias no aportan al sentimiento. Si encuentras reseñas en las que los usuarios desean que un artículo tenga alguna característica, eso no te dice mucho sobre el sentimiento del cliente. Podrías pensar inicialmente que es negativo, y a veces lo es. Por ejemplo, “El filete estaba horrible, ojalá no lo hubieran sobrecocinado” es negativo. Pero los deseos y anhelos también pueden aparecer en reseñas positivas: “La tarta estaba deliciosa, ojalá hubiera más” o “Me encanta todo de esta camisa, ojalá viniera en 100 colores”.
Tener un neutro claramente definido es la base de todo análisis de sentimiento. Cada análisis comienza en neutro, después de todo, y luego se inclina hacia lo positivo o negativo a medida que se valora el texto.
Conclusión
El análisis de sentimiento es un tipo de herramienta de aprendizaje automático. El aprendizaje automático trabaja con el procesamiento de lenguaje natural para formar los elementos básicos del proceso de análisis de sentimiento.
Sin embargo, el aprendizaje automático es simplemente la manera en la que las computadoras aprenden y no siempre tiene que estar vinculado al análisis de sentimientos. También existe aprendizaje automático para chatbots de servicio al cliente, previsión empresarial, motores de recomendación de productos, precios dinámicos de productos y más.
Suscríbete al boletín de The CX Lead para obtener más información experta sobre experiencia del cliente y experiencia de usuario.
Lectura relacionada: Los 10 mejores softwares de soporte al cliente para PYMES y grandes empresas
