Análisis de los sentimientos - Sentiment analysis

El análisis de sentimientos (también conocido como minería de opiniones o IA de emociones ) es el uso del procesamiento del lenguaje natural , análisis de texto , lingüística computacional y biometría para identificar, extraer, cuantificar y estudiar sistemáticamente estados afectivos e información subjetiva. El análisis de sentimientos se aplica ampliamente a los materiales de voz del cliente , como revisiones y respuestas a encuestas, redes sociales y en línea, y materiales de atención médica para aplicaciones que van desde el marketing hasta el servicio al cliente y la medicina clínica.

Ejemplos de

El objetivo y los desafíos del análisis de sentimientos se pueden mostrar a través de algunos ejemplos simples.

Casos sencillos

  • Coronet tiene las mejores líneas de cruceros de todo el día.
  • Bertram tiene un casco en V profundo y atraviesa fácilmente los mares.
  • Los cruceros diurnos de colores pastel de los años 80 de Florida son feos.
  • No me gustan los cruceros de cabina viejos .

Ejemplos más desafiantes

  • No me disgustan los cruceros de cabina. ( Manejo de negación )
  • No me gustan las motos de agua no es lo mío. (Negación, orden de palabras invertido )
  • A veces realmente odio las semirrígidas . ( Adverbial modifica el sentimiento)
  • ¡Realmente me encantaría salir con este clima! (Posiblemente sarcástico )
  • Chris Craft es más guapo que Limestone. (Dos marcas , identificar el objetivo de la actitud es difícil).
  • Chris Craft es más atractivo que Limestone, pero Limestone proyecta navegabilidad y confiabilidad. (Dos actitudes, dos marcas).
  • La película es sorprendente con muchos giros de trama inquietantes. (Término negativo usado en sentido positivo en ciertos dominios).
  • Debería ver su menú de postres decadente. (El término actitudinal ha cambiado de polaridad recientemente en ciertos dominios)
  • Me encanta mi móvil, pero no se lo recomendaría a ninguno de mis compañeros. (Sentimiento positivo calificado, difícil de categorizar)
  • ¡El concierto de la semana que viene estará bien, koide9! ("Quoi de neuf?", Francés para "¿qué hay de nuevo?". Los términos recién acuñados pueden ser muy actitudinales pero volátiles en polaridad y, a menudo, fuera del vocabulario conocido).

Tipos

Una tarea básica en el análisis de sentimientos es clasificar la polaridad de un texto dado a nivel de documento, oración o característica / aspecto, ya sea que la opinión expresada en un documento, una oración o una característica / aspecto de entidad sea positiva, negativa o neutral. La clasificación de sentimiento avanzada, "más allá de la polaridad", se centra, por ejemplo, en estados emocionales como el disfrute, la ira, el disgusto, la tristeza, el miedo y la sorpresa.

Los precursores del análisis sentimental incluyen el General Inquirer, que proporcionó pistas para cuantificar patrones en el texto y, por separado, la investigación psicológica que examinó el estado psicológico de una persona basándose en el análisis de su comportamiento verbal.

Posteriormente, el método descrito en una patente por Volcani y Fogel, analizó específicamente el sentimiento e identificó palabras y frases individuales en el texto con respecto a diferentes escalas emocionales. Un sistema actual basado en su trabajo, llamado EffectCheck, presenta sinónimos que pueden usarse para aumentar o disminuir el nivel de emoción evocada en cada escala.

Muchos otros esfuerzos posteriores fueron menos sofisticados, utilizando una mera visión polar del sentimiento, de positivo a negativo, como el trabajo de Turney y Pang, quienes aplicaron diferentes métodos para detectar la polaridad de las reseñas de productos y las reseñas de películas, respectivamente. Este trabajo está a nivel de documento. También se puede clasificar la polaridad de un documento en una escala multidireccional, lo que intentaron Pang y Snyder, entre otros: Pang y Lee ampliaron la tarea básica de clasificar una reseña de una película como positiva o negativa para predecir las calificaciones de estrellas en un 3- o una escala de 4 estrellas, mientras que Snyder realizó un análisis en profundidad de las reseñas de restaurantes, prediciendo calificaciones para varios aspectos del restaurante dado, como la comida y el ambiente (en una escala de cinco estrellas).

Los primeros pasos para unir varios enfoques (aprendizaje, léxico, basado en el conocimiento, etc.) se tomaron en el Simposio de primavera de la AAAI de 2004, donde lingüistas, informáticos y otros investigadores interesados ​​alinearon primero sus intereses y propusieron tareas compartidas y conjuntos de datos de referencia para la Investigación computacional sistemática sobre el afecto, el atractivo, la subjetividad y el sentimiento en el texto.

Aunque en la mayoría de los métodos de clasificación estadística, la clase neutra se ignora bajo el supuesto de que los textos neutrales se encuentran cerca del límite del clasificador binario, varios investigadores sugieren que, como en todo problema de polaridad, deben identificarse tres categorías. Además, se puede demostrar que clasificadores específicos como Max Entropy y SVM pueden beneficiarse de la introducción de una clase neutral y mejorar la precisión general de la clasificación. En principio, hay dos formas de operar con una clase neutra. O bien, el algoritmo procede identificando primero el lenguaje neutral, filtrándolo y luego evaluando el resto en términos de sentimientos positivos y negativos, o construye una clasificación de tres vías en un solo paso. Este segundo enfoque a menudo implica estimar una distribución de probabilidad sobre todas las categorías (por ejemplo, clasificadores ingenuos de Bayes implementados por el NLTK ). El uso de una clase neutral y cómo hacerlo depende de la naturaleza de los datos: si los datos están claramente agrupados en un lenguaje neutral, negativo y positivo, tiene sentido filtrar el lenguaje neutral y enfocarse en la polaridad entre sentimientos positivos y negativos. Si, por el contrario, los datos son en su mayoría neutrales con pequeñas desviaciones hacia el afecto positivo y negativo, esta estrategia haría más difícil distinguir claramente entre los dos polos.

Un método diferente para determinar el sentimiento es el uso de un sistema de escala mediante el cual a las palabras comúnmente asociadas con tener un sentimiento negativo, neutral o positivo con ellas se les asigna un número asociado en una escala de −10 a +10 (del más negativo al más positivo) o simplemente de 0 a un límite superior positivo como +4. Esto hace posible ajustar el sentimiento de un término dado en relación con su entorno (generalmente en el nivel de la oración). Cuando se analiza un fragmento de texto no estructurado utilizando el procesamiento del lenguaje natural , cada concepto en el entorno especificado recibe una puntuación basada en la forma en que las palabras de sentimiento se relacionan con el concepto y su puntuación asociada. Esto permite avanzar hacia una comprensión más sofisticada del sentimiento, porque ahora es posible ajustar el valor del sentimiento de un concepto en relación con las modificaciones que pueden rodearlo. Las palabras, por ejemplo, que intensifican, relajan o niegan el sentimiento expresado por el concepto pueden afectar su puntuación. Alternativamente, los textos pueden recibir un puntaje de fuerza de sentimiento positivo y negativo si el objetivo es determinar el sentimiento en un texto en lugar de la polaridad y fuerza general del texto.

Hay varios otros tipos de análisis de sentimientos como: análisis de sentimiento basado en aspectos, análisis de sentimiento de calificación (positivo, negativo, neutral), análisis de sentimiento multilingüe y detección de emociones.

Identificación de subjetividad / objetividad

Esta tarea se define comúnmente como clasificar un texto dado (generalmente una oración) en una de dos clases: objetiva o subjetiva. Este problema a veces puede ser más difícil que la clasificación de polaridad. La subjetividad de las palabras y frases puede depender de su contexto y un documento objetivo puede contener oraciones subjetivas (por ejemplo, un artículo de noticias que cita las opiniones de las personas). Además, como lo menciona Su, los resultados dependen en gran medida de la definición de subjetividad utilizada al anotar textos. Sin embargo, Pang demostró que eliminar oraciones objetivas de un documento antes de clasificar su polaridad ayudó a mejorar el rendimiento.

La identificación subjetiva y objetiva, las subtareas emergentes del análisis de sentimientos para utilizar características sintácticas y semánticas y el conocimiento del aprendizaje automático para identificar una oración o documento son hechos u opiniones. La conciencia de reconocer los hechos y las opiniones no es reciente, posiblemente habiendo sido presentado por primera vez por Carbonell en la Universidad de Yale en 1979.

El término objetivo se refiere a que el incidente lleve información fáctica.

  • Ejemplo de una oración objetiva: "Para ser elegido presidente de los Estados Unidos, un candidato debe tener al menos treinta y cinco años de edad".

El término subjetivo describe que el incidente contiene información no fáctica en varias formas, como opiniones personales, juicios y predicciones. También conocidos como 'estados privados' mencionados por Quirk et al. En el siguiente ejemplo, refleja un estado privado "Nosotros, los estadounidenses". Además, la entidad objetivo comentada por las opiniones puede tomar varias formas, desde productos tangibles hasta asuntos temáticos intangibles mencionados en Liu (2010). Además, Liu (2010) observó tres tipos de actitudes: 1) opiniones positivas, 2) opiniones neutrales y 3) opiniones negativas.

  • Ejemplo de una oración subjetiva: "Nosotros, los estadounidenses, debemos elegir un presidente que sea maduro y que sea capaz de tomar decisiones acertadas".

Este análisis es un problema de clasificación.

Las colecciones de palabras o indicadores de frases de cada clase se definen para localizar patrones deseables en texto sin anotaciones. Para la expresión subjetiva, se ha creado una lista de palabras diferente. En Riloff et al. (2003), varios investigadores del campo del procesamiento lingüístico y natural del lenguaje han desarrollado listas de indicadores subjetivos en palabras o frases. Debe crearse un diccionario de reglas de extracción para medir expresiones dadas. A lo largo de los años, en la detección subjetiva, la extracción de características progresa desde la curación manual de características en 1999 hasta el aprendizaje de características automatizadas en 2005. Por el momento, los métodos de aprendizaje automatizados pueden separarse aún más en aprendizaje automático supervisado y no supervisado . Los investigadores académicos han explorado ampliamente la extracción de patrones con el proceso de aprendizaje automático con texto anotado y sin anotar.

Sin embargo, los investigadores reconocieron varios desafíos en el desarrollo de conjuntos fijos de reglas para las expresiones de manera respetable. Gran parte de los desafíos en el desarrollo de reglas provienen de la naturaleza de la información textual. Varios investigadores han reconocido seis desafíos: 1) expresiones metafóricas, 2) discrepancias en los escritos, 3) sensibles al contexto, 4) palabras representadas con menos usos, 5) sensibles al tiempo y 6) volumen cada vez mayor.

  1. Expresiones metafóricas. El texto contiene expresión metafórica que puede repercutir en el desempeño de la extracción. Además, las metáforas adoptan diferentes formas, lo que puede haber contribuido al aumento de la detección.
  2. Discrepancias en los escritos. Para el texto obtenido de Internet, las discrepancias en el estilo de escritura de los datos de texto específicos involucran distintos géneros y estilos de escritura.
  3. Sensible al contexto. La clasificación puede variar según la subjetividad u objetividad de las oraciones anteriores y siguientes.
  4. Atributo sensible al tiempo. La tarea se ve desafiada por el atributo sensible al tiempo de algunos datos textuales. Si un grupo de investigadores quiere confirmar un hecho en las noticias, necesitan más tiempo para la validación cruzada, de lo que las noticias quedan desactualizadas.
  5. Palabras clave con menos usos.
  6. Volumen en constante crecimiento. La tarea también se ve desafiada por el gran volumen de datos textuales. La naturaleza cada vez mayor de los datos textuales hace que la tarea sea abrumadoramente difícil para que los investigadores la completen a tiempo.

Anteriormente, la investigación se centró principalmente en la clasificación a nivel de documentos. Sin embargo, la clasificación de un nivel de documento tiene menos precisión, ya que un artículo puede tener diversos tipos de expresiones involucradas. La evidencia de la investigación sugiere un conjunto de artículos de noticias que se espera que dominen por la expresión objetiva, mientras que los resultados muestran que consistió en más del 40% de expresión subjetiva.

Para superar esos desafíos, los investigadores concluyen que la eficacia del clasificador depende de la precisión de los patrones del aprendiz. Y el alumno se alimenta con grandes volúmenes de datos de capacitación anotados que superaron a los capacitados en funciones subjetivas menos completas. Sin embargo, uno de los principales obstáculos para ejecutar este tipo de trabajo es generar un gran conjunto de datos de oraciones anotadas manualmente. El método de anotación manual se ha visto menos favorecido que el aprendizaje automático por tres razones:

  1. Variaciones en comprensiones. En la tarea de anotación manual, el desacuerdo sobre si una instancia es subjetiva u objetiva puede ocurrir entre los anotadores debido a la ambigüedad de los idiomas.
  2. Errores humanos. La tarea de anotación manual es una tarea meticulosa, requiere una concentración intensa para terminar.
  3. Pérdida de tiempo. La tarea de anotación manual es un trabajo asiduo. Riloff (1996) muestra que 160 textos cuestan 8 horas para que un anotador los termine.

Todas estas razones mencionadas pueden afectar la eficiencia y eficacia de la clasificación subjetiva y objetiva. En consecuencia, se diseñaron dos métodos de arranque para aprender patrones lingüísticos a partir de datos de texto no anotados. Ambos métodos comienzan con un puñado de palabras iniciales y datos textuales sin anotar.

  1. Meta-Bootstrapping de Riloff y Jones en 1999. Nivel uno: Genere patrones de extracción basados ​​en las reglas predefinidas y los patrones extraídos por el número de palabras semilla que contiene cada patrón. Nivel dos: Las 5 palabras principales se marcarán y se agregarán al diccionario. Repetir.
  2. Basilisk ( B ootstrapping A pproach to S emantic L exicon I nduction usando S emantic K nowledge) por Thelen y Riloff. Paso uno: generar patrones de extracción Paso dos: mover los mejores patrones del conjunto de patrones al conjunto de palabras candidatas. Paso tres: las 10 palabras principales se marcarán y se agregarán al diccionario. Repetir.

En general, estos algoritmos destacan la necesidad de un reconocimiento y extracción automática de patrones en tareas subjetivas y objetivas.

El clasificador subjetivo y de objetos puede mejorar las aplicaciones servales del procesamiento del lenguaje natural. Uno de los principales beneficios del clasificador es que popularizó la práctica de los procesos de toma de decisiones basados ​​en datos en varias industrias. Según Liu, las aplicaciones de la identificación subjetiva y objetiva se han implementado en los negocios, la publicidad, los deportes y las ciencias sociales.

  • Clasificación de reseñas en línea: en la industria empresarial, el clasificador ayuda a la empresa a comprender mejor los comentarios sobre el producto y los razonamientos detrás de las reseñas.
  • Predicción del precio de las acciones: en la industria financiera, el más clásico ayuda al modelo de predicción procesando información auxiliar de las redes sociales y otra información textual de Internet. Estudios previos sobre el precio de las acciones japonesas realizados por Dong et.al. indica que el modelo con módulo subjetivo y objetivo puede funcionar mejor que aquellos sin esta parte.
  • Análisis de redes sociales.
  • Clasificación de los comentarios de los estudiantes.
  • Resumen de documentos: el clasificador puede extraer comentarios específicos del objetivo y recopilar opiniones hechas por una entidad en particular.
  • Respuesta a preguntas complejas. El clasificador puede diseccionar las preguntas complejas clasificando el tema del lenguaje o el objetivo objetivo y enfocado. En la investigación de Yu et al. (2003), el investigador desarrolló un nivel de oración y documento que agrupaba las piezas de opinión de identidad.
  • Aplicaciones específicas de dominio.
  • Análisis de correo electrónico: el clasificador subjetivo y objetivo detecta el spam rastreando patrones de lenguaje con palabras de destino.

Basado en características / aspectos

Se refiere a determinar las opiniones o sentimientos expresados ​​sobre diferentes características o aspectos de entidades, por ejemplo, de un teléfono celular, una cámara digital o un banco. Una característica o aspecto es un atributo o componente de una entidad, por ejemplo, la pantalla de un teléfono celular, el servicio de un restaurante o la calidad de imagen de una cámara. La ventaja del análisis de sentimientos basado en características es la posibilidad de capturar matices sobre objetos de interés. Diferentes características pueden generar diferentes respuestas de sentimiento, por ejemplo, un hotel puede tener una ubicación conveniente, pero comida mediocre. Este problema involucra varios subproblemas, por ejemplo, identificar entidades relevantes, extraer sus características / aspectos y determinar si una opinión expresada sobre cada característica / aspecto es positiva, negativa o neutral. La identificación automática de características se puede realizar con métodos sintácticos, con modelado de temas o con aprendizaje profundo . Se pueden encontrar discusiones más detalladas sobre este nivel de análisis de sentimientos en el trabajo de Liu.

Métodos y características

Los enfoques existentes para el análisis de sentimientos se pueden agrupar en tres categorías principales: técnicas basadas en el conocimiento, métodos estadísticos y enfoques híbridos. Las técnicas basadas en el conocimiento clasifican el texto por categorías de afecto basándose en la presencia de palabras de afecto inequívocas como feliz, triste, asustado y aburrido. Algunas bases de conocimiento no solo enumeran palabras afectivas obvias, sino que también asignan a palabras arbitrarias una probable "afinidad" a emociones particulares. Los métodos estadísticos aprovechan elementos del aprendizaje automático , como el análisis semántico latente , las máquinas vectoriales de soporte , la " bolsa de palabras ", la " información mutua puntual " para la orientación semántica y el aprendizaje profundo . Los métodos más sofisticados intentan detectar al portador de un sentimiento (es decir, la persona que mantiene ese estado afectivo) y al objetivo (es decir, la entidad sobre la que se siente el afecto). Para extraer la opinión en contexto y obtener la característica sobre la que ha opinado el hablante, se utilizan las relaciones gramaticales de las palabras. Las relaciones de dependencia gramatical se obtienen mediante un análisis profundo del texto. Los enfoques híbridos aprovechan tanto el aprendizaje automático como elementos de la representación del conocimiento , como ontologías y redes semánticas, para detectar semánticas que se expresan de manera sutil, por ejemplo, a través del análisis de conceptos que no transmiten explícitamente información relevante, pero que están implícitamente vinculados. a otros conceptos que lo hacen.

Las herramientas de software de código abierto, así como una variedad de herramientas de análisis de sentimientos gratuitas y de pago, implementan aprendizaje automático , estadísticas y técnicas de procesamiento del lenguaje natural para automatizar el análisis de sentimientos en grandes colecciones de textos, incluidas páginas web, noticias en línea, grupos de discusión de Internet, reseñas en línea, blogs web y redes sociales. Los sistemas basados ​​en el conocimiento, por otro lado, hacen uso de los recursos disponibles públicamente para extraer la información semántica y afectiva asociada con los conceptos del lenguaje natural. El sistema puede ayudar a realizar el razonamiento afectivo de sentido común . El análisis de sentimiento también se puede realizar en contenido visual, es decir, imágenes y videos (consulte Análisis de sentimiento multimodal ). Uno de los primeros enfoques en esta dirección es SentiBank que utiliza una representación de un par de sustantivo adjetivo del contenido visual. Además, la gran mayoría de los enfoques de clasificación de sentimientos se basan en el modelo de bolsa de palabras, que ignora el contexto, la gramática e incluso el orden de las palabras . Los enfoques que analizan el sentimiento en función de cómo las palabras componen el significado de frases más largas han mostrado un mejor resultado, pero incurren en una sobrecarga de anotación adicional.

Se requiere un componente de análisis humano en el análisis de sentimientos, ya que los sistemas automatizados no pueden analizar las tendencias históricas del comentarista individual o de la plataforma y, a menudo, se clasifican incorrectamente en su sentimiento expresado. La automatización afecta aproximadamente al 23% de los comentarios que los humanos clasifican correctamente. Sin embargo, los humanos a menudo no están de acuerdo, y se argumenta que el acuerdo interhumano proporciona un límite superior que los clasificadores automatizados de sentimientos pueden alcanzar eventualmente.

Evaluación

La precisión de un sistema de análisis de sentimientos es, en principio, qué tan bien concuerda con los juicios humanos. Por lo general, esto se mide mediante medidas variantes basadas en la precisión y el recuerdo de las dos categorías objetivo de textos negativos y positivos. Sin embargo, según la investigación, los evaluadores humanos generalmente solo están de acuerdo en aproximadamente el 80% de las veces (consulte la confiabilidad entre evaluadores ). Por lo tanto, un programa que alcanza el 70% de precisión en la clasificación de sentimientos está funcionando casi tan bien como los humanos, aunque tal precisión no suene impresionante. Si un programa fuera "correcto" el 100% del tiempo, los humanos todavía estarían en desacuerdo con él aproximadamente el 20% del tiempo, ya que no están de acuerdo en ninguna respuesta.

Por otro lado, los sistemas informáticos cometerán errores muy diferentes a los de los evaluadores humanos y, por lo tanto, las cifras no son del todo comparables. Por ejemplo, un sistema informático tendrá problemas con las negaciones, las exageraciones, las bromas o el sarcasmo, que normalmente son fáciles de manejar para un lector humano: algunos errores que comete un sistema informático le parecerán demasiado ingenuos. En general, la utilidad para las tareas comerciales prácticas del análisis de sentimientos, tal como se define en la investigación académica, ha sido cuestionada, sobre todo porque el modelo unidimensional simple de sentimiento de negativo a positivo produce bastante poca información procesable para un cliente preocupado por la efecto del discurso público en, por ejemplo, la marca o la reputación corporativa.

Para adaptarse mejor a las necesidades del mercado, la evaluación del análisis de sentimientos se ha trasladado a medidas más basadas en tareas, formuladas junto con representantes de agencias de relaciones públicas y profesionales de investigación de mercado. Por ejemplo, el enfoque en el conjunto de datos de evaluación RepLab está menos en el contenido del texto en consideración y más en el efecto del texto en cuestión en la reputación de la marca .

Debido a que la evaluación del análisis de sentimientos se basa cada vez más en tareas, cada implementación necesita un modelo de entrenamiento separado para obtener una representación más precisa del sentimiento para un conjunto de datos dado.

web 2.0

El auge de las redes sociales como blogs y redes sociales ha alimentado el interés en el análisis de sentimientos. Con la proliferación de reseñas, valoraciones, recomendaciones y otras formas de expresión online, la opinión online se ha convertido en una especie de moneda virtual para las empresas que buscan comercializar sus productos, identificar nuevas oportunidades y gestionar su reputación. A medida que las empresas buscan automatizar el proceso de filtrar el ruido, comprender las conversaciones, identificar el contenido relevante y actuar de manera adecuada, muchas ahora están mirando hacia el campo del análisis de sentimientos. Para complicar aún más el asunto, está el surgimiento de plataformas de redes sociales anónimas como 4chan y Reddit . Si la web 2.0 se trataba de democratizar la publicación, entonces la siguiente etapa de la web podría basarse en la democratización de la minería de datos de todo el contenido que se publica.

Un paso hacia este objetivo se logra en la investigación. Varios equipos de investigación en universidades de todo el mundo se centran actualmente en comprender la dinámica del sentimiento en las comunidades electrónicas a través del análisis del sentimiento. El proyecto CyberEmotions , por ejemplo, identificó recientemente el papel de las emociones negativas en el impulso de las discusiones en las redes sociales.

El problema es que la mayoría de los algoritmos de análisis de sentimientos utilizan términos simples para expresar sentimientos sobre un producto o servicio. Sin embargo, los factores culturales, los matices lingüísticos y los contextos diferentes hacen que sea extremadamente difícil convertir una cadena de texto escrito en un simple sentimiento a favor o en contra. El hecho de que los humanos a menudo no estén de acuerdo con el sentimiento del texto ilustra lo grande que es para las computadoras hacer esto bien. Cuanto más corta sea la cadena de texto, más difícil se vuelve.

Aunque las cadenas de texto cortas pueden ser un problema, el análisis de sentimientos dentro del microblogging ha demostrado que Twitter puede verse como un indicador en línea válido del sentimiento político. El sentimiento político de los tweets demuestra una estrecha correspondencia con las posiciones políticas de los partidos y los políticos, lo que indica que el contenido de los mensajes de Twitter refleja de manera plausible el panorama político fuera de línea. Además, también se ha demostrado que el análisis de sentimientos en Twitter captura el estado de ánimo del público detrás de los ciclos de reproducción humana a nivel mundial, así como otros problemas de relevancia para la salud pública, como las reacciones adversas a los medicamentos.

Si bien el análisis de sentimientos ha sido popular para los dominios donde los autores expresan su opinión de manera bastante explícita ("la película es increíble"), como las redes sociales y las reseñas de productos, solo recientemente se diseñaron métodos sólidos para otros dominios donde el sentimiento es fuertemente implícito o indirecto. Por ejemplo, en los artículos de noticias, principalmente debido a la objetividad periodística esperada, los periodistas a menudo describen acciones o eventos en lugar de indicar directamente la polaridad de una información. Los enfoques anteriores que utilizaban diccionarios o funciones de aprendizaje automático poco profundas no podían captar el "significado entre líneas", pero recientemente los investigadores han propuesto un enfoque y un conjunto de datos basados ​​en el aprendizaje profundo para poder analizar el sentimiento en los artículos de noticias.

Aplicación en sistemas de recomendación

Para un sistema de recomendación , se ha demostrado que el análisis de sentimientos es una técnica valiosa. Un sistema de recomendación tiene como objetivo predecir la preferencia por un artículo de un usuario objetivo. Los sistemas de recomendación convencionales funcionan con un conjunto de datos explícitos. Por ejemplo, el filtrado colaborativo funciona en la matriz de clasificación y el filtrado basado en contenido funciona en los metadatos de los elementos.

En muchos servicios de redes sociales o sitios web de comercio electrónico, los usuarios pueden proporcionar revisiones de texto, comentarios o comentarios sobre los elementos. Este texto generado por el usuario proporciona una rica fuente de opiniones de los usuarios sobre numerosos productos y artículos. Potencialmente, para un artículo, dicho texto puede revelar tanto la característica / aspectos relacionados del artículo como los sentimientos de los usuarios sobre cada característica. Las características / aspectos del elemento descritos en el texto juegan el mismo papel que los metadatos en el filtrado basado en contenido , pero los primeros son más valiosos para el sistema de recomendación. Dado que los usuarios mencionan ampliamente estas características en sus reseñas, pueden verse como las características más cruciales que pueden influir significativamente en la experiencia del usuario en el artículo, mientras que los metadatos del artículo (generalmente proporcionados por los productores en lugar de los consumidores) puede ignorar las funciones que preocupan a los usuarios. Para diferentes elementos con características comunes, un usuario puede expresar diferentes opiniones. Además, una característica del mismo artículo puede recibir diferentes sentimientos de diferentes usuarios. Los sentimientos de los usuarios sobre las funciones se pueden considerar como una puntuación de calificación multidimensional, que refleja su preferencia por los elementos.

En función de las características / aspectos y los sentimientos extraídos del texto generado por el usuario, se puede construir un sistema de recomendación híbrido. Hay dos tipos de motivación para recomendar un artículo candidato a un usuario. La primera motivación es que el artículo candidato tiene numerosas características en común con los artículos preferidos del usuario, mientras que la segunda motivación es que el artículo candidato recibe una alta opinión sobre sus características. Para un artículo preferido, es razonable creer que los artículos con las mismas características tendrán una función o utilidad similar. Por lo tanto, es probable que el usuario prefiera estos elementos. Por otro lado, para una característica compartida de dos elementos candidatos, otros usuarios pueden dar un sentimiento positivo a uno de ellos mientras dan un sentimiento negativo a otro. Claramente, el elemento de alta evaluación debe recomendarse al usuario. Con base en estas dos motivaciones, se puede construir una puntuación de clasificación combinada de similitud y clasificación de sentimiento para cada elemento candidato.

Excepto por la dificultad del análisis de sentimientos en sí, la aplicación del análisis de sentimientos en reseñas o comentarios también enfrenta el desafío del spam y las reseñas sesgadas. Una dirección de trabajo se centra en evaluar la utilidad de cada revisión. La revisión o la retroalimentación mal redactadas no son útiles para el sistema de recomendación. Además, una reseña puede diseñarse para obstaculizar las ventas de un producto de destino y, por lo tanto, ser perjudicial para el sistema de recomendación, incluso si está bien redactada.

Los investigadores también encontraron que las formas largas y cortas de texto generado por el usuario deben tratarse de manera diferente. Un resultado interesante muestra que las reseñas breves son a veces más útiles que las extensas, porque es más fácil filtrar el ruido en un texto breve. Para el texto de formato largo, la extensión creciente del texto no siempre trae un aumento proporcional en el número de características o sentimientos en el texto.

Lamba & Madhusudhan introducen una forma incipiente de satisfacer las necesidades de información de los usuarios de bibliotecas de hoy al volver a empaquetar los resultados del análisis de sentimientos de plataformas de redes sociales como Twitter y proporcionarlo como un servicio consolidado basado en el tiempo en diferentes formatos. Además, proponen una nueva forma de realizar marketing en bibliotecas utilizando la minería de redes sociales y el análisis de sentimientos.

Ver también

Referencias