El análisis de sentimiento también es conocido como minería de opinión o Opinion Mining y es el proceso de determinar el tono emocional que hay detrás de una serie de palabras que se utilizan para intentar entender las actitudes, opiniones y emociones expresadas gracias al Machine Learning ¿En qué consiste?
El Análisis de sentimiento o Opinion Mining
El Análisis de sentimiento hace referencia al uso de procesamiento de lenguaje natural (NLP), lingüística computacional y análisis de texto (rama específica de la minería de datos) para identificar y extraer información subjetiva de los recursos.
Por si llevara a error es importante resaltar que el Análisis de Sentimiento es un tratamiento que se basa en relaciones estadísticas y de asociación, no en análisis lingüístico como tal.
Para realizar un Análisis de Sentimiento se utiliza un DataSets de reviews, donde se utilizan algoritmos como Bag Of Words (BOW) o Tf-idf que es una mejora que se puede aplicar a Bag Of Words. Y por ultimo y no por ello menos importante, BERT (Bidirectional Encoder Representations For Transformers).
Bag Of Words
Bag Of Words o Modelo bolsa de palabras es un método que se utiliza en el procesado del lenguaje para representar documentos ignorando el orden de las palabras, en este caso se utiliza para ver qué palabras aparecen en una frase y ver si esas palabras contribuyen de forma general a formar una review positiva o negativa. Una vez terminada la review se aplica un algoritmo clasificador KNN, que determina si esa muestra tiene nuevos “vecinos” de un tipo u otro y asigna la clase por mayoría.
El Análisis de Sentimiento es un tratamiento que se basa en relaciones estadísticas y de asociación
Tf-idf
Tf-idf es una medida numérica que expresa lo relevante que es una palabra para un documento. El valor Tf-idf aumenta proporcionalmente al número de veces que una palabra aparece en el documento, sin embargo, es compensada por la frecuencia de la palabra en la colección de documentos, lo que permite esclarecer que algunas palabras son generalmente más comunes que otras.
BERT
Para terminar, BERT o Representación de Codificador Bidireccional de Transformadores, es un algoritmo desarrollado por Google, que tiene como objetivo interpretar el lenguaje de nuestras búsquedas de una forma más natural (PNL). Entre otras cosas se diferencia de BOW en que tiene en cuenta el orden de las palabras, suposición y contexto. Destacar que BERT se ha convertido en uno de los modelos de procesamiento del lenguaje natural más influyentes y ampliamente utilizados, y ha tenido un impacto significativo en el campo de la investigación en NLP (procesamiento del lenguaje natural).
BERT se usa en el campo del procesamiento del lenguaje natural (NLP) para una amplia gama de tareas, incluyendo clasificación de texto, extracción de información, respuesta a preguntas o generación de texto.
Por otra parte, sabías que BERT y otros modelos de procesamiento del lenguaje natural se pueden utilizar en medicina para una variedad de tareas. El uso de BERT en medicina puede mejorar la eficiencia y la precisión en la toma de decisiones médicas, y ayudar a los profesionales de la salud a acceder a información valiosa más rápidamente.
En definitiva, el proceso de usar el análisis de sentimiento en Machine Learning es para determinar las emociones positivas o negativas que tienen las personas de una red respecto a un producto, noticia, tema, producto, etc.