MODELO PARA EL ANÁLISIS DE SENTIMIENTOS DEL BANCO DE ENCUESTAS CON PREGUNTAS SOBRE CORONAVIRUS DE LA OMS EMPLEANDO PRINCIPIOS DE MINERÍA DE TEXTOS

Autores/as

  • Navira Gissela Angulo Murillo Universidad Laica Eloy Alfaro de Manabí
  • Alex Alfonso Sánchez Arteaga
  • Gabriel Rodolfo García Murillo Universidad Técnica de Manabí
  • Wilton Rafael Saltos Rivas Universidad Técnica de Manabí

Resumen

La presente investigación tiene la finalidad de elaborar un modelo de Análisis de Sentimientos de un Banco de 250 instrumentos de recolección de Datos sobre Coronavirus, mismo que es guardado como referencia en el sitio web oficial de la Organización Mundial de la Salud, OMS. Para esto se ha empleado fundamentos de Minería de Textos mediante la plataforma Open Source de Minería de Datos, Orange, construyendo un modelo que analiza el Corpus de documentos y genera diagramas de distribución de sentimientos según la herramienta Valence Aware Dictionary and Sentiment Reasoner, VADER, y nube de palabras que ilustra el peso de las palabras según su frecuencia en el Corpus. Los resultados reflejan que las emociones Neutras son las que alcanzan valores más altos en todos los tipos de preguntas, las Negativas y Positivas guardan cierto patrón y alcanzan niveles medios en todos los tipos de preguntas, en tanto que las emociones Combinadas no tienen un patrón establecido, aunque son más frecuentes en preguntas relacionadas al Entorno, Conocimiento y Tratamiento de Salud de los posibles encuestados. Es de indicar que los tipos de preguntas son siete: Entorno, Exposición, Impacto, Conocimiento, Atención médica, Percepción y Miscelánea.PALABRAS CLAVE: Big Data; Minería de Datos; Orange; Minería de Textos; Coronavirus.MODEL FOR THE ANALYSIS OF FEELINGS OF THE SURVEY BANK WITH QUESTIONS ON WHO CORONAVIRUSES USING TEXT MINING PRINCIPLESABSTRACTThis is an academic paper, the purpose of which is to develop a Sentiment Analysis model of a Bank of 250 instruments for data collection on Coronavirus, which is kept as a reference on the official website of the World Health Organization, WHO . For this, Text Mining fundamentals have been used through the Open Source Data Mining platform, Orange, building a model that analyzes the Corpus of documents and generates diagrams of sentiment distribution according to the Valence Aware Dictionary and Sentiment Reasoner tool, VADER, and word cloud that illustrates the weight of words according to their frequency in Corpus. The results reflect that the Neutral emotions are those that reach higher values in all types of questions, the Negative and Positive ones maintain a certain pattern and reach medium levels in all types of questions, while the Combined emotions do not have an established pattern , although they are more frequent in questions related to the Environment, Knowledge and Treatment of Health of the possible respondents. It is to indicate that the types of questions are seven: Environment, Exposure, Impact, Knowledge, Medical attention, Perception and Miscellaneous.KEYWORDS: Big Data; Data Mining; Orange; Text Mining; Coronavirus.

Descargas

Los datos de descargas todavía no están disponibles.

Biografía del autor/a

Navira Gissela Angulo Murillo, Universidad Laica Eloy Alfaro de Manabí

Ingenieria en Sistemas, Magíster en Auditoría de Tecnologías de la Información en la Universidad de Especialidades Espíritu Santo - Ecuador, Magíster en Gestión Estratégica de Tecnologías de la Información y Comunicación en la Universidad Nacional de Piura - Perú. Doctorando en Ciencias Informáticas en la Universidad Nacional La Plata – Argentina. Docente y Especialista en Planificación en la Universidad Laica Eloy Alfaro de Manabí, Dirección de Planificación, Proyectos y Desarrollo Institucional, Ecuador.     

Alex Alfonso Sánchez Arteaga

Abogado de los Juzgados y Tribunales de la República, Magíster en Derecho de Empresa en la Universidad de Especialidades Espíritu Santo – Ecuador, abogado de libre ejercicio, Ecuador   

Gabriel Rodolfo García Murillo, Universidad Técnica de Manabí

Licenciado en ciencias de la educación – Analista en Sistemas Informáticos, Magister en Administración de Telecomunicaciones, Docente tiempo completo de la Universidad Técnica de Manabí, Doctorando de la Universidad de Córdoba - España, Vicedecano en la Facultad de Filosofía, Letras y Ciencias de la Educación – UTM, Departamento de Filosofía- Universidad Técnica de Manabí, Portoviejo, Manabí, Ecuador.   

Wilton Rafael Saltos Rivas, Universidad Técnica de Manabí

Ingeniero en Sistemas, Magister en Administración de Telecomunicaciones, Docente tiempo completo de la Universidad Técnica de Manabí, Doctorando de la Universidad de Córdoba – España. Departamento de Filosofía – Universidad Técnica de Manabí, Portoviejo, Manabí, Ecuador. 

Citas

Amala, G. (2019). Orange tool approach for comparative analysis of supervised learning algorithm in classification mining. Journal of Analysis and Computation, 13(1), 1–10.

Bird, S., Klein, E., & Loper, E. (2008). NLTK Documentation. Online: Accessed April.

Jin, Y. (2017). Development of word cloud generator software based on python. Procedia Engineering, 174, 788–792.

Manguri, K., Ramadhan, R., & Mohammed Amin, P. (2020). Twitter Sentiment Analysis on Worldwide COVID-19 Outbreaks. Kurdistan Journal of Applied Research, 54–65. https://doi.org/10.24017/covid.8

Newman, H., & Joyner, D. (2018). Sentiment analysis of student evaluations of teaching. International Conference on Artificial Intelligence in Education, 246–250.

Peng, L., Yang, W., Zhang, D., Zhuge, C., & Hong, L. (2020). Epidemic analysis of COVID-19 in China by dynamical modeling. ArXiv Preprint ArXiv:2002.06563.

Vijaymeena, M. K., & Kavitha, K. (2016). A survey on similarity measures in text mining. Machine Learning and Applications: An International Journal, 3(2), 19–28.

World Health Organization. (2000). The world health report 2000: health systems: improving performance. World Health Organization.

World Health Organization. (2020). World Health Organization. Covid-19 Question Bank. https://tinyurl.com/y2tv8b7o

Publicado

2020-07-27

Cómo citar

Angulo Murillo, N. G., Sánchez Arteaga, A. A., García Murillo, G. R., & Saltos Rivas, W. R. (2020). MODELO PARA EL ANÁLISIS DE SENTIMIENTOS DEL BANCO DE ENCUESTAS CON PREGUNTAS SOBRE CORONAVIRUS DE LA OMS EMPLEANDO PRINCIPIOS DE MINERÍA DE TEXTOS. Mikarimin. Revista Científica Multidisciplinaria, 6, 31–40. Recuperado a partir de https://revista.uniandes.edu.ec/ojs/index.php/mikarimin/article/view/1931

Número

Sección

Ciencias Informáticas

Artículos más leídos del mismo autor/a