""

Thaqhaña: Un Motor De Búsqueda Semántico Basado En Una Ontología Y En Un Modelo Entrenado Con Machine Learning Para Soporte A La Investigación

Published in: Prospective and trends in technology and skills for sustainable social development. Leveraging emerging technologies to construct the future: Proceedings of the 19th LACCEI International Multi-Conference for Engineering, Education and Technology
Date of Conference: July 19-23, 2021
Location of Conference: Virtual
Authors: Felipe Cujar Rosero (Universidad de Nariño, CO)
David Santiago Pinchao Ortiz (Universidad de Nariño, CO)
Ricardo Timarán Pereira (Universidad de Nariño, CO)
Jimmy Mateo Guerrero Restrepo (Universidad de Nariño, CO)
Full Paper: #596

Abstract:

En este artículo se presentan los resultados finales del proyecto de investigación que tuvo como objetivo la construcción de un motor de búsqueda semántico que utiliza una ontología y de un modelo entrenado con Machine Learning para soportar la búsqueda semántica de proyectos de investigación del Sistema de Investigaciones de la Universidad de Nariño. Para la construcción de THAQHAÑA, como se le denomina a este motor, se utilizó la metodología que comprende las etapas de: apropiación del conocimiento, instalación y configuración de las herramientas, bibliotecas y tecnologías, recolección, extracción y preparación de proyectos de investigación, diseño y desarrollo del motor de búsqueda semántico. Los resultados principales del trabajo fueron tres: a) la construcción completa de la Ontología con classes (clases), object properties(predicados), data properties(atributos) e individuals (instancias) en Protegé, consultas SPARQL con Apache Jena Fuseki y la respectiva codificación con Owlready2 usando Jupyter Notebook con Python dentro del entorno virtual de anaconda; b) el entrenamiento exitoso del modelo para el cual se usaron algoritmos de Machine Learning y específicamente de Procesamiento de Lenguaje Natural como: SpaCy, NLTK, Word2vec y Doc2vec, esto también se realizó en Jupyter Notebook con Python dentro del entorno virtual de anaconda y con Elasticsearch; y c) la creación de THAQHAÑA gestionando y unificando las consultas para la Ontología y para el modelo de Machine Learning. Las pruebas demostraron que THAQHAÑA fue exitoso en todas las búsquedas llevadas a cabo porque sus resultados fueron satisfactorios.