Abstract:En este artículo se presentan los resultados finales del proyecto de investigación que tuvo como objetivo la construcción de un motor de búsqueda semántico que utiliza una ontología y de un modelo entrenado con Machine Learning para soportar la búsqueda semántica de proyectos de investigación del Sistema de Investigaciones de la Universidad de Nariño. Para la construcción de THAQHAÑA, como se le denomina a este motor, se utilizó la metodología que comprende las etapas de: apropiación del conocimiento, instalación y configuración de las herramientas, bibliotecas y tecnologías, recolección, extracción y preparación de proyectos de investigación, diseño y desarrollo del motor de búsqueda semántico. Los resultados principales del trabajo fueron tres: a) la construcción completa de la Ontología con classes (clases), object properties(predicados), data properties(atributos) e individuals (instancias) en Protegé, consultas SPARQL con Apache Jena Fuseki y la respectiva codificación con Owlready2 usando Jupyter Notebook con Python dentro del entorno virtual de anaconda; b) el entrenamiento exitoso del modelo para el cual se usaron algoritmos de Machine Learning y específicamente de Procesamiento de Lenguaje Natural como: SpaCy, NLTK, Word2vec y Doc2vec, esto también se realizó en Jupyter Notebook con Python dentro del entorno virtual de anaconda y con Elasticsearch; y c) la creación de THAQHAÑA gestionando y unificando las consultas para la Ontología y para el modelo de Machine Learning. Las pruebas demostraron que THAQHAÑA fue exitoso en todas las búsquedas llevadas a cabo porque sus resultados fueron satisfactorios. |