Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08
Cargando...
Fecha
2023-10-04
Autores
Director
Enlace al recurso
DOI
Google Scholar
gruplac
Descripción Dominio:
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Santo Tomás
Compartir
Cargando...
Resumen
La Clasificación Internacional Uniforme de Ocupaciones (CIUO) es una herramienta adoptada por la Conferencia Internacional de Estadísticos del Trabajo, que permite agrupar los diferentes tipos de empleos mediante las actividades y tareas de cada uno de ellos. Este trabajo brinda una visión general de los modelos de Machine Learning para procesos de clasificación y del Procesamiento de Lenguaje Natural (NLP) mediante la implementación de la herramienta de análisis textual Topic Modeling en las descripciones de los anuncios en tres portales de empleo en Colombia, con el objetivo de clasificarlos según la CIUO a un dígito. Se hace uso de los métodos de clasificación Ada Boost, Naive Bayes, Random Forest, Knn, Árboles de decisión y Máquinas de Vectores de Soporte para hallar el que se ajuste mejor a los datos y lograr ordenar de forma adecuada los anuncios. El modelo Random Forest fue el que tuvo mayor acierto en los nueve modelos binarios (uno por cada clase de la CIUO), dado que, para un anuncio hay diferentes profesiones que cumplen con los requisitos del cargo.
Abstract
The International Standard Classification of Occupations (ISCO) is a tool adopted by the International Conference of Labor Statisticians, which allows different types of jobs to be grouped through the activities and tasks of each of them. This work provides an overview of Machine Learning models for classification processes and Natural Language Processing (NLP) by implementing the Topic Modeling textual analysis tool in the descriptions of advertisements in three job portals in Colombia, with the aim of classifying them according to the ISCO to one digit. The classification methods Ada Boost, Naive Bayes, Random Forest, Knn, Decision Trees and Support Vector Machines are used to find the one that best fits the data and to properly order the ads. The Random Forest model was the one that had the greatest success in the nine binary models (one for each ISCO class), given that, for an advertisement, there are different professions that meet the requirements of the position.
Idioma
spa
Palabras clave
Citación
León Rocha, L. N. (2023). Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.
Colecciones
Licencia Creative Commons
Atribución-NoComercial-SinDerivadas 2.5 Colombia