Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08

Cargando...
Miniatura

Fecha

2023-10-04

Enlace al recurso

DOI

gruplac

Descripción Dominio:

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Santo Tomás

Compartir

Cargando...
Miniatura

Resumen

La Clasificación Internacional Uniforme de Ocupaciones (CIUO) es una herramienta adoptada por la Conferencia Internacional de Estadísticos del Trabajo, que permite agrupar los diferentes tipos de empleos mediante las actividades y tareas de cada uno de ellos. Este trabajo brinda una visión general de los modelos de Machine Learning para procesos de clasificación y del Procesamiento de Lenguaje Natural (NLP) mediante la implementación de la herramienta de análisis textual Topic Modeling en las descripciones de los anuncios en tres portales de empleo en Colombia, con el objetivo de clasificarlos según la CIUO a un dígito. Se hace uso de los métodos de clasificación Ada Boost, Naive Bayes, Random Forest, Knn, Árboles de decisión y Máquinas de Vectores de Soporte para hallar el que se ajuste mejor a los datos y lograr ordenar de forma adecuada los anuncios. El modelo Random Forest fue el que tuvo mayor acierto en los nueve modelos binarios (uno por cada clase de la CIUO), dado que, para un anuncio hay diferentes profesiones que cumplen con los requisitos del cargo.

Abstract

The International Standard Classification of Occupations (ISCO) is a tool adopted by the International Conference of Labor Statisticians, which allows different types of jobs to be grouped through the activities and tasks of each of them. This work provides an overview of Machine Learning models for classification processes and Natural Language Processing (NLP) by implementing the Topic Modeling textual analysis tool in the descriptions of advertisements in three job portals in Colombia, with the aim of classifying them according to the ISCO to one digit. The classification methods Ada Boost, Naive Bayes, Random Forest, Knn, Decision Trees and Support Vector Machines are used to find the one that best fits the data and to properly order the ads. The Random Forest model was the one that had the greatest success in the nine binary models (one for each ISCO class), given that, for an advertisement, there are different professions that meet the requirements of the position.

Idioma

spa

Palabras clave

Citación

León Rocha, L. N. (2023). Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.

Licencia Creative Commons

Atribución-NoComercial-SinDerivadas 2.5 Colombia