Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08
dc.contributor.advisor | Pacheco López, Mario José | Spa |
dc.contributor.author | Leon Rocha, Laura Nathalia | Spa |
dc.contributor.corporatename | Universidad Santo Tomás | spa |
dc.contributor.cvlac | https://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000775479 | spa |
dc.contributor.googlescholar | https://scholar.google.com/citations?hl=es&user=a5SEoPgAAAAJ | spa |
dc.contributor.orcid | https://orcid.org/0000-0003-4752-703X | spa |
dc.coverage.campus | CRAI-USTA Bogotá | spa |
dc.date.accessioned | 2023-10-04T20:55:00Z | |
dc.date.available | 2023-10-04T20:55:00Z | |
dc.date.issued | 2023-10-04 | |
dc.description | La Clasificación Internacional Uniforme de Ocupaciones (CIUO) es una herramienta adoptada por la Conferencia Internacional de Estadísticos del Trabajo, que permite agrupar los diferentes tipos de empleos mediante las actividades y tareas de cada uno de ellos. Este trabajo brinda una visión general de los modelos de Machine Learning para procesos de clasificación y del Procesamiento de Lenguaje Natural (NLP) mediante la implementación de la herramienta de análisis textual Topic Modeling en las descripciones de los anuncios en tres portales de empleo en Colombia, con el objetivo de clasificarlos según la CIUO a un dígito. Se hace uso de los métodos de clasificación Ada Boost, Naive Bayes, Random Forest, Knn, Árboles de decisión y Máquinas de Vectores de Soporte para hallar el que se ajuste mejor a los datos y lograr ordenar de forma adecuada los anuncios. El modelo Random Forest fue el que tuvo mayor acierto en los nueve modelos binarios (uno por cada clase de la CIUO), dado que, para un anuncio hay diferentes profesiones que cumplen con los requisitos del cargo. | spa |
dc.description.abstract | The International Standard Classification of Occupations (ISCO) is a tool adopted by the International Conference of Labor Statisticians, which allows different types of jobs to be grouped through the activities and tasks of each of them. This work provides an overview of Machine Learning models for classification processes and Natural Language Processing (NLP) by implementing the Topic Modeling textual analysis tool in the descriptions of advertisements in three job portals in Colombia, with the aim of classifying them according to the ISCO to one digit. The classification methods Ada Boost, Naive Bayes, Random Forest, Knn, Decision Trees and Support Vector Machines are used to find the one that best fits the data and to properly order the ads. The Random Forest model was the one that had the greatest success in the nine binary models (one for each ISCO class), given that, for an advertisement, there are different professions that meet the requirements of the position. | Eng |
dc.description.degreelevel | Pregrado | spa |
dc.description.degreename | Profesional en estadística | spa |
dc.format.mimetype | application/pdf | spa |
dc.identifier.citation | León Rocha, L. N. (2023). Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional. | spa |
dc.identifier.instname | instname:Universidad Santo Tomás | spa |
dc.identifier.reponame | reponame:Repositorio Institucional Universidad Santo Tomás | spa |
dc.identifier.repourl | repourl:https://repository.usta.edu.co | spa |
dc.identifier.uri | http://hdl.handle.net/11634/52594 | |
dc.language.iso | spa | spa |
dc.publisher | Universidad Santo Tomás | spa |
dc.publisher.faculty | Facultad de estadística | spa |
dc.publisher.program | Rregrado estadística | spa |
dc.relation.references | Alpaydin, E. (2014). Introduction to Machine Learning. Massachusetts Institute of Technology. https://dl.matlabyar.com/siavash/ML/Book/Ethem%20AlpaydinIntroduction%20to%20Machine%20Learning-The%20MIT%20Press%20(2014).pdf | spa |
dc.relation.references | Aprende IA. (s.f). Máquinas Vectores de Soporte Clasificación Teoría. https://aprendeia.com/maquinas-vectores-de-soporte-clasificacion-teoria/ | spa |
dc.relation.references | Arquez, M. (30 de marzo de 2020). Random Forest. https://rpubs.com/arquez9512/592295 | spa |
dc.relation.references | Barrientos et al. (2009). Árboles de decisión como herramienta en el diagnóstico médico. http://www.soporte.uv.mx/rm/num_anteriores/revmedica_vol9_num2/articulos/arboles.p df | spa |
dc.relation.references | Breiman, L. (2001, Octubre). Random Forests. https://doi.org/10.1023/A:1010933404324 | spa |
dc.relation.references | Burgues, C. (1998). A Tutorial on Support Vector Machines for Pattern Recognition. https://doi.org/10.1023/A:1009715923555 | spa |
dc.relation.references | Calvo, J. (1 de diciembre de 2016). Topic Modeling: ¿Qué, cómo, cuándo?. http://www.morethanbooks.eu/topic-modeling-introduccion/ | spa |
dc.relation.references | Carmona, E. (2016). Tutorial sobre Máquinas de Vectores Soporte (SVM). https://www.researchgate.net/publication/263817587_Tutorial_sobre_Maquinas_de_Vect ores_Soporte_SVM | spa |
dc.relation.references | Darad, S. y Krishnan, S. (2023). Análisis de sentimiento de los datos de twitter de COVID-19 utilizando modelos de aprendizaje profundo y aprendizaje máquina. https://doi.org/10.17163/ings.n29.2023.10 | spa |
dc.relation.references | Guardiola González, C. (2020). Clasificador de texto mediante técnicas de aprendizaje automático. [Trabajo Fin de Grado, Escola Tècnica Superior d’Enginyeria Informàtica Universitat Politècnica de València]. https://riunet.upv.es/bitstream/handle/10251/133840/Guardiola%20- %20Clasificador%20de%20textos%20mediante%20t%C3%A9cnicas%20de%20aprendiz aje%20autom%C3%A1tico.pdf?sequence=1 | spa |
dc.relation.references | Hastie et al. (2008, Agosto). The Elements of Statistical Learning. Springer. https://hastie.su.domains/Papers/ESLII.pdf | spa |
dc.relation.references | IBM. (17 de agosto de 2021). Funcionamiento de SVM. https://www.ibm.com/docs/es/spssmodeler/saas?topic=models-how-svm-works | spa |
dc.relation.references | Java T point. (s.f.). K-Nearest Neighbor(KNN) Algorithm for Machine Learning. https://www.javatpoint.com/k-nearest-neighbor-algorithm-for-machine-learning | spa |
dc.relation.references | Martínez Ribón, J. G. T. (2011). Propuesta de metodología para la implementación de la filosofía Lean (construcción esbelta) en proyectos de construcción [Tesis de Maestría, Universidad Nacional de Colombia]. http://bdigital.unal.edu.co/10578/ | spa |
dc.relation.references | Meza, A. y Chue, J. (2020). Uso del algoritmo Adaboost y la regresión logística para la predicción de fuga de clientes en una empresa de telefonía móvil. Natura@economía. https://doi.org/10.21704/ne.v5i2.1610 | spa |
dc.relation.references | Minoli, M. (5 de julio de 2018). Análisis de datos no estructurados usando Topic Models. https://www.linkedin.com/pulse/an%C3%A1lisis-de-datos-estructurados-usando-topicmodels-mariano-minoli/?originalSubdomain=es | spa |
dc.relation.references | Mitchell, T. (1997). Machine Learning. Book News. https://www.cin.ufpe.br/~cavmj/Machine%20-%20Learning%20- %20Tom%20Mitchell.pdf | spa |
dc.relation.references | Nalda, V, (29 de septiembre de 2020). Machine Learning: Los orígenes y la evolución. https://www.futurespace.es/machine-learning-los-origenes-y-laevolucion/#:~:text=Los%20or%C3%ADgenes%20del%20Machine%20Learning&text=P or%20moderno%20que%20pueda%20parecer,en%20vez%20de%20un%20ordenador | spa |
dc.relation.references | Organización Internacional del Trabajo. (30 de enero de 2005). Estructura de la CIUO-08 y concordancias previas con la CIUO-88. https://www.ilo.org/public/spanish/bureau/stat/isco/isco08/index.htm | spa |
dc.relation.references | Recuero, P. (2021, Diciembre). Tipos de aprendizaje en Machine Learning: supervisado y no supervisado. https://empresas.blogthinkbig.com/que-algoritmo-elegir-en-ml-aprendizaje/ | spa |
dc.relation.references | Simeone, O. (2018, Noviembre). A Very Brief Introduction to Machine Learning With Applications to Communication Systems. https://arxiv.org/ | spa |
dc.relation.references | TIBCO. (s.f.). What is a Random Forest?. https://www.tibco.com/reference-center/what-is-arandom-forest | spa |
dc.relation.references | Tovar, J. (11 de mayo de 2022). Método Supervisado – Clasificación – Naive Bayes. https://forum.huawei.com/enterprise/es/m%25C3%25A9todo-supervisadoclasificaci%25C3%25B3n-naive-bayes/thread/667228966991314944- 667212895009779712 | spa |
dc.relation.references | Zelada, C. (10 de mayo de 2017). Evaluación de modelos de clasificación. https://rpubs.com/chzelada/275494 | spa |
dc.relation.references | Zhao, B. (2017). Web Scraping. DOI:10.1007/978-3-319-32001-4_483-1. https://www.researchgate.net/publication/317177787_Web_Scraping | spa |
dc.rights | Atribución-NoComercial-SinDerivadas 2.5 Colombia | * |
dc.rights.accessrights | info:eu-repo/semantics/openAccess | |
dc.rights.coar | http://purl.org/coar/access_right/c_abf2 | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.rights.local | Abierto (Texto Completo) | spa |
dc.rights.uri | http://creativecommons.org/licenses/by-nc-nd/2.5/co/ | * |
dc.subject.keyword | Machine Learning | Eng |
dc.subject.keyword | ISCO | Eng |
dc.subject.keyword | Topic Modeling | Eng |
dc.subject.keyword | Classification | Eng |
dc.subject.keyword | Ads | Eng |
dc.subject.lemb | Estadística | spa |
dc.subject.lemb | Empleo | spa |
dc.subject.lemb | Proceso de Comunicación | spa |
dc.subject.proposal | Machine Learning | spa |
dc.subject.proposal | CIUO | spa |
dc.subject.proposal | Topic Modeling | spa |
dc.subject.proposal | Clasificación | spa |
dc.subject.proposal | Anuncios | spa |
dc.title | Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08 | spa |
dc.type.coar | http://purl.org/coar/resource_type/c_7a1f | |
dc.type.coarversion | http://purl.org/coar/version/c_ab4af688f83e57aa | |
dc.type.drive | info:eu-repo/semantics/bachelorThesis | |
dc.type.version | info:eu-repo/semantics/acceptedVersion |
Archivos
Bloque original
1 - 3 de 3
Cargando...
- Nombre:
- 2023lauraleon
- Tamaño:
- 797.29 KB
- Formato:
- Adobe Portable Document Format
- Descripción:

- Nombre:
- 2023cartaaprobaciónfacultad
- Tamaño:
- 17.53 KB
- Formato:
- Adobe Portable Document Format
- Descripción:

- Nombre:
- 2023cartaderechosautor
- Tamaño:
- 482.76 KB
- Formato:
- Adobe Portable Document Format
- Descripción:
Bloque de licencias
1 - 1 de 1

- Nombre:
- license.txt
- Tamaño:
- 807 B
- Formato:
- Item-specific license agreed upon to submission
- Descripción: