Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08

dc.contributor.advisorPacheco López, Mario JoséSpa
dc.contributor.authorLeon Rocha, Laura NathaliaSpa
dc.contributor.corporatenameUniversidad Santo Tomásspa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0000775479spa
dc.contributor.googlescholarhttps://scholar.google.com/citations?hl=es&user=a5SEoPgAAAAJspa
dc.contributor.orcidhttps://orcid.org/0000-0003-4752-703Xspa
dc.coverage.campusCRAI-USTA Bogotáspa
dc.date.accessioned2023-10-04T20:55:00Z
dc.date.available2023-10-04T20:55:00Z
dc.date.issued2023-10-04
dc.descriptionLa Clasificación Internacional Uniforme de Ocupaciones (CIUO) es una herramienta adoptada por la Conferencia Internacional de Estadísticos del Trabajo, que permite agrupar los diferentes tipos de empleos mediante las actividades y tareas de cada uno de ellos. Este trabajo brinda una visión general de los modelos de Machine Learning para procesos de clasificación y del Procesamiento de Lenguaje Natural (NLP) mediante la implementación de la herramienta de análisis textual Topic Modeling en las descripciones de los anuncios en tres portales de empleo en Colombia, con el objetivo de clasificarlos según la CIUO a un dígito. Se hace uso de los métodos de clasificación Ada Boost, Naive Bayes, Random Forest, Knn, Árboles de decisión y Máquinas de Vectores de Soporte para hallar el que se ajuste mejor a los datos y lograr ordenar de forma adecuada los anuncios. El modelo Random Forest fue el que tuvo mayor acierto en los nueve modelos binarios (uno por cada clase de la CIUO), dado que, para un anuncio hay diferentes profesiones que cumplen con los requisitos del cargo.spa
dc.description.abstractThe International Standard Classification of Occupations (ISCO) is a tool adopted by the International Conference of Labor Statisticians, which allows different types of jobs to be grouped through the activities and tasks of each of them. This work provides an overview of Machine Learning models for classification processes and Natural Language Processing (NLP) by implementing the Topic Modeling textual analysis tool in the descriptions of advertisements in three job portals in Colombia, with the aim of classifying them according to the ISCO to one digit. The classification methods Ada Boost, Naive Bayes, Random Forest, Knn, Decision Trees and Support Vector Machines are used to find the one that best fits the data and to properly order the ads. The Random Forest model was the one that had the greatest success in the nine binary models (one for each ISCO class), given that, for an advertisement, there are different professions that meet the requirements of the position.Eng
dc.description.degreelevelPregradospa
dc.description.degreenameProfesional en estadísticaspa
dc.format.mimetypeapplication/pdfspa
dc.identifier.citationLeón Rocha, L. N. (2023). Modelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.spa
dc.identifier.instnameinstname:Universidad Santo Tomásspa
dc.identifier.reponamereponame:Repositorio Institucional Universidad Santo Tomásspa
dc.identifier.repourlrepourl:https://repository.usta.edu.cospa
dc.identifier.urihttp://hdl.handle.net/11634/52594
dc.language.isospaspa
dc.publisherUniversidad Santo Tomásspa
dc.publisher.facultyFacultad de estadísticaspa
dc.publisher.programRregrado estadísticaspa
dc.relation.referencesAlpaydin, E. (2014). Introduction to Machine Learning. Massachusetts Institute of Technology. https://dl.matlabyar.com/siavash/ML/Book/Ethem%20AlpaydinIntroduction%20to%20Machine%20Learning-The%20MIT%20Press%20(2014).pdfspa
dc.relation.referencesAprende IA. (s.f). Máquinas Vectores de Soporte Clasificación Teoría. https://aprendeia.com/maquinas-vectores-de-soporte-clasificacion-teoria/spa
dc.relation.referencesArquez, M. (30 de marzo de 2020). Random Forest. https://rpubs.com/arquez9512/592295spa
dc.relation.referencesBarrientos et al. (2009). Árboles de decisión como herramienta en el diagnóstico médico. http://www.soporte.uv.mx/rm/num_anteriores/revmedica_vol9_num2/articulos/arboles.p dfspa
dc.relation.referencesBreiman, L. (2001, Octubre). Random Forests. https://doi.org/10.1023/A:1010933404324spa
dc.relation.referencesBurgues, C. (1998). A Tutorial on Support Vector Machines for Pattern Recognition. https://doi.org/10.1023/A:1009715923555spa
dc.relation.referencesCalvo, J. (1 de diciembre de 2016). Topic Modeling: ¿Qué, cómo, cuándo?. http://www.morethanbooks.eu/topic-modeling-introduccion/spa
dc.relation.referencesCarmona, E. (2016). Tutorial sobre Máquinas de Vectores Soporte (SVM). https://www.researchgate.net/publication/263817587_Tutorial_sobre_Maquinas_de_Vect ores_Soporte_SVMspa
dc.relation.referencesDarad, S. y Krishnan, S. (2023). Análisis de sentimiento de los datos de twitter de COVID-19 utilizando modelos de aprendizaje profundo y aprendizaje máquina. https://doi.org/10.17163/ings.n29.2023.10spa
dc.relation.referencesGuardiola González, C. (2020). Clasificador de texto mediante técnicas de aprendizaje automático. [Trabajo Fin de Grado, Escola Tècnica Superior d’Enginyeria Informàtica Universitat Politècnica de València]. https://riunet.upv.es/bitstream/handle/10251/133840/Guardiola%20- %20Clasificador%20de%20textos%20mediante%20t%C3%A9cnicas%20de%20aprendiz aje%20autom%C3%A1tico.pdf?sequence=1spa
dc.relation.referencesHastie et al. (2008, Agosto). The Elements of Statistical Learning. Springer. https://hastie.su.domains/Papers/ESLII.pdfspa
dc.relation.referencesIBM. (17 de agosto de 2021). Funcionamiento de SVM. https://www.ibm.com/docs/es/spssmodeler/saas?topic=models-how-svm-worksspa
dc.relation.referencesJava T point. (s.f.). K-Nearest Neighbor(KNN) Algorithm for Machine Learning. https://www.javatpoint.com/k-nearest-neighbor-algorithm-for-machine-learningspa
dc.relation.referencesMartínez Ribón, J. G. T. (2011). Propuesta de metodología para la implementación de la filosofía Lean (construcción esbelta) en proyectos de construcción [Tesis de Maestría, Universidad Nacional de Colombia]. http://bdigital.unal.edu.co/10578/spa
dc.relation.referencesMeza, A. y Chue, J. (2020). Uso del algoritmo Adaboost y la regresión logística para la predicción de fuga de clientes en una empresa de telefonía móvil. Natura@economía. https://doi.org/10.21704/ne.v5i2.1610spa
dc.relation.referencesMinoli, M. (5 de julio de 2018). Análisis de datos no estructurados usando Topic Models. https://www.linkedin.com/pulse/an%C3%A1lisis-de-datos-estructurados-usando-topicmodels-mariano-minoli/?originalSubdomain=esspa
dc.relation.referencesMitchell, T. (1997). Machine Learning. Book News. https://www.cin.ufpe.br/~cavmj/Machine%20-%20Learning%20- %20Tom%20Mitchell.pdfspa
dc.relation.referencesNalda, V, (29 de septiembre de 2020). Machine Learning: Los orígenes y la evolución. https://www.futurespace.es/machine-learning-los-origenes-y-laevolucion/#:~:text=Los%20or%C3%ADgenes%20del%20Machine%20Learning&text=P or%20moderno%20que%20pueda%20parecer,en%20vez%20de%20un%20ordenadorspa
dc.relation.referencesOrganización Internacional del Trabajo. (30 de enero de 2005). Estructura de la CIUO-08 y concordancias previas con la CIUO-88. https://www.ilo.org/public/spanish/bureau/stat/isco/isco08/index.htmspa
dc.relation.referencesRecuero, P. (2021, Diciembre). Tipos de aprendizaje en Machine Learning: supervisado y no supervisado. https://empresas.blogthinkbig.com/que-algoritmo-elegir-en-ml-aprendizaje/spa
dc.relation.referencesSimeone, O. (2018, Noviembre). A Very Brief Introduction to Machine Learning With Applications to Communication Systems. https://arxiv.org/spa
dc.relation.referencesTIBCO. (s.f.). What is a Random Forest?. https://www.tibco.com/reference-center/what-is-arandom-forestspa
dc.relation.referencesTovar, J. (11 de mayo de 2022). Método Supervisado – Clasificación – Naive Bayes. https://forum.huawei.com/enterprise/es/m%25C3%25A9todo-supervisadoclasificaci%25C3%25B3n-naive-bayes/thread/667228966991314944- 667212895009779712spa
dc.relation.referencesZelada, C. (10 de mayo de 2017). Evaluación de modelos de clasificación. https://rpubs.com/chzelada/275494spa
dc.relation.referencesZhao, B. (2017). Web Scraping. DOI:10.1007/978-3-319-32001-4_483-1. https://www.researchgate.net/publication/317177787_Web_Scrapingspa
dc.rightsAtribución-NoComercial-SinDerivadas 2.5 Colombia*
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2spa
dc.rights.localAbierto (Texto Completo)spa
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/*
dc.subject.keywordMachine LearningEng
dc.subject.keywordISCOEng
dc.subject.keywordTopic ModelingEng
dc.subject.keywordClassificationEng
dc.subject.keywordAdsEng
dc.subject.lembEstadísticaspa
dc.subject.lembEmpleospa
dc.subject.lembProceso de Comunicaciónspa
dc.subject.proposalMachine Learningspa
dc.subject.proposalCIUOspa
dc.subject.proposalTopic Modelingspa
dc.subject.proposalClasificaciónspa
dc.subject.proposalAnunciosspa
dc.titleModelo de Clasificación para los Anuncios en Tres Portales de Empleo de Colombia según la CIUO-08spa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.driveinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
2023lauraleon
Tamaño:
797.29 KB
Formato:
Adobe Portable Document Format
Descripción:
Thumbnail USTA
Nombre:
2023cartaaprobaciónfacultad
Tamaño:
17.53 KB
Formato:
Adobe Portable Document Format
Descripción:
Thumbnail USTA
Nombre:
2023cartaderechosautor
Tamaño:
482.76 KB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
Thumbnail USTA
Nombre:
license.txt
Tamaño:
807 B
Formato:
Item-specific license agreed upon to submission
Descripción: