Predicciones del Número de Pasajeros de la Ruta 330 del SITP Utilizando Técnicas de Machine Learning: Random Forest y Silverkyte

dc.contributor.advisorMoreno Lopez, Edna Carolina
dc.contributor.authorMesa Cantillo, Yanela Alexandra
dc.contributor.corporatenameUniversidad Santo Tomásspa
dc.contributor.cvlachttps://scienti.minciencias.gov.co/cvlac/visualizador/generarCurriculoCv.do?cod_rh=0001381730
dc.contributor.googlescholarhttps://scholar.google.es/citations?hl=es&user=3HPuekUAAAAJ
dc.contributor.orcidhttps://orcid.org/0000-0002-1364-0096
dc.date.accessioned2024-10-03T15:45:10Z
dc.date.available2024-10-03T15:45:10Z
dc.date.issued2024
dc.descriptionEste estudio utiliza los datos proporcionados por Transmilenio, que incluyen registros de accesos a los servicios del Sistema Integrado de Transporte Público (SITP) correspondientes a la ruta 330 durante los años 2020 a 2023. Se analizaron diversos factores que podrían influir en la decisión de los usuarios de utilizar el SITP, tales como los días festivos, fines de semana y períodos de vacaciones. El objetivo principal de este trabajo es entender la demanda futura del uso del Sistema Integrado de Transporte Público (SITP) mediante el análisis de los datos del número de pasajeros. Además, se incluirán otras variables relevantes como las vacaciones, los días festivos y los fines de semana, con el propósito de mejorar las predicciones del modelo. Para lograr este objetivo, se emplearán los modelos Silverkite, desarrollado por LinkedIn y parte de la biblioteca Greykite publicada en 2021, así como el método Random Forest, ampliamente reconocido en el campo del aprendizaje automático. Estos modelos serán comparados para determinar cuál de ellos ofrece pronósticos más precisos sobre la demanda futura del SITP.spa
dc.description.abstractThis study utilizes data provided by Transmilenio, which includes access records to the services of the Integrated Public Transport System (SITP) corresponding to route 330 from the years 2020 to 2023. Various factors that could influence the users’ decision to use the SITP, such as holidays, weekends, and vacation periods, were analyzed. The main objective of this work is to understand the future demand for the use of the Integrated Public Transport System (SITP) through the analysis of passenger number data. Additionally, other relevant variables such as holidays, weekends, and vacation periods will be included to improve the model’s predictions.spa
dc.description.degreelevelPregradospa
dc.description.degreenameProfesional en estadísticaspa
dc.format.mimetypeapplication/pdf
dc.identifier.citationMesa Cantillo, Y. A. (2024). Predicciones del Número de Pasajeros de la Ruta 330 del SITP Utilizando Técnicas de Machine Learning: Random Forest y Silverkyte. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.spa
dc.identifier.instnameinstname:Universidad Santo Tomásspa
dc.identifier.reponamereponame:Repositorio Institucional Universidad Santo Tomásspa
dc.identifier.repourlrepourl:https://repository.usta.edu.cospa
dc.identifier.urihttp://hdl.handle.net/11634/58130
dc.language.isospa
dc.publisherUniversidad Santo Tomásspa
dc.publisher.branchCRAI-USTA Bogotáspa
dc.publisher.facultyFacultad de estadísticaspa
dc.publisher.programRregrado estadísticaspa
dc.relation.referencesBreiman, L. (2001), ‘Random forests’, Machine Learning 45(1), 5–32.spa
dc.relation.referencesCheng, C.-H., Tsai, M.-C. & Cheng, Y.-C. (2022), ‘An intelligent time-series model for forecasting bus passengers based on smartcard data’, Appl. Sci. 12(9), 4763.spa
dc.relation.referencesCutler, D. R., Edwards Jr, T. C., Beard, K. H., Hess, K. T., Gibson, J. & Lawler, J. J. (2007), ‘Random forests for classification in ecology’, Ecology 88(11), 2783–2792.spa
dc.relation.referencesDatos Abiertos TransMilenio (n.d.), https://datosabiertos-transmilenio.hub.arcgis.com/.spa
dc.relation.referencesGallo, F., Corman, F. & Sacco, N. (2022), ‘Real-time occupancy predictions of public transport vehicles’, Institute for Transport Planning and Systems, ETH Zurich, Switzerland and Department of Mecha- nical, Energy, Management and Transportation Engineering, University of Genova, Italyspa
dc.relation.referencesHosseini, R., Chen, A., Yang, K., Patra, S., Su, Y., Al Orjany, S. E., Tang, S. & Ahammad, P. (2022), Greykite: Deploying flexible forecasting at scale at linkedin, in ‘Proceedings of the 28th ACM SIGKDD Conference on Knowledge Discovery and Data Mining’, KDD ’22, Association for Com- puting Machinery, New York, NY, USA, p. 3007ˆa3017.spa
dc.relation.referencesHosseini, R., Chen, A., Yang, K., Patra, S., Su, Y. & Arora, R. (2021), ‘Greykite: a flexible, intuitive and fast forecasting library’.spa
dc.relation.referencesLing, X., Huang, Z., Wang, C., Zhang, F. & Wang, P. (2018), ‘Predicting subway passenger flows under different traffic conditions’, PLoS ONE 13(8).spa
dc.relation.referencesMilind, K. & Sandhya, D. (2024), ‘Forecasting the future: A comprehensive review of time series predic- tion techniques’, J. Electrical Systems 20(2), 575–586.spa
dc.relation.referencesMonje, L., Carrasco, R. A., Rosado, C. & S´anchez-Monta˜n´es, M. (2022), ‘Deep learning xai for bus passenger forecasting: A use case in spain’, Mathematics 10(9), 1428.spa
dc.relation.referencesNagaraj, N., Gururaj, H. L., Swathi, B. H. & Hu*, Y.-C. (2022), ‘Passenger flow prediction in bus transportation system using deep learning’, Multimedia Tools and Applications 81, 12519–12542.spa
dc.relation.referencesNoursalehi, P. & Koutsopoulos, H. N. (2022), ‘Real-time predictive analytics for improving pu- blic transportation systemsˆa resilience’, Northeastern University, Boston, MA, USAspa
dc.relation.referencesPeña, D., Poncela, P. & Ruiz, E. (2021), Nuevos métodos de predición económica con datos masivos.spa
dc.relation.referencesResende, D. (2023), ‘Linkedin greykite: What it is, how it works, and how to use it’.spa
dc.relation.referencesRodrigo, J. A. & Ortiz, J. E. (2022), ‘Modelar series temporales con tendencia utilizando modelos de ˜Arboles’.spa
dc.relation.referencesRoque Rojas, E. (2022), ‘Predicción de la demanda de pasajeros a clústeres de estaciones del metropolitano usando métodos de data mining, la metodología box-jenkins y sarima’spa
dc.relation.referencesUtku, A. & Kaya*, S. K. (2022), ‘Multi-layer perceptron based transfer passenger flow prediction in istanbul transportation system’, Decision Making: Applications in Management and Engineering 5(1), 208–224.spa
dc.relation.referencesZhang, X., Lauber, L., Liu, H., Shi, J., Xie, M. & Pan, Y. (2022), ‘Travel time prediction of urban public transportation based on detection of single routes’,spa
dc.relation.referencesCamacho, M., Ramallo, S. & Marín, M. R. (2021), ‘˜Arboles de decisión económica: Una aplicación a la determinación del precio de la vivienda′spa
dc.rightsAtribución-NoComercial-SinDerivadas 2.5 Colombia
dc.rights.accessrightsinfo:eu-repo/semantics/openAccess
dc.rights.coarhttp://purl.org/coar/access_right/c_abf2spa
dc.rights.localAbierto (Texto Completo)spa
dc.rights.localAbierto (Texto Completo)spa
dc.rights.urihttp://creativecommons.org/licenses/by-nc-nd/2.5/co/
dc.subject.keywordAnalysisspa
dc.subject.keywordForecastingspa
dc.subject.keywordRandom Foresspa
dc.subject.keywordSilverkitespa
dc.subject.lembEstadísticaspa
dc.subject.lembTransporte Masivo -- SITPspa
dc.subject.lembServicios -- Transmileniospa
dc.subject.lembUsuariosspa
dc.subject.proposalAnálisisspa
dc.subject.proposalPronósticospa
dc.subject.proposalRandom Forestspa
dc.subject.proposalSilverkitespa
dc.titlePredicciones del Número de Pasajeros de la Ruta 330 del SITP Utilizando Técnicas de Machine Learning: Random Forest y Silverkytespa
dc.type.coarhttp://purl.org/coar/resource_type/c_7a1f
dc.type.coarversionhttp://purl.org/coar/version/c_ab4af688f83e57aa
dc.type.driveinfo:eu-repo/semantics/bachelorThesis
dc.type.versioninfo:eu-repo/semantics/acceptedVersion

Archivos

Bloque original

Mostrando 1 - 3 de 3
Cargando...
Miniatura
Nombre:
2024yanelamesa
Tamaño:
1.61 MB
Formato:
Adobe Portable Document Format
Descripción:
Cargando...
Miniatura
Nombre:
2024cartaaprobaciónfacultad
Tamaño:
341.13 KB
Formato:
Adobe Portable Document Format
Descripción:
Cargando...
Miniatura
Nombre:
2024cartaderechosautor
Tamaño:
3.23 MB
Formato:
Adobe Portable Document Format
Descripción:

Bloque de licencias

Mostrando 1 - 1 de 1
Cargando...
Miniatura
Nombre:
license.txt
Tamaño:
807 B
Formato:
Item-specific license agreed upon to submission
Descripción: