Predicción de la producción de rosas mediante aprendizaje automático: Una comparación entre modelos fenológicos y autorregresivos

Documentos PDF

Descripción

Esta investigación compara la efectividad de dos enfoques de modelado para la predicción de la producción de rosas: uno basado en conteos fenológicos tradicionales y otro puramente autorregresivo, empleando algoritmos clásicos de Machine Learning (ML) como alternativa de bajo costo. Debido a la limitada disponibilidad de datos históricos, se generaron datos sintéticos que preservan la estacionalidad y los patrones cíclicos del sector floricultor colombiano. Se evaluaron modelos MLP, LSTM y XGBoost bajo un diseño experimental reproducible, aplicando validación cruzada y métricas de error (MSE, R²). Los resultados muestran que el enfoque autorregresivo con XGBoost alcanzó el mejor desempeño (R²=0.82), superando a los modelos basados en información fenológica (R²=0.809). Esto evidencia que la historia productiva contiene una señal predictiva más robusta que los conteos manuales, permitiendo prescindir de procesos costosos y subjetivos. El estudio aporta un modelo predictivo replicable que optimiza la planeación productiva del sector floricultor, fortaleciendo su competitividad mediante el uso eficiente de los datos disponibles.

Abstract

This research compares the effectiveness of two modeling approaches for predicting rose production: one based on traditional phenological counts and another purely autoregressive, using classical Machine Learning (ML) algorithms as a low-cost alternative. Due to the limited availability of historical data, synthetic datasets were generated to preserve the seasonal and cyclical patterns of Colombia’s floriculture sector. MLP, LSTM, and XGBoost models were evaluated under a reproducible experimental design, applying cross-validation and standard error metrics (MSE, R²). Results indicate that the autoregressive XGBoost model achieved the best performance (R²=0.82), outperforming models based on phenological information (R²=0.809). These findings demonstrate that production history provides a stronger predictive signal than manual field counts, reducing dependence on subjective and labor-intensive procedures. The study offers a replicable predictive framework that enhances production planning and strengthens the competitiveness of the floriculture industry through efficient use of existing data.

Idioma

spa

Palabras clave

Citación

Caicedo Arroyave, L. C., Pineda Rios, W. D., y , Zainea Maya C. I. (2026). Predicción de la producción de rosas mediante aprendizaje automático: una comparación entre modelos fenológicos y autorregresivos. [Trabajo de Maestría, Universidad Santo Tomás]. Repositorio Institucional.

Licencia Creative Commons

Attribution-NonCommercial-NoDerivs 2.5 Colombia