Extensión del Algoritmo ClustImpute para Variables Cualitativas y Mixtas: Una Aplicación al Capítulo de Cultivos de Bogotá D.C. del III Censo Nacional Agropecuario

Miniatura

Fecha

2023

Enlace al recurso

DOI

gruplac

Descripción Dominio:

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Santo Tomás

Compartir

Cargando...
Miniatura

Resumen

En el actual contexto colombiano, caracterizado por cambios demográficos, económicos y ambientales, así como la importancia del sector agropecuario en la economía, la realización del III Censo Nacional Agropecuario en 2014 se presenta como una herramienta fundamental para comprender las complejas variables que impactan este sector. Con una cobertura operativa del 98.9%, este censo proporcionó información detallada y actualizada sobre el sector agropecuario en todo el país, incluyendo municipios, territorios indígenas, tierras de comunidades negras y parques nacionales. Sin embargo, el análisis de datos presenta desafíos, como el 4% de registros con datos faltantes, los cuales se abordan mediante enfoques estadísticos como la imputación de valores faltantes. En este contexto, el trabajo se enfoca en el capítulo de Cultivos en Bogotá, proponiendo la aplicación de una extensión del algoritmo ClustImpute. Este algoritmo, combinando técnicas de imputación con el método de k-medias, busca abordar tanto variables cuantitativas como cualitativas presentes en el censo, ofreciendo una alternativa innovadora a los métodos convencionales de imputación. El objetivo final es proporcionar un análisis de datos más completo y fiable para contribuir a la comprensión y mejora de las políticas y esfuerzos destinados al desarrollo rural y la calidad de vida en áreas rurales en Bogotá y, por extensión, en el conjunto del país.

Abstract

In the current Colombian context marked by demographic, economic, and environmental changes, coupled with the significant role of the agricultural sector in the economy, the implementation of the III National Agricultural Census in 2014 emerges as a crucial tool to comprehend the multifaceted variables impacting this sector. With an operational coverage of 98.9%, this census provided detailed and updated information on the agricultural sector nationwide, including municipalities, indigenous territories, lands of black communities, and national parks. However, data analysis presents challenges such as the existence of 4% of records with missing data, which are addressed through statistical approaches like missing value imputation. Focusing on the Cultivation chapter in Bogotá, this work proposes the application of an extended version of the ClustImpute algorithm. By combining imputation techniques with the k-means method, this algorithm aims to address both quantitative and qualitative variables present in the census, offering an innovative alternative to conventional imputation methods. The ultimate goal is to provide a more comprehensive and reliable data analysis to contribute to the understanding and improvement of policies and efforts related to rural development and the quality of life in rural areas in Bogotá and, consequently, throughout the country.

Idioma

spa

Palabras clave

Citación

Rojas Pulido, W. C. (2023). Extensión del Algoritmo ClustImpute para Variables Cualitativas y Mixtas: Una Aplicación al Capítulo de Cultivos de Bogotá D.C. del III Censo Nacional Agropecuario. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.

Licencia Creative Commons

Atribución-NoComercial-SinDerivadas 2.5 Colombia
Atribución-NoComercial-SinDerivadas 2.5 Colombia
Atribución-NoComercial-SinDerivadas 2.5 Colombia