Construcción de una Base de Datos de Frutas Cítricas A Partir del Aumento de Datos para un Modelo de Clasificación con Aprendizaje Profundo

Cargando...
Miniatura

Resumen

Cada día millones de imágenes son almacenadas, ya sea por páginas web o redes sociales, generando base de datos con etiquetas. Sin embargo, no siempre son representativas, de gran variedad o de dominio público. En este artículo se presenta la construcción de una base de datos particular de frutas cítricas distribuidas en Colombia que se encuentran escasamente en repositorios, siendo estas informaciones los registros de entrada a un modelo de clasificación de única etiqueta con aprendizaje profundo. Las imágenes fueron obtenidas por medio de la opción ráfaga en una cámara de 48 MP (f2,0 con tecnología Quad Píxel, 1,6 µm), se variaron condiciones de exposición tales como la posición por medio de la rotación y la iluminación en la fruta con el fin de obtener el aumento de registros en la base de datos, previa definición de las características que identifican cada una de las frutas se realiza la selección de una cantidad limitada representativa. Mediante la utilización de diferentes técnicas se aplica un redimensionamiento espacial en las imágenes a nivel de software. De esta forma son obtenidos 20738 registros pertenecientes a 8 clases de frutas cítricas, que luego se separan implementando la regla de división 90% a 10%, en dos directorios llamados entrenamiento y prueba.

Abstract

Every day millions of images are stored, either by websites or by social networks, generating datasets with labels. However, they are not always representative, of great variety or in the public domain. This article presents the construction of a particular dataset of citrus fruits distributed in Colombia that are sparsely found in repositories, these information are the input records to a single-label classification model with deep learning. The images were obtained through the burst option on a 48 MP camera (f2.0 with Quad Pixel technology, 1.6 µm). Exposure conditions such as position were evaluated through rotation and lighting of the fruit with the purpose to obtain the increase of records in the dataset, previous defining the features that identify each of the fruits, the selection of a representative limited quantity is made. Through the use of different techniques, a spatial resizing is applied to the images at the software level. In this way, 20738 samples belonging to 8 classes of citrus fruits are obtained and they are separated by implementing the division rule 90% to 10%, in two directories called; train and test.

Idioma

Palabras clave

Citación

Cardenas, J. F. y Jimenez, K. J., (2021). Construcción de una Base de Datos de Frutas Cítricas A Partir del Aumento de Datos para un Modelo de Clasificación con Aprendizaje Profundo. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.

Licencia Creative Commons

Atribución-NoComercial-SinDerivadas 2.5 Colombia