Sistema de Identificación de Objetos en Espacios Cerrados Basado en Segmentación Semántica

Cargando...
Miniatura

Fecha

2023-07

Enlace al recurso

DOI

Google Scholar

gruplac

Descripción Dominio:

Título de la revista

ISSN de la revista

Título del volumen

Editor

Universidad Santo Tomás

Compartir

Documentos PDF
Cargando...
Miniatura

Resumen

Este proyecto propone realizar el reconocimiento de objetos en entornos cerrados basado en segmentación semántica utilizando redes neuronales profundas. Para lograr esto, se han selec- cionado dos arquitecturas de referencia ampliamente utilizadas en el campo de la visión: YOLO (You Only Look Once, YOLOv7) y Mask R-CNN. La elección de la arquitectura YOLOv7 para la detección de objetos se debe a su capacidad para identificar objetos de manera eficiente en tiempo real. YOLO utiliza una única iteración para detectar objetos en una imagen, lo que la hace especialmente adecuada para aplicaciones donde la velocidad es un factor crítico. Por otro lado, la arquitectura Mask R-CNN se seleccionó para abordar la tarea de la segmen- tación semántica. Esta permite asignar una máscara a cada objeto detectado, lo que brinda información detallada de la forma precisa de cada objeto en la imagen. Ambas arquitecturas, YOLO y Mask R-CNN, se han entrenado y evaluado utilizando la reco- nocida base de datos COCO (Common Objects in Context). COCO ofrece una amplia variedad de imágenes etiquetadas y anotadas, lo que permite entrenar las redes neuronales en un conjunto diverso de categorías de objetos y contextos.

Abstract

This project proposes to perform object recognition in indoor environments based on semantic segmentation using deep neural networks. To achieve this, two reference architectures widely used in the vision field have been selected: YOLO (YOLOv7) and Mask R-CNN. The choice of the YOLOv7 architecture for object detection is due to its ability to efficiently identify objects in real time. YOLO uses a single pass through the neural network to detect objects in an image, making it especially suitable for real-time applications where speed is a critical factor. On the other hand, the Mask R-CNN architecture was selected to address the task of semantic segmentation. It is used for mask assigment to each detected object, which provides detailed information on the precise shape of each object in the image. Both architectures, YOLO and Mask R-CNN, have been trained and evaluated using the well- known COCO (Common Objects in Context) database. COCO provides a wide variety of labeled and annotated images, allowing neural networks to be trained on a diverse set of object cate- gories and contexts.

Idioma

spa

Palabras clave

Citación

Sarria Arteaga, A. M. y Rojas Guayambuco, A. M. (2023). Sistema de Identificación de Objetos en Espacios Cerrados Basado en Segmentación Semántica. [Trabajo de Grado, Universidad Santo Tomas´]. Reportorio Institucional.

Licencia Creative Commons

Atribución-NoComercial-SinDerivadas 2.5 Colombia