Sistema de Identificación de Objetos en Espacios Cerrados Basado en Segmentación Semántica
Cargando...
Fecha
2023-07
Director
Enlace al recurso
DOI
Google Scholar
gruplac
Descripción Dominio:
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Santo Tomás
Compartir
Documentos PDF
Cargando...
Resumen
Este proyecto propone realizar el reconocimiento de objetos en entornos cerrados basado en
segmentación semántica utilizando redes neuronales profundas. Para lograr esto, se han selec-
cionado dos arquitecturas de referencia ampliamente utilizadas en el campo de la visión: YOLO
(You Only Look Once, YOLOv7) y Mask R-CNN.
La elección de la arquitectura YOLOv7 para la detección de objetos se debe a su capacidad para
identificar objetos de manera eficiente en tiempo real. YOLO utiliza una única iteración para
detectar objetos en una imagen, lo que la hace especialmente adecuada para aplicaciones donde
la velocidad es un factor crítico.
Por otro lado, la arquitectura Mask R-CNN se seleccionó para abordar la tarea de la segmen-
tación semántica. Esta permite asignar una máscara a cada objeto detectado, lo que brinda
información detallada de la forma precisa de cada objeto en la imagen.
Ambas arquitecturas, YOLO y Mask R-CNN, se han entrenado y evaluado utilizando la reco-
nocida base de datos COCO (Common Objects in Context). COCO ofrece una amplia variedad de
imágenes etiquetadas y anotadas, lo que permite entrenar las redes neuronales en un conjunto
diverso de categorías de objetos y contextos.
Abstract
This project proposes to perform object recognition in indoor environments based on semantic
segmentation using deep neural networks. To achieve this, two reference architectures widely
used in the vision field have been selected: YOLO (YOLOv7) and Mask R-CNN.
The choice of the YOLOv7 architecture for object detection is due to its ability to efficiently
identify objects in real time. YOLO uses a single pass through the neural network to detect
objects in an image, making it especially suitable for real-time applications where speed is a
critical factor.
On the other hand, the Mask R-CNN architecture was selected to address the task of semantic
segmentation. It is used for mask assigment to each detected object, which provides detailed
information on the precise shape of each object in the image.
Both architectures, YOLO and Mask R-CNN, have been trained and evaluated using the well-
known COCO (Common Objects in Context) database. COCO provides a wide variety of labeled
and annotated images, allowing neural networks to be trained on a diverse set of object cate-
gories and contexts.
Idioma
spa
Palabras clave
Citación
Sarria Arteaga, A. M. y Rojas Guayambuco, A. M. (2023). Sistema de Identificación de Objetos en Espacios Cerrados Basado en Segmentación Semántica. [Trabajo de Grado, Universidad Santo Tomas´]. Reportorio Institucional.
Colecciones
Licencia Creative Commons
Atribución-NoComercial-SinDerivadas 2.5 Colombia