Desarrollo de un Algoritmo de Navegación Autónoma Basado en Técnicas de Aprendizaje por Refuerzo Usando Información Visual
Cargando...
Fecha
2023-01-31
Director
Enlace al recurso
DOI
Google Scholar
gruplac
Descripción Dominio:
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Santo Tomás
Compartir
Documentos PDF
Cargando...
Resumen
En este proyecto se realiza la implementación de un algoritmo de
navegación autónoma basado en información visual, usando aprendizaje
profundo por refuerzo (DRL, por sus siglas en inglés Deep Reinforcement
Learning). El algoritmo le enseña a un agente a identificar patrones
visuales para navegar hacia un objetivo en un entorno cerrado y
desconocido.
El proceso de aprendizaje se compone de tres etapas: clasificación,
imitación y entrenamiento, y un sistema de Replay Memory. Las etapas de
aprendizaje brindan al agente diferentes herramientas para categorizar la
información y tomar una decisión, transfiriendo el conocimiento adquirido
en cada una. Por su parte, el sistema de Replay Memory le proveé
información al agente de experiencias pasadas para entender y resolver
entornos desconocidos. A su vez, el algoritmo se basa en un modelo de
entrenamiento redes Q profundas (DQN, por sus siglas en inglés Deep Q
Network), con una recompensa hacia el agente en cada interacción con el
entorno. La evaluación del algoritmo se realiza a través de experimentos
basados en la interacción con entornos simulados de diferentes tamaños,
rutas y caracteracterísticas.
Abstract
This project proposes the implementation of an algorithm autonomous
navigation based on visual information using deep reinforcement learning.
The algorithm aims to teach an agent to identify visual patterns to
navigate to a goal in closed and unknown environments.
The learning process is made out of three stages: Classification,
Imitation and Training, and a Replay Memory system. The Learning
stages provide the agent with different tools to classify the information
and make a decision, transferring the knowledge acquired in each one.
Meanwhile, the replay memory provides the agent information from past
experiences to understand and solve unfamiliar environments. At the same
time, the algorithm is based on a Deep Q Network (DQN) model, with a
reward to the agent in each interaction with the environment. The
evaluation of the algorithm is performed through experiments based on
the interaction with simulated environments of different sizes, routes and
features.
Idioma
spa
Palabras clave
Citación
Aponte Vargas, D. F., y Martínez Méndez, E. D. (2023). Desarrollo de un Algoritmo de Navegación Autónoma Basado en Técnicas de Aprendizaje por Refuerzo Usando Información Visual. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.
Colecciones
Licencia Creative Commons
Atribución-NoComercial-SinDerivadas 2.5 Colombia