Evaluación de Algoritmos de Navegación a través de Aprendizaje por Refuerzo Profundo sobre el Vehículo Autónomo Deep Racer AWS

Documentos PDF
Cargando...
Miniatura

Resumen

El presente trabajo de grado tiene como objetivo comparar algoritmos de aprendizaje por refuerzo profundo, también conocido como Deep Reinforcement Learning, en el contexto de la navegación autónoma. Se evaluaron tres algoritmos en particular: SAC (Soft Actor-Critic), PPO (Proximal Policy Optimization) y una versión modificada de SAC. Las pruebas se llevaron a cabo en el vehículo autónomo Deep Racer de la empresa AWS. Para llevar a cabo la evaluación, se implementó cada algoritmo tanto en una simulación virtual como en el vehículo autónomo físico. Se realizaron múltiples pruebas en una pista de navegación estandarizada para garantizar la consistencia de los resultados. Durante estas pruebas, se recopilaron datos sobre el desempeño de cada algoritmo, incluyendo métricas como el tiempo de ejecución, la distancia recorrida y la velocidad alcanzada. Después de recopilar los datos experimentales, se realiza un análisis comparativo de los resultados obtenidos por cada algoritmo. Se evalúa su rendimiento en base a las métricas establecidas y se identifican las fortalezas y debilidades de cada uno.

Abstract

The present work aims to compare deep reinforcement learning algorithms, also known as Deep Reinforcement Learning, in the context of autonomous navigation. Three algorithms in particular were evaluated: SAC (Soft Actor-Critic), PPO (Proximal Policy Optimization) and a modified version of SAC. The tests were carried out on AWS’s Deep Racer autonomous vehicle. To conduct the evaluation, each algorithm was implemented on both a virtual simulation and the physical auto nomous vehicle. Multiple tests were conducted on a standardized navigation track to ensure consistency of results. During these tests, data was collected on the performance of each algorithm, including metrics such as execution time, distance traveled, and speed achieved. After collecting the experimental data, a comparative analysis of the results obtained by each algorithm is performed. Their performance is evaluated based on the established metrics and the strengths and weaknesses of each one are identified.

Idioma

spa

Palabras clave

Citación

Gil Suarez, A. L. (2023). Evaluación de Algoritmos de Navegación a través de Aprendizaje por Refuerzo Profundo sobre el Vehículo Autónomo Deep Racer AWS [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.

Licencia Creative Commons

Atribución-NoComercial-SinDerivadas 2.5 Colombia