Aprendizaje de movimientos en robot humanoide a partir de inferencia de objetivos

Documentos PDF
Cargando...
Miniatura

Resumen

Este documento presenta la aplicación del aprendizaje por refuerzo inverso (IRL por sus siglas en inglés) en un robot humanoide conocido como Poppy Torso, con el fin de realizar movimientos de las extremidades superiores. El aprendizaje por refuerzo inverso se basa en el aprendizaje a partir de las demostraciones (trayectorias) de un experto. Con el fin de obtener una utilidad final lo más cercana a la utilidad obtenida por el experto en su recorrido, previamente se implementa un aprendizaje por refuerzo (RL por sus siglas en inglés) con una recompensa plenamente establecida dentro del entorno diseñado, el cual logró cumplir el objetivo que corresponde a generar movimientos desde un punto aleatorio hasta un punto establecido. El robot en simulación logra en la mayoría de los casos (con un porcentaje del 97.5% realizado sobre 1000 pruebas) llegar a su objetivo, tanto por aprendizaje por refuerzo como por refuerzo inverso.

Abstract

This document presents the application of Inverse Reinforcement Learning (IRL) in a humanoid robot known as Poppy Torso, in order to perform upper extremity movements. Inverse Reinforcement Learning (IRL) is based on learning from the demonstrations (trajectories) of an expert. In order to obtain a final utility as close to the utility obtained by the expert in his task, reinforcement learning (RL) is previously implemented with a fully established reward within the designed environment, which achieved fulfill the objective that corresponds to generating movements from a random point to a set point. The robot in simulation achieves in most cases (with a percentage of 97.5% performed on 1000 tests) to reach its objective, both by reinforcement learning and by inverse reinforcement.

Idioma

spa

Palabras clave

Citación

Suarez Huertas, Y. E. (2020). Aprendizaje de movimientos en robot humanoide a partir de inferencia de objetivos [tesis de pregrado, Universidad Santo Tomás] Repositorio instituconal - Universidad Santo Tomás

Licencia Creative Commons

Atribución-NoComercial 2.5 Colombia
Atribución-NoComercial 2.5 Colombia