Aprendizaje por refuerzo para manipulación de objetos con actuador robótico

Documentos PDF

Descripción

Este proyecto implementará un algoritmo de aprendizaje por refuerzo para la manipulación de objetos por parte de un brazo robótico, enfocado en tareas que debatirán realizar un robot de servicio doméstico. Partirá de la implementación de la plataforma robótica, la cual tendrá los grados de libertad y el actuador específico para la manipulación de objetos encontrados en situaciones cotidianas. A continuación, se planteará el algoritmo de aprendizaje por refuerzo, partiendo del espacio de estados que mejor describe el ambiente, y el espacio de acciones que permite realizar las tareas de forma adecuada. Así mismo se estudiarán métodos que evaluarán el estado a partir de la observación directa del ambiente, como redes neuronales profundas. El entrenamiento se realizará en su mayoría en un entorno de simulación, con el fin de no poner en riesgo la integridad física del robot en las primeras etapas de aprendizaje. Al final del proceso, si se considera necesario, se refinará el entrenamiento obtenido con el robot real. A continuación, se evaluará cuantitativamente el resultado obtenido por el agente en las diferentes tareas aprendidas. Finalmente, se iniciará con la implementación de este brazo robótico en un prototipo de robot social doméstico construido en su totalidad por la Universidad Santo Tomás, con el fin de participar en certificados de robótica social y doméstica.

Abstract

This project will implement a reinforcement learning algorithm for the manipulation of objects by a robotic arm, focused on tasks that a domestic service robot will discuss. It will start from the implementation of the robotic platform, which will have the degrees of freedom and the specific actuator for the manipulation of objects found in everyday situations. Next, the reinforcement learning algorithm will be proposed, starting from the state space that best describes the environment, and the action space that allows tasks to be carried out properly. Likewise, methods that will evaluate the state from direct observation of the environment, such as deep neural networks, will be studied. The training will be carried out mostly in a simulation environment, in order not to jeopardize the physical integrity of the robot in the early stages of learning. At the end of the process, if deemed necessary, the training obtained with the real robot will be refined. Next, the result obtained by the agent in the different tasks learned will be evaluated quantitatively. Finally, it will begin with the implementation of this robotic arm in a prototype of a domestic social robot built entirely by the Santo Tomás University, in order to participate in certificates of social and domestic robotics.

Idioma

Palabras clave

Citación

Colecciones

Licencia Creative Commons

Atribución-NoComercial-SinDerivadas 2.5 Colombia