Implementación de un sistema de reconocimiento de comandos de voz en sistemas embebidos orientado a entornos domóticos y al desarrollo de una guía de laboratorio
Cargando...
Archivos
Fecha
Autores
Vargas Cruz, Sergio Emiro
Melo Suarez, David Ricardo
Director
Enlace al recurso
DOI
Google Scholar
gruplac
Descripción Dominio:
Título de la revista
ISSN de la revista
Título del volumen
Editor
Universidad Santo Tomás
Compartir
Descripción
Este proyecto presenta el diseño e implementación de un sistema de reconocimiento de coman dos de voz en un entorno embebido, orientado al control de dispositivos domóticos. Se emplea el procesador digital de señales TMS320C5535, integrando el codec TLV320AIC3204 y una inter faz UART con Arduino para la activación de actuadores mediante comandos de voz. El sistema incluye etapas completas de adquisición de audio, preprocesamiento (eliminación de silencios,
normalización, preénfasis y ventaneo), extracción de características mediante Mel-frequency cepstral coeficients (MFCC) y clasificación con tres modelos: Dynamic Time Warping (DTW), Gaussian Mixture Models (GMM) y distancia Euclidiana con normalización CMVN. Los resul tados muestran que el modelo GMM ofrece el mejor balance entre precisión (86 % en ambientes ruidosos) y eficiencia computacional. Además, se desarrolló una guía de laboratorio que re fuerza el aprendizaje del procesamiento digital de señales, fomentando el interés estudiantil en esta área crítica para la ingeniería electrónica actual.
Abstract
This project presents the design and implementation of a voice command recognition sys tem on an embedded platform aimed at controlling home automation devices. The system is based on the TMS320C5535 digital signal processor, integrating TLV320AIC3204 audio co dec and a UART interface with an Arduino to toggle actuators voice commands. It includes complete stages of audio acquisition, preprocessing (silence removal, Z-score normalization, pre-emphasis, and windowing), feature extraction using Mel-frequency cepstral coeficients (MFCC), and classification using three models: Dynamic Time Warping (DTW), Gaussian Mix ture Models (GMM), and Euclidean Distance with CMVN normalization. Results indicate that GMM achieves the best trade-off between accuracy (86 % under noisy conditions) and compu tational efficiency. A complementary lab guide was developed to enhance the learning of digital signal processing and to encourage student engagement in this key area of electronic enginee ring.
Idioma
spa
Palabras clave
Citación
Melo Suarez, D. R., y Vargas Cruz, S. E. (2025). Implementación de un sistema de reconocimiento de comandos de voz en sistemas embebidos orientado a entornos domóticos y al desarrollo de una guía de laboratorio. [Trabajo de Grado, Universidad Santo Tomás]. Repositorio Institucional.
Colecciones
Licencia Creative Commons
Attribution 2.5 Colombia

