Download Codificación bidimensional de patrones vocales mediante un
Transcript
Codificación bidimensional de patrones vocales mediante un esquema de reducción dimensional basado en redes neuronales Alejandro Bassi A. Universidad de Chile Departamento de Ciencias de la Computación abassi@dcc.uchile.cl Caracterización fonética del timbre oído interno descompone en frecuencias escala no lineal lo importante es la envolvente del espectro Caracterización articulatoria del habla bastan dos dimensiones Relación articulación/timbre posición de "formantes" Codificación de la envolvente del espectro cepstrum reducción dimensional: lineal (componentes principales) no lineal (redes neuronales) calidad de la reconstrucción Reconstrucción lineal (2D) Reconstrucción lineal (3D) Reconstrucción lineal (4D) Reducción dimensional con redes neuronales estructura codificador/decodificador entrenamiento autoasociativo decodificador basado en composición gausiana Codificación inicial Codificación final Reconstrucción (diptongos) Posición de formantes Reconstrucción (palabra: "cuatro") Reconstrucción (otra palabra: "nueve") Reconstrucción (diptongos, otro hablante) Comparación entre hablantes Conclusiones buena reconstrucción (visualización) reducción dimensional / seguimiento formantes contexto general / contexto local Reconocimiento de patrones (TDW, HMM) ¿varios hablantes? normalización del "triángulo"