Download implementación y análisis de un sistema ambiofónico a partir del

Document related concepts

Ambiofonía wikipedia , lookup

Surround wikipedia , lookup

Holofonía wikipedia , lookup

Joint stereo wikipedia , lookup

Auriculares wikipedia , lookup

Transcript

IMPLEMENTACIÓN Y ANÁLISIS DE UN SISTEMA AMBIOFÓNICO A
PARTIR DEL PROCESADOR RACE
CHRISTIAN CAMILO CABEZAS
UNIVERSIDAD DE SAN BUENAVENTURA
FACULTAD DE INGENIERÍA
INGENIERÍA DE SONIDO
BOGOTÁ D.C.
2009
IMPLEMENTACIÓN Y ANÁLISIS DE UN SISTEMA AMBIOFÓNICO A
PARTIR DEL PROCESADOR RACE
CHRISTIAN CAMILO CABEZAS
Proyecto de grado
Tutor de forma: Olga Lucía Mora
Tutor de fondo: Ing. Luis Fernando Hermida
UNIVERSIDAD DE SAN BUENAVENTURA
FACULTAD DE INGENIERÍA
INGENIERÍA DE SONIDO
BOGOTÁ D.C.
2009
_________________________
Firma del presidente del jurado
_________________________
Firma del jurado
_________________________
Firma del jurado
Bogotá D.C
CONTENIDO
INTRODUCCIÓN
1. PLANTEAMIENTO DEL PROBLEMA
1.1 ANTECEDENTES
1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA
1.3 JUSTIFICACIÓN
1.4 OBJETIVOS
1.4.1 Objetivo general
1.4.2 Objetivos específicos
1.5 ALCANCES Y LIMITACIONES
2. MARCO REFERENCIAL
2.1 MARCO TEÓRICO- CONCEPTUAL
2.1 Estéreo y falencias
2.1.1 Reproducción y problemas del Crosstalk
2.1.1.1 Crosstalk y la imagen sonora
2.1.1.2 Respuesta en frecuencia y Comb-filtering
2.1.3 Efectos en estudios profesionales
2.1.4 El dipolo estéreo
2.2 El método ambiofónico
2.2.1 Grabación ambiofónica
2.2.2 Comportamiento del Pinna (oído externo)
2.2.3 El ambiófono
2.3 Procesador RACE
2.3.1 Opciones de implementación
2.3.1.1 Sistema Tact RCS 2.0
2.3.1.2 Software Audiomulch
2.4 Sala de reproducción ambiofónica
3. METODOLOGÍA
3.1 ENFOQUE DE LA INVESTIGACIÓN
3.2 LÍNEA DE INVESTIGACIÓN
3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN
3.4 HIPÓTESIS
3.5 VARIABLES
3.5.1 Variables independientes
3.5.2 Variables dependientes
4. DECISIÓN INGENIERIL
5. ANÁLISIS DE DATOS
6. CONCLUSIONES
7. RECOMENDACIONES
BIBLIOGRAFÍA
ANEXOS
INTRODUCCIÓN
Hace ya más de 75 años se ha empleado el concepto práctico y teórico de estereofonía y
se ha desarrollado un gran número de técnicas para su grabación y reproducción, no
obstante, los dispositivos que manejan señales estéreo tardaron varios años en
reemplazar a los sistemas monofónicos en el hogar y en general, cualquier lugar en
donde existía la necesidad de reproducir señales de audio. Por tanto la estereofonía fue
la generación que siguió a la monofonía y aunque se encuentra en casi cualquier
sistema actual, la búsqueda por mejores percepciones subjetivas ha llevado a la
implementación de sonido envolvente en distintos formatos (entre ellos el 5.1) y la
captura binaural entre otras. Todas ellas con el fin de lograr una sensación espacial
realista a nivel acústico buscando una imagen sonora óptima y la percepción de “estar
ahí presente”.
En el caso del estéreo, se toma la apreciación de difusión sonora y relación interaural
como un nuevo camino a seguir para tratar el audio y la manera en que los oídos han de
interpretarlo. Sin embargo, nuevas teorías sobre el comportamiento del oído y las
variaciones que padece una señal en el proceso de interpretación auditiva, ha llevado a
tomar el problema desde una perspectiva diferente.
Entran entonces, conceptos nuevos como el comportamiento del Pinna (oído externo),
la relación interaural, el método de función de transferencia relacionado a la cabeza (en
inglés HRTF) y las características que afectan el comportamiento de estos en un recinto
y en la geometría existente entre las fuentes sonoras y el oído.
El método de ambiofonía nace de los análisis de los fenómenos y condiciones
previamente mencionados y aunque se diferencia de sistemas de la misma índole en
varios aspectos, el objetivo que busca es el mismo: mejorar la sensación auditiva al
reproducir material de audio. El método ha llegado a tal punto que sus precursores y
principales especialistas afirman que este es el siguiente paso después de la estereofonía
y que incluso, puede lograr mejores resultados que los sistemas 5.1, con una menor
cantidad de altavoces.
Cabe mencionar que, el método de ambiofonía se enfoca principalmente a reproducir la
sensación que tiene un espectador en la silla con mejor ubicación en una sala de
conciertos, esto con el fin de lograr una percepción espacial mayor a la del estéreo y
con un método diferente para lograr envolvencia.
Las teorías que sustentan el método son puestas a la práctica gracias al procesador de
Eliminación Recursiva Ambiofónica de Crosstalk (RACE) el cual se puede programar
en un DSP o disponer como un plug-in VST que reduce los datos de ILD e ITD en un
sistema de dos canales y a diferencia del estéreo, utiliza una menor distancia entre los
parlantes frontales.
El presente trabajo pretende implementar un sistema ambiofónico analizando sus
fundamentos teóricos, el tipo de captura, procesamiento y reproducción de material
idóneo para dicha técnica. Evaluando diferentes aspectos a considerar respecto a cada
etapa, para determinar que tan favorable es utilizar sistemas ambiofónicos y que
medidas se deben tomar en cuenta para su uso.
A lo largo del trabajo se encontrará una nomenclatura específica respecto a las
imágenes e información anexa. Las figuras muestran imágenes puntuales, las tablas
indican una tabulación de datos y las gráficas son sistemas de representación de datos.
1. PLANTEAMIENTO DEL PROBLEMA
1.1 ANTECEDENTES
Existen varios métodos que han tratado de mejorar la percepción espacial de material
de audio. Ambisonics, por ejemplo, consiste en una serie de técnicas de grabación y
reproducción usando tecnología de mezcla multicanal que puede ser usada en sonido en
vivo. Fue establecido en los años setentas por el especialista Michael Gerzon y se basa
en el principio de Síntesis de frente de Onda o Wave Front Synthesis. Es isotrópica, por
lo cual consideran las fuentes iguales y proporciona una buena sensación auditiva.
Para su uso se necesita de una codificación y decodificación en 2d o 3d (plana o
perifónica). Por lo cual requiere de un decoder ambisónico y exige como mínimo cuatro
altavoces lo cual puede llegar a limitar el campo sonoro y además, según el Sr. Ralph
Glasgal1: “…el método no es eficaz en frecuencias sobre los 1500 Hz y por lo tanto se
vale de la habilidad aparente del cerebro para ignorar esta falta de localización realista
en altas frecuencias”.
El concepto teórico Wave Front Synthesis es similar al de Wave Field Synthesis, sin
embargo, este último posee un sistema distinto que fue desarrollado en 1988 por el
Profesor A. J Berkhout2 bajo este principio también se bada el método de la homofonía.
Dicha teoría, conocida como el principio de Huygens, sostiene que todo frente de onda
puede ser considerado como una superposición de ondas esféricas elementales. Por
tanto, el método asegura que se pueden producir frentes de onda artificiales sintetizados
desde un gran número de altoparlantes manejados individualmente.
La ventaja es que se pueden establecer localizaciones estables de las fuentes (la
holofonía por ejemplo, recrea una copia virtual genuina del campo sonoro) y se le
puede adecuar una técnica denominada “virtual panning spots” con el fin de reducir la
influencia del movimiento del receptor.
No obstante, existe una fuerte reducción en el nivel horizontal suministrado por los
altavoces, debido a variaciones necesarias en el método. Se produce también un
problema conocido como “truncation effect” que afecta la reproducción del audio ya
que al haber varios altavoces recreando un frente de onda, hay variaciones de presión
que afectan el resultado. Además, se hace difícil crear transductores cercanos entre sí y
generar un número ilimitado de ondas elementales (efecto “Aliasing”).
Cabe mencionar como antecedente también, los estudios de la función HRTF o ATF, la
cual describe como una onda sonora de entrada es filtrada por las propiedades de
difracción y rarefacción de la cabeza, el oído externo (Pinna) y el torso, antes de que
este llegue al tímpano y al oído medio. Esta función puede ser hallada a partir del HRIR
1
2
GLASGAL, Ralph. Chapter 1 “Wave front synthesis” Ambiophonics 2nd Edition.
BERKHOUT A.J AES E-Library: Wave Front Synthesis: A new Direction in Electroacoustics”
(Head Related Impulse Response) y resulta de suma importancia para todo tipo de
aplicaciones y técnicas binaurales.
Como antecedentes en proyectos de grado se encuentran:
•
“Diseño y construcción de sistemas electrónicos virtuales para el procesamiento
y la generación de señal musical en tiempo real soportados como plug-in VST:
vocoder de fase y reverberación digital” Juan Manuel Medina.
•
“Análisis comparativo de cuatro configuraciones de microfonía en estéreo”
Francisco castro.
1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA
La idea de la ambiofonía ha sido probada pocas veces en el mundo, logrando resultados
realmente satisfactorios, sin embargo, no se ha probado en Latinoamérica ya que no
existe mucho conocimiento sobre el tema y hay un cierto escepticismo hacia el tema a
en la comunidad de sonido y audio. La ambiofonía presenta las ventajas y alcances de
su método claramente, desde los puntos de vista teóricos y prácticos y su conocimiento
está abierto al dominio público.
El método puede llegar a cambiar la manera de procesar cualquier tipo de material de
audio en cada una de sus etapas, desde grabación hasta masterización, lo cual mejoraría
la percepción espacial y la localización psicoacústica de fuentes. Crearía nuevas
experiencias auditivas y revolucionaría los dispositivos de procesamiento de señal en
hogares y estudios especializados.
Por tanto es importante examinar cuán grande es y puede llegar a ser y puede incluso
abrir muchas puertas para mayores desarrollos. Por tanto el problema a resolver será:
¿Cómo se debe implementar el método de ambiofonía en cada una de sus etapas desde
grabación a reproducción, usando el procesador RACE y cómo se puede mejorar el
mismo?
1.3 JUSTIFICACIÓN
Dado que el sistema ambiofónico es bastante reciente y sigue en proceso de desarrollo,
no es bien conocido a nivel mundial aunque ya ha estado en discusión y demostración
en reuniones de la AES. También existe escepticismo entre la comunidad de sonido y
audio porque la base conceptual del sistema ambiofónico contradice y en cierta manera
rechaza ciertos parámetros en los cuales se basan criterios y procedimientos de la
estereofonía y el procesamiento de señal de audio. Por tanto, como el método pretende
reemplazar a estéreo, se debe evaluar su capacidad, alcance y viabilidad.
Por esta razón y quizás también por poca publicidad o implementación de esta
tecnología, el sistema es poco conocido en Latinoamérica, pero representa un área de
estudio importante que puede ser desarrollada para ofrecer un gran campo de acción en
diversos aspectos de la producción de audio, ya que al ser un método nuevo y
revolucionario, necesita de trabajo para ampliarse y lograr nuevos y mejores resultados.
Según el método ambiofónico – y en general todos los esfuerzos por lograr un nuevo
modelo de reproducción de audio innovador y más eficaz- existen múltiples problemas
con el estéreo, aunque cada método aborda de distinta manera el manejo del estéreo y el
modo de reproducción de audio en dos canales.
Todos estos se basan en los principios de la teoría binaural aunque sus criterios y
fundamentos sean distintos.
A grandes rasgos, el problema principal del estéreo radica en el fenómeno de crosstalk
o habla cruzada, es decir, el arribo de una señal de uno de los dos parlantes al oído
receptor contrario (parlante izquierdo al oído derecho y parlante derecho al oído
izquierdo) y los inconvenientes que se originan a partir del mismo:
•
Compresión del ancho de la fuente en el escenario.
•
Picos y frecuencias nulas generadas en el centro por la reproducción simultánea
de dos parlantes (Comb filtering).
•
Crosstalk secundario generado por el comportamiento de la cabeza y posterior
ilusión de cambio de timbre.
Por lo tanto, se ven involucrados muchos temas de la ingeniería de sonido que van
desde teoría acústica y psicoacústica hasta manejo de señales digitales por medio de
DSP. También es importante aclarar que, incluso si el método de ambiofonía llegase a
presentar alguna falla nueva u omita algún detalle respecto al tratamiento del problema,
resulta de suma importancia analizar el mismo ya que el método hace ciertas
observaciones acerca del funcionamiento de estéreo que son importantes para cualquier
persona involucrada en el desarrollo de sistemas y material para reproducción de audio
en dos o más canales.
1.4 OBJETIVOS
1.4.1 Objetivo general
Implementar y analizar el método ambiofónico, utilizando como base el procesador
RACE.
1.4.2 Objetivos específicos
•
Adecuar un recinto para realizar pruebas iniciales sobre el método con material
existente.
•
Realizar el montaje y posterior grabación con un ambiófono.
•
Diseñar y programar la función de un DSP en el software Matlab a partir del
diagrama de bloques con el cual funciona el eliminador RACE para procesar el
material grabado.
•
Seleccionar y adecuar un recinto para la reproducción del material ambiofónico.
•
Realizar una encuesta para valorar la respuesta del resultado obtenido.
•
Establecer posibles correcciones del procesador, de las ecuaciones propuestas
por el método y de la implementación del sistema para distintos lugares.
1.5 ALCANCES Y LIMITACIONES
El proyecto generar una nueva propuesta, la cual podría cambiar los sistemas de
reproducción en hogares e incluso salas de mezcla y masterización. Puede dar pie a
trabajos en grabación y desarrollo de nuevos sistemas procesamiento de señal. De
trabajarse a fondo, puede dar origen a sistemas con múltiples altavoces que tengan preconfiguraciones para simular distintos tipos de recintos, dando un ángulo de
especialidad completo y sensación de altura determinadas.
Este método no abandona el trabajo hecho con producciones estereofónicas y busca
mejorar la percepción de las ya realizadas, por tanto su desarrollo representa un campo
amplio en todas las materias relacionadas.
Sin embargo, algunas limitaciones pueden llegar a ocurrir por problemas para realizar
pruebas con múltiples parlantes, debido a la adquisición de un DSP multicanal.
Además el método sigue ciertos parámetros y condiciones que pueden ser difíciles de
cumplir en la reproducción como por ejemplo, la adecuación de recintos y
características de altavoces a usar.
Las características del recinto a reproducir el audio grabado exigen condiciones que
pueden ser difíciles de lograr debido al presupuesto y material destinado a la
adecuación de este lugar. Se busca que no existan ningún tipo de reflexiones propias del
recinto en el área a escuchar, además de un RT60 menor a 0.2 seg y en general, una
absorción considerable en casi todas las superficies del cuarto, lo cual resulta ser
complicado de alcanzar.
2. MARCO REFERENCIAL
2.1 Estéreo y falencias
El término viene del griego stéreos, que significa “sólido” y —aunque se refiere
exclusivamente a sistemas de dos canales— el término se puede aplicar a cualquier
sistema de audio que usa más de un canal, así como el audio de 5.1 canales.
El sonido estereofónico es un término que hace referencia a grabación y reproducción
que usa proyección estereográfica para codificar posiciones relativas y eventos
grabados.
Para la reproducción estereofónica en espacios abiertos, se suele ubicar un par de
monitores que conforman un triángulo equilátero cuyo tercer punto es la posición del
oyente.
De acuerdo al Sr. Robin Miller3 denominamos al triángulo como “parlante-stereo”
mientras que al método propuesto por ambiofonía se le denomina “parlante-binaural”
aunque esto propone una discusión gramatical para algunos, en cierto sentido se evade
la misma ya que lo que nos pretende decir es que el stereo no cumple la labor para la
cual está destinada por lo cual el “parlante-binaural” es una mejor manera de escuchar
el estéreo.
Aunque el problema ha sido diagnosticado desde hace ya bastante tiempo y el sistema
estéreo existe desde hace más de 70 años, hacía falta un mayor conocimiento
psicoacústico y procedimientos técnicos y tecnológicos para eliminar los problemas
ocasionados por el sistema de reproducción en estéreo.
2.1.1 Reproducción y problemas del Crosstalk
Uno de los grandes estudios sobre el fenómeno del Habla Cruzada Interaural o
“Interaural Crosstalk” fue propuesto para la reunión de la AES del año 1986 por los
doctores Timothy Bock y Don Keele Jr.4.
3
MILLER, Robin “How Good Can Stereo Be? – Try Ambiophonics and See. Speaker Stereo v. Speaker
Binaural. 2008.
4
BOCK, Timothy. KEELE JR, Don B. “The effects of interaural crosstalk on stereo reproduction and
minimizing interaural crosstalk in nearfield monitoring by the use of a physical barrier”
De acuerdo a dicha publicación, hablamos de Crosstalk cuando el sonido reproducido
por un parlante es percibido por el oído contra-lateral u opuesto. Es decir, cuando el
oído derecho recibe rayos sonoros emitidos por el parlante izquierdo y viceversa (Fig
1).
Figura 1 Arreglo en estéreo
El crosstalk es amplio en la disposición espacial de reproducción en estereo y sus
principales falencias readican en el efecto en la imagen sonora y en la respuesta en
frecuencia.
En el caso de la imagen, el problema se debe a que el ancho del escenario está
restringido por la separación angular de los parlantes además del efecto del crosstalk en
contra de la precisión de las imágenes creadas.
Además, la reproducción genera filtrado tipo peine (comb-filtering) en el campo de
sonido directo frente a los parlantes, el cual es mayor para fuente centrales.
2.1.1.1 Crosstalk y la imagen sonora
La disposición espacial de los parlantes en estéreo, produce imágenes fuera de la
cabeza que se pueden localizar fácilmente en los extremos izquierdo y derecho y en el
centro, no obstante, la localización se dificulta entre estos puntos debido a la falta de
claridad y difusión de los mismos.
Si se produjese una cancelación efectiva del crosstalk interaural en la cual la fase y
tiempo de arribo de una señal a cada oído pudiese ser tratada independientemente, el
ángulo de percepción espacial podría llegar a los 180° e incluso a los 360° (cabe
mencionar que los estudio que comprueban está teoría fueron realizados en cámaras
anecoicas).
Dicho efecto se puede cancelar con audífonos pero si el material a reproducir no toma
en cuenta ciertos factores (como el estéreo convencional), la percepción auditiva
seguirá viéndose afectada.
El Dr Keele relaciona las reflexiones tempranas de un escenario con este fenómeno
afirmando que “las grabaciones en estéreo en las cuales se han controlado y reducido
las reflexiones tempranas, son realmente capaces de acercarse al comportamiento ideal
respecto al espacio”.5
2.1.1.2 Respuesta en frecuencia y Comb-filtering
Los defectos del estéreo en la respuesta en frecuencia se deben a la generación de
comb-filtering en el campo sonoro en donde se encuentra la cabeza, aunque la misma
aporta al decrecimiento de este fenómeno. Esto quiere decir que la respuesta en
frecuencia en el punto de audición va a ser filtrada y por ende distorsionada para
asemejarse a un filtro tipo peine que creará picos y nulos en la respuesta en frecuencia
audible.
Según el Dr. Keele, en condiciones reales la configuración de reproducción estéreo
presentará una señal de crosstalk –para una imagen sonora central- con una atenuación
de -0.3 dB y un retardo de 250useg después del sonido directo llegando de cada
parlante a su lado correcto de la cabeza. Afirma además que debido a los nulos
5
KEELE JR, Don. BOCK, Timothy. “The effects of interaural crosstalk on stereo reproduction and
minimizing interaural crosstalk in nearfield monitoring by the use of a physical barrier” 1986. p. 8-9
cercanos y el crosstalk posterior (proveniente de la parte superior y trasera de la
cabeza), el oído percibe esto como un cambio de timbre.
La mayor relación pico-a-nulo del comb-filtering se genera precisamente en la imagen
central estéreo ya que como la imagen central se crea con señales iguales en fase
coincidentes de los dos parlantes, el crosstalk presente estará en el máximo valor.
Para señales completamente paneadas a la derecha o izquierda, no hay comb-filtering
porque solo un parlante está activo.
Destaca además que el oído puede diferenciar una variación de un grado en posición
angular para fuentes reales, lo cual no sucede en la reproducción porque el oído es más
sens|ible a los efectos de convolución propia del oído externo e intensidades del mismo
mecanismo.
Cabe resaltar que este tipo de filtrado ocurre siempre que hay una mezcla entre dos
señales que se diferencian por una variación en retardo y suelen generar cambios en la
coloración de la señal.
2.1.3 Efectos en estudios profesionales
El Dr. Keele llegó a la conclusión de que el diseño acústico de las salas de monitoreo
de los estudios profesionales de su época (hace más de 20 años) incrementan el efecto
nocivo del fenómeno de comb-filtering en varios aspectos. Muchos de los principios en
el diseño de estos recintos aún se aplican hoy en día, por lo cual el acercamiento
planteado por estas conclusiones es aún importante en la actualidad.
Los diseños basados en los principios LEDE (Live End Dead End) y las zonas libres de
reflexiones aumentan en gran manera los efectos del crosstalk interaural.
En el caso de los estudios que presentan ausencia de reflexiones y cuya señal se
caracteriza por llegar correctamente en tiempo y a campo directo con bajas reflexiones
tempranas, también aumentan el efecto del crosstalk interaural.
En algunos casos sucede que las reflexiones tempranas en los estudios ayudan a
enmascarar el crosstalk y esto no ocurre en sitios con campo directo, por ende si se
enfatiza en un ambiente libre de reflexiones y con un monitoreo igual para ambos
parlantes, asegura que el crosstalk estará presente y que debido a que no tiene
restricciones específicas, obtendrá el mayor valor que pueda tener. Lo cual resulta
bastante lógico, ya que mientras más estrictos sean los estándares en el estéreo y mayor
sea la intención de obtener campo directo, mayor será la susceptibilidad del sistema a
generar estos fenómenos.
2.1.4 El dipolo estéreo
Se denomina dipolo estéreo a un arreglo del estéreo convencional en el cual los
parlantes se separan a 10° del receptor cada uno, por lo cual habrá un ángulo de 20°
entre los parlantes y el oyente. Empezó a implementarse a partir de las teorías
previamente mencionadas, para ampliar el ángulo de percepción sonora 180° por
medio de cancelación de crosstalk.
La razón para dicha reducción espacial es simple, reduce el ángulo del crosstalk
interaural al hacer que los rayos lleguen con una diferencia menor en nivel y tiempo.
No obstante, se necesita un medio para minimizar el crosstalk restante. Esto se puede
conseguir con una barrera acústica frente al oyente entre los dos parlantes (véase la fig
2) o por medios electrónicos.
Figura 2 Arreglo en dipolo estéreo con una barrera acústica según método
ambiofónico.
Existen antecedentes de métodos para eliminar el crosstalk como los de Lexicon y
Carver entre otros. No obstante, su problema radica en que no lo han hecho por medio
del dipolo estéreo sino por el triángulo estéreo convencional, y por lo tanto el campo
sonoro sigue viéndose limitado por la posición espacial de los parlantes. Cabe recordar
que la función del dipolo estéreo es reducir el ITD e ILD al tratar de que las señales
lleguen simultáneamente, sin embargo no se había tomado en consideración romper el
triángulo equilátero.
2.2 El método ambiofónico
El método ambiofónico implementado por el Sr. Ralph Glasgal, consiste en un sistema
capaz de recrear campos sonoros de excelentes salas de concierto para cuartos de
audición en el hogar, buscando una percepción espacial mejor que la de estéreo y una
localización de fuentes exacta para un escenario determinado. La figura 2 muestra
también la totalidad de la cadena de reproducción ambiofónica de manera general
El Sr. Glasgal resume su método de la siguiente manera: “La ambiofonía mueve al
oyente al mismo espacio de los músicos, al acomodarse a las características del oído
externo y la cabeza del individuo, minimizando la correlación interaural en las
posiciones de audición, abandonando el tradicional triángulo equilátero estéreo,
recreando reflexiones tempranas y campos reverberantes por medio de computador,
eliminando el crosstalk de los altoparlantes frontales y reduciendo el tiempo de
reverberación del teatro musical en casa a menos de 0.2 segundos”.6
Aquí se ponen en práctica las teorías propuestas por Polk, Cohen y Keele respecto a las
falencias del estéreo. Y además, otros especialistas en la materia han diseñado procesos
alternativos que han permitido mejorar al método ambiofónico en cada una de sus
etapas, lo cual se verá más adelante.
2.2.1 Grabación ambiofónica
Para obtener un material en audio realmente óptimo para el método de ambiofonía, se
debe ver el tema a partir del concepto de la grabación binaural. En este tipo de
grabación una cabeza binaural posee las dimensiones y densidad de una cara humana
promedio y en la posición de los tímpanos, se ubican micrófonos cuyo propósito es
obtener la misma captura que tiene un humano normal.
En estas cabezas se hace un oído externo similar al humano y aquí nos encontramos con
la primera diferencia entre la binauralidad y la ambiofonía: para el método binaural se
hace un oído externo falso (asumiendo que al usar audífonos el sonido es directo y el
oído externo propio no afectará al momento de la reproducción) y posteriormente se
utiliza la denominada HRTF (Head Relation Transfer Function) según la cual se basa
un algoritmo que procesa el material y lo hace ideal para una reproducción en
audífonos. El método funciona eficazmente, recrea un campo sonoro mucho más
amplio y real que el estéreo en audífonos. No obstante, en el método de ambiofonía se
busca grabar de una manera similar a la binaural pero sin un oído externo superficial
por el hecho de que al tener que pasar el material a un espacio abierto, no hay forma de
6
GLASGAL, Ralph. “Ambiophnics 2nd edition” Introduction. 2001.
ignorar el oído externo del oyente en el lugar de reproducción, por tanto las sumas de
dos oídos externos resultarían contra-productivas y afectarían al resultado obtenido.
2.2.2 Comportamiento de oído externo
El oído externo (o Pinna) ha sido objeto de estudios psicoacústicos que han mejorado
en los últimos años, aunque existen varias teorías y análisis sobre su comportamiento,
algunos afirman que faltan aún ciertos aspectos por cubrir, sin embargo, según el
método de ambiofonía, ya existe el conocimiento suficiente para mejorar los defectos
de los sistemas actuales y estos no tienen que ser tan específicos ni rigurosos.
En el método de ambiofonía se toman en cuenta las principales características del oído
externo7, se afirma que el pinna está diseñado para modificar la respuesta en frecuencia
de las ondas sonoras como función de la dirección por la cual viene el sonido.
Figura 3 Respuesta del oído externo. Wiener y Ross (1946) línea punteada; Shaw
(1974) línea por segmentos; Mehrgardt (1977), línea completa.
De acuerdo a la figura 3, hay un aumento importante en nivel a partir de los 3KHz que
posteriormente disminuye en 10 KHz. Dadas las importantes amplitudes de estas
variaciones (+10dB y -11dB respectivamente), resulta muy difícil corregir las mismas
por procesamiento o ecualización. Glasgal afirma que para un sonido lateral llegando al
oído más cercano, ocurre un aumento en 200Hz y llega a 15 dB en 2.5KHz, luego baja
7
GLASGAL, Ralph. Ambiophonics 2nd edition. 2001
a 1dB en 5Khz, y sube de nuevo a 12 dB en unos 7Khz, finalmente baja a 4 dB en unos
10 KHz. Con lo cual se demuestra que los humanos somos sensibles a la dirección de
emisión incluso si escuchamos con un solo oído.
Las respuestas también varían si el sonido viene de una parte superior o inferior al oído
y para sonidos provenientes de atrás, ocurre una declinación de 25 dB entre 2.5 KHz y
10 KHz.
Esto corrobora el hecho de que los parlantes ubicados detrás del oyente tienen una
respuesta con una variación bastante importante incluso a una misma distancia que las
fuentes frontales, lo cual representa ciertas dudas sobre el sistema 5.1.
2.2.3 El ambiófono
Aunque el método ambiofónico se adapta al material estéreo actual y por tanto a las
técnicas de grabación estéreo convencionales, el sistema ha de trabajar mejor en
grabaciones hechas con la técnica ORTF o par espaciado, ya que estas proporcionan
una espacialidad importante y cercana a los requerimientos del método de Glasgal.
Sin embargo, ninguna funciona de manera óptima ya que se omiten muchas variables
que van en contra del resultado deseado. El sistema ambiofónico incluye tres elementos
importantes, el ambiopolo, el ambiovolver (o convolucionador para ambiofonía) y el
ambiófono.
Este último consiste en una técnica de grabación especial para el método la cual tiene
que cumplir ciertas condiciones.
Para empezar, el ambiófono debe capturar el sonido directo y solo las reflexiones leves
provenientes del proscenio, por ende se debe rechazar las reflexiones frontales, laterales
y superiores en el punto de grabación. Esto implica que el ambiófono debe ubicarse en
un buen asiento en el escenario y que debe tener una distancia adecuada para lograr
capturar un espacio amplio en el plano horizontal y para cumplir con los demás
requerimientos.
Los micrófonos omnidireccionales binaurales se ubicaran de acuerdo a la medida de la
cabeza humana pero sin un oído externo simulado. Para generar la impresión de que los
sonidos que vienen de un extremo pasan por una cabeza humana (la denominada
“sombra de la cabeza”), se debe crear una esfera de las mismas dimensiones de una
cabeza normal, cuya superficie tendrá sujetados los micrófonos.
El patrón direccional de los micrófonos también puede ser cardioide pero puede llegar
a exagerar la “sombra de la cabeza” de la grabación. La espacialidad del recinto se dará
por parlantes auxiliares ligados al ambiovolver, los cuales convolucionarán la señal
grabada por el ambiófono con respuestas al impulso deseadas.
Finalmente, el método está diseñado para reproducir fielmente un escenario de 150°.
No obstante, puede llegar a simular los 180° con ciertas fallas en los extremos.
2.3 Procesador RACE
Como se dijo previamente, el dipolo estéreo no funciona eficazmente si no hay un
modo de cancelación activa del crosstalk restante entre los parlantes. La Eliminación
Ambiofónica Recursiva de Crosstalk (Recursive Ambiophonic Crosstalk Elimination,
RACE) consiste en un método de cancelación electrónica que sirve para sistemas de
dos o más canales. Actualmente se puede utilizar como un plug-in VST y su función es
la de simular la barrera física utilizada en los estudios de Dr. Keele.
El Sr. Glasgal dedica una publicación en la convención número 123 de la AES al
RACE y el método ambiofónico8. En dicha publicación se presentan los aspectos
técnicos, según los cuales el RACE tiene varias virtudes.
Entre ellas está la posibilidad de obtener cancelación que no afecta la coloración o
timbre de la señal (como sucede con otros métodos), cancela el ITD e ILD presentes en
la reproducción con el fin de entregar el valor que se puede esperar de dichos factores
en una presentación en vivo.
8
GLASGAL, Ralph. “360° Localization via 4.x RACE Processing”. 2007. Paper, 123rd AES
Convention
El principio según el cual se basa el procesador, nos dice que para cancelar una señal
que llega del parlante izquierdo al oído derecho, debemos generar una replica de fase
invertida y ligeramente retrazada y atenuada que parta del parlante derecho. La señal
que se reproducirá con función de cancelación, también debe ser cancelada por otra
réplica generada por el parlante izquierdo para llegar a una cancelación de segundo
orden, está será cancelada por una nueva señal proveniente del parlante derecho (tercer
orden) y así sucesivamente.
Para lograr esta generación continua de señales, el diagrama dispone de un loop de
retroalimentación (feedback) en su diagrama de bloques, que ejecuta un “ping-pong
delay” continuo. Tal como se ve en la figura número 4.
Figura 4. Diagrama de bloques de operación de RACE
Para generar la señal de cancelación, el RACE toma los canales L y R y utiliza un filtro
pasa-bandas para trabajar de 250Hz a 5KHz. No es posible ni necesario cancelar el
crosstalk en frecuencias superiores a los 5KHz ya que estas dependen de la localización
del oído externo y no del ITD e ILD.
En el caso de las frecuencias bajas, el ILD sufre pocos cambios a medida que decrece la
frecuencia específica y aumenta la longitud de onda ya que las dimensiones de la
cabeza empiezan a ser insignificantes a partir de los 400Hz. Por lo tanto, cuando se
llega a los 250 Hz, la diferencia es irrelevante. El bypass de frecuencias bajas lleva a
una disminución moderada mientras que las sumas de bajos en el triángulo estéreo
crean inconsistencia en reproducciones monofónicas con dos parlantes.
Cabe mencionar que este tipo de incongruencia del estéreo suele arreglarse por métodos
como la matriz M/S (Mid/Side) en los cuales se busca operar un rango determinado de
frecuencias en una parte específica de la imagen fantasma estéreo. Con ello se puede
dar la impresión por ejemplo, de que las frecuencias bajas vienen del centro lo cual da
una percepción más agradable de audición, no obstante, retomando el sentido lógico del
método de ambiofonía, lo ideal sería que este tipo de métodos no debieran emplearse
aunque no por eso dejan de ser realmente útiles.
2.3.1 Opciones de implementación
El diagrama de bloques del procesador RACE en el paper del Sr. Glasgal nos muestra
como idea general el tratamiento que habrá de sufrir una señal de dos canales para
considerarse ambiofónica, sin embargo, algunos arreglos o adiciones se han diseñado
para los distintos modos de implementación del RACE.
Las dos versiones más conocidas son: en software, el programa AudioMulch y en
hardware el excelente sistema Tact RCS2.
2.3.1.1 Sistema Tact RCS2
Este sistema se ha empleado en los laboratorios más importantes en cuanto a desarrollo
de ambiofonía que son: “Filmaker Technology”9y “Ambiophonics Institute”.
En los textos referentes a la ambiofonía se encuentra un escrito que habla sobre el Tact
RCS 2.010. En el cual se explica que: “el RCS 2.0 AA es un preamplificador de linea
análoga y digital que utiliza un PC para automatizar o configurar funciones avanzadas
de audio”. Posee entradas XLR y RCA y salidas digitales como Toslink, AES/EBU y
RCA.
Entre sus virtudes se encuentra la posibilidad de realizar una inversión de polaridad y
retardos que van desde centésimas partes de un milisegundo hasta 99.9 milisegundos.
Un EQ paramétrico de alta resolución (2Hz), filtros de tono (ajustables en un software
que viene incluido) y otro gran número de aplicaciones entre las cuales es de interés el
proceso de convolución que puede hacer. Por ende, tiene todo lo que se necesita para
cumplir con el sistema ambiofónico. Además, también puede enviar señales a un
ambiopolo posterior o a cierta serie de altavoces adicionales para llegar a las técnicas
avanzadas de ambiofonía y mejorar aún más, la sensación auditiva producida.
Aunque su herramienta más útil es su sistema de control activo de ruido, que opera por
medio de pulsos y con el cual puede medir la respuesta de los altavoces y realizar
cambios automatizados de acuerdos a las mismas, tal como se utiliza para
presentaciones de sonido en vivo.
Esto es una ventaja muy grande ya que ayuda a mejorar la respuesta en cuartos no
tratados acústicamente. Cabe recalcar la alta precisión que presenta en el software con
el que opera.
El sistema regula además las respuestas para que no siempre sean lineales en todas las
bandas de frecuencias por diferentes motivos ligados a determinadas frecuencias, como
por ejemplo (como menciona el libro) una caída de 10dB en 100 Hz no será
apropiadamente arreglada con un incremento de 10 dBs en el ecualizador ya que en el
9
Disponible en http://www.filmaker.com/
Dsiponibke en tactaudio.com “Tact RCS 2.0 AA Room Correction System One Hell of a Computing
Animal”
10
plano musical ocurren transientes y dicha modificación tendrá consecuencias
inadecuadas y audibles.
Aunque el sistema es realmente versátil y útil, no es una solución perfecta. Diversos
factores acústicos en el recinto de audición influyen para que la respuesta en un punto
determinado tenga problemas a pesar de la corrección del sistema de control activo.
Como tal es el caso de reflexiones de paredes traseras lejanas etc.
Al tener la ventaja de manipular crossovers para sus salidas, se puede ajustar fácilmente
a un sistema determinado de subwoofers
El sistema proporciona una calidad extraordinaria, por lo cual su precio resulta también
bastante elevado.
2.3.1.2 Software AudioMulch
En un principio, el software AudioMulch cumplía con algunas funciones que
relacionaban procesamiento por bloques de DSPs, compatibles con sistemas MIDI y
ciertos procesamientos de Audio.
En su más reciente versión (2.0.1) el programa se transforma como sus desarrolladores
mismos lo denominan, en un software para síntesis de sonido en tiempo real y
procesamiento de audio para presentaciones.
La última versión es ejecutable en las plataformas Windows y Mac. Su interfaz y modo
de uso son similares al del software Reaktor de Native Instruments en el cual se hacen
enlaces de componentes de procesamiento digital, cada uno de los cuales tiene sus
propios controles ajustables. Dado que el sistema ambiofónico es de dominio público,
la versión del RACE para el software AudioMulch es de libre descarga de la página
ambiophonics.org. Aunque contiene ligeras ventajas sobre el diagrama de bloques.
Como por ejemplo un procesador de ping-pong delay ajustable a cualquiera de los dos
canales y con dos controles que permiten ajustar el número, feedback y porcentaje de
dicho tipo de delay en la señal.
Existen dos controles de atenuación de nivel, uno al final del filtro pasabanda y otro al
antes del filtrado por bandas como se ve en la figura 5.
Aunque no se especifica en las características del software, resulta coherente creer que
la fase permanece lineal ya que los resultados logrados con esta presentación del RACE
han sido corroborados y puestos a pruebas por muchos seguidores del método sin
presentar algún tipo de falla considerable.
Cabe mencionar que el procesador de libre descarga ejecuta un archivo de texto que
contiene instrucciones para configurar el sistema. Aunque hay algunos aspectos
relevantes.
Figura 5. Procesador RACE en AudioMulch 2.0.1
Las indicaciones nos dicen que para un enfoque fuerte se determine un delay recursivo
de 0.07 milisegundos, 0.08 para la HRTF predeterminado y 0.09 para cabezas más
grandes, esto hace recordar una de las premisas básicas del RACE: el tiempo del delay
ping-pong entre los dos canales está directamente ligado al tamaño que posee la cabeza.
Propone además un rango de configuración del valor de atenuación recursiva para
máxima amplitud en -2.5 dB hasta -6dB para mínima coloración, con 3.5 dB como
valor predeterminado. Cada valor tiene su equivalente en porcentaje de feedback para el
delay siendo estos 75%, 50% y 67% respectivamente.
2.4 Sala de reproducción
Ralph Glasgal recomienda tener en cuenta ciertas pautas respecto a las condiciones
acústicas de un recinto designado para la reproducción ambiofónica11. Para empezar,
designa tres factores vitales e imprescindibles: bajo ruido ambiente, alta absorción
(RT60 de 0.2 segundos o menos) y ausencia de fenómenos acústicos propios de los
recintos como modos de reverberación.
El sistema está destinado para implementarse en recintos pequeños, o más
específicamente, en una habitación regular. Sin embargo la amplitud del sweet spot en
el punto de audición sigue siendo bastante sensible, por ende a medida que se logran
mayores acercamientos a las condiciones ideales, hay que implementar medidas
estrictas respecto al comportamiento de las salas.
Por esta razón y por la debida sustentación del comportamiento del crosstalk respecto a
la geometría en cuartos de control de estudios o salas de mezcla, se debe abordar el
tema del recinto desde un punto de vista distinto al del estéreo.
3. METODOLOGÍA
3.1 ENFOQUE DE LA INVESTIGACIÓN
El trabajo a realizar tiene un enfoque empírico-analítico, porque se orienta a lo técnico
y a la transformación del mundo material. Busca información más confiable y eficaz a
través de la obtención de datos y análisis de los mismos. Utiliza modelos matemáticos y
teoría específica para verificarla en la práctica. Esto es, teoría psicoacústica y
comportamiento de señal, procesamiento digital y evaluación de criterios subjetivos.
11
GLASGAL, Ralph. “Tuning the Listening Room For Ambiophonics”. Capítulo 5, Ambiophonics 2da edición.
3.2 LÍNEA DE INVESTIGACIÓN
Este proyecto se enmarca en la línea de investigación “Tecnologías actuales y
sociedad” de la Universidad de San Buenaventura ya que como su nombre lo indica, se
está examinando un nuevo método partiendo de una tecnología específica que es la
binaural y se relaciona con el impacto social en la medida en que es un sistema que
puede llegar a cambiar todos los sistemas de reproducción habituales.
A su vez se ubica dentro de la sublínea de investigación de Facultad “Procesamiento de
señales digitales y/o analógicas” ya que el flujo de señal convencional desde grabación
hasta reproducción señala a ese tema. Además, hay un procesamiento especial, debido
al sistema DSP basado en el RACE, el cual es vital para el método. En cuanto al campo
de investigación, el trabajo recoge información de las tres áreas, ya que existe una etapa
de grabación y análisis de grabaciones. El sistema del RACE y su análisis pertenece al
tema digital y su modificación implica un concepto de diseño, aunque este solo se
enfoca en programación. Además, la justificación y tipo de aplicación del método están
basados en temas de acústica y psicoacústica, por lo cual, esta también tiene un papel
importante en la implementación.
3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN
Selección del recinto
Para la selección de un lugar ideal para las pruebas iniciales resulta importante tomar en
cuenta los tres criterios establecidos por Glasgal respecto al tema, estos son:
aislamiento, alta absorción interna y ausencia de modos o problemas de reflexiones en
la posición del oyente.
Además, al ser este un método diseñado para ser reproducido en los hogares y
habitaciones, se hace necesario que el cuarto a utilizar sea de medidas cercanas a este
tipo de lugares.
El método indica que la única propiedad acústica realmente útil al tratar un recinto para
una reproducción ambiofónica es la absorción (más que la difusión y reflexión).
El método demanda además, un tiempo de reverberación RT60 promedio menor o igual
a los 0,2 seg. Por lo cual habrá de requerirse una alta absorción en el recinto para
alcanzar tales valores. Se hace vital la implementación de material absorbente en el
techo y en las paredes laterales respecto al punto de audición.
En un caso ideal, el comportamiento acústico del recinto debería evitar el uso de
sistemas de control activo de ruido. Y esta afirmación debe tenerse muy en claro a la
hora de seleccionar y adecuar el lugar a probar.
Por tanto el recinto debe tener un tiempo de reverberación inicial relativamente bajo,
unas dimensiones cercanas a un cuarto normal y un aislamiento y/o ubicación que
impida incidencias de fuentes externas.
Ambiófono y grabación ambiofónica
Debido a que se necesita recrear el campo de sonido directo desde los parlantes
frontales respetando los conceptos referentes a la localización vertical y la profundidad
espacial; la técnica de grabación ambiofónica debe evitar las reflexiones laterales,
superiores y traseras del recinto ha ser capturado. Ya que el campo difuso será recreado
por parlantes auxiliares ejecutando un proceso de convolución en tiempo real de la
señal original con una respuesta al impulso determinada.
El ambiófono es una técnica de grabación que consiste en una adaptación de una cabeza
binaural sujeta a dos paneles laterales y uno superior para evitar el fenómeno de
reflexiones mencionado.
A diferencia de la cabeza binaural, el modelo de la cabeza humana del ambiófono
carece de oído externo y de la parte trasera de la misma que precede a partir de la
ubicación del tímpano.
Esto corrobora la afirmación según la cual solo debe haber un oído externo a lo largote
la cadena de instrumentista-oyente y tal parte del oído no puede ser omitida del oído del
oyente al momento de la reproducción.
Aunque otras técnicas en estereo funcionan bien en el método ambiofónico (en especial
la ORTF y XY) el ambiófono está diseñado para alcanzar el mayor (más no óptimo)
grado de definición y conveniencia para la ambiofonía.
El sr. Miller no habla de medidas específicas ni materiales especiales para el diseño del
ambiófono. De hecho la técnica se puede emplear con el Schoeps KFM-6 el cual
consiste en una esfera de alta definición cuyos excelentes micrófonos y adecuada
densidad (respecto a la de la cabeza humana) proporcionan una grabación ideal.
Por tanto si se ha de diseñar un ambiófono, se debe dar la mayor relevancia a los tres
criterios básicos respetando también unas medidas y materiales debidamente
formulados.
Los micrófonos han de ser omnidireccionales preferiblemente aunque los cardioides
también pueden funcionar pero a costo de cerrar un poco la percepción espacial,
especialmente en los extremos.
La posición recomendada para la grabación ambiofónica es la silla que se considera la
mejor del escenario, suele estar entre la primera y quinta fila en el centro del recinto.
Figura 6 Grabación ambiofónica de “AMBIOPHONICS Achieving Physiological
Realism in Music Recording and Reproduction” Glasgal, Ralph AES 111th AES
Convention
Es opcional realizar grabaciones en otras ubicaciones tal como lo indica la figura 6.
RACE y Matlab
El procesador RACE surge de la idea de reducir el crosstalk tanto como sea posible sin
emplear una barrera acústica física. Lo cual se consigue a partir de cancelaciones de
ondas entre los mismos altoparlantes. La ausencia de crosstalk nos ha de dar una
imagen clara, profunda y específica respecto a la ubicación de las fuentes sonoras. La
evaluación del sistema se hará a partir de percepción subjetiva
El RACE se ha implementado en software y hardware siendo Noach y TaCT los
mejores sistemas respectivamente. Sin embargo, se formuló el objetivo de crear un
sistema similar al RACE desde el programa Matlab ya que la teoría del RACE parece
ser relativamente sencilla respecto a los alcances que el sistema tiene. Sin embargo hay
muchos factores que hay que revisar y cuidar si se pretende generar un programa
cercano.
Para empezar, los dos canales de la señal estereo deben ser separados y filtrados en tres
rangos distintos. Las regiones de frecuencias bajas y las altas, deben ser omitidas y
transmitidas sin modificación alguna (aunque en la versión de Audiomulch hay una
reducción de 6dB en los filtros pasabajas y pasaaltas). Mientras que una región
comprendida entre los 250Hz y los 5KHz será sometida a una inversión de fase, una
ligera atenuación (que puede variar de acuerdo a la ampliación deseada del escenario) y
comenzarán una secuencia de cancelaciones de n órdenes que procuran eliminar los
rasgos del crosstalk restantes.
Los tiempos establecidos para los retardos que han de servir para la cancelación
recursiva (en el margen de los 65us a 100us) son bastante cortos y audiblemente
imperceptibles, por ende posiblemente se encontrarán sistemas que no conseguirán a
llegar a dichos rangos de tiempo.
El efecto de dos delays continuos en L y R (comúnmente denominado ping-pong delay)
se compone por un flujo de señal que ha de producir retroalimentación y tal fenómeno
se debe controlar por medio de una regulación de ganancia en los puntos principales
(feedback gain). La siguiente figura muestra el flujo de señal de un ping-pong delay
sencillo.12
12
Disponible en http://www.harmony-central.com/Effects/Articles/Delay/
Figura 7 Ping-pong delay disponible en harmonycentral.com
Los valores a consignar en cada uno de los controles de ganancia dependerán de la
atenuación previa al delay tal como lo sugieren las notas adjuntas del diagrama de
bloques de RACE para el software Audiomulch. Con el Laboratorio de matrices
Matlab, se pueden generar todo tipo de procesamientos para señales digitales por medio
de programación algorítmica o por flujos de señal a través de la aplicación Simulink,
posteriormente se pueden quemar e implementar para generar sistemas de hardware o
DSPs.
Evaluación subjetiva
Para realizar una valoración de los resultados obtenidos, se habrá de remitir al tema de
las pruebas de Ceoen, de acuerdo a las cuales se evalúan criterios específicos respecto a
la percepción de material en estéreo para diferentes tipos de técnicas. Los valores más
importantes a examinar son profundidad, naturalidad, definición de extremos y
definición de centro y centros y parciales.
Aunque tales aspectos son relevantes, existe la necesidad de que el encuestado
determine su percepción acerca de materiales de audio de distinto origen en términos
de un procesamiento específico, es decir, se debe precisar si se hallan diferencias entre
un material y su versión procesada por Audiomulch, o su versión procesada por
Simulink. En tal medida, ciertas preguntas deben ser específicas y los detalles deben ser
sugeridos por el oyente a partir de su propio criterio.
3.4 HIPÓTESIS
La grabación ambiofónica ha de realizarse exclusivamente con el ambiófono ubicado
en la posición de un asiento central entre la tercera o quinta fila de acuerdo a la
profundidad del espacio del público en la sala de conciertos, una menor distancia
cerrará la espacialidad en el eje X (horizontal) y provocará una respuesta difusa y poco
clara en los extremos. La percepción de profundidad (eje Z) es óptima y esto se ve en el
campo sonoro de la reproducción.
El procesador RACE diseñado en Matlab presenta cierta distorsión debido a la calidad
del procesamiento. Sin embargo alcanza el objetivo planteado por el principio teórico
inicial del método de cancelación ambiofónica recursiva, la fase y la amplitud se
mantienen ideales. Para mayor efectividad se opera a 70 useg de retardo entre las dos
señales y a una atenuación de -2.5 dB. El resultado subjetivo es bastante similar al
percibido con el software Audiomulch.
Los recintos de reproducción no alcanzan las condiciones ideales en especial en el
RT60 ya que este es difícil de reducir a los 0.2 seg requeridos. Mientras que los
fenómenos acústicos sean controlados en el punto de audición, y el tiempo de
reverberación promedio descienda tanto como sea posible (ojalá a menos de 0.5 seg) se
podrán apreciar los resultados favorables del método ambiofónico.
La mejor distancia entre los parlantes estará cercana a los 55 cms y la cabeza del oyente
respecto al centro del triángulo ambiofónico deberá estar localizada a 2 metros de
distancia. Las medidas variarán de acuerdo a las dimensiones y condiciones acústicas
del lugar. Se sugiere hacer pruebas. No obstante, el ambiopolo suele ser más eficaz para
distancias de -20° entre los dos parlantes, incluso más que en -30°
3.5 VARIABLES
3.5.1 Variables independientes
•
Implementación de ambiófono.
•
Operación del RACE.
•
Sistema de altavoces usado y ubicación.
•
Material procesado.
3.5.2 Variables dependientes
•
Percepción de espacialidad.
•
Facilidad de ubicación de fuentes.
•
Determinación de instrumentos a partir de sus rangos en frecuencia.
4. DESARROLLO INGENIERIL
Selección y medición del recinto
En un principio se consideró realizar las pruebas auditivas del método ambiofónico en
una sala de grabación. El problema radica en que estos son recintos acústicamente
tratados cuyos tiempos de reverberación suelen ser cercanos a 1 segundo y sus
proporciones pueden ser bastante amplias en cada una de sus medidas. Por tanto las
dimensiones no son favorables y reducir su tiempo de reverberación es una tarea
bastante dispendiosa además de costosa.
Una habitación promedio tendría ventajas dimensionalmente, sin embargo, el ruido
externo se convierte en una amenaza para casi cualquier lugar de este tipo a
considerarse. Habría facilidad de realizar un tratamiento acústico. Más sin embargo, las
habitaciones revisadas tenían ruido externo bastante molesto e inmanejable.
Finalmente, se escogió el cuarto auxiliar de la sala de Pre-producción de Audio de la
Universidad de San Buenaventura el cual cumple con las características básicas
necesarias para la implementación del método. Ya que sus tiempos de reverberación
promedio oscilan entre los 0,4 y 1 segs de acuerdo a cada de rango de frecuencias
(reducible a los 0,2 deseados) y además se encuentra aislado acústicamente por medio
de espacio vacío entre las ventanas cuya superficie inferior contiene fibra de vidrio para
evitar reflexiones internas, como tal es el caso de los vidrios que comunican las salas
de grabación con el control room en un estudio de grabación musical. La entrada tiene
dos puertas de vidrio delgado.
Además el lugar es cercano a zonas de bajo ruido, lo cual es un punto a favor respecto
al asilamiento.
Por tanto, se procedió a realizar las primeras pruebas en este salón, para lo cual se tuvo
que medir el tiempo de reverberación inicial del salón vacío y se debieron buscar
problemas de modos y fenómenos acústicos.
En especial existían ecos fluctuantes que se acentuaban a distintos rangos de
frecuencias, ya que para la entrada del recinto, se presentaban en frecuencias altas y al
final de este, en frecuencias bajas.
Dadas las medidas del recinto se decidió medir el tiempo de reverberación a dos
posiciones de micrófonos y una posición de fuente, ya que el lugar es de un tamaño
relativamente pequeño y el uso de un número mayor de posiciones implicaba infringir
las normas de medición de tiempo de reverberación de la ISO-3382, como por ejemplo
la distancia que debe existir entre los muros del lugar y las posiciones elegidas.
El método elegido para dicha medición fue el proceso de convolución y deconvolución
de un barrido sinusoidal logarítmico (en inglés LSS) según el cual se debe generar una
señal logarítmica ascendente que cubre todo el rango de frecuencias audibles, la
respuesta a esta señal es guardada y con la ayuda de la versión invertida de la señal
inicial, se ejecuta el proceso de deconvolución de la grabación separando así, la
respuesta al impulso del barrido sinusoidal. Finalmente se analiza la respuesta al
impulso del lugar y se sacan los tiempos para cada banda de frecuencias.
Para empezar se hizo la medición de ruido ambiente, la cual generó 37.8 dBs(A). Por
ende se calibró la fuente omnidireccional (un dodecaedro) para generar una señal con
un valor de 80,9 dBs(A) lo cual cumple la regla establecida acerca de la diferencia
mínima la presión sonora del ruido ambiente y el SPL de la señal a medir.
Se tomaron dos puntos de medición con un punto de fuente, ya que al ser un espacio
pequeño, era difícil que los puntos de captura estuvieran a una distancia adecuada
respecto a las paredes y de acuerdo a la norma.
Los datos generados ese ven en detalle en el capítulo 5 (Análisis de datos).
Ambiófono y grabación ambiofónica
Para el método de ambiofonía a ejecutar se decidió diseñar un ambiófono en lugar de
probar técnicas en estereo con el fin de examinar la efectividad del método de
grabación y garantizar una respuesta fiel a la teoría establecida.
Para realizar el ambiófono se partió de la idea de tomar un punto de referencia para las
medidas en primer lugar, se decidió tomar las dimensiones promedio de una cabeza
humana y relacionar la longitud de los paneles con longitudes de onda específicos a
ciertas frecuencias, procurando conservar unas medidas coherentes para que el
ambiófono no fuese muy pesado o muy pequeño.
Por ende, se tomaron algunas cifras respecto a la antropometría de la cabeza humana13
de acuerdo a un estudio realizado por Alan Poston. Las medidas encontradas están
divididas por percentiles entre mujeres y hombres, para el proyecto se decidió utilizar el
quincuagésimo percentil en medida de la cabeza humana de hombres, no obstante, los
datos respecto a las dimensiones de la cabeza de las mujeres resultan de gran
importancia ya que el RACE establece una relación entre el retardo aplicado a la
cancelación recursiva ambiofónica y el ancho de la cabeza del oyente. Cabe mencionar
que no sea necesitan múltiples medidas ya que la forma de la cabeza para el ambiófono
no tiene mayor influencia en el resultado de la grabación de acuerdo a Glasgal, lo
importante es cuidar de la densidad.
Las siguientes gráficas nos muestran las medidas a considerar del estudio de Poston
respecto a las aplicables al diseño del ambiófono.
13
POSTON, Alan“Human Engineering Design Data Digest”. 2000.
Figura 8 Medidas antropométricas por Alan Poston. Ancho de la cabeza humana
Figura 9 Medidas antropométricas por Alan Poston. Longitud de la cabeza humana
Figura 10 Medidas antropométricas por Alan Poston. Altura de la cabeza humana
Por tanto las medidas a usar respecto al ancho, largo y alto de la cabeza humana son
14,5cm, 19,7cm y 23,3cm respectivamente. Hay que recordar que el diseño a realizar
está basado en el ambiófono del Sr Robin Miller (Fig 11)
Figura 11 Ambiófono diseñado por Robin Miller
Por ende, no se trata de ubicar una cabeza humana normal, sino que se debe realizar un
corte determinado por el panel superior tal como se ve en la figura 9. De hecho como se
mencionó previamente, la cabeza humana puede ser reemplazada por un objeto de
forma ovalada pero el detalle en las especificaciones nos da una idea más clara de las
dimensiones y proporciones restantes, ya que los factores de altura, longitud y ancho de
necesitan incluso en una forma ovalada.
El Sr. Glasgal comenta que el ambiófono ha de tener material absorbente en frecuencias
altas alrededor de todas sus superficies incluyendo las traseras. Sin embargo, la parte
trasera no ha de importar mucho ya que si esta es reflectiva, estará repelando las
reflexiones innecesarias de las cuales ya se ha hablado.
Para el diseño se buscó un material que fuese absorbente en las superficies frontales
(las que rodean la cabeza) y reflectivas en la parte trasera.
El peso juega un papel importante en el ambiofono ya que de ello depende su fácil
manejo y estabilidad, en especial si se planea usar a alturas considerables.
Se descartó entonces, el uso de metales para las superficies a pesar de ser altamente
reflectivas, ya que implicarían un peso exagerado y de ser huecas causarían reflexiones
internas del sonido incidente por ambas caras.
Por lo tanto se optó por utilizar un material ligero y plano, para este caso se
consideraron dos tipos de madera sencilla: aglomerado y MDF. La superficie del
aglomerado es un tanto porosa, por lo cual se eligió el MDF de 12mm de grosor.
Como se comentó previamente, las caras internas del ambiófono han de tener material
absorbente por tanto se consideraron dos materiales de la firma Fiberglass. La primera
opción consistió en un panel compuesto por una fibra de 25mm de espesor denominada
Acoustifiber cuyos coeficientes de absorción son bastante altos. Para cubrir la cara
frontal de este panel, se añade una lámina difusora fonoabsorbente de espuma de
poliuretano de distintas formas determinadas denominado FGC Sonoacoustic.
A pesar de que el panel completo en el ambiofono habría de trabajar eficazmente,
resultaba demasiado grueso y de difícil instalación debido a los cortes diagonales y los
que habrían de ajustarse al modelo de la cabeza, por lo tanto, las paredes internas del
ambiofono fueron forradas por material FGC Sonoacoustics tipo Waves, por su
facilidad de uso y su consistencia.
Respecto al material de la cabeza se pensó inicialmente en crearla de acuerdo a las
medidas en un material que no fuese reflejante ni demasiado poroso, y cuya densidad se
asemejase a la real, por ende un buen material hubiese sido la silicona. No obstante,
resultaba bastante difícil calcular el corte que habría de aplicarse a dicha cabeza para
que se ajustara al panel superior del sistema, ya que el ángulo al que este se inclina
podría variar ligeramente al momento de crear el ambiófono y ello implicaría que la
cabeza podría quedar inclinada hacia abajo o hacia arriba dependiendo de la
incongruencia del corte respecto a dicho ángulo. La figura 13 muestra una
aproximación a una vista lateral del ambiófono.
Figura 13 vista lateral ambiofono con aproximación facial
El punto guía para el problema del corte serían los ojos de la cabeza humana ya que
estos deben estar paralelos al suelo.
Al tener dicho problema, se hacía difícil aproximar –por diseño- la cabeza humana ya
que el menor error causaría una fuerte incongruencia, por ende, lo ideal de manera
práctica sería realizar un corte posteriormente ajustable para asegurar una adecuada
ubicación del rostro del ambiofono. Por ello, se decidió que en lugar de realizar un
modelo en silicona, se usaría un rostro hecho de icopor -cuyas medidas son
predeterminadas- y se llenaría de una mezcla de gelatina sin sabor y bicarbonato de
sodio (para alargar su tiempo en estado relativamente sólido). La consistencia de la
mezcla realizada ha de durar un tiempo prudente (alrededor de una semana) en estado
similar al de la silicona y su densidad sería bastante parecida.
La solución además de práctica posee la ventaja de que el icopor es de fácil manejo y su
corte es más fácil, por lo tanto se pudo cortar varias veces hasta lograr la forma
deseada. La cual habría de ajustarse a una altura adecuada de la cabeza y el ángulo de
inclinación de la tabla superior. Cabe resaltar que dicha propuesta fue planteada de
antemano para evitar problemas futuros, ya que el ángulo necesario para el ambiófono
ya se había determinado en el diseño, pero dado que la unión de superficies representa
una forma irregular, era de esperarse que el ángulo variara levemente. Las figuras 14 y
15 muestran el diseño inicial de la unión de superficies
Figura 14 Vista superior, diseño de ambiófono
Figura 15 Vistas lateral y trasera, diseño de ambiófono
También se debe tomar en cuenta que al realizar el modelo en madera, se redujo una
pequeña parte de la longitud de las superficies ya que se hizo un corte diagonal en los
bordes para lograr unir las dos tablas en la parte trasera sin que hubiese espacio entre
ellas.
Por lo tanto la primera medida base en el diseño fueron las medidas de ancho y altura
de la cabeza, se dispusieron de tal manera que el borde inferior triangular del panel
superior encajara con la parte inferior de la cabeza humana. La segunda medida base
habría de ser la altura de las superficies laterales –la misma altura del ambiófono en si-.
Si tomamos en cuenta que estas paredes han de evitar las reflexiones laterales,
resultaría lógico entonces considerar que dicha altura fuese igual a la mayor longitud de
onda entre las frecuencias que se buscan evitar. La menor frecuencia serían los 250 Hz
ya que es en dicha frecuencia donde el RACE empieza a operar y donde se encuentra la
frecuencia de corte para su filtro pasabajos y el de inicio para su filtro pasabandas.
El lambda correspondiente a dicha frecuencia es de 1.37m aproximadamente, medida
que resulta bastante grande si se piensa en la facilidad de manipulación del ambiófono.
Además, la atención debe estar concentrada en las frecuencias altas ya que estas son las
más apreciadas para el sonido directo a capturar. Se abordaron medidas de acuerdo a
determinadas frecuencias y en un principio se propuso trabajar una altura de 0.686
metros, correspondientes a la longitud de onda de 500Hz, sin embargo, un ambiofono
con esta medida resultaría en unos paneles muy grandes y una cabeza muy pequeña y
también hay que cuidar cierta proporcionalidad entre la cabeza y la altura del
ambiófono. Por tanto, se propuso una altura desde la base del ambiófono hasta la parte
inferior de la cabeza de 12 centímetros y la altura de las superficies laterales se
determinó de acuerdo a esta proporcionalidad tanto para la altura inferior como para la
altura restante, desde la parte superior de la cabeza hasta el borde superior del
ambiófono, dicha altura corresponde a los 50 cms especificados en las figuras 11 y 12.
La tercera medida importante es el ángulo que debe haber entre las dos superficies
paralelas, ya que dicho ángulo determina el ángulo que se esperar capturar y por ende,
escuchar al momento de la reproducción. El método asegura una espacialidad de -76 y
76 grados a izquierda y derecha respectivamente, pero esto implicaría un ángulo
demasiado abierto y unas superficies laterales más largas para compensarlo, por ende se
redujo a 140 grados.
Las medidas restantes salieron a partir de las iniciales, incluyendo el ángulo de 73
grados de inclinación del panel superior respecto a una vista lateral, el cual resultó de la
altura del ambiófono y la altura base de 12 cm. El ambiófono final se ve en la figura 16.
Figura 6 ambiófono
RACE y Matlab
Como opción inicial se planteó generar el procesador por medio de la ventana de
comandos de Matlab. Sin embargo al momento de programar los retardos de
cancelación recursiva se hacía necesario tener una manera rápida de variar los valores
de ganancias destinadas al control de feedback. Por ello resultaba más fácil generarlo
por medio de diagramas de bloques debido al acceso directo y a las ventajas de manejar
manualmente el flujo de señal a procesar.
Figura 17 División de señal estereo en Simulink
La figura 17 muestra la división inicial de la señal estéreo, para ello se crea un bloque
emisor de un archivo wave en extensión .wav que muestra la tasa de sampleo, número
de canales y tasa de bits, propias del archivo. Estos datos –además de la duración en
tiempo del archivo- influyen en el desarrollo del procesador ya que de ello dependen
los periodos de sampleo ejecutados por software, sus equivalentes en tiempo y otros
datos de suma relevancia al momento de procesar.
De la salida del bloque de archivo wave, se pasa a un unbuffer que se encargará de
convertir la muestra de frames a valores escalares. Este a su vez se dirige a un demux
cuya función es dividir la señal en dos vectores que serán L y R. Para poder continuar
al resto del proceso se hace necesario convertir los nuevos valores escalares de vuelta a
frames por medio de dos buffers para cada señal.
Figura 18 Señal dividida a tres filtros
La herramienta FDA Tool permite crear filtros cuyos valores, componentes y tipos se
pueden variar a gusto. A pesar de la facilidad de edición de filtro, la fase se convierte en
un factor en contra ya que esta no puede ser lineal a lo largo del rango de frecuencias a
trabajar, por lo tanto, las señales generadas tendrán fases diversas a las lineales-el caso
que sería ideal-. Los filtros utilizados son tipo IIR de Butterworth.
Figura 19 respuestas de magnitud y fase del filtro pasabajos
El filtro pasabajos diseñado para tomar las frecuencias menores a 250 Hz tiene su
frecuencia de paso en 200 Hz y su frecuencia de detención en 250 Hz, al tratar de
reducir esta diferencia de 50 Hz se empezaban a generar irregularidades en las
frecuencias menores a la frecuencia de paso. Para 250 Hz, el filtro tendrá un valor
aproximado a los -81 dB, por lo cual la magnitud es adecuada. Sin embargo, la fase
decae rápidamente a tal punto que al llegar a los 250 Hz, su valor será menor a los -360
grados. Este factor resulta grave para el filtro y el procesador en general.
Figura 20 Respuesta en magnitud y fase del filtro pasabandas
El filtro pasabandas tiene sus frecuencias de corte fc1 y fc2 en 250 y 5KHz
respectivamente, el orden del filtro es de 16. La pendiente a partir de fc2 es bastante
larga, por ende el valor reducido a frecuencias altas será menor que en frecuencias
bajas, ya que apoyados en el teorema de Nyquist, la frecuencia de sampleo de una señal
debe ser el doble de la mayor señal a analizar, por ende el filtro actuará desde fc2 hasta
la última frecuencia sampleada la cual es ligeramente mayor a 20 KHz.
Una vez más, la fase se convierte en un factor en contra y alcanza valores altamente
nocivos para el resultado de la señal.
Figura 21 Respuestas en magnitud y fase del filtro pasaaltos
Para el tercer filtro se determinaron una frecuencia de detención de 4.85 Khz y una
frecuencia de paso de 5.15 KHz, el paso está regulado a partir de los -80 dBs en la
frecuencia de detención. La fase se sigue viendo gravemente afectada.
Después de pasar por el filtro pasabandas, la señal prosigue a un controlador de
ganancia cuyo valor será de -1 con el fin de invertir la fase. El sencillo ejemplo de la
figura 22 lo muestra para el caso de una señal sinusoidal.
Figura 22 Inversión de fase
Una vez la fase esté invertida, la señal procede a un controlador de ganancia en dB que
se encargará de disminuir su nivel de presión sonora en -2.5 dB, Cabe recordar que
dicho valor puede variar entre los -2.5 y los -6dB, pero su mayor eficacia se encuentra
en el valor decidido.
A continuación iniciará la etapa de cancelación recursiva ejecutada por un ping-pong
delay entre los dos canales. Para esto la señal se divide en dos, la primera irá a un
controlador de ganancia, luego a un sumador al que se le añadirá la señal proveniente
del delay del canal contrario. La salida de esta sumatoria irá al delay propio del canal,
desde el cual la señal se partirá en dos caminos, uno a un controlador de ganancia que
servirá como control de mezcla entre la señal retardada y la señal original (parámetro
de suma relevancia para RACE) y después llegará al sumador final del canal para
unirse con la segunda división de la señal original; el otro camino irá a un control de
feedback posteriormente ligado a la sumatoria inicial del canal contrario.
Como se ve en la figura, existen tres tipos de control de ganancia, el primero de ellos se
denomina controlador de feedback o regeneración y su función es hacer que el delay se
repite tantas veces como lo determine su valor. El segundo tipo de controladores de
ganancia manejarán el porcentaje de retroalimentación entre los dos canales, es decir,
cuando se repite una secuencia del ping-pong delay, este control determinará la
presencia de la primera secuencia una vez se inicie la segunda, dejar este controlador en
1 o 100% implicaría generar secuencias ilimitadas que terminarían por enmascarar a la
señal original.
El tercer tipo de ganancia se denomina “Delay Mix” ya que indicará la proporción
existente entre la señal retardada y la señal original. Al estar en uno, la señal retardada
será la única presente. Este control se puede variar a valores superiores al 50%.
Figura 23 Eliminación recursiva producida por un ping-pong delay
El rango de tiempos establecido para el trabajo del RACE está comprendido entre los
65useg y 100useg. El tipo de delay usado para el procesador en Simulink trabaja con
valores enteros, y si estimamos el tiempo requerido a número de muestras ejecutadas
por segundo de acuerdo a la tasa se sampleo de 44.1KHz tenemos que los valores más
cercanos a dicho rango corresponden a 3 y 4 equivalentes a 68useg y 90useg
respectivamente. Tal como se ve en la tabla 1.
Número de muestras
Equivalente en tiempo (seg)
1
0.000022676
2
0.000045351
3
0.000068027
4
0.000090703
5
0.000113379
6
0.000136054
Tabla 1 número de muestras y equivalentes en tiempo a una tasa de 44.1Khz
El valor de retardo es proporcional al tamaño de la cabeza del oyente. De 60 a 70 useg
existe el enfoque más directo, 80useg se utilizan para la HRTF y un número mayor
significarán cabezas de tamaños mayores al promedio.
Se optó por usar un delay de 3 muestras, equivalente a 68 useg, lo cual significa que el
sweetspot será más sensible, pero superar las dimensiones –como sería el caso de 4
muestras- no resulta conveniente, ya que ninguna cabeza encontraría el estado óptimo.
Este representa un factor de error, ya que lo ideal sería utilizar un valor entre 70useg y
80useg o tener la posibilidad de variar esto a gusto. Sin embargo, el tiempo de
ejecución del sistema a este número de muestras es bastante largo y la generación de
archivos procesados es lenta.
Para terminar el flujo del procesamiento, las salidas de cada filtro llegan a un sumador
triple, el cual envía una única señal a una caja de concatenación de matriz donde se
encontrará con su señal homóloga del otro canal, y se convertirán en una señal única de
nuevo, de aquí sale la señal procesada final.
Hay que cuidar los parámetros de la simulación ya que pueden presentar errores, en
especial por las opciones del solver. Pensando en ajustar el delay a 80useg, se buscó
utilizar un tamaño de paso (step size) arreglado, pero era difícil ajustar el paso al
tiempo requerido para cada periodo de sampleo de simulink.
El solver variable predeterminado ha de funcionar, sin embargo, versiones como matlab
2007b pueden generar error debido a que los retardos generados son más pequeños que
un periodo de muestra. En las últimas versiones los solvers variables actuarán sin
problema en especial al usar ode45.
La versión utilizada de matlab es la r2009a y estos son los parámetros predeterminados
del solver variable. Véase fig 24.
Figura 24 Parámetros solver variable.
Grabación
Obedeciendo los designios del método ambiofónico, la grabación se planeó para ser fiel
a lo sugerido por Glasgal respecto al tema.
La grabación se realizó en el auditorio San Francisco de Asís de la Universidad de San
Buenaventura.
Figura 25 Levantamiento de planta del escenario. Auditorio San Francisco de Asís
El proscenio de tal auditorio posee un borde curvo, a partir del punto central inferior (el
cercano a las sillas) se tomaron ángulos desde -60° a 60° en intervalos de 20 grados,
para realizar las grabaciones respecto al tema espacial en el plano horizontal. Los
puntos tienen una distancia de 5 metros respecto al punto inicial. Tal como se ve en la
figura. Las siglas EI y ED significan Extremo izquierdo y extremo derecho
respectivamente
Figura 26 Proscenio del auditorio San Francisco de Asís
El ambiófono se ubicó en la tercera fila del escenario en la parte central. Véase la fig.
Figura 27 Ambiófono ubicado en tercera fila respecto al escenario
Para la captura se utilizaron micrófonos AKG C480, conectados a una interfaz Fastrack
Pro de M-audio y esta a su vez estaba ligada a un computador que grabó en el software
Adobe Audtion ver 3.0. Se monitoreó con audífonos Sony MDR900HD
Figura28 sistema de grabación y monitoreo
Figura 29 patrón direccional de los micrófonos
El patrón direccional de los micrófonos empleados es cardioide, lo cual no es óptimo ya
que en el mejor de los casos los micrófonos deben ser omnidireccionales, la diferencia
radica en que será más difícil para un patrón cardioide el determinar efectivamente
fuentes localizadas a los extremos. Y la percepción de profundidad puede verse
afectada ligeramente.
Para la grabación se optó por usar dos instrumentos –una guitarra acústica y un violíny las tomas se decidieron a partir de diferentes criterios. Tal par de instrumentos fue
elegido porque el método funciona mejor con instrumentos acústicos. Resulta
importante que al momento de la interpretación A continuación se encuentras la lista
de cada toma, una descripción y el propósito.
Nombre
Objetivo
Evaluar la percepción
1) Guitarra a -20°.
espacial a -20° y 20° del
Violín a -20°
punto central de referencia
Evaluar la percepción
2) Guitarra a -40°.
espacial a -40° y 40° del
Violín a -40°
punto central de referencia
Evaluar la percepción
3) Guitarra a -60°.
espacial a -60° y 60° del
Violín a -60°
punto central de referencia
Imagen
4) Ambos
Evaluar la sensación de
instrumentos al
profundidad y definición de
centro
centro
5) Movimiento
circular de derecha a Evaluar la localización en el
izquierda pasando
plano horizontal y la
por todos los puntos
posterior coloración que
establecidos (Punto
pueda sufrir la señal al ser
X a Y)
procesada por RACE.
6) Línea recta desde
extremo derecho
hasta extremo
izquierdo
Evaluar la localización y
reproduciendo la
percepción horizontal de la
misma nota (X a Y)
fuente.
7) Línea recta de
Evaluar la localización y
izquierda a derecha
percepción horizontal de la
(X a Y)
fuente.
Evaluar la percepción de
8) Eje Z atrás hacia
profundidad del instrumento
adelante
acercándose.
9) 40° Atrás hacia
Evaluar percepción de
delante
profundidad y localización.
10) -40° Atrás
Evaluar percepción de
hacia delante
profundidad y localización.
11) Guitarra
Examinar la percepción
extremo izquierdo,
horizontal al máximo
violín extremo
ángulo posible respecto al
derecho
ambiófono.
12) Guitarra
Evaluar el comportamiento
ejecutando una
a un rango amplio de
escala musical al
frecuencias y la percepción
extremo izquierdo
de localización.
Evaluar el comportamiento
13) Guitarra
de un amplio rango de
ejecutando escala en frecuencias y la definición
el centro.
de centro
Evaluar el comportamiento
14) Guitarra
a un rango amplio de
ejecutando escala en frecuencias y la percepción
la derecha.
de localización.
Evaluar el comportamiento
15) Violín
a un rango amplio de
ejecutando escala en frecuencias y la percepción
el extremo izquierdo de localización.
Evaluar el comportamiento
16) Violín
a un rango amplio de
ejecutando escala en frecuencias y la percepción
el extremo derecho
de localización.
17) Violín
ejecutando nota en
cada uno de los
Evaluar la percepción
puntos determinados horizontal y localización en
(X a Y)
cada punto específico.
Evaluar el comportamiento
18) Voz de atrás
de la voz en el eje Z,
hacia delante en el
además de profundidad y
eje Z (X a Y)
percepción de proximidad.
Evaluar el comportamiento
de la voz respecto a
profundidad, localización y
19) Voz a 40°
proximidad.
Evaluar el comportamiento
de la voz respecto a
profundidad, localización y
20) Voz a -40°
proximidad.
Evaluar el comportamiento
21) Voz derecha a
de la voz en el plano
izquierda (X a Y)
horizontal
Tabla 2 Grabaciones realizadas
Figura 30 Grabación auditorio san Francisco de Asís
Evaluación subjetiva
Inicialmente se consideró realizar preguntas de selección múltiple para darle valor a la
percepción subjetiva de los oyentes a encuestar. Sin embargo, las opciones limitaban en
cierta manera a la opinión de estos, además de la dificultad que representa precisarlas.
Por lo tanto, se optó por preguntas cuyas respuestas fueran “si” o “no” con una casilla
de observaciones. Se sugirió cordialmente expresar impresiones acerca de la percepción
espacial y los conceptos evaluados por test de Ceoen se hicieron sobre un material de
óptima calidad previamente procesado.
El encuestado requiere un perfil que cumpla con los siguientes requisitos.
•
Persona mayor de 18 años.
•
Persona con título o en proceso de titulación de ingeniería de sonido o en un
área afín (música, tecnólogo en audio, etc).
•
Debe tener conocimiento de los criterios establecidos en el test de Ceoen.
•
Debe haber trabajado en proyectos de producción de audio en el área musical o
audiovisual en cualquiera de sus etapas.
De acuerdo a los requerimientos mencionados, se desarrolló el formato de encuesta de
la siguiente manera:
VALORACIÓN SUBJETIVA MATERIAL AMBIOFÓNICO
Nombre:_______________________Ocupación:_________________Edad:________
Escuche con atención a cada uno de los materiales suministrados y conteste las
preguntas de acuerdo a su apreciación, puede omitir la casilla de observaciones de
considerarlo necesario. Marque con una X en la respuesta de selección múltiple.
1- ¿En cuál presentación de la canción Lil´ David considera usted que existe una
imagen sonora más amplia en el plano horizontal?
A- Primera versión (RACE OFF)
B- Segunda versión (RACE ON)
C- Ns/Nr.
Observaciones__________________________________________________________
______________________________________________________________________
_
2- ¿En cuál presentación de la canción en stereo considera usted que existe una imagen
sonora más amplia en el plano horizontal?
A- Primera versión (Stereo)
B- Segunda versión (Ambio)
C- Ns/Nr.
Observaciones__________________________________________________________
______________________________________________________________________
_
3- ¿En cuál presentación de la canción considera usted que existe una imagen sonora
más amplia en el plano horizontal?
A- Primera versión (Stereo)
B- Segunda versión (procesamiento por SL)
C- Ns/Nr.
Observaciones__________________________________________________________
______________________________________________________________________
_
4- ¿En cuál presentación de la canción considera usted que existe una imagen sonora
más amplia en el plano horizontal?
A-) Primera versión (grabación original)
B-) Segunda versión (Procesamiento por SL).
C- Ns/Nr.
Observaciones__________________________________________________________
______________________________________________________________________
_
5- Respecto al video de la firma Noach, responda: ¿Qué diferencias o semejanzas
encuentra usted entre la reproducción ambiofónica y la reproducción stereo en términos
de naturalidad, profundidad, definición de centros y extremos y localización de fuentes?
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
6- Respecto al material ambiofónico, sugiera un valor de 1 a 5 para los siguientes
factores propuestos por test de Ceoen:
1
2
3
4
5
NATURALIDAD
PROFUNDIDAD
DEFINICION DE EXTREMOS
DEFINICION DE CENTRO
DEFINICION DE CENTROS PARCIALES
Observaciones__________________________________________________________
______________________________________________________________________
______________________________________________________________________
______________________________________________________________________
_
Figura 31 Formato de encuesta para valoración subjetiva
Duración
Pregunta Tipo de material
Versión 1
Versión 2
RACE OFF
RACE ON
aproximada
Grabación
ambiofónica
1 (ambiophonics.org) (Audiomulch)
2 Grabación estéreo
(Audiomulch)
40 segundos
RACE OFF
RACE ON
(Audiomulch)
(Audiomulch)
50 segundos
RACE ON (Simulink)
12 segundos
(Simulink)
RACE ON (Simulink)
10 segundos
Única
Única
6 minutos
RACE OFF
3 Grabación estéreo
(Simulink)
Grabación
ambiofónica San
4 Franciso de Asís
RACE OFF
Video de la firma
5 Noach
Tabla 3 Lista de material evaluado.
El material número 4 fue la grabación a -60° y 60° realizada en el auditorio. La
encuesta se enfocó en el plano horizontal principalmente ya que era de suma
importancia ver cuanto podría abrirse el campo sonoro.
Los archivos procesados por RACE de simulink fueron generados, ya que el
diagramade bloques se tarda mucho tiempo en procesar, y es muy probable que incluso
un computador de alto procesamiento lograse mostrar resultados en tiempo real.
Al momento de adecuar el recinto se hicieron tres pruebas previas para decidir cual era
la mejor geometría respecto al sistema de reproducción.
Tales pruebas consistieron en reproducir el material de prueba de ancho horizontal
proporcionado por la página del método a tres distancias distintas entre los puntos
centrales de los altavoces y su distancia equivalente respecto al oyente.
Dicha información sugiere que la distancia entre los parlantes debe estar entre 50 y 70
cm, y las distancias respecto al oyente estarán entre 1.5 y 3 metros.
Por ende se puso a prueba las relaciones: 50cm-1.5m; 60cm-2,25m y 70cm 3m.
La mejor de estas fue la menor, probablemente debido a que la pared posterior del
recinto no se encontraba tratada y los puntos alejados de audición se encontraban cerca
de las superficies planas sin material absorbente, aunque los fenómenos acústicos en
general ya habían sido eliminados.
El sweet spot conseguido es bastante pequeño corroborando el hehco de que en
ambiofonía el sweetspot es largo más no ancho y es altamente sensible a reclinación y
giros de la cabeza.
5. ANÁLISIS DE DATOS
La prueba inicial, consiste en seleccionar un recinto adecuado para probar la versión de
RACE con el software AudioMulch 2.0 y el material de audio proveído por la página
del método (ambiophonics.org). Para verificar si el recinto cumple o no con las
características adecuadas, se hizo una medición del tiempo de reverberación sin
acondicionamiento acústico en dos posiciones de recepción según la gráfica 1. Para
cada posición se hicieron dos mediciones. Los dos puntos de medición se ubicaron de
tal manera que estuviesen a una distancia igual o mayor a un metro respecto a las
paredes, la fuente y entre sí, tal como se ve en la figura 32. Los resultados arrojados por
las dos primeras mediciones en el primer punto se encuentran en las tablas 4 y 5.
Figura 32 Levantamiento de planta de recinto a medir
Freq, [Hz] 63 125
250
500
1000
2000
4000 8000 Lin A Signal [dB] 62.48 84.36 81.45 76.13 80.88 77.71
Noise [dB] 26.42 38.79 32.81 27.65 23.07
27.9 34.86 36.41 strenGth [dB] ‐6.52 15.36 12.45
7.13 11.88
8.71
10.2 10.79 10.93 10.02
9.07 10.48
7.31
6.61 C50 [dB] 1.29 1.44
4.58
C80 [dB] 3.66 6.22
7.97 15.91 16.19 11.95
D50 [%] 57.38 58.23 74.15 88.98 91.78 84.33
Ts [ms] 86.14 69.81
79.2 79.79 89.93 87.02
9.56 9.55 12.91 45.1 41.92
4.44
8.16
9.15 12.12
82.1 90.03 73.54 86.75
48
27.1
20.1 25.06 28.81 19.29 36.65
23.2
EDT [s] 1.07 0.7
0.6
0.33
0.29
0.42
0.53 0.35 0.52
0.39
T20 [s] 1 0.84
0.81
0.27
0.39
0.49
0.62 0.59 0.82
0.58
r T20 1 0.99
1
0.99
0.99
1
1 1 0.99
0.99
T30 [s] 1.02 0.84
0.8
0.33
0.4
0.54
0.67 0.6 0.83
0.64
r T30 1 1
1
0.98
0.99
0.99
1 1 1
0.99
Tuser [s] 0.98 0.92
0.76
0.3
0.32
0.46
0.65 0.52 0.73
0.5
r Tuser 0.99 0.94
0.98
0.97
0.99
0.99
1 0.99 0.95
0.99
Tabla 4. Posición 1. Medición 1 Recinto sin tratamiento.
Freq, [Hz] 63 125
250
500
1000
2000
4000 8000 Lin A Signal [dB] Noise [dB] strenGth [dB] 61.92 83.82 80.89 75.59 80.41 77.35 78.76 79.38 89.43 86.58
38.8 54.75 46.43 25.74 23.53 31.52
‐7.08 14.82 11.89
42.2 36.66 56.48 46.88
6.59 11.41
8.35
9.76 10.38 10.43
9.58
9.17 10.56
7.27
6.56 8.18
C50 [dB] 1.33 1.42
4.69
C80 [dB] 3.73 6.25
8.01 15.46 16.37 11.86
9.65 4.52
9.54 13.07 9.2 12.15
D50 [%] 57.61 58.08 74.66 89.21 91.93 84.21 81.93 90.23 73.9 86.81
Ts [ms] 85.09 69.67 47.48 26.07 19.38 25.59 29.22 19.24 36.25 23.06
EDT [s] 1.06 0.7
0.6
0.33
0.28
0.41
0.53 0.34 0.51
0.38
T20 [s] 0.9 0.83
0.79
0.28
0.39
0.48
0.62 0.59 0.81
0.57
r T20 1 0.98
1
0.99
0.99
1
1 1 0.99
0.99
T30 [s] 0.84 0.78
0.78
0.34
0.4
0.53
0.65 0.6 0.78
0.63
r T30 0.99 0.99
1
0.98
0.99
0.99
1 1 1
1
Tuser [s] 0.95 0.91
0.76
0.32
0.32
0.43
0.65 0.51 0.73
0.5
r Tuser 0.99 0.93
0.98
0.97
0.99
0.99
1 0.99 0.95
0.99
Tabla 5. Posición 1. Medición 2. Recinto sin tratamiento.
Freq, [Hz] 63 125
250
500
1000
2000
4000 Signal [dB] 65.26 87.25
82.73
78.95
81.29
78.56
80.31 80.35 91.55 87.88
Noise [dB] 44.92 58.59
41.16
27.06
25.63
30.45
‐3.74 18.25
13.73
9.95
12.29
9.56
37.9 8000 Lin A 38.8 58.79 46.82
strenGth [dB] 11.31 11.35 12.55 10.88
C50 [dB] 0.05 1.64
5.15
9.77
9.53
6.52
5.89 8.66 C80 [dB] 3.44 3.92
8.87
18.07
16.3
11.74
D50 [%] 50.28 59.32
76.58
90.46
89.97
81.77
79.52 88.01 73.74 84.58
Ts [ms] 89.9 61.88
39.62
24.61
24.05
31.37
33.14 21.79 EDT [s] 1.05 0.73
0.55
0.27
0.27
0.41
0.49 0.39 0.66
0.39
T20 [s] 0.93 0.77
0.64
0.3
0.31
0.49
0.64 0.61 0.68
0.56
r T20 1 0.97
0.99
0.98
0.99
1
1 1 0.99
1
T30 [s] 0.84 0.74
0.67
0.33
0.36
0.52
0.65 0.61 0.71
0.6
r T30 0.99 0.98
0.99
0.99
0.99
1
1 1 0.99
1
Tuser [s] 0.98 0.64
0.65
0.26
0.32
0.43
0.63 0.55 0.55
0.49
r Tuser 1 0.94
0.98
0.99
0.99
0.99
0.99 0.99 0.98
1
9.3 12.12 4.48
7.39
6.79 11.49
37.5 26.99
Tabla 6. Posición 2. Medición 1. Recinto sin tratamiento.
Freq, [Hz] 63 125
250
500
1000
2000
4000 Signal [dB] 64.69 86.71
82.3
78.49
80.76
77.79
79.62 79.69 91.01 87.26
Noise [dB] 44.44 57.54
40.58
25.74
24.61
30.1
37.82 38.27 58.17 46.42
strenGth[dB] ‐4.31 17.71
13.3
9.49
11.76
8.79
10.62 10.69 12.01 10.26
5.85 8000 Lin 8.74 A C50 [dB] 0 1.52
5.27
10.07
9.52
6.49
C80 [dB] 3.39 3.76
9.2
18.32
16.64
11.44
D50 [%] 50.02 58.64
77.11
91.04
89.96
81.67
79.35 88.21 73.39 84.66
Ts [ms] 90.15 62.79
39.09
24.26
24.43
31.32
33.79 21.83 38.04
9.32 12.13 4.41
7.42
6.66 11.46
27.2
EDT [s] 1.05 0.74
0.52
0.27
0.28
0.42
0.49 0.39 0.66
0.39
T20 [s] 0.93 0.77
0.63
0.29
0.33
0.49
0.63 0.6 0.69
0.57
r T20 1 0.98
0.99
0.98
0.99
1
1 1 0.99
1
T30 [s] 0.85 0.74
0.65
0.35
0.37
0.52
0.65 0.61 0.71
0.6
r T30 0.99 0.98
0.99
0.98
0.99
1
1 1 0.99
1
Tuser [s] 0.98 0.72
0.67
0.26
0.3
0.46
0.64 0.55 0.56
0.5
r Tuser 1 0.94
0.99
0.98
0.99
0.99
0.99 0.99 0.98
1
8000 Lin Tabla 7. Posición 2. Medición 2. Recinto sin tratamiento.
Freq, [Hz] 125
250
500
1000
2000
4000 Signal [dB] 62.88 79.95
77.8
72.15
74.31
71.61
73.48 75.16 85.25
81.61
Noise [dB] 52.25 54.28
42
23.29
19.76
18.3
21.41 25.09 57.91
41.82
strenGth[dB] ‐6.12 10.95
8.8
3.15
5.31
2.61
3.46
9.34
13.32
20.02
C80 [dB] 5.72 10.86
12.52
25.44
D50 [%] 59.65 68.93
89.57
Ts [ms] 73.61 55.28
C50 [dB] 63 1.7 4.48 A 6.16 6.25
4.61
19.72
23.18 25.47 6.6
16.17
31.88
31.85
32.68 36.97 13.79
23.28
95.55
99.01
98.95
99.52 99.72 82.05
97.64
30.76
18.17
11.65
12.16
7.85 4.64 24.21
9.87
0.28
0.31
0.17
0.15
0.14 0.12 0.45
0.17
EDT [s] 0.76 ‐‐ T20 [s] 0.53 0.5
0.35
0.18
0.15
0.15
0.13 0.13 0.42
0.23
r T20 0.98 0.96
0.93
0.98
0.99
0.99
0.98 0.97 0.97
0.99
T30 [s] 0.46 0.48
0.32
0.21
0.15
0.15
0.16 0.14 0.43
0.32
r T30 0.92 Tuser [s] r Tuser 0.98
0.97
0.97
1
1
0.98 0.99 0.99
0.97
0.66 ‐‐ 0.49
0.22
0.19
0.15
0.11 0.1 0.3
0.22
0.99 ‐‐ 0.98
0.91
0.98
0.99
0.95 0.94 0.94
0.97
Tabla 8. Posición 1. Medición 1. Recinto tratado
Freq, [Hz] 63 125
250
500
1000
2000
4000 Signal [dB] 65.51 82.41
80.22
74.67
77.07
74.17
76.05 77.73 87.76
84.19
Noise [dB] 52.14 56.17
35.91
27.65
22.14
20.39
43.97 35.87 57.78
46.67
Strength[dB] ‐3.49 13.41
11.22
5.67
8.07
5.17
7.05 8000 Lin A 8.73 8.76
7.19
24.1 24.99 6.59
16.31
C50 [dB] 1.43 3.4
9.21
13.16
20.71
20.11
C80 [dB] 5.24 10.79
12.6
25.25
31.72
32.34
35.81 32.43 13.81
23.42
D50 [%] 58.17 68.64
89.28
95.39
99.16
99.03
99.61 99.68 82.01
97.71
30.79
18.11
11.47
12.63
7.66 0.29
0.3
0.16
0.15
0.14 0.12 0.45
0.16
Ts [ms] 77.1 55.8
5 24.26
9.87
EDT [s] 0.82 ‐‐ T20 [s] 0.61 0.5
0.35
0.17
0.15
0.14
0.13 0.14 0.44
0.23
r T20 0.98 0.97
0.94
0.98
0.99
0.99
0.98 0.97 0.97
0.99
T30 [s] 0.55 0.5
0.33
0.2
0.15
0.14
0.15 0.22 0.47
0.33
r T30 0.96 0.98
0.97
0.98
1
1
0.99 0.91 0.99
0.97
Tuser [s]
0.73 ‐‐ 0.49
0.22
0.17
0.14
0.11 0.09 0.31
0.21
r Tuser 0.99 ‐‐ 0.98
0.93
0.99
0.99
0.95 0.94 0.94
0.97
8000 Lin Tabla 9. Posición 1. Medición 2. Recinto tratado
Freq, [Hz] 63 125
250
500
1000
2000
4000 A Signal [dB] 59.15 85.29
79.38
74.6
75.79
74.09
76.78 76.51 88.59 83.83
Noise [dB] 38.69 56.31
41.61
25.8
28.02
23.16
strenGth[dB] ‐9.85 16.29
10.38
5.6
6.79
5.09
27.8 30.67 53.6 40.25
7.78 9.59
7.51 6.83
C50 [dB] 3.28 5.31
7.21
14.97
17.96
19.49
22.64 24.79 6.97 15.15
C80 [dB] 6.82 7.65
15.17
21.99
25.86
28.12
30.86 32.52 9.89 19.62
68.06 77.27
84.03
96.91
98.42
98.89
99.46 99.67 83.26 97.04
D50 [%] Ts [ms] 55.32 44.74
28.42
16.71
13.18
10.61
6.17 4.74 25.1
10
EDT [s] 0.89 0.68
0.41
0.16
0.16
0.16
0.12 0.09 0.48
0.15
T20 [s] 0.63 0.55
0.44
0.24
0.19
0.17
0.16 0.15 0.55
0.35
r T20 0.98 0.99
0.96
0.99
0.99
0.99
0.99 0.99 0.99
0.97
T30 [s] 0.55 0.52
0.43
0.27
0.22
0.2
0.2 0.19 0.54
0.44
r T30 0.98 0.99
0.98
0.98
0.98
0.99
0.99 0.98 1
0.97
Tuser [s] 0.77 0.58
0.37
0.23
0.19
0.16
0.12 0.12 0.57
0.23
r Tuser 0.98 0.95
0.92
0.97
0.97
0.99
0.97 0.97 0.97
0.96
Tabla 10. Posición 2. Medición 1. Recinto tratado.
Freq, [Hz] 63 125
250
500
1000
2000
4000 Signal [dB] 59.42 85.32
79.71
75.25
75.93
74.25
76.87 76.69 88.74
84.03
Noise [dB] 40.12 56.55
43.98
28.27
28.04
23.32
27.21 30.67 56.3
43.37
Strength[dB] ‐9.58 16.32
10.71
6.25
6.93
5.25
7.69 9.74
7.03
22.04 24.57 7.46
15.41
7.87 8000 Lin
A
C50 [dB] 3.04 5.58
7.47
14.7
18.8
19.1
C80 [dB] 6.47 8.13
14.61
21.76
25.52
28.59
30.8 32.77 10.31
19.81
D50 [%] 66.81 78.31
84.81
96.73
98.7
98.78
99.38 99.65 84.78
97.2
Ts [ms] 57.17 42.65
28.84
17.29
13.16
10.13
6.09 4.68 23.71
9.86
EDT [s] 0.9 0.68
0.4
0.15
0.16
0.15
0.12 0.09 0.44
0.16
T20 [s] 0.64 0.54
0.41
0.25
0.19
0.18
0.16 0.15 0.53
0.33
r T20 0.98 0.98
0.97
0.99
0.99
1
0.99 0.99 0.99
0.98
T30 [s] 0.57 0.51
0.42
0.28
0.22
0.2
0.19 0.18 0.52
0.42
r T30 0.98 0.99
0.99
0.98
0.98
0.99
0.99 0.98 0.99
0.97
Tuser [s] 0.79 0.56
0.38
0.24
0.18
0.17
0.12 0.13 0.62
0.22
r Tuser 0.98 0.92
0.94
0.95
0.97
0.99
0.98 0.98 0.94
0.97
Tabla 11. Posición 2. Medición 2. Recinto tratado.
Figura 34 Medición del recinto en los dos puntos, sin acondicionamiento
Figura 35 Medición del recinto tratado
Como los datos lo indican, el tratamiento consiguió reducir el tiempo de reverberación
del recinto por 0.2 segundos aproximadamente en la mayoría de bandas de frecuencia.
A excepción de las frecuencias igual o menores a 250 Hz, el recinto posee tiempos de
reverberación que lo hacen adecuado para una reproducción ambiofónica, sin embargo,
no es ideal, ya que aún hay problemas en frecuencias bajas.
Como se puede ver en las figuras previas, el acondicionamiento consistió en ubicar
material poroso en las superficies paralelas, para evitar los fuertes ecos fluctuantes
existentes en tres pares de segmentos de las superficies del lugar, estos son, la pared
frente a la ventana isolada y la ventana misma, la pared frontal y la pared trasera (solo
la frontal fue tratada) y la parte frontal de muro ubicada en la misma pared de la
ventana, en esta última habían ecos evidentes en frecuencias altas, lo cual se redujo con
un resonador en una parte y material en la otra. Los materiales se dispusieron de forma
tal que no quedaran exactamente paralelos a las paredes contrarias.
Por ende es de esperarse que al reproducir el material, este sea claro en frecuencias
altas (las más importantes de acuerdo al método) y que existan ciertos inconvenientes
en frecuencias bajas. Cabe recordar que las frecuencias medias bajas también poseen
tiempos de reverberación relativamente altos y que el método de ambiofonía asegura
que este tipo de frecuencias no se ubican específicamente en el centro como suele ser el
caso en estéreo para una audición real.
Un factor en contra resulta ser también, el hecho de que existe una gran diferencia entre
los tiempos de reverberación promedio y el menor tiempo de reverberación a lo largo
del espectro. Diferencia que según Glasgal no debe superar al 25% del valor del RT
promedio, lo cual en este caso no se cumple.
Es probable que un material más grande y poroso, diseñado especialmente para
absorber acústicamente hubiese solucionado el problema; medida no ejecutada por
cuestiones de presupuesto.
Por otra parte, al realizar la grabación en el auditorio y revisar los resultados obtenidos,
se puede ver que la espacialidad se ve afectada en algunos casos, en especial, por la
mayor presencia del violín frente a la guitarra –esta última es fácilmente localizable- ya
que el nivel de este es muy alto y en algunos momentos hace parecer que está ubicado
en el centro cuando realmente no lo está. Esta impresión está ligada la frecuencia y
nivel de la nota reproducida.
Esto pudo deberse a que los pre-amplificadores no son de la calidad más alta y además
de generar cierto ruido, pueden afectar la naturalez ay claridad de la respuesta d elos
micrófonos. Además, los micrófonos tiene forma cilíndrica y por lo tanto no se
sujetaron a la superficie de la cabeza como los micrófonos pequeños similares a los
lavaliers que se utilizan para grabaciones binaurales, esto quiere decir que hubo un
pequeño aumento en la distancia entre los dos oídos que se pretende simular con la
técnica ambiofónica. Estos problemas ocurrieron a pesar de que las señales fueron
calibradas para tener una respuesta tan equivalente como fuese posible y los valores
respecto a nivel que estas generaron son prácticamente iguales.
El desempeño y características del RACE actual se usaron para la configuración y
calibración del sistema de reproducción y en general para el estudio de los diferentes
elementos tratados en el proyecto. Mientras que el diagrama de bloques generado en
Simulink sirvió para realizar un acercamiento a la composición interna del procesador,
resultaron ciertos factores de error discutidos en la sección de desarrollo ingenieril.
Debido al tiempo necesario para generar los archivos de audio desde simulink
(aproximadamente veinte minutos para un archivo de 10 segundos de duración) solo se
utilizaron muestras procesadas para la evaluación, ya que no era fiable ni conveniente
calibrar los sistemas con el diagrama en simulink.
Evaluación subjetiva del material recolectado
En la siguiente encuesta se evalúan diferentes materiales de acuerdo al contenido
recolectado para cada uno de los casos posibles.
Después de realizar la encuesta a diez personas (estudiantes y docentes de ingeniería de
sonido entre los 22 y 30 años) se obtuvieron los siguientes datos de acuerdo a cada
pregunta.
Pregunta 1
1- ¿En cuál presentación de la canción Lil´ David considera usted que existe una
imagen sonora más amplia en el plano horizontal?
A- Primera versión (RACE OFF)
B- Segunda versión (RACE ON)
C- Ns/Nr.
Resultados
Pregunta 1
Versión 2 (RACE ON
Versión 1 (RACE off)
Audiomulch)
3
NS/NR
6
1
Pregunta 2
Versión 2 (RACE ON
Versión 1 (Stereo)
Audiomulch)
2
NS/NR
8
0
Pregunta 3
Versión 1 (Stereo)
Segunda versión (Simulink)
3
NS/NR
7
0
Pregunta 4
Grabación original
Segunda versión (Simulink)
0
7
Tabla 12 Resultados encuestas pregunta 1 a la 4
Pregunta 1 Material ambiofónico en
Audiomulch
Versión 1 (RACE
off)
Versión 2 (RACE
ON Audiomulch)
NS/NR
Gráfica 1 resultados pregunta 1
Observaciones
NS/NR
3
•
“El cambio es poco aparente, ambas poseen gran espacialidad pero la segunda
tiene mayor nivel”
•
“La versión 2 está más centrada”
Apreciaciones
La mayoría de encuestados estuvieron de acuerdo en que la versión del RACE ampliaba
el espacio horizontal de campo sonoro, sin embargo, pruebas fuera de la encuesta
acordaron que la diferencia es mayor para frecuencias más altas, este material en
especial contenía mayor presencia de fuentes cuyas frecuencias más relevantes se
encuentran por debajo de las frecuencias medias. Por ende se puede asociar este
fenómeno al hecho de que a frecuencias bajas-medias hay un comportamiento acústico
de menor calidad en el recinto.
2- ¿En cuál presentación de la canción en stereo considera usted que existe una imagen
sonora más amplia en el plano horizontal?
A- Primera versión (Stereo)
B- Segunda versión (Ambio)
C- Ns/Nr.
Pregunta 2 Archivo estereo Procesador
Audiomulch
Versión 1 (Stereo)
Versión 2 (RACE
ON Audiomulch)
NS/NR
Gráfica 2 resultados pregunta 2
Observaciones
•
“Se escucha más definición en algunos sonidos en la segunda versión”.
•
“Existe una mayor espacialidad en la B pero es más aparente el cambio en la
pregunta 1”.
Apreciaciones
La segunda apreciación es bastante acertada ya que como se ha dicho en capítulos
anteriores, el estéreo se verá mejorado por el RACE más no habrá una diferencia
demasiado apreciable en ciertos materiales respecto a otros. Es probable que los
sonidos a los cuales se refiere la primera observación estén concentrados en frecuencias
altas. Pruebas iniciales realizadas con otros materiales en estéreo muestran que la
profundidad también crece además de la claridad de la presentación auditiva.
3- ¿En cuál presentación de la canción considera usted que existe una imagen sonora
más amplia en el plano horizontal?
A- Primera versión (Stereo)
B- Segunda versión (procesamiento por SL)
C- Ns/Nr.
Pregunta 3 Archivo estéreo procesador
simulink
Versión 1 (Stereo)
Segunda versión
(Simulink)
NS/NR
Gráfica 3 resultados pregunta 3
Observaciones
•
“Se siente más amplia horizontalmente y más profunda”
Apreciaciones
La observación resulta de gran alivio ya que esto indica que el diagrama de simulink
consiguió ampliar tanto horizontalmente como a nivel de profundidad a la señal estéreo.
Quizás exista cierto desacuerdo porque la calidad de la señal resultante de simulink se
ve afectada no solo por los factores en contra (en especial la fase) sino por el deterioro
de la señal que ocasiona el propio sistema. Habrá algo más de ruido y distorsión en una
señal de salida de simulink así no exista demasiada variación en sus componentes ni en
el paso por el sistema.
4- ¿En cuál presentación de la canción considera usted que existe una imagen sonora
más amplia en el plano horizontal?
A-) Primera versión (grabación original)
B-) Segunda versión (Procesamiento por SL).
C- Ns/Nr.
Pregunta 4 Grabación original
Procesador Simulink
Grabación original
Segunda versión
(Simulink)
NS/NR
Gráfica 4 resultados pregunta 4
Observaciones
•
“La versión 2 se siente como si uno como oyente estuviera ubicado en un
entorno más amplio”
Apreciaciones
Se corrobora un buen comportamiento del sistema de simulink, esta es una de las
preguntas más importantes ya que implica el uso del material grabado y el procesador
usado.
En este caso el archivo fue seleccionado porque era el que mayor diferencia mostraba –
espacialmente- entre una señal y la otra. Se puede afirmar que aunque no muestra una
diferencia tan significativa como Audiomulch, el procesador RACE generado en
Simulink si logra una diferencia importante en el campo sonoro.
Pregunta 5
Respecto al video de la firma Noach, responda: ¿Qué diferencias o semejanzas
encuentra usted entre la reproducción ambiofónica y la reproducción stereo en términos
de naturalidad, profundidad, definición de centros y extremos y localización de fuentes?
Resultados
Todos los encuestados afirmaron que hay mayor naturalidad, espacialidad y definición
de extremos en la reproducción, aunque algunos mencionaron que el centro es más
claro en estereo y otros opinaron lo contrario. También se comentó que el campo de
ambiofonía es mucho más difuso. Una persona comentó que había sonidos que parecían
venir de las paredes laterales.
Apreciaciones
Este material en especial no fue procesado por la versión de RACE para Audiomulch
sino que fue generado por la firma Noach, quienes poseen un Plug-in VST que ejecuta
el procesamiento de RACE sobre sistemas como DAW o reproductores multimedia
para computadores. El material ya venía procesado, por ende solo tuvo que ser
reproducido. En el se hace una comparación de fragmentos de películas y de su
presentación en Ambio y en Estereo. Lo que resulta interesante de este video además de
la gran diferencia de campos sonoros, es el hecho de que este material al ser
reproducido no se ve demasiado afectado por la acústica del recinto. De hecho, parece
generar un sweet spot mayor al de Audiomulch, y por la calidad del mismo, se podría
pensar que hubo algún tipo de procesamiento extra además de la cancelación recursiva
ambiofónica.
Algunos encuestados sugirieron que reverberaciones extra pudieron ser empleadas y
que el sonido suena mucho más claro por lo que pudo ser procesado por algún otro
sistema externo.
Esta afirmación resulta de vital importancia para el proyecto ya que esto nos indica que
se podría disminuir el rigor acústico exigido por las salas de reproducción ambiofónica
y el resultado esperado por la ambiofonía podría generarse en recintos de poco o nulo
tratamiento.
Pregunta 6
Respecto al material ambiofónico, sugiera un valor de 1 a 5 para los siguientes factores
propuestos por test de Ceoen:
•
NATURALIDAD
•
PROFUNDIDAD
•
DEFINICION DE EXTREMOS
•
DEFINICION DE CENTRO
•
DEFINICION DE CENTROS PARCIALES
1
4
5 PROMEDIO
NATURALIDAD
8
2
4.2
PROFUNDIDAD
1
9
4.9
DEFINICION DE EXTREMOS
6
4
4.4
4
2
3.7
DEFINICION DE CENTRO
2
1
3
3
DEFINICION DE CENTROS
3
PARCIALES
7
4.7
Tabla 13 resultados sobre valores subjetivos en percepción ambiofónica
Resultado total de valores por Test de Ceoen
6
5
4
3
2
1
0
DEFINICION
DE CENTROS
PARCIALES
DEFINICION
DE CENTRO
DEFINICION
DE
EXTREMOS
PROFUNDIDA
D
NATURALIDAD
PROMEDIO
Gráfica 5 Resultados promedio por Test de Ceoen
Apreciaciones
Para este punto algunos encuestados pidieron escuchar más ejemplos de la
reproducción ambiofónica óptima, y como los datos lo muestran, la profundidad, los
centros parciales y los extremos son bastante claros. Aunque para algunos los extremos
más abiertos suenan un poco difusos, lo cual es de esperarse ya que el mismo método lo
aclara.
Es importante discutir el factor de definición de centro ya que acá existen opiniones
encontradas. Debido a que en una reproducción estéreo la sumatoria de energía de
ambos parlantes es empleada para generar un centro muy grande (que afecta a los
centros parciales) se puede considerar la idea de que, al trabajar en estéreo se está
habituado a esperar una respuesta mucho mayor en el centro respecto al resto de la
imagen sonora. Algunos sugirieron que el centro es más claro mientras que otros se
opusieron a la afirmación.
Entonces existen dos posibilidades para interpretar el resultado: el centro es más claro,
pero menor en nivel (gracias a la cancelación recursiva) y su presencia es igual a la de
los centros parciales y los extremos claros y nuestra costumbre por centros fuertes nos
puede engañar o por el otro lado, la configuración del ambiopolo evita que existan
centros claros y la cancelación recursiva juega como factor en contra para la misma
definición central.
Personalmente, consideraría la primera idea ya que las fuentes centrales poseen el
mismo nivel que los centros parciales tal como en la audición real para el caso de
ambiofonía, y la idea de que la imagen estereo es deficiente para centros parciales es
bastante contundente y fácil de comprobar.
Como aspecto relevante se considera el hecho de que la imagen estereo genera
desordenes en frecuencias bajas por lo que se tienden a dejar en e centro al momento de
realizar una mezcla o un proceso en particular. En el caso de ambiofonía las frecuencias
bajas y las medias bajas pueden venir de varios espacios del campo sonoro. De hecho
en el video de Noach existe una escena de la película “Apocalypse Now” en la que un
barco se encuentra a la izquierda generando una fuerte presencia de frecuencias bajas
hacia el lado izquierdo, entre los centros parciales y los extremos. Pero la sensación
auditiva no es de incomodidad, sino por el contrario resulta totalmente concordante con
la imagen y el resultado que habría de esperarse en una situación real similar.
Por lo tanto, hay ciertos factores subjetivos que entran en guerra respecto a los dos tipos
de reproducciones, sin embargo es apenas natural que ocurran y el método propuesto
por Glasgal nos ayuda a desarrollar además de conceptos a niveles teóricos y
tecnológicos, un mejor criterio sobre que se requiere y se busca a nivel ingenieril
respecto a la reproducción sonora.
6. CONCLUSIONES
Para la grabación ambiofónica vale la pena no limitarse a realizar las grabaciones en
sillas específicas de la sala, ya que de acuerdo a los análisis, sería utilizar este punto de
grabación solo para la técnica panambiofónica (grabación ambiofónica con grbación
extra se reflexiones traseras y posterior convolución) o modelos ambiofónicos que
impliquen el uso de más de dos parlantes. Por ende, para un resultado eficaz en el
método con dos altavoces se deben evaluar técnicas desde el punto central del
proscenio o entre este y la silletería. Cabe mencionar también que al momento de elegir
una técnica específica se debe tomar en cuenta la cantidad y distancia relativa de los
instrumentos a interpretar. De ser una orquesta amplia si habrán de considerarse
técnicas desde una de las primeras filas del público.
En conclusión, mientras más amplio sea el campo a capturar en el eje horizontal, mayor
debe ser la distancia entre el ambiófono y las fuentes sin que el ambiófono deba
ubicarse obligatoriamente en una de las primeras filas. Se debe mantener como medida
de referencia los 140 grados de captura directa del ambiófono y el rango de posibilidad
de posición del ambiófono será entre el inicio del proscenio hasta la fila ideal para
grabación de fuentes ocupando la totalidad del proscenio (orquesta)
La herramienta Simulink no genera una calidad óptima ni eficacia de trabajo para el
procesamiento del RACE. Presenta falencias en la fase y amplitud de la repuesta en
frecuencia. Se puede optar por procesamiento adicional (no incluído en el diagrama de
bloques de RACE según Glasgal) para remendar los errores presentados pero un mayor
procesamiento implica una menor calidad del material final. De ser ejecutado en un
DSP, el sistema en simulink podría beneficiarse por procesamiento final que busque la
restauración de la perdida generada por el procesamiento de señales respecto a la
calidad del audio, tales como dithers de salida. El sistema de RACE ejecutado en
audiomulch presenta una respuesta fiel a los principios teóricos del método.
Un procesamiento adicional en el sistema y diagrama de RACE puede llevar a mejores
resultados que ayuden a una espacialidad mayor, más real y de menor factor de error
acústicamente como lo demuestra el video comparativo de técnicas de la firma Noach.
Por lo tanto, el RACE cumple efectivamente su labor, sin embargo se necesita de una
mayor definición y procesamiento para mejorar la adaptabilidad del método
ambiofónico en sistemas más comunes.
El sistema ambiofónico genera una mejor percepción espacial que el sistema estereo
mejorando la profundidad, naturalidad y definición de extremos de una señal.
El sweet spot en la reproducción ambiofónica es bastante reducido y de difícil
calibración, pero mientras mejor sea el tratamiento acústico y en especial el
procesamiento, se lograran mejores resultados.
La tan discutida sensación de “estar ahí presente” al momento de escuchar un material
de audio se cumple con ambiofonía por lo menos en gran parte del campo sonoro y con
todo tipo de material. No obstante, mientras más se acerque el material reproducido a
las condiciones ideales de la ambiofonía, mejor será el resultado.
La técnica de grabación ambiofónica aunque es eficiente, requiere de componentes de
alta calidad, mientras mejor sea el campo sonoro capturado, mayor será la diferencia
generada por RACE. El procesador tiende a abrir los campos sonoros, pero no puede
hacer mucho por grabaciones muy cerradas. Por ello no funciona con grabaciones
binaurales regulares.
De mejorar el sweet spot, el requerimiento acústico y la confiabilidad de los
procesadores, la ambiofonía puede ser la exitosa sucesora de la técnica estereofónica,
además su implementación se hace más inmediata a medida que evoluciona y se da a
conocer el método.
7. RECOMENDACIONES
Al momento de adecuar una sala de reproducción ambiofónica, hay que asegurarse de
realizar varias pruebas con diferentes medidas para el, ambiopolo. Los archivos de
prueba de libre acceso disponibles en ambiophonics.org son la mejor guía para la
percepción subjetiva, mientras que el ruido rosa limitado en bandas también disponible
en la página es gran ayuda para calibrar el Nivel de Presión Sonora emitido por los
parlantes.
Al hacer una grabación ambiofónica se sugiere salir un poco de las reglas del método y
probar distintas ubicaciones, como por ejemplo, dejar el ambiófono a una altura
considerable en el punto central inferior del auditorio o sala de conciertos determinada.
Si se desean hacer pruebas ambiofónicas sin tener los medios para la sala normal, se
sugiere buscar el lugar más cercano al estado ideal en la medida de lo posible y probar
dimensiones de ambiopolos menores a las recomendadas por el método ya que dichas
medidas funcionan para cuartos acústicamente tratados. Aunque la diferencia no sea
muy grande, hacer pruebas iniciales con ambiopolos pequeños da una idea inicial útil.
Es importante que los intérpretes a grabar realicen un trabajo en conjunto y cuiden de
no sobrepasar un nivel que enmascare a sus compañeros, ya que esto conduce a factores
muy difíciles de controlar en una “post-producción” del material grabado.
Para realizar pruebas sobre los valores de los componentes del procesador RACE se
sugiere realizarlas con retardos grandes (por ejemplo mayores a 250ms) no solo para
revisar que funcionen sino para probar diferentes tipos de combinaciones que
produzcan un retardo prolongado que no ocasione retroalimentación reiterativa y de
necesitar una referencia una vez estén configurados los retardos pequeños, utilizar la
misma pieza de audio en Audiomulch u otro cancelador confiable para comparar. El
archivo ideal para realizar lo antes dicho es sin duda el test de ancho L y R disponible
en ambiophonics.org
BIBLIOGRAFÍA
•
“Ambiophonics: Achieving Physiological Realism in Music Recording and
Reproduction” Glasgal, Ralph. AES Convention paper 111th Convention 2001.
•
“Ambiophonics 2nd Edition: Replacing Stereophonics to Achieve Concert-Hall
Realism” Glasgal, Ralph. 2001
•
“The effects of interaural crosstalk on stereo reproduction and minimizing
interaural crosstalk in nearfield monitoring by the use of a physical barrier”
Bock, Timothy. Keele Jr, Don. 81st AES convention paper. Los Angeles,
California, 1986.
•
“Ambiophonic Principles for the Recording and Reproduction of Surround
Sound for Music” Angelo Farina, Ralph Glasgal, Enrico Armelloni, Anders
Torger.
•
“Constrasting ITU 5.1 and Panor-ambiophonic 4.1 Surround Sound Recording
Using OCT and Sphere Microphones” Robert E. (Robin) Miller III 2002.
•
“Scalable Tri-play Recording for Stereo, ITU 5.1/6.1 2D, and Periphonic 3D
(with Height) Compatible Surround Sound Reproduction” AES. Convention
paper. Robert E. (Robin) Miller III 2003.
•
“Real Time partitioned convolution for ambiophonics surround sound”. Angelo
Farina, Anders Torger. 2001 IEEE Workshop on Applications of Signal
Processing to Audio and Acoustics.
•
“360° Localization via 4.x RACE Processing”. Glasgal, Ralph. AES 123rd
convention paper.
•
“The ambiophone derivation of a recording methodology optimized for
ambiophonic reproduction”. Glasgal, Ralph. AES 19th International Conference
on Surround Sound Techniques, Technology, and Perception. Germany 2001.
ANEXOS
Anexo 1. Vista parcial del contenido de la cabeza del ambiófono
Anexo 2. Vista trasera ambiófono-proscenio.
Anexo 3. Configuración ambiofónica y mediciones
Anexo 4. Vista frontal modelo cabeza humana de ambiófono
FECHA
23/10/09
NÚMERO RA
PROGRAMA
AUTOR (ES)
TÍTULO
Ingeniería de sonido
CABEZAS, Christian Camilo
Implementación y análisis de un sistema ambiofónico a partir del
procesador RACE.
PALABRAS CLAVES
DESCRIPCIÓN
Ambiofonía, ambiófono, ambiopolo, binaural, RACE,
dipolo estereo, crosstalk, ILD, ITD, comb-filtering, dsp,
matlab, siulink, Tact, audiomulch, ambisonics.
El presente documento pone a prueba y analiza los componentes de
un sistema ambiofónico en todas y cada una de sus etapas. El
método ambiofónico busca mejorar la percepción auditiva de
campos sonoros mediante técnicas de grabación, procesamientos de
señal y reproducciones específicas. Todas argumentadas, evaluadas
y discutidas en el documento.
FUENTES
BIBLIOGRÁFICAS
•
“Ambiophonics 2nd edition” Glasgal, Ralph.
•
“The Effects of Interaural Crosstalk on Stereo
Reproduction and Minimizing Interaural Crosstalk in
Nearfield Monitoring by the Use of a Physical Barrier”
Bock, Timothy. Keele Jr, Don.
•
360° Localization via 4.x RACE Processing
NÚMERO RA
PROGRAMA
Ingeniería de sonido
CONTENIDOS
1. PLANTEAMIENTO DEL PROBLEMA
El problema se basa en la importancia de un conocimiento claro acerca de la manera en
la cual se debe implementar el sistema de ambiofonía con el fín de evaluar si su uso es
viable y si está en la capacidad de mejorar la percepción espacial proporcionada por el
estéreo. Como base se plantea la pregunta: ¿Cómo se debe implementar el método de
ambiofonía en cada una de sus etapas desde grabación a reproducción, usando el
procesador RACE y cómo se puede mejorar el mismo? Como objetivo general se desea
implementar y analizar el métodos y los objetivos específicos son:
•
Adecuar un recinto para realizar pruebas iniciales sobre el método con material
existente.
•
Realizar el montaje y posterior grabación con un ambiófono.
•
Diseñar y programar la función de un DSP en el software Matlab a partir del
diagrama de bloques con el cual funciona el eliminador RACE para procesar el
material grabado.
•
Seleccionar y adecuar un recinto para la reproducción del material ambiofónico.
•
Realizar una encuesta para valorar la respuesta del resultado obtenido.
•
Establecer posibles correcciones del procesador, de las ecuaciones propuestas
por el método y de la implementación del sistema para distintos lugares.
2. MARCO REFERENCIAL
En este capítulo se enuncia la teoría detrás del método ambiofónico, lo cual incluye el
problema con los sistemas actuales y las maneras de evitarlos de acuerdo a la
ambiofonía. Se revisa además cada una de las etapas en la cadena de grabaciónreproducción del método. Se examinan factores relevantes como el crosstalk, el combfiltering y lo defectos del triángulo equilátero estereo.
3. METODOLOGÍA
Describe el enfoque y línea de la investigación. Discute cada parte del método
aclarando lo que se busca en cada etapa con base en el marco referencial, incluye un
resultado anticipado de la investigación (hipótesis) y las variables presentes. Además se
ven las posibilidades existentes respecto a cada punto importante del sistema.
4. DECISIÓN INGENIERIL
Se describen las elecciones tomadas respecto a los problemas encontrados con el fin de
cumplir las etapas del sistema bajo la mayor calidad posible. Los resultados se toman a
partir de un punto de vista teórico y se llevan a la práctica.
5. ANÁLISIS DE DATOS
Los datos obtenidos se consignan en este capítulo, vienen acompañados por el análisis
respectivo y los razonamientos que han de llevar a las conclusiones. Se encuentran
datos de mediciones y tabulación de datos a partir de una encuesta de valoración
subjetiva.
NÚMERO RA
PROGRAMA
Ingeniería de sonido
METODOLOGÍA
1 ENFOQUE DE LA INVESTIGACIÓN
El trabajo a realizar tiene un enfoque empírico-analítico, porque se orienta a lo técnico
y a la transformación del mundo material. Busca información más confiable y eficaz a
través de la obtención de datos y análisis de los mismos. Utiliza modelos matemáticos y
teoría específica para verificarla en la práctica. Esto es, teoría psicoacústica y
comportamiento de señal, procesamiento digital y evaluación de criterios subjetivos.
Este proyecto se enmarca en la línea de investigación “Tecnologías actuales y
sociedad” de la Universidad de San Buenaventura ya que como su nombre lo indica, se
está examinando un nuevo método partiendo de una tecnología específica que es la
binaural y se relaciona con el impacto social en la medida en que es un sistema que
puede llegar a cambiar todos los sistemas de reproducción habituales.
A su vez se ubica dentro de la sublínea de investigación de Facultad “Procesamiento de
señales digitales y/o analógicas” ya que el flujo de señal convencional desde grabación
hasta reproducción señala a ese tema.
HIPÓTESIS
La grabación ambiofónica ha de realizarse exclusivamente con el ambiófono ubicado
en la posición de un asiento central entre la tercera o quinta fila de acuerdo a la
profundidad del espacio del público en la sala de conciertos, una menor distancia
cerrará la espacialidad en el eje X (horizontal) y provocará una respuesta difusa y poco
clara en los extremos. La percepción de profundidad (eje Z) es óptima y esto se ve en el
campo sonoro de la reproducción.
El procesador RACE diseñado en Matlab presenta cierta distorsión debido a la calidad
del procesamiento. Sin embargo alcanza el objetivo planteado por el principio teórico
inicial del método de cancelación ambiofónica recursiva, la fase y la amplitud se
mantienen ideales. Para mayor efectividad se opera a 70 useg de retardo entre las dos
señales y a una atenuación de -2.5 dB. El resultado subjetivo es bastante similar al
percibido con el software Audiomulch.
Los recintos de reproducción no alcanzan las condiciones ideales en especial en el
RT60 ya que este es difícil de reducir a los 0.2 seg requeridos. Mientras que los
fenómenos acústicos sean controlados en el punto de audición, y el tiempo de
reverberación promedio descienda tanto como sea posible (ojalá a menos de 0.5 seg) se
podrán apreciar los resultados favorables del método ambiofónico.
La mejor distancia entre los parlantes estará cercana a los 55 cms y la cabeza del oyente
respecto al centro del triángulo ambiofónico deberá estar localizada a 2 metros de
distancia. Las medidas variarán de acuerdo a las dimensiones y condiciones acústicas
del lugar. Se sugiere hacer pruebas. No obstante, el ambiopolo suele ser más eficaz para
distancias de -20° entre los dos parlantes, incluso más que en -30°.
Variables independientes
•
•
•
•
Implementación de ambiófono.
Operación del RACE.
Sistema de altavoces usado y ubicación.
Material procesado.
Variables dependientes
• Percepción de espacialidad.
• Facilidad de ubicación de fuentes.
Determinación de instrumentos a partir de sus rangos en frecuencia.
CONCLUSIONES
En conclusión, mientras más amplio sea el campo a capturar en el eje horizontal, mayor
debe ser la distancia entre el ambiófono y las fuentes sin que el ambiófono deba
ubicarse obligatoriamente en una de las primeras filas.
La herramienta Simulink no genera una calidad óptima ni eficacia de trabajo para el
procesamiento del RACE. Presenta falencias en la fase y amplitud de la repuesta en
frecuencia.
Un procesamiento adicional en el sistema y diagrama de RACE puede llevar a mejores
resultados que ayuden a una espacialidad mayor, más real y de menor factor de error
acústicamente como lo demuestra el video comparativo de técnicas de la firma Noach.
El sistema ambiofónico genera una mejor percepción espacial que el sistema estereo
mejorando la profundidad, naturalidad y definición de extremos de una señal.
La tan discutida sensación de “estar ahí presente” al momento de escuchar un material
de audio se cumple con ambiofonía por lo menos en gran parte del campo sonoro y con
todo tipo de material.

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Top subcategories

Download implementación y análisis de un sistema ambiofónico a partir del