Download implementación y análisis de un sistema ambiofónico a partir del
Document related concepts
Transcript
IMPLEMENTACIÓN Y ANÁLISIS DE UN SISTEMA AMBIOFÓNICO A PARTIR DEL PROCESADOR RACE CHRISTIAN CAMILO CABEZAS UNIVERSIDAD DE SAN BUENAVENTURA FACULTAD DE INGENIERÍA INGENIERÍA DE SONIDO BOGOTÁ D.C. 2009 IMPLEMENTACIÓN Y ANÁLISIS DE UN SISTEMA AMBIOFÓNICO A PARTIR DEL PROCESADOR RACE CHRISTIAN CAMILO CABEZAS Proyecto de grado Tutor de forma: Olga Lucía Mora Tutor de fondo: Ing. Luis Fernando Hermida UNIVERSIDAD DE SAN BUENAVENTURA FACULTAD DE INGENIERÍA INGENIERÍA DE SONIDO BOGOTÁ D.C. 2009 _________________________ Firma del presidente del jurado _________________________ Firma del jurado _________________________ Firma del jurado Bogotá D.C CONTENIDO INTRODUCCIÓN 1. PLANTEAMIENTO DEL PROBLEMA 1.1 ANTECEDENTES 1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA 1.3 JUSTIFICACIÓN 1.4 OBJETIVOS 1.4.1 Objetivo general 1.4.2 Objetivos específicos 1.5 ALCANCES Y LIMITACIONES 2. MARCO REFERENCIAL 2.1 MARCO TEÓRICO- CONCEPTUAL 2.1 Estéreo y falencias 2.1.1 Reproducción y problemas del Crosstalk 2.1.1.1 Crosstalk y la imagen sonora 2.1.1.2 Respuesta en frecuencia y Comb-filtering 2.1.3 Efectos en estudios profesionales 2.1.4 El dipolo estéreo 2.2 El método ambiofónico 2.2.1 Grabación ambiofónica 2.2.2 Comportamiento del Pinna (oído externo) 2.2.3 El ambiófono 2.3 Procesador RACE 2.3.1 Opciones de implementación 2.3.1.1 Sistema Tact RCS 2.0 2.3.1.2 Software Audiomulch 2.4 Sala de reproducción ambiofónica 3. METODOLOGÍA 3.1 ENFOQUE DE LA INVESTIGACIÓN 3.2 LÍNEA DE INVESTIGACIÓN 3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN 3.4 HIPÓTESIS 3.5 VARIABLES 3.5.1 Variables independientes 3.5.2 Variables dependientes 4. DECISIÓN INGENIERIL 5. ANÁLISIS DE DATOS 6. CONCLUSIONES 7. RECOMENDACIONES BIBLIOGRAFÍA ANEXOS INTRODUCCIÓN Hace ya más de 75 años se ha empleado el concepto práctico y teórico de estereofonía y se ha desarrollado un gran número de técnicas para su grabación y reproducción, no obstante, los dispositivos que manejan señales estéreo tardaron varios años en reemplazar a los sistemas monofónicos en el hogar y en general, cualquier lugar en donde existía la necesidad de reproducir señales de audio. Por tanto la estereofonía fue la generación que siguió a la monofonía y aunque se encuentra en casi cualquier sistema actual, la búsqueda por mejores percepciones subjetivas ha llevado a la implementación de sonido envolvente en distintos formatos (entre ellos el 5.1) y la captura binaural entre otras. Todas ellas con el fin de lograr una sensación espacial realista a nivel acústico buscando una imagen sonora óptima y la percepción de “estar ahí presente”. En el caso del estéreo, se toma la apreciación de difusión sonora y relación interaural como un nuevo camino a seguir para tratar el audio y la manera en que los oídos han de interpretarlo. Sin embargo, nuevas teorías sobre el comportamiento del oído y las variaciones que padece una señal en el proceso de interpretación auditiva, ha llevado a tomar el problema desde una perspectiva diferente. Entran entonces, conceptos nuevos como el comportamiento del Pinna (oído externo), la relación interaural, el método de función de transferencia relacionado a la cabeza (en inglés HRTF) y las características que afectan el comportamiento de estos en un recinto y en la geometría existente entre las fuentes sonoras y el oído. El método de ambiofonía nace de los análisis de los fenómenos y condiciones previamente mencionados y aunque se diferencia de sistemas de la misma índole en varios aspectos, el objetivo que busca es el mismo: mejorar la sensación auditiva al reproducir material de audio. El método ha llegado a tal punto que sus precursores y principales especialistas afirman que este es el siguiente paso después de la estereofonía y que incluso, puede lograr mejores resultados que los sistemas 5.1, con una menor cantidad de altavoces. Cabe mencionar que, el método de ambiofonía se enfoca principalmente a reproducir la sensación que tiene un espectador en la silla con mejor ubicación en una sala de conciertos, esto con el fin de lograr una percepción espacial mayor a la del estéreo y con un método diferente para lograr envolvencia. Las teorías que sustentan el método son puestas a la práctica gracias al procesador de Eliminación Recursiva Ambiofónica de Crosstalk (RACE) el cual se puede programar en un DSP o disponer como un plug-in VST que reduce los datos de ILD e ITD en un sistema de dos canales y a diferencia del estéreo, utiliza una menor distancia entre los parlantes frontales. El presente trabajo pretende implementar un sistema ambiofónico analizando sus fundamentos teóricos, el tipo de captura, procesamiento y reproducción de material idóneo para dicha técnica. Evaluando diferentes aspectos a considerar respecto a cada etapa, para determinar que tan favorable es utilizar sistemas ambiofónicos y que medidas se deben tomar en cuenta para su uso. A lo largo del trabajo se encontrará una nomenclatura específica respecto a las imágenes e información anexa. Las figuras muestran imágenes puntuales, las tablas indican una tabulación de datos y las gráficas son sistemas de representación de datos. 1. PLANTEAMIENTO DEL PROBLEMA 1.1 ANTECEDENTES Existen varios métodos que han tratado de mejorar la percepción espacial de material de audio. Ambisonics, por ejemplo, consiste en una serie de técnicas de grabación y reproducción usando tecnología de mezcla multicanal que puede ser usada en sonido en vivo. Fue establecido en los años setentas por el especialista Michael Gerzon y se basa en el principio de Síntesis de frente de Onda o Wave Front Synthesis. Es isotrópica, por lo cual consideran las fuentes iguales y proporciona una buena sensación auditiva. Para su uso se necesita de una codificación y decodificación en 2d o 3d (plana o perifónica). Por lo cual requiere de un decoder ambisónico y exige como mínimo cuatro altavoces lo cual puede llegar a limitar el campo sonoro y además, según el Sr. Ralph Glasgal1: “…el método no es eficaz en frecuencias sobre los 1500 Hz y por lo tanto se vale de la habilidad aparente del cerebro para ignorar esta falta de localización realista en altas frecuencias”. El concepto teórico Wave Front Synthesis es similar al de Wave Field Synthesis, sin embargo, este último posee un sistema distinto que fue desarrollado en 1988 por el Profesor A. J Berkhout2 bajo este principio también se bada el método de la homofonía. Dicha teoría, conocida como el principio de Huygens, sostiene que todo frente de onda puede ser considerado como una superposición de ondas esféricas elementales. Por tanto, el método asegura que se pueden producir frentes de onda artificiales sintetizados desde un gran número de altoparlantes manejados individualmente. La ventaja es que se pueden establecer localizaciones estables de las fuentes (la holofonía por ejemplo, recrea una copia virtual genuina del campo sonoro) y se le puede adecuar una técnica denominada “virtual panning spots” con el fin de reducir la influencia del movimiento del receptor. No obstante, existe una fuerte reducción en el nivel horizontal suministrado por los altavoces, debido a variaciones necesarias en el método. Se produce también un problema conocido como “truncation effect” que afecta la reproducción del audio ya que al haber varios altavoces recreando un frente de onda, hay variaciones de presión que afectan el resultado. Además, se hace difícil crear transductores cercanos entre sí y generar un número ilimitado de ondas elementales (efecto “Aliasing”). Cabe mencionar como antecedente también, los estudios de la función HRTF o ATF, la cual describe como una onda sonora de entrada es filtrada por las propiedades de difracción y rarefacción de la cabeza, el oído externo (Pinna) y el torso, antes de que este llegue al tímpano y al oído medio. Esta función puede ser hallada a partir del HRIR 1 2 GLASGAL, Ralph. Chapter 1 “Wave front synthesis” Ambiophonics 2nd Edition. BERKHOUT A.J AES E-Library: Wave Front Synthesis: A new Direction in Electroacoustics” (Head Related Impulse Response) y resulta de suma importancia para todo tipo de aplicaciones y técnicas binaurales. Como antecedentes en proyectos de grado se encuentran: • “Diseño y construcción de sistemas electrónicos virtuales para el procesamiento y la generación de señal musical en tiempo real soportados como plug-in VST: vocoder de fase y reverberación digital” Juan Manuel Medina. • “Análisis comparativo de cuatro configuraciones de microfonía en estéreo” Francisco castro. 1.2 DESCRIPCIÓN Y FORMULACIÓN DEL PROBLEMA La idea de la ambiofonía ha sido probada pocas veces en el mundo, logrando resultados realmente satisfactorios, sin embargo, no se ha probado en Latinoamérica ya que no existe mucho conocimiento sobre el tema y hay un cierto escepticismo hacia el tema a en la comunidad de sonido y audio. La ambiofonía presenta las ventajas y alcances de su método claramente, desde los puntos de vista teóricos y prácticos y su conocimiento está abierto al dominio público. El método puede llegar a cambiar la manera de procesar cualquier tipo de material de audio en cada una de sus etapas, desde grabación hasta masterización, lo cual mejoraría la percepción espacial y la localización psicoacústica de fuentes. Crearía nuevas experiencias auditivas y revolucionaría los dispositivos de procesamiento de señal en hogares y estudios especializados. Por tanto es importante examinar cuán grande es y puede llegar a ser y puede incluso abrir muchas puertas para mayores desarrollos. Por tanto el problema a resolver será: ¿Cómo se debe implementar el método de ambiofonía en cada una de sus etapas desde grabación a reproducción, usando el procesador RACE y cómo se puede mejorar el mismo? 1.3 JUSTIFICACIÓN Dado que el sistema ambiofónico es bastante reciente y sigue en proceso de desarrollo, no es bien conocido a nivel mundial aunque ya ha estado en discusión y demostración en reuniones de la AES. También existe escepticismo entre la comunidad de sonido y audio porque la base conceptual del sistema ambiofónico contradice y en cierta manera rechaza ciertos parámetros en los cuales se basan criterios y procedimientos de la estereofonía y el procesamiento de señal de audio. Por tanto, como el método pretende reemplazar a estéreo, se debe evaluar su capacidad, alcance y viabilidad. Por esta razón y quizás también por poca publicidad o implementación de esta tecnología, el sistema es poco conocido en Latinoamérica, pero representa un área de estudio importante que puede ser desarrollada para ofrecer un gran campo de acción en diversos aspectos de la producción de audio, ya que al ser un método nuevo y revolucionario, necesita de trabajo para ampliarse y lograr nuevos y mejores resultados. Según el método ambiofónico – y en general todos los esfuerzos por lograr un nuevo modelo de reproducción de audio innovador y más eficaz- existen múltiples problemas con el estéreo, aunque cada método aborda de distinta manera el manejo del estéreo y el modo de reproducción de audio en dos canales. Todos estos se basan en los principios de la teoría binaural aunque sus criterios y fundamentos sean distintos. A grandes rasgos, el problema principal del estéreo radica en el fenómeno de crosstalk o habla cruzada, es decir, el arribo de una señal de uno de los dos parlantes al oído receptor contrario (parlante izquierdo al oído derecho y parlante derecho al oído izquierdo) y los inconvenientes que se originan a partir del mismo: • Compresión del ancho de la fuente en el escenario. • Picos y frecuencias nulas generadas en el centro por la reproducción simultánea de dos parlantes (Comb filtering). • Crosstalk secundario generado por el comportamiento de la cabeza y posterior ilusión de cambio de timbre. Por lo tanto, se ven involucrados muchos temas de la ingeniería de sonido que van desde teoría acústica y psicoacústica hasta manejo de señales digitales por medio de DSP. También es importante aclarar que, incluso si el método de ambiofonía llegase a presentar alguna falla nueva u omita algún detalle respecto al tratamiento del problema, resulta de suma importancia analizar el mismo ya que el método hace ciertas observaciones acerca del funcionamiento de estéreo que son importantes para cualquier persona involucrada en el desarrollo de sistemas y material para reproducción de audio en dos o más canales. 1.4 OBJETIVOS 1.4.1 Objetivo general Implementar y analizar el método ambiofónico, utilizando como base el procesador RACE. 1.4.2 Objetivos específicos • Adecuar un recinto para realizar pruebas iniciales sobre el método con material existente. • Realizar el montaje y posterior grabación con un ambiófono. • Diseñar y programar la función de un DSP en el software Matlab a partir del diagrama de bloques con el cual funciona el eliminador RACE para procesar el material grabado. • Seleccionar y adecuar un recinto para la reproducción del material ambiofónico. • Realizar una encuesta para valorar la respuesta del resultado obtenido. • Establecer posibles correcciones del procesador, de las ecuaciones propuestas por el método y de la implementación del sistema para distintos lugares. 1.5 ALCANCES Y LIMITACIONES El proyecto generar una nueva propuesta, la cual podría cambiar los sistemas de reproducción en hogares e incluso salas de mezcla y masterización. Puede dar pie a trabajos en grabación y desarrollo de nuevos sistemas procesamiento de señal. De trabajarse a fondo, puede dar origen a sistemas con múltiples altavoces que tengan preconfiguraciones para simular distintos tipos de recintos, dando un ángulo de especialidad completo y sensación de altura determinadas. Este método no abandona el trabajo hecho con producciones estereofónicas y busca mejorar la percepción de las ya realizadas, por tanto su desarrollo representa un campo amplio en todas las materias relacionadas. Sin embargo, algunas limitaciones pueden llegar a ocurrir por problemas para realizar pruebas con múltiples parlantes, debido a la adquisición de un DSP multicanal. Además el método sigue ciertos parámetros y condiciones que pueden ser difíciles de cumplir en la reproducción como por ejemplo, la adecuación de recintos y características de altavoces a usar. Las características del recinto a reproducir el audio grabado exigen condiciones que pueden ser difíciles de lograr debido al presupuesto y material destinado a la adecuación de este lugar. Se busca que no existan ningún tipo de reflexiones propias del recinto en el área a escuchar, además de un RT60 menor a 0.2 seg y en general, una absorción considerable en casi todas las superficies del cuarto, lo cual resulta ser complicado de alcanzar. 2. MARCO REFERENCIAL 2.1 Estéreo y falencias El término viene del griego stéreos, que significa “sólido” y —aunque se refiere exclusivamente a sistemas de dos canales— el término se puede aplicar a cualquier sistema de audio que usa más de un canal, así como el audio de 5.1 canales. El sonido estereofónico es un término que hace referencia a grabación y reproducción que usa proyección estereográfica para codificar posiciones relativas y eventos grabados. Para la reproducción estereofónica en espacios abiertos, se suele ubicar un par de monitores que conforman un triángulo equilátero cuyo tercer punto es la posición del oyente. De acuerdo al Sr. Robin Miller3 denominamos al triángulo como “parlante-stereo” mientras que al método propuesto por ambiofonía se le denomina “parlante-binaural” aunque esto propone una discusión gramatical para algunos, en cierto sentido se evade la misma ya que lo que nos pretende decir es que el stereo no cumple la labor para la cual está destinada por lo cual el “parlante-binaural” es una mejor manera de escuchar el estéreo. Aunque el problema ha sido diagnosticado desde hace ya bastante tiempo y el sistema estéreo existe desde hace más de 70 años, hacía falta un mayor conocimiento psicoacústico y procedimientos técnicos y tecnológicos para eliminar los problemas ocasionados por el sistema de reproducción en estéreo. 2.1.1 Reproducción y problemas del Crosstalk Uno de los grandes estudios sobre el fenómeno del Habla Cruzada Interaural o “Interaural Crosstalk” fue propuesto para la reunión de la AES del año 1986 por los doctores Timothy Bock y Don Keele Jr.4. 3 MILLER, Robin “How Good Can Stereo Be? – Try Ambiophonics and See. Speaker Stereo v. Speaker Binaural. 2008. 4 BOCK, Timothy. KEELE JR, Don B. “The effects of interaural crosstalk on stereo reproduction and minimizing interaural crosstalk in nearfield monitoring by the use of a physical barrier” De acuerdo a dicha publicación, hablamos de Crosstalk cuando el sonido reproducido por un parlante es percibido por el oído contra-lateral u opuesto. Es decir, cuando el oído derecho recibe rayos sonoros emitidos por el parlante izquierdo y viceversa (Fig 1). Figura 1 Arreglo en estéreo El crosstalk es amplio en la disposición espacial de reproducción en estereo y sus principales falencias readican en el efecto en la imagen sonora y en la respuesta en frecuencia. En el caso de la imagen, el problema se debe a que el ancho del escenario está restringido por la separación angular de los parlantes además del efecto del crosstalk en contra de la precisión de las imágenes creadas. Además, la reproducción genera filtrado tipo peine (comb-filtering) en el campo de sonido directo frente a los parlantes, el cual es mayor para fuente centrales. 2.1.1.1 Crosstalk y la imagen sonora La disposición espacial de los parlantes en estéreo, produce imágenes fuera de la cabeza que se pueden localizar fácilmente en los extremos izquierdo y derecho y en el centro, no obstante, la localización se dificulta entre estos puntos debido a la falta de claridad y difusión de los mismos. Si se produjese una cancelación efectiva del crosstalk interaural en la cual la fase y tiempo de arribo de una señal a cada oído pudiese ser tratada independientemente, el ángulo de percepción espacial podría llegar a los 180° e incluso a los 360° (cabe mencionar que los estudio que comprueban está teoría fueron realizados en cámaras anecoicas). Dicho efecto se puede cancelar con audífonos pero si el material a reproducir no toma en cuenta ciertos factores (como el estéreo convencional), la percepción auditiva seguirá viéndose afectada. El Dr Keele relaciona las reflexiones tempranas de un escenario con este fenómeno afirmando que “las grabaciones en estéreo en las cuales se han controlado y reducido las reflexiones tempranas, son realmente capaces de acercarse al comportamiento ideal respecto al espacio”.5 2.1.1.2 Respuesta en frecuencia y Comb-filtering Los defectos del estéreo en la respuesta en frecuencia se deben a la generación de comb-filtering en el campo sonoro en donde se encuentra la cabeza, aunque la misma aporta al decrecimiento de este fenómeno. Esto quiere decir que la respuesta en frecuencia en el punto de audición va a ser filtrada y por ende distorsionada para asemejarse a un filtro tipo peine que creará picos y nulos en la respuesta en frecuencia audible. Según el Dr. Keele, en condiciones reales la configuración de reproducción estéreo presentará una señal de crosstalk –para una imagen sonora central- con una atenuación de -0.3 dB y un retardo de 250useg después del sonido directo llegando de cada parlante a su lado correcto de la cabeza. Afirma además que debido a los nulos 5 KEELE JR, Don. BOCK, Timothy. “The effects of interaural crosstalk on stereo reproduction and minimizing interaural crosstalk in nearfield monitoring by the use of a physical barrier” 1986. p. 8-9 cercanos y el crosstalk posterior (proveniente de la parte superior y trasera de la cabeza), el oído percibe esto como un cambio de timbre. La mayor relación pico-a-nulo del comb-filtering se genera precisamente en la imagen central estéreo ya que como la imagen central se crea con señales iguales en fase coincidentes de los dos parlantes, el crosstalk presente estará en el máximo valor. Para señales completamente paneadas a la derecha o izquierda, no hay comb-filtering porque solo un parlante está activo. Destaca además que el oído puede diferenciar una variación de un grado en posición angular para fuentes reales, lo cual no sucede en la reproducción porque el oído es más sens|ible a los efectos de convolución propia del oído externo e intensidades del mismo mecanismo. Cabe resaltar que este tipo de filtrado ocurre siempre que hay una mezcla entre dos señales que se diferencian por una variación en retardo y suelen generar cambios en la coloración de la señal. 2.1.3 Efectos en estudios profesionales El Dr. Keele llegó a la conclusión de que el diseño acústico de las salas de monitoreo de los estudios profesionales de su época (hace más de 20 años) incrementan el efecto nocivo del fenómeno de comb-filtering en varios aspectos. Muchos de los principios en el diseño de estos recintos aún se aplican hoy en día, por lo cual el acercamiento planteado por estas conclusiones es aún importante en la actualidad. Los diseños basados en los principios LEDE (Live End Dead End) y las zonas libres de reflexiones aumentan en gran manera los efectos del crosstalk interaural. En el caso de los estudios que presentan ausencia de reflexiones y cuya señal se caracteriza por llegar correctamente en tiempo y a campo directo con bajas reflexiones tempranas, también aumentan el efecto del crosstalk interaural. En algunos casos sucede que las reflexiones tempranas en los estudios ayudan a enmascarar el crosstalk y esto no ocurre en sitios con campo directo, por ende si se enfatiza en un ambiente libre de reflexiones y con un monitoreo igual para ambos parlantes, asegura que el crosstalk estará presente y que debido a que no tiene restricciones específicas, obtendrá el mayor valor que pueda tener. Lo cual resulta bastante lógico, ya que mientras más estrictos sean los estándares en el estéreo y mayor sea la intención de obtener campo directo, mayor será la susceptibilidad del sistema a generar estos fenómenos. 2.1.4 El dipolo estéreo Se denomina dipolo estéreo a un arreglo del estéreo convencional en el cual los parlantes se separan a 10° del receptor cada uno, por lo cual habrá un ángulo de 20° entre los parlantes y el oyente. Empezó a implementarse a partir de las teorías previamente mencionadas, para ampliar el ángulo de percepción sonora 180° por medio de cancelación de crosstalk. La razón para dicha reducción espacial es simple, reduce el ángulo del crosstalk interaural al hacer que los rayos lleguen con una diferencia menor en nivel y tiempo. No obstante, se necesita un medio para minimizar el crosstalk restante. Esto se puede conseguir con una barrera acústica frente al oyente entre los dos parlantes (véase la fig 2) o por medios electrónicos. Figura 2 Arreglo en dipolo estéreo con una barrera acústica según método ambiofónico. Existen antecedentes de métodos para eliminar el crosstalk como los de Lexicon y Carver entre otros. No obstante, su problema radica en que no lo han hecho por medio del dipolo estéreo sino por el triángulo estéreo convencional, y por lo tanto el campo sonoro sigue viéndose limitado por la posición espacial de los parlantes. Cabe recordar que la función del dipolo estéreo es reducir el ITD e ILD al tratar de que las señales lleguen simultáneamente, sin embargo no se había tomado en consideración romper el triángulo equilátero. 2.2 El método ambiofónico El método ambiofónico implementado por el Sr. Ralph Glasgal, consiste en un sistema capaz de recrear campos sonoros de excelentes salas de concierto para cuartos de audición en el hogar, buscando una percepción espacial mejor que la de estéreo y una localización de fuentes exacta para un escenario determinado. La figura 2 muestra también la totalidad de la cadena de reproducción ambiofónica de manera general El Sr. Glasgal resume su método de la siguiente manera: “La ambiofonía mueve al oyente al mismo espacio de los músicos, al acomodarse a las características del oído externo y la cabeza del individuo, minimizando la correlación interaural en las posiciones de audición, abandonando el tradicional triángulo equilátero estéreo, recreando reflexiones tempranas y campos reverberantes por medio de computador, eliminando el crosstalk de los altoparlantes frontales y reduciendo el tiempo de reverberación del teatro musical en casa a menos de 0.2 segundos”.6 Aquí se ponen en práctica las teorías propuestas por Polk, Cohen y Keele respecto a las falencias del estéreo. Y además, otros especialistas en la materia han diseñado procesos alternativos que han permitido mejorar al método ambiofónico en cada una de sus etapas, lo cual se verá más adelante. 2.2.1 Grabación ambiofónica Para obtener un material en audio realmente óptimo para el método de ambiofonía, se debe ver el tema a partir del concepto de la grabación binaural. En este tipo de grabación una cabeza binaural posee las dimensiones y densidad de una cara humana promedio y en la posición de los tímpanos, se ubican micrófonos cuyo propósito es obtener la misma captura que tiene un humano normal. En estas cabezas se hace un oído externo similar al humano y aquí nos encontramos con la primera diferencia entre la binauralidad y la ambiofonía: para el método binaural se hace un oído externo falso (asumiendo que al usar audífonos el sonido es directo y el oído externo propio no afectará al momento de la reproducción) y posteriormente se utiliza la denominada HRTF (Head Relation Transfer Function) según la cual se basa un algoritmo que procesa el material y lo hace ideal para una reproducción en audífonos. El método funciona eficazmente, recrea un campo sonoro mucho más amplio y real que el estéreo en audífonos. No obstante, en el método de ambiofonía se busca grabar de una manera similar a la binaural pero sin un oído externo superficial por el hecho de que al tener que pasar el material a un espacio abierto, no hay forma de 6 GLASGAL, Ralph. “Ambiophnics 2nd edition” Introduction. 2001. ignorar el oído externo del oyente en el lugar de reproducción, por tanto las sumas de dos oídos externos resultarían contra-productivas y afectarían al resultado obtenido. 2.2.2 Comportamiento de oído externo El oído externo (o Pinna) ha sido objeto de estudios psicoacústicos que han mejorado en los últimos años, aunque existen varias teorías y análisis sobre su comportamiento, algunos afirman que faltan aún ciertos aspectos por cubrir, sin embargo, según el método de ambiofonía, ya existe el conocimiento suficiente para mejorar los defectos de los sistemas actuales y estos no tienen que ser tan específicos ni rigurosos. En el método de ambiofonía se toman en cuenta las principales características del oído externo7, se afirma que el pinna está diseñado para modificar la respuesta en frecuencia de las ondas sonoras como función de la dirección por la cual viene el sonido. Figura 3 Respuesta del oído externo. Wiener y Ross (1946) línea punteada; Shaw (1974) línea por segmentos; Mehrgardt (1977), línea completa. De acuerdo a la figura 3, hay un aumento importante en nivel a partir de los 3KHz que posteriormente disminuye en 10 KHz. Dadas las importantes amplitudes de estas variaciones (+10dB y -11dB respectivamente), resulta muy difícil corregir las mismas por procesamiento o ecualización. Glasgal afirma que para un sonido lateral llegando al oído más cercano, ocurre un aumento en 200Hz y llega a 15 dB en 2.5KHz, luego baja 7 GLASGAL, Ralph. Ambiophonics 2nd edition. 2001 a 1dB en 5Khz, y sube de nuevo a 12 dB en unos 7Khz, finalmente baja a 4 dB en unos 10 KHz. Con lo cual se demuestra que los humanos somos sensibles a la dirección de emisión incluso si escuchamos con un solo oído. Las respuestas también varían si el sonido viene de una parte superior o inferior al oído y para sonidos provenientes de atrás, ocurre una declinación de 25 dB entre 2.5 KHz y 10 KHz. Esto corrobora el hecho de que los parlantes ubicados detrás del oyente tienen una respuesta con una variación bastante importante incluso a una misma distancia que las fuentes frontales, lo cual representa ciertas dudas sobre el sistema 5.1. 2.2.3 El ambiófono Aunque el método ambiofónico se adapta al material estéreo actual y por tanto a las técnicas de grabación estéreo convencionales, el sistema ha de trabajar mejor en grabaciones hechas con la técnica ORTF o par espaciado, ya que estas proporcionan una espacialidad importante y cercana a los requerimientos del método de Glasgal. Sin embargo, ninguna funciona de manera óptima ya que se omiten muchas variables que van en contra del resultado deseado. El sistema ambiofónico incluye tres elementos importantes, el ambiopolo, el ambiovolver (o convolucionador para ambiofonía) y el ambiófono. Este último consiste en una técnica de grabación especial para el método la cual tiene que cumplir ciertas condiciones. Para empezar, el ambiófono debe capturar el sonido directo y solo las reflexiones leves provenientes del proscenio, por ende se debe rechazar las reflexiones frontales, laterales y superiores en el punto de grabación. Esto implica que el ambiófono debe ubicarse en un buen asiento en el escenario y que debe tener una distancia adecuada para lograr capturar un espacio amplio en el plano horizontal y para cumplir con los demás requerimientos. Los micrófonos omnidireccionales binaurales se ubicaran de acuerdo a la medida de la cabeza humana pero sin un oído externo simulado. Para generar la impresión de que los sonidos que vienen de un extremo pasan por una cabeza humana (la denominada “sombra de la cabeza”), se debe crear una esfera de las mismas dimensiones de una cabeza normal, cuya superficie tendrá sujetados los micrófonos. El patrón direccional de los micrófonos también puede ser cardioide pero puede llegar a exagerar la “sombra de la cabeza” de la grabación. La espacialidad del recinto se dará por parlantes auxiliares ligados al ambiovolver, los cuales convolucionarán la señal grabada por el ambiófono con respuestas al impulso deseadas. Finalmente, el método está diseñado para reproducir fielmente un escenario de 150°. No obstante, puede llegar a simular los 180° con ciertas fallas en los extremos. 2.3 Procesador RACE Como se dijo previamente, el dipolo estéreo no funciona eficazmente si no hay un modo de cancelación activa del crosstalk restante entre los parlantes. La Eliminación Ambiofónica Recursiva de Crosstalk (Recursive Ambiophonic Crosstalk Elimination, RACE) consiste en un método de cancelación electrónica que sirve para sistemas de dos o más canales. Actualmente se puede utilizar como un plug-in VST y su función es la de simular la barrera física utilizada en los estudios de Dr. Keele. El Sr. Glasgal dedica una publicación en la convención número 123 de la AES al RACE y el método ambiofónico8. En dicha publicación se presentan los aspectos técnicos, según los cuales el RACE tiene varias virtudes. Entre ellas está la posibilidad de obtener cancelación que no afecta la coloración o timbre de la señal (como sucede con otros métodos), cancela el ITD e ILD presentes en la reproducción con el fin de entregar el valor que se puede esperar de dichos factores en una presentación en vivo. 8 GLASGAL, Ralph. “360° Localization via 4.x RACE Processing”. 2007. Paper, 123rd AES Convention El principio según el cual se basa el procesador, nos dice que para cancelar una señal que llega del parlante izquierdo al oído derecho, debemos generar una replica de fase invertida y ligeramente retrazada y atenuada que parta del parlante derecho. La señal que se reproducirá con función de cancelación, también debe ser cancelada por otra réplica generada por el parlante izquierdo para llegar a una cancelación de segundo orden, está será cancelada por una nueva señal proveniente del parlante derecho (tercer orden) y así sucesivamente. Para lograr esta generación continua de señales, el diagrama dispone de un loop de retroalimentación (feedback) en su diagrama de bloques, que ejecuta un “ping-pong delay” continuo. Tal como se ve en la figura número 4. Figura 4. Diagrama de bloques de operación de RACE Para generar la señal de cancelación, el RACE toma los canales L y R y utiliza un filtro pasa-bandas para trabajar de 250Hz a 5KHz. No es posible ni necesario cancelar el crosstalk en frecuencias superiores a los 5KHz ya que estas dependen de la localización del oído externo y no del ITD e ILD. En el caso de las frecuencias bajas, el ILD sufre pocos cambios a medida que decrece la frecuencia específica y aumenta la longitud de onda ya que las dimensiones de la cabeza empiezan a ser insignificantes a partir de los 400Hz. Por lo tanto, cuando se llega a los 250 Hz, la diferencia es irrelevante. El bypass de frecuencias bajas lleva a una disminución moderada mientras que las sumas de bajos en el triángulo estéreo crean inconsistencia en reproducciones monofónicas con dos parlantes. Cabe mencionar que este tipo de incongruencia del estéreo suele arreglarse por métodos como la matriz M/S (Mid/Side) en los cuales se busca operar un rango determinado de frecuencias en una parte específica de la imagen fantasma estéreo. Con ello se puede dar la impresión por ejemplo, de que las frecuencias bajas vienen del centro lo cual da una percepción más agradable de audición, no obstante, retomando el sentido lógico del método de ambiofonía, lo ideal sería que este tipo de métodos no debieran emplearse aunque no por eso dejan de ser realmente útiles. 2.3.1 Opciones de implementación El diagrama de bloques del procesador RACE en el paper del Sr. Glasgal nos muestra como idea general el tratamiento que habrá de sufrir una señal de dos canales para considerarse ambiofónica, sin embargo, algunos arreglos o adiciones se han diseñado para los distintos modos de implementación del RACE. Las dos versiones más conocidas son: en software, el programa AudioMulch y en hardware el excelente sistema Tact RCS2. 2.3.1.1 Sistema Tact RCS2 Este sistema se ha empleado en los laboratorios más importantes en cuanto a desarrollo de ambiofonía que son: “Filmaker Technology”9y “Ambiophonics Institute”. En los textos referentes a la ambiofonía se encuentra un escrito que habla sobre el Tact RCS 2.010. En el cual se explica que: “el RCS 2.0 AA es un preamplificador de linea análoga y digital que utiliza un PC para automatizar o configurar funciones avanzadas de audio”. Posee entradas XLR y RCA y salidas digitales como Toslink, AES/EBU y RCA. Entre sus virtudes se encuentra la posibilidad de realizar una inversión de polaridad y retardos que van desde centésimas partes de un milisegundo hasta 99.9 milisegundos. Un EQ paramétrico de alta resolución (2Hz), filtros de tono (ajustables en un software que viene incluido) y otro gran número de aplicaciones entre las cuales es de interés el proceso de convolución que puede hacer. Por ende, tiene todo lo que se necesita para cumplir con el sistema ambiofónico. Además, también puede enviar señales a un ambiopolo posterior o a cierta serie de altavoces adicionales para llegar a las técnicas avanzadas de ambiofonía y mejorar aún más, la sensación auditiva producida. Aunque su herramienta más útil es su sistema de control activo de ruido, que opera por medio de pulsos y con el cual puede medir la respuesta de los altavoces y realizar cambios automatizados de acuerdos a las mismas, tal como se utiliza para presentaciones de sonido en vivo. Esto es una ventaja muy grande ya que ayuda a mejorar la respuesta en cuartos no tratados acústicamente. Cabe recalcar la alta precisión que presenta en el software con el que opera. El sistema regula además las respuestas para que no siempre sean lineales en todas las bandas de frecuencias por diferentes motivos ligados a determinadas frecuencias, como por ejemplo (como menciona el libro) una caída de 10dB en 100 Hz no será apropiadamente arreglada con un incremento de 10 dBs en el ecualizador ya que en el 9 Disponible en http://www.filmaker.com/ Dsiponibke en tactaudio.com “Tact RCS 2.0 AA Room Correction System One Hell of a Computing Animal” 10 plano musical ocurren transientes y dicha modificación tendrá consecuencias inadecuadas y audibles. Aunque el sistema es realmente versátil y útil, no es una solución perfecta. Diversos factores acústicos en el recinto de audición influyen para que la respuesta en un punto determinado tenga problemas a pesar de la corrección del sistema de control activo. Como tal es el caso de reflexiones de paredes traseras lejanas etc. Al tener la ventaja de manipular crossovers para sus salidas, se puede ajustar fácilmente a un sistema determinado de subwoofers El sistema proporciona una calidad extraordinaria, por lo cual su precio resulta también bastante elevado. 2.3.1.2 Software AudioMulch En un principio, el software AudioMulch cumplía con algunas funciones que relacionaban procesamiento por bloques de DSPs, compatibles con sistemas MIDI y ciertos procesamientos de Audio. En su más reciente versión (2.0.1) el programa se transforma como sus desarrolladores mismos lo denominan, en un software para síntesis de sonido en tiempo real y procesamiento de audio para presentaciones. La última versión es ejecutable en las plataformas Windows y Mac. Su interfaz y modo de uso son similares al del software Reaktor de Native Instruments en el cual se hacen enlaces de componentes de procesamiento digital, cada uno de los cuales tiene sus propios controles ajustables. Dado que el sistema ambiofónico es de dominio público, la versión del RACE para el software AudioMulch es de libre descarga de la página ambiophonics.org. Aunque contiene ligeras ventajas sobre el diagrama de bloques. Como por ejemplo un procesador de ping-pong delay ajustable a cualquiera de los dos canales y con dos controles que permiten ajustar el número, feedback y porcentaje de dicho tipo de delay en la señal. Existen dos controles de atenuación de nivel, uno al final del filtro pasabanda y otro al antes del filtrado por bandas como se ve en la figura 5. Aunque no se especifica en las características del software, resulta coherente creer que la fase permanece lineal ya que los resultados logrados con esta presentación del RACE han sido corroborados y puestos a pruebas por muchos seguidores del método sin presentar algún tipo de falla considerable. Cabe mencionar que el procesador de libre descarga ejecuta un archivo de texto que contiene instrucciones para configurar el sistema. Aunque hay algunos aspectos relevantes. Figura 5. Procesador RACE en AudioMulch 2.0.1 Las indicaciones nos dicen que para un enfoque fuerte se determine un delay recursivo de 0.07 milisegundos, 0.08 para la HRTF predeterminado y 0.09 para cabezas más grandes, esto hace recordar una de las premisas básicas del RACE: el tiempo del delay ping-pong entre los dos canales está directamente ligado al tamaño que posee la cabeza. Propone además un rango de configuración del valor de atenuación recursiva para máxima amplitud en -2.5 dB hasta -6dB para mínima coloración, con 3.5 dB como valor predeterminado. Cada valor tiene su equivalente en porcentaje de feedback para el delay siendo estos 75%, 50% y 67% respectivamente. 2.4 Sala de reproducción Ralph Glasgal recomienda tener en cuenta ciertas pautas respecto a las condiciones acústicas de un recinto designado para la reproducción ambiofónica11. Para empezar, designa tres factores vitales e imprescindibles: bajo ruido ambiente, alta absorción (RT60 de 0.2 segundos o menos) y ausencia de fenómenos acústicos propios de los recintos como modos de reverberación. El sistema está destinado para implementarse en recintos pequeños, o más específicamente, en una habitación regular. Sin embargo la amplitud del sweet spot en el punto de audición sigue siendo bastante sensible, por ende a medida que se logran mayores acercamientos a las condiciones ideales, hay que implementar medidas estrictas respecto al comportamiento de las salas. Por esta razón y por la debida sustentación del comportamiento del crosstalk respecto a la geometría en cuartos de control de estudios o salas de mezcla, se debe abordar el tema del recinto desde un punto de vista distinto al del estéreo. 3. METODOLOGÍA 3.1 ENFOQUE DE LA INVESTIGACIÓN El trabajo a realizar tiene un enfoque empírico-analítico, porque se orienta a lo técnico y a la transformación del mundo material. Busca información más confiable y eficaz a través de la obtención de datos y análisis de los mismos. Utiliza modelos matemáticos y teoría específica para verificarla en la práctica. Esto es, teoría psicoacústica y comportamiento de señal, procesamiento digital y evaluación de criterios subjetivos. 11 GLASGAL, Ralph. “Tuning the Listening Room For Ambiophonics”. Capítulo 5, Ambiophonics 2da edición. 3.2 LÍNEA DE INVESTIGACIÓN Este proyecto se enmarca en la línea de investigación “Tecnologías actuales y sociedad” de la Universidad de San Buenaventura ya que como su nombre lo indica, se está examinando un nuevo método partiendo de una tecnología específica que es la binaural y se relaciona con el impacto social en la medida en que es un sistema que puede llegar a cambiar todos los sistemas de reproducción habituales. A su vez se ubica dentro de la sublínea de investigación de Facultad “Procesamiento de señales digitales y/o analógicas” ya que el flujo de señal convencional desde grabación hasta reproducción señala a ese tema. Además, hay un procesamiento especial, debido al sistema DSP basado en el RACE, el cual es vital para el método. En cuanto al campo de investigación, el trabajo recoge información de las tres áreas, ya que existe una etapa de grabación y análisis de grabaciones. El sistema del RACE y su análisis pertenece al tema digital y su modificación implica un concepto de diseño, aunque este solo se enfoca en programación. Además, la justificación y tipo de aplicación del método están basados en temas de acústica y psicoacústica, por lo cual, esta también tiene un papel importante en la implementación. 3.3 TÉCNICAS DE RECOLECCIÓN DE INFORMACIÓN Selección del recinto Para la selección de un lugar ideal para las pruebas iniciales resulta importante tomar en cuenta los tres criterios establecidos por Glasgal respecto al tema, estos son: aislamiento, alta absorción interna y ausencia de modos o problemas de reflexiones en la posición del oyente. Además, al ser este un método diseñado para ser reproducido en los hogares y habitaciones, se hace necesario que el cuarto a utilizar sea de medidas cercanas a este tipo de lugares. El método indica que la única propiedad acústica realmente útil al tratar un recinto para una reproducción ambiofónica es la absorción (más que la difusión y reflexión). El método demanda además, un tiempo de reverberación RT60 promedio menor o igual a los 0,2 seg. Por lo cual habrá de requerirse una alta absorción en el recinto para alcanzar tales valores. Se hace vital la implementación de material absorbente en el techo y en las paredes laterales respecto al punto de audición. En un caso ideal, el comportamiento acústico del recinto debería evitar el uso de sistemas de control activo de ruido. Y esta afirmación debe tenerse muy en claro a la hora de seleccionar y adecuar el lugar a probar. Por tanto el recinto debe tener un tiempo de reverberación inicial relativamente bajo, unas dimensiones cercanas a un cuarto normal y un aislamiento y/o ubicación que impida incidencias de fuentes externas. Ambiófono y grabación ambiofónica Debido a que se necesita recrear el campo de sonido directo desde los parlantes frontales respetando los conceptos referentes a la localización vertical y la profundidad espacial; la técnica de grabación ambiofónica debe evitar las reflexiones laterales, superiores y traseras del recinto ha ser capturado. Ya que el campo difuso será recreado por parlantes auxiliares ejecutando un proceso de convolución en tiempo real de la señal original con una respuesta al impulso determinada. El ambiófono es una técnica de grabación que consiste en una adaptación de una cabeza binaural sujeta a dos paneles laterales y uno superior para evitar el fenómeno de reflexiones mencionado. A diferencia de la cabeza binaural, el modelo de la cabeza humana del ambiófono carece de oído externo y de la parte trasera de la misma que precede a partir de la ubicación del tímpano. Esto corrobora la afirmación según la cual solo debe haber un oído externo a lo largote la cadena de instrumentista-oyente y tal parte del oído no puede ser omitida del oído del oyente al momento de la reproducción. Aunque otras técnicas en estereo funcionan bien en el método ambiofónico (en especial la ORTF y XY) el ambiófono está diseñado para alcanzar el mayor (más no óptimo) grado de definición y conveniencia para la ambiofonía. El sr. Miller no habla de medidas específicas ni materiales especiales para el diseño del ambiófono. De hecho la técnica se puede emplear con el Schoeps KFM-6 el cual consiste en una esfera de alta definición cuyos excelentes micrófonos y adecuada densidad (respecto a la de la cabeza humana) proporcionan una grabación ideal. Por tanto si se ha de diseñar un ambiófono, se debe dar la mayor relevancia a los tres criterios básicos respetando también unas medidas y materiales debidamente formulados. Los micrófonos han de ser omnidireccionales preferiblemente aunque los cardioides también pueden funcionar pero a costo de cerrar un poco la percepción espacial, especialmente en los extremos. La posición recomendada para la grabación ambiofónica es la silla que se considera la mejor del escenario, suele estar entre la primera y quinta fila en el centro del recinto. Figura 6 Grabación ambiofónica de “AMBIOPHONICS Achieving Physiological Realism in Music Recording and Reproduction” Glasgal, Ralph AES 111th AES Convention Es opcional realizar grabaciones en otras ubicaciones tal como lo indica la figura 6. RACE y Matlab El procesador RACE surge de la idea de reducir el crosstalk tanto como sea posible sin emplear una barrera acústica física. Lo cual se consigue a partir de cancelaciones de ondas entre los mismos altoparlantes. La ausencia de crosstalk nos ha de dar una imagen clara, profunda y específica respecto a la ubicación de las fuentes sonoras. La evaluación del sistema se hará a partir de percepción subjetiva El RACE se ha implementado en software y hardware siendo Noach y TaCT los mejores sistemas respectivamente. Sin embargo, se formuló el objetivo de crear un sistema similar al RACE desde el programa Matlab ya que la teoría del RACE parece ser relativamente sencilla respecto a los alcances que el sistema tiene. Sin embargo hay muchos factores que hay que revisar y cuidar si se pretende generar un programa cercano. Para empezar, los dos canales de la señal estereo deben ser separados y filtrados en tres rangos distintos. Las regiones de frecuencias bajas y las altas, deben ser omitidas y transmitidas sin modificación alguna (aunque en la versión de Audiomulch hay una reducción de 6dB en los filtros pasabajas y pasaaltas). Mientras que una región comprendida entre los 250Hz y los 5KHz será sometida a una inversión de fase, una ligera atenuación (que puede variar de acuerdo a la ampliación deseada del escenario) y comenzarán una secuencia de cancelaciones de n órdenes que procuran eliminar los rasgos del crosstalk restantes. Los tiempos establecidos para los retardos que han de servir para la cancelación recursiva (en el margen de los 65us a 100us) son bastante cortos y audiblemente imperceptibles, por ende posiblemente se encontrarán sistemas que no conseguirán a llegar a dichos rangos de tiempo. El efecto de dos delays continuos en L y R (comúnmente denominado ping-pong delay) se compone por un flujo de señal que ha de producir retroalimentación y tal fenómeno se debe controlar por medio de una regulación de ganancia en los puntos principales (feedback gain). La siguiente figura muestra el flujo de señal de un ping-pong delay sencillo.12 12 Disponible en http://www.harmony-central.com/Effects/Articles/Delay/ Figura 7 Ping-pong delay disponible en harmonycentral.com Los valores a consignar en cada uno de los controles de ganancia dependerán de la atenuación previa al delay tal como lo sugieren las notas adjuntas del diagrama de bloques de RACE para el software Audiomulch. Con el Laboratorio de matrices Matlab, se pueden generar todo tipo de procesamientos para señales digitales por medio de programación algorítmica o por flujos de señal a través de la aplicación Simulink, posteriormente se pueden quemar e implementar para generar sistemas de hardware o DSPs. Evaluación subjetiva Para realizar una valoración de los resultados obtenidos, se habrá de remitir al tema de las pruebas de Ceoen, de acuerdo a las cuales se evalúan criterios específicos respecto a la percepción de material en estéreo para diferentes tipos de técnicas. Los valores más importantes a examinar son profundidad, naturalidad, definición de extremos y definición de centro y centros y parciales. Aunque tales aspectos son relevantes, existe la necesidad de que el encuestado determine su percepción acerca de materiales de audio de distinto origen en términos de un procesamiento específico, es decir, se debe precisar si se hallan diferencias entre un material y su versión procesada por Audiomulch, o su versión procesada por Simulink. En tal medida, ciertas preguntas deben ser específicas y los detalles deben ser sugeridos por el oyente a partir de su propio criterio. 3.4 HIPÓTESIS La grabación ambiofónica ha de realizarse exclusivamente con el ambiófono ubicado en la posición de un asiento central entre la tercera o quinta fila de acuerdo a la profundidad del espacio del público en la sala de conciertos, una menor distancia cerrará la espacialidad en el eje X (horizontal) y provocará una respuesta difusa y poco clara en los extremos. La percepción de profundidad (eje Z) es óptima y esto se ve en el campo sonoro de la reproducción. El procesador RACE diseñado en Matlab presenta cierta distorsión debido a la calidad del procesamiento. Sin embargo alcanza el objetivo planteado por el principio teórico inicial del método de cancelación ambiofónica recursiva, la fase y la amplitud se mantienen ideales. Para mayor efectividad se opera a 70 useg de retardo entre las dos señales y a una atenuación de -2.5 dB. El resultado subjetivo es bastante similar al percibido con el software Audiomulch. Los recintos de reproducción no alcanzan las condiciones ideales en especial en el RT60 ya que este es difícil de reducir a los 0.2 seg requeridos. Mientras que los fenómenos acústicos sean controlados en el punto de audición, y el tiempo de reverberación promedio descienda tanto como sea posible (ojalá a menos de 0.5 seg) se podrán apreciar los resultados favorables del método ambiofónico. La mejor distancia entre los parlantes estará cercana a los 55 cms y la cabeza del oyente respecto al centro del triángulo ambiofónico deberá estar localizada a 2 metros de distancia. Las medidas variarán de acuerdo a las dimensiones y condiciones acústicas del lugar. Se sugiere hacer pruebas. No obstante, el ambiopolo suele ser más eficaz para distancias de -20° entre los dos parlantes, incluso más que en -30° 3.5 VARIABLES 3.5.1 Variables independientes • Implementación de ambiófono. • Operación del RACE. • Sistema de altavoces usado y ubicación. • Material procesado. 3.5.2 Variables dependientes • Percepción de espacialidad. • Facilidad de ubicación de fuentes. • Determinación de instrumentos a partir de sus rangos en frecuencia. 4. DESARROLLO INGENIERIL Selección y medición del recinto En un principio se consideró realizar las pruebas auditivas del método ambiofónico en una sala de grabación. El problema radica en que estos son recintos acústicamente tratados cuyos tiempos de reverberación suelen ser cercanos a 1 segundo y sus proporciones pueden ser bastante amplias en cada una de sus medidas. Por tanto las dimensiones no son favorables y reducir su tiempo de reverberación es una tarea bastante dispendiosa además de costosa. Una habitación promedio tendría ventajas dimensionalmente, sin embargo, el ruido externo se convierte en una amenaza para casi cualquier lugar de este tipo a considerarse. Habría facilidad de realizar un tratamiento acústico. Más sin embargo, las habitaciones revisadas tenían ruido externo bastante molesto e inmanejable. Finalmente, se escogió el cuarto auxiliar de la sala de Pre-producción de Audio de la Universidad de San Buenaventura el cual cumple con las características básicas necesarias para la implementación del método. Ya que sus tiempos de reverberación promedio oscilan entre los 0,4 y 1 segs de acuerdo a cada de rango de frecuencias (reducible a los 0,2 deseados) y además se encuentra aislado acústicamente por medio de espacio vacío entre las ventanas cuya superficie inferior contiene fibra de vidrio para evitar reflexiones internas, como tal es el caso de los vidrios que comunican las salas de grabación con el control room en un estudio de grabación musical. La entrada tiene dos puertas de vidrio delgado. Además el lugar es cercano a zonas de bajo ruido, lo cual es un punto a favor respecto al asilamiento. Por tanto, se procedió a realizar las primeras pruebas en este salón, para lo cual se tuvo que medir el tiempo de reverberación inicial del salón vacío y se debieron buscar problemas de modos y fenómenos acústicos. En especial existían ecos fluctuantes que se acentuaban a distintos rangos de frecuencias, ya que para la entrada del recinto, se presentaban en frecuencias altas y al final de este, en frecuencias bajas. Dadas las medidas del recinto se decidió medir el tiempo de reverberación a dos posiciones de micrófonos y una posición de fuente, ya que el lugar es de un tamaño relativamente pequeño y el uso de un número mayor de posiciones implicaba infringir las normas de medición de tiempo de reverberación de la ISO-3382, como por ejemplo la distancia que debe existir entre los muros del lugar y las posiciones elegidas. El método elegido para dicha medición fue el proceso de convolución y deconvolución de un barrido sinusoidal logarítmico (en inglés LSS) según el cual se debe generar una señal logarítmica ascendente que cubre todo el rango de frecuencias audibles, la respuesta a esta señal es guardada y con la ayuda de la versión invertida de la señal inicial, se ejecuta el proceso de deconvolución de la grabación separando así, la respuesta al impulso del barrido sinusoidal. Finalmente se analiza la respuesta al impulso del lugar y se sacan los tiempos para cada banda de frecuencias. Para empezar se hizo la medición de ruido ambiente, la cual generó 37.8 dBs(A). Por ende se calibró la fuente omnidireccional (un dodecaedro) para generar una señal con un valor de 80,9 dBs(A) lo cual cumple la regla establecida acerca de la diferencia mínima la presión sonora del ruido ambiente y el SPL de la señal a medir. Se tomaron dos puntos de medición con un punto de fuente, ya que al ser un espacio pequeño, era difícil que los puntos de captura estuvieran a una distancia adecuada respecto a las paredes y de acuerdo a la norma. Los datos generados ese ven en detalle en el capítulo 5 (Análisis de datos). Ambiófono y grabación ambiofónica Para el método de ambiofonía a ejecutar se decidió diseñar un ambiófono en lugar de probar técnicas en estereo con el fin de examinar la efectividad del método de grabación y garantizar una respuesta fiel a la teoría establecida. Para realizar el ambiófono se partió de la idea de tomar un punto de referencia para las medidas en primer lugar, se decidió tomar las dimensiones promedio de una cabeza humana y relacionar la longitud de los paneles con longitudes de onda específicos a ciertas frecuencias, procurando conservar unas medidas coherentes para que el ambiófono no fuese muy pesado o muy pequeño. Por ende, se tomaron algunas cifras respecto a la antropometría de la cabeza humana13 de acuerdo a un estudio realizado por Alan Poston. Las medidas encontradas están divididas por percentiles entre mujeres y hombres, para el proyecto se decidió utilizar el quincuagésimo percentil en medida de la cabeza humana de hombres, no obstante, los datos respecto a las dimensiones de la cabeza de las mujeres resultan de gran importancia ya que el RACE establece una relación entre el retardo aplicado a la cancelación recursiva ambiofónica y el ancho de la cabeza del oyente. Cabe mencionar que no sea necesitan múltiples medidas ya que la forma de la cabeza para el ambiófono no tiene mayor influencia en el resultado de la grabación de acuerdo a Glasgal, lo importante es cuidar de la densidad. Las siguientes gráficas nos muestran las medidas a considerar del estudio de Poston respecto a las aplicables al diseño del ambiófono. 13 POSTON, Alan“Human Engineering Design Data Digest”. 2000. Figura 8 Medidas antropométricas por Alan Poston. Ancho de la cabeza humana Figura 9 Medidas antropométricas por Alan Poston. Longitud de la cabeza humana Figura 10 Medidas antropométricas por Alan Poston. Altura de la cabeza humana Por tanto las medidas a usar respecto al ancho, largo y alto de la cabeza humana son 14,5cm, 19,7cm y 23,3cm respectivamente. Hay que recordar que el diseño a realizar está basado en el ambiófono del Sr Robin Miller (Fig 11) Figura 11 Ambiófono diseñado por Robin Miller Por ende, no se trata de ubicar una cabeza humana normal, sino que se debe realizar un corte determinado por el panel superior tal como se ve en la figura 9. De hecho como se mencionó previamente, la cabeza humana puede ser reemplazada por un objeto de forma ovalada pero el detalle en las especificaciones nos da una idea más clara de las dimensiones y proporciones restantes, ya que los factores de altura, longitud y ancho de necesitan incluso en una forma ovalada. El Sr. Glasgal comenta que el ambiófono ha de tener material absorbente en frecuencias altas alrededor de todas sus superficies incluyendo las traseras. Sin embargo, la parte trasera no ha de importar mucho ya que si esta es reflectiva, estará repelando las reflexiones innecesarias de las cuales ya se ha hablado. Para el diseño se buscó un material que fuese absorbente en las superficies frontales (las que rodean la cabeza) y reflectivas en la parte trasera. El peso juega un papel importante en el ambiofono ya que de ello depende su fácil manejo y estabilidad, en especial si se planea usar a alturas considerables. Se descartó entonces, el uso de metales para las superficies a pesar de ser altamente reflectivas, ya que implicarían un peso exagerado y de ser huecas causarían reflexiones internas del sonido incidente por ambas caras. Por lo tanto se optó por utilizar un material ligero y plano, para este caso se consideraron dos tipos de madera sencilla: aglomerado y MDF. La superficie del aglomerado es un tanto porosa, por lo cual se eligió el MDF de 12mm de grosor. Como se comentó previamente, las caras internas del ambiófono han de tener material absorbente por tanto se consideraron dos materiales de la firma Fiberglass. La primera opción consistió en un panel compuesto por una fibra de 25mm de espesor denominada Acoustifiber cuyos coeficientes de absorción son bastante altos. Para cubrir la cara frontal de este panel, se añade una lámina difusora fonoabsorbente de espuma de poliuretano de distintas formas determinadas denominado FGC Sonoacoustic. A pesar de que el panel completo en el ambiofono habría de trabajar eficazmente, resultaba demasiado grueso y de difícil instalación debido a los cortes diagonales y los que habrían de ajustarse al modelo de la cabeza, por lo tanto, las paredes internas del ambiofono fueron forradas por material FGC Sonoacoustics tipo Waves, por su facilidad de uso y su consistencia. Respecto al material de la cabeza se pensó inicialmente en crearla de acuerdo a las medidas en un material que no fuese reflejante ni demasiado poroso, y cuya densidad se asemejase a la real, por ende un buen material hubiese sido la silicona. No obstante, resultaba bastante difícil calcular el corte que habría de aplicarse a dicha cabeza para que se ajustara al panel superior del sistema, ya que el ángulo al que este se inclina podría variar ligeramente al momento de crear el ambiófono y ello implicaría que la cabeza podría quedar inclinada hacia abajo o hacia arriba dependiendo de la incongruencia del corte respecto a dicho ángulo. La figura 13 muestra una aproximación a una vista lateral del ambiófono. Figura 13 vista lateral ambiofono con aproximación facial El punto guía para el problema del corte serían los ojos de la cabeza humana ya que estos deben estar paralelos al suelo. Al tener dicho problema, se hacía difícil aproximar –por diseño- la cabeza humana ya que el menor error causaría una fuerte incongruencia, por ende, lo ideal de manera práctica sería realizar un corte posteriormente ajustable para asegurar una adecuada ubicación del rostro del ambiofono. Por ello, se decidió que en lugar de realizar un modelo en silicona, se usaría un rostro hecho de icopor -cuyas medidas son predeterminadas- y se llenaría de una mezcla de gelatina sin sabor y bicarbonato de sodio (para alargar su tiempo en estado relativamente sólido). La consistencia de la mezcla realizada ha de durar un tiempo prudente (alrededor de una semana) en estado similar al de la silicona y su densidad sería bastante parecida. La solución además de práctica posee la ventaja de que el icopor es de fácil manejo y su corte es más fácil, por lo tanto se pudo cortar varias veces hasta lograr la forma deseada. La cual habría de ajustarse a una altura adecuada de la cabeza y el ángulo de inclinación de la tabla superior. Cabe resaltar que dicha propuesta fue planteada de antemano para evitar problemas futuros, ya que el ángulo necesario para el ambiófono ya se había determinado en el diseño, pero dado que la unión de superficies representa una forma irregular, era de esperarse que el ángulo variara levemente. Las figuras 14 y 15 muestran el diseño inicial de la unión de superficies Figura 14 Vista superior, diseño de ambiófono Figura 15 Vistas lateral y trasera, diseño de ambiófono También se debe tomar en cuenta que al realizar el modelo en madera, se redujo una pequeña parte de la longitud de las superficies ya que se hizo un corte diagonal en los bordes para lograr unir las dos tablas en la parte trasera sin que hubiese espacio entre ellas. Por lo tanto la primera medida base en el diseño fueron las medidas de ancho y altura de la cabeza, se dispusieron de tal manera que el borde inferior triangular del panel superior encajara con la parte inferior de la cabeza humana. La segunda medida base habría de ser la altura de las superficies laterales –la misma altura del ambiófono en si-. Si tomamos en cuenta que estas paredes han de evitar las reflexiones laterales, resultaría lógico entonces considerar que dicha altura fuese igual a la mayor longitud de onda entre las frecuencias que se buscan evitar. La menor frecuencia serían los 250 Hz ya que es en dicha frecuencia donde el RACE empieza a operar y donde se encuentra la frecuencia de corte para su filtro pasabajos y el de inicio para su filtro pasabandas. El lambda correspondiente a dicha frecuencia es de 1.37m aproximadamente, medida que resulta bastante grande si se piensa en la facilidad de manipulación del ambiófono. Además, la atención debe estar concentrada en las frecuencias altas ya que estas son las más apreciadas para el sonido directo a capturar. Se abordaron medidas de acuerdo a determinadas frecuencias y en un principio se propuso trabajar una altura de 0.686 metros, correspondientes a la longitud de onda de 500Hz, sin embargo, un ambiofono con esta medida resultaría en unos paneles muy grandes y una cabeza muy pequeña y también hay que cuidar cierta proporcionalidad entre la cabeza y la altura del ambiófono. Por tanto, se propuso una altura desde la base del ambiófono hasta la parte inferior de la cabeza de 12 centímetros y la altura de las superficies laterales se determinó de acuerdo a esta proporcionalidad tanto para la altura inferior como para la altura restante, desde la parte superior de la cabeza hasta el borde superior del ambiófono, dicha altura corresponde a los 50 cms especificados en las figuras 11 y 12. La tercera medida importante es el ángulo que debe haber entre las dos superficies paralelas, ya que dicho ángulo determina el ángulo que se esperar capturar y por ende, escuchar al momento de la reproducción. El método asegura una espacialidad de -76 y 76 grados a izquierda y derecha respectivamente, pero esto implicaría un ángulo demasiado abierto y unas superficies laterales más largas para compensarlo, por ende se redujo a 140 grados. Las medidas restantes salieron a partir de las iniciales, incluyendo el ángulo de 73 grados de inclinación del panel superior respecto a una vista lateral, el cual resultó de la altura del ambiófono y la altura base de 12 cm. El ambiófono final se ve en la figura 16. Figura 6 ambiófono RACE y Matlab Como opción inicial se planteó generar el procesador por medio de la ventana de comandos de Matlab. Sin embargo al momento de programar los retardos de cancelación recursiva se hacía necesario tener una manera rápida de variar los valores de ganancias destinadas al control de feedback. Por ello resultaba más fácil generarlo por medio de diagramas de bloques debido al acceso directo y a las ventajas de manejar manualmente el flujo de señal a procesar. Figura 17 División de señal estereo en Simulink La figura 17 muestra la división inicial de la señal estéreo, para ello se crea un bloque emisor de un archivo wave en extensión .wav que muestra la tasa de sampleo, número de canales y tasa de bits, propias del archivo. Estos datos –además de la duración en tiempo del archivo- influyen en el desarrollo del procesador ya que de ello dependen los periodos de sampleo ejecutados por software, sus equivalentes en tiempo y otros datos de suma relevancia al momento de procesar. De la salida del bloque de archivo wave, se pasa a un unbuffer que se encargará de convertir la muestra de frames a valores escalares. Este a su vez se dirige a un demux cuya función es dividir la señal en dos vectores que serán L y R. Para poder continuar al resto del proceso se hace necesario convertir los nuevos valores escalares de vuelta a frames por medio de dos buffers para cada señal. Figura 18 Señal dividida a tres filtros La herramienta FDA Tool permite crear filtros cuyos valores, componentes y tipos se pueden variar a gusto. A pesar de la facilidad de edición de filtro, la fase se convierte en un factor en contra ya que esta no puede ser lineal a lo largo del rango de frecuencias a trabajar, por lo tanto, las señales generadas tendrán fases diversas a las lineales-el caso que sería ideal-. Los filtros utilizados son tipo IIR de Butterworth. Figura 19 respuestas de magnitud y fase del filtro pasabajos El filtro pasabajos diseñado para tomar las frecuencias menores a 250 Hz tiene su frecuencia de paso en 200 Hz y su frecuencia de detención en 250 Hz, al tratar de reducir esta diferencia de 50 Hz se empezaban a generar irregularidades en las frecuencias menores a la frecuencia de paso. Para 250 Hz, el filtro tendrá un valor aproximado a los -81 dB, por lo cual la magnitud es adecuada. Sin embargo, la fase decae rápidamente a tal punto que al llegar a los 250 Hz, su valor será menor a los -360 grados. Este factor resulta grave para el filtro y el procesador en general. Figura 20 Respuesta en magnitud y fase del filtro pasabandas El filtro pasabandas tiene sus frecuencias de corte fc1 y fc2 en 250 y 5KHz respectivamente, el orden del filtro es de 16. La pendiente a partir de fc2 es bastante larga, por ende el valor reducido a frecuencias altas será menor que en frecuencias bajas, ya que apoyados en el teorema de Nyquist, la frecuencia de sampleo de una señal debe ser el doble de la mayor señal a analizar, por ende el filtro actuará desde fc2 hasta la última frecuencia sampleada la cual es ligeramente mayor a 20 KHz. Una vez más, la fase se convierte en un factor en contra y alcanza valores altamente nocivos para el resultado de la señal. Figura 21 Respuestas en magnitud y fase del filtro pasaaltos Para el tercer filtro se determinaron una frecuencia de detención de 4.85 Khz y una frecuencia de paso de 5.15 KHz, el paso está regulado a partir de los -80 dBs en la frecuencia de detención. La fase se sigue viendo gravemente afectada. Después de pasar por el filtro pasabandas, la señal prosigue a un controlador de ganancia cuyo valor será de -1 con el fin de invertir la fase. El sencillo ejemplo de la figura 22 lo muestra para el caso de una señal sinusoidal. Figura 22 Inversión de fase Una vez la fase esté invertida, la señal procede a un controlador de ganancia en dB que se encargará de disminuir su nivel de presión sonora en -2.5 dB, Cabe recordar que dicho valor puede variar entre los -2.5 y los -6dB, pero su mayor eficacia se encuentra en el valor decidido. A continuación iniciará la etapa de cancelación recursiva ejecutada por un ping-pong delay entre los dos canales. Para esto la señal se divide en dos, la primera irá a un controlador de ganancia, luego a un sumador al que se le añadirá la señal proveniente del delay del canal contrario. La salida de esta sumatoria irá al delay propio del canal, desde el cual la señal se partirá en dos caminos, uno a un controlador de ganancia que servirá como control de mezcla entre la señal retardada y la señal original (parámetro de suma relevancia para RACE) y después llegará al sumador final del canal para unirse con la segunda división de la señal original; el otro camino irá a un control de feedback posteriormente ligado a la sumatoria inicial del canal contrario. Como se ve en la figura, existen tres tipos de control de ganancia, el primero de ellos se denomina controlador de feedback o regeneración y su función es hacer que el delay se repite tantas veces como lo determine su valor. El segundo tipo de controladores de ganancia manejarán el porcentaje de retroalimentación entre los dos canales, es decir, cuando se repite una secuencia del ping-pong delay, este control determinará la presencia de la primera secuencia una vez se inicie la segunda, dejar este controlador en 1 o 100% implicaría generar secuencias ilimitadas que terminarían por enmascarar a la señal original. El tercer tipo de ganancia se denomina “Delay Mix” ya que indicará la proporción existente entre la señal retardada y la señal original. Al estar en uno, la señal retardada será la única presente. Este control se puede variar a valores superiores al 50%. Figura 23 Eliminación recursiva producida por un ping-pong delay El rango de tiempos establecido para el trabajo del RACE está comprendido entre los 65useg y 100useg. El tipo de delay usado para el procesador en Simulink trabaja con valores enteros, y si estimamos el tiempo requerido a número de muestras ejecutadas por segundo de acuerdo a la tasa se sampleo de 44.1KHz tenemos que los valores más cercanos a dicho rango corresponden a 3 y 4 equivalentes a 68useg y 90useg respectivamente. Tal como se ve en la tabla 1. Número de muestras Equivalente en tiempo (seg) 1 0.000022676 2 0.000045351 3 0.000068027 4 0.000090703 5 0.000113379 6 0.000136054 Tabla 1 número de muestras y equivalentes en tiempo a una tasa de 44.1Khz El valor de retardo es proporcional al tamaño de la cabeza del oyente. De 60 a 70 useg existe el enfoque más directo, 80useg se utilizan para la HRTF y un número mayor significarán cabezas de tamaños mayores al promedio. Se optó por usar un delay de 3 muestras, equivalente a 68 useg, lo cual significa que el sweetspot será más sensible, pero superar las dimensiones –como sería el caso de 4 muestras- no resulta conveniente, ya que ninguna cabeza encontraría el estado óptimo. Este representa un factor de error, ya que lo ideal sería utilizar un valor entre 70useg y 80useg o tener la posibilidad de variar esto a gusto. Sin embargo, el tiempo de ejecución del sistema a este número de muestras es bastante largo y la generación de archivos procesados es lenta. Para terminar el flujo del procesamiento, las salidas de cada filtro llegan a un sumador triple, el cual envía una única señal a una caja de concatenación de matriz donde se encontrará con su señal homóloga del otro canal, y se convertirán en una señal única de nuevo, de aquí sale la señal procesada final. Hay que cuidar los parámetros de la simulación ya que pueden presentar errores, en especial por las opciones del solver. Pensando en ajustar el delay a 80useg, se buscó utilizar un tamaño de paso (step size) arreglado, pero era difícil ajustar el paso al tiempo requerido para cada periodo de sampleo de simulink. El solver variable predeterminado ha de funcionar, sin embargo, versiones como matlab 2007b pueden generar error debido a que los retardos generados son más pequeños que un periodo de muestra. En las últimas versiones los solvers variables actuarán sin problema en especial al usar ode45. La versión utilizada de matlab es la r2009a y estos son los parámetros predeterminados del solver variable. Véase fig 24. Figura 24 Parámetros solver variable. Grabación Obedeciendo los designios del método ambiofónico, la grabación se planeó para ser fiel a lo sugerido por Glasgal respecto al tema. La grabación se realizó en el auditorio San Francisco de Asís de la Universidad de San Buenaventura. Figura 25 Levantamiento de planta del escenario. Auditorio San Francisco de Asís El proscenio de tal auditorio posee un borde curvo, a partir del punto central inferior (el cercano a las sillas) se tomaron ángulos desde -60° a 60° en intervalos de 20 grados, para realizar las grabaciones respecto al tema espacial en el plano horizontal. Los puntos tienen una distancia de 5 metros respecto al punto inicial. Tal como se ve en la figura. Las siglas EI y ED significan Extremo izquierdo y extremo derecho respectivamente Figura 26 Proscenio del auditorio San Francisco de Asís El ambiófono se ubicó en la tercera fila del escenario en la parte central. Véase la fig. Figura 27 Ambiófono ubicado en tercera fila respecto al escenario Para la captura se utilizaron micrófonos AKG C480, conectados a una interfaz Fastrack Pro de M-audio y esta a su vez estaba ligada a un computador que grabó en el software Adobe Audtion ver 3.0. Se monitoreó con audífonos Sony MDR900HD Figura28 sistema de grabación y monitoreo Figura 29 patrón direccional de los micrófonos El patrón direccional de los micrófonos empleados es cardioide, lo cual no es óptimo ya que en el mejor de los casos los micrófonos deben ser omnidireccionales, la diferencia radica en que será más difícil para un patrón cardioide el determinar efectivamente fuentes localizadas a los extremos. Y la percepción de profundidad puede verse afectada ligeramente. Para la grabación se optó por usar dos instrumentos –una guitarra acústica y un violíny las tomas se decidieron a partir de diferentes criterios. Tal par de instrumentos fue elegido porque el método funciona mejor con instrumentos acústicos. Resulta importante que al momento de la interpretación A continuación se encuentras la lista de cada toma, una descripción y el propósito. Nombre Objetivo Evaluar la percepción 1) Guitarra a -20°. espacial a -20° y 20° del Violín a -20° punto central de referencia Evaluar la percepción 2) Guitarra a -40°. espacial a -40° y 40° del Violín a -40° punto central de referencia Evaluar la percepción 3) Guitarra a -60°. espacial a -60° y 60° del Violín a -60° punto central de referencia Imagen 4) Ambos Evaluar la sensación de instrumentos al profundidad y definición de centro centro 5) Movimiento circular de derecha a Evaluar la localización en el izquierda pasando plano horizontal y la por todos los puntos posterior coloración que establecidos (Punto pueda sufrir la señal al ser X a Y) procesada por RACE. 6) Línea recta desde extremo derecho hasta extremo izquierdo Evaluar la localización y reproduciendo la percepción horizontal de la misma nota (X a Y) fuente. 7) Línea recta de Evaluar la localización y izquierda a derecha percepción horizontal de la (X a Y) fuente. Evaluar la percepción de 8) Eje Z atrás hacia profundidad del instrumento adelante acercándose. 9) 40° Atrás hacia Evaluar percepción de delante profundidad y localización. 10) -40° Atrás Evaluar percepción de hacia delante profundidad y localización. 11) Guitarra Examinar la percepción extremo izquierdo, horizontal al máximo violín extremo ángulo posible respecto al derecho ambiófono. 12) Guitarra Evaluar el comportamiento ejecutando una a un rango amplio de escala musical al frecuencias y la percepción extremo izquierdo de localización. Evaluar el comportamiento 13) Guitarra de un amplio rango de ejecutando escala en frecuencias y la definición el centro. de centro Evaluar el comportamiento 14) Guitarra a un rango amplio de ejecutando escala en frecuencias y la percepción la derecha. de localización. Evaluar el comportamiento 15) Violín a un rango amplio de ejecutando escala en frecuencias y la percepción el extremo izquierdo de localización. Evaluar el comportamiento 16) Violín a un rango amplio de ejecutando escala en frecuencias y la percepción el extremo derecho de localización. 17) Violín ejecutando nota en cada uno de los Evaluar la percepción puntos determinados horizontal y localización en (X a Y) cada punto específico. Evaluar el comportamiento 18) Voz de atrás de la voz en el eje Z, hacia delante en el además de profundidad y eje Z (X a Y) percepción de proximidad. Evaluar el comportamiento de la voz respecto a profundidad, localización y 19) Voz a 40° proximidad. Evaluar el comportamiento de la voz respecto a profundidad, localización y 20) Voz a -40° proximidad. Evaluar el comportamiento 21) Voz derecha a de la voz en el plano izquierda (X a Y) horizontal Tabla 2 Grabaciones realizadas Figura 30 Grabación auditorio san Francisco de Asís Evaluación subjetiva Inicialmente se consideró realizar preguntas de selección múltiple para darle valor a la percepción subjetiva de los oyentes a encuestar. Sin embargo, las opciones limitaban en cierta manera a la opinión de estos, además de la dificultad que representa precisarlas. Por lo tanto, se optó por preguntas cuyas respuestas fueran “si” o “no” con una casilla de observaciones. Se sugirió cordialmente expresar impresiones acerca de la percepción espacial y los conceptos evaluados por test de Ceoen se hicieron sobre un material de óptima calidad previamente procesado. El encuestado requiere un perfil que cumpla con los siguientes requisitos. • Persona mayor de 18 años. • Persona con título o en proceso de titulación de ingeniería de sonido o en un área afín (música, tecnólogo en audio, etc). • Debe tener conocimiento de los criterios establecidos en el test de Ceoen. • Debe haber trabajado en proyectos de producción de audio en el área musical o audiovisual en cualquiera de sus etapas. De acuerdo a los requerimientos mencionados, se desarrolló el formato de encuesta de la siguiente manera: VALORACIÓN SUBJETIVA MATERIAL AMBIOFÓNICO Nombre:_______________________Ocupación:_________________Edad:________ Escuche con atención a cada uno de los materiales suministrados y conteste las preguntas de acuerdo a su apreciación, puede omitir la casilla de observaciones de considerarlo necesario. Marque con una X en la respuesta de selección múltiple. 1- ¿En cuál presentación de la canción Lil´ David considera usted que existe una imagen sonora más amplia en el plano horizontal? A- Primera versión (RACE OFF) B- Segunda versión (RACE ON) C- Ns/Nr. Observaciones__________________________________________________________ ______________________________________________________________________ _ 2- ¿En cuál presentación de la canción en stereo considera usted que existe una imagen sonora más amplia en el plano horizontal? A- Primera versión (Stereo) B- Segunda versión (Ambio) C- Ns/Nr. Observaciones__________________________________________________________ ______________________________________________________________________ _ 3- ¿En cuál presentación de la canción considera usted que existe una imagen sonora más amplia en el plano horizontal? A- Primera versión (Stereo) B- Segunda versión (procesamiento por SL) C- Ns/Nr. Observaciones__________________________________________________________ ______________________________________________________________________ _ 4- ¿En cuál presentación de la canción considera usted que existe una imagen sonora más amplia en el plano horizontal? A-) Primera versión (grabación original) B-) Segunda versión (Procesamiento por SL). C- Ns/Nr. Observaciones__________________________________________________________ ______________________________________________________________________ _ 5- Respecto al video de la firma Noach, responda: ¿Qué diferencias o semejanzas encuentra usted entre la reproducción ambiofónica y la reproducción stereo en términos de naturalidad, profundidad, definición de centros y extremos y localización de fuentes? ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ 6- Respecto al material ambiofónico, sugiera un valor de 1 a 5 para los siguientes factores propuestos por test de Ceoen: 1 2 3 4 5 NATURALIDAD PROFUNDIDAD DEFINICION DE EXTREMOS DEFINICION DE CENTRO DEFINICION DE CENTROS PARCIALES Observaciones__________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ ______________________________________________________________________ _ Figura 31 Formato de encuesta para valoración subjetiva Duración Pregunta Tipo de material Versión 1 Versión 2 RACE OFF RACE ON aproximada Grabación ambiofónica 1 (ambiophonics.org) (Audiomulch) 2 Grabación estéreo (Audiomulch) 40 segundos RACE OFF RACE ON (Audiomulch) (Audiomulch) 50 segundos RACE ON (Simulink) 12 segundos (Simulink) RACE ON (Simulink) 10 segundos Única Única 6 minutos RACE OFF 3 Grabación estéreo (Simulink) Grabación ambiofónica San 4 Franciso de Asís RACE OFF Video de la firma 5 Noach Tabla 3 Lista de material evaluado. El material número 4 fue la grabación a -60° y 60° realizada en el auditorio. La encuesta se enfocó en el plano horizontal principalmente ya que era de suma importancia ver cuanto podría abrirse el campo sonoro. Los archivos procesados por RACE de simulink fueron generados, ya que el diagramade bloques se tarda mucho tiempo en procesar, y es muy probable que incluso un computador de alto procesamiento lograse mostrar resultados en tiempo real. Al momento de adecuar el recinto se hicieron tres pruebas previas para decidir cual era la mejor geometría respecto al sistema de reproducción. Tales pruebas consistieron en reproducir el material de prueba de ancho horizontal proporcionado por la página del método a tres distancias distintas entre los puntos centrales de los altavoces y su distancia equivalente respecto al oyente. Dicha información sugiere que la distancia entre los parlantes debe estar entre 50 y 70 cm, y las distancias respecto al oyente estarán entre 1.5 y 3 metros. Por ende se puso a prueba las relaciones: 50cm-1.5m; 60cm-2,25m y 70cm 3m. La mejor de estas fue la menor, probablemente debido a que la pared posterior del recinto no se encontraba tratada y los puntos alejados de audición se encontraban cerca de las superficies planas sin material absorbente, aunque los fenómenos acústicos en general ya habían sido eliminados. El sweet spot conseguido es bastante pequeño corroborando el hehco de que en ambiofonía el sweetspot es largo más no ancho y es altamente sensible a reclinación y giros de la cabeza. 5. ANÁLISIS DE DATOS La prueba inicial, consiste en seleccionar un recinto adecuado para probar la versión de RACE con el software AudioMulch 2.0 y el material de audio proveído por la página del método (ambiophonics.org). Para verificar si el recinto cumple o no con las características adecuadas, se hizo una medición del tiempo de reverberación sin acondicionamiento acústico en dos posiciones de recepción según la gráfica 1. Para cada posición se hicieron dos mediciones. Los dos puntos de medición se ubicaron de tal manera que estuviesen a una distancia igual o mayor a un metro respecto a las paredes, la fuente y entre sí, tal como se ve en la figura 32. Los resultados arrojados por las dos primeras mediciones en el primer punto se encuentran en las tablas 4 y 5. Figura 32 Levantamiento de planta de recinto a medir Freq, [Hz] 63 125 250 500 1000 2000 4000 8000 Lin A Signal [dB] 62.48 84.36 81.45 76.13 80.88 77.71 Noise [dB] 26.42 38.79 32.81 27.65 23.07 27.9 34.86 36.41 strenGth [dB] ‐6.52 15.36 12.45 7.13 11.88 8.71 10.2 10.79 10.93 10.02 9.07 10.48 7.31 6.61 C50 [dB] 1.29 1.44 4.58 C80 [dB] 3.66 6.22 7.97 15.91 16.19 11.95 D50 [%] 57.38 58.23 74.15 88.98 91.78 84.33 Ts [ms] 86.14 69.81 79.2 79.79 89.93 87.02 9.56 9.55 12.91 45.1 41.92 4.44 8.16 9.15 12.12 82.1 90.03 73.54 86.75 48 27.1 20.1 25.06 28.81 19.29 36.65 23.2 EDT [s] 1.07 0.7 0.6 0.33 0.29 0.42 0.53 0.35 0.52 0.39 T20 [s] 1 0.84 0.81 0.27 0.39 0.49 0.62 0.59 0.82 0.58 r T20 1 0.99 1 0.99 0.99 1 1 1 0.99 0.99 T30 [s] 1.02 0.84 0.8 0.33 0.4 0.54 0.67 0.6 0.83 0.64 r T30 1 1 1 0.98 0.99 0.99 1 1 1 0.99 Tuser [s] 0.98 0.92 0.76 0.3 0.32 0.46 0.65 0.52 0.73 0.5 r Tuser 0.99 0.94 0.98 0.97 0.99 0.99 1 0.99 0.95 0.99 Tabla 4. Posición 1. Medición 1 Recinto sin tratamiento. Freq, [Hz] 63 125 250 500 1000 2000 4000 8000 Lin A Signal [dB] Noise [dB] strenGth [dB] 61.92 83.82 80.89 75.59 80.41 77.35 78.76 79.38 89.43 86.58 38.8 54.75 46.43 25.74 23.53 31.52 ‐7.08 14.82 11.89 42.2 36.66 56.48 46.88 6.59 11.41 8.35 9.76 10.38 10.43 9.58 9.17 10.56 7.27 6.56 8.18 C50 [dB] 1.33 1.42 4.69 C80 [dB] 3.73 6.25 8.01 15.46 16.37 11.86 9.65 4.52 9.54 13.07 9.2 12.15 D50 [%] 57.61 58.08 74.66 89.21 91.93 84.21 81.93 90.23 73.9 86.81 Ts [ms] 85.09 69.67 47.48 26.07 19.38 25.59 29.22 19.24 36.25 23.06 EDT [s] 1.06 0.7 0.6 0.33 0.28 0.41 0.53 0.34 0.51 0.38 T20 [s] 0.9 0.83 0.79 0.28 0.39 0.48 0.62 0.59 0.81 0.57 r T20 1 0.98 1 0.99 0.99 1 1 1 0.99 0.99 T30 [s] 0.84 0.78 0.78 0.34 0.4 0.53 0.65 0.6 0.78 0.63 r T30 0.99 0.99 1 0.98 0.99 0.99 1 1 1 1 Tuser [s] 0.95 0.91 0.76 0.32 0.32 0.43 0.65 0.51 0.73 0.5 r Tuser 0.99 0.93 0.98 0.97 0.99 0.99 1 0.99 0.95 0.99 Tabla 5. Posición 1. Medición 2. Recinto sin tratamiento. Freq, [Hz] 63 125 250 500 1000 2000 4000 Signal [dB] 65.26 87.25 82.73 78.95 81.29 78.56 80.31 80.35 91.55 87.88 Noise [dB] 44.92 58.59 41.16 27.06 25.63 30.45 ‐3.74 18.25 13.73 9.95 12.29 9.56 37.9 8000 Lin A 38.8 58.79 46.82 strenGth [dB] 11.31 11.35 12.55 10.88 C50 [dB] 0.05 1.64 5.15 9.77 9.53 6.52 5.89 8.66 C80 [dB] 3.44 3.92 8.87 18.07 16.3 11.74 D50 [%] 50.28 59.32 76.58 90.46 89.97 81.77 79.52 88.01 73.74 84.58 Ts [ms] 89.9 61.88 39.62 24.61 24.05 31.37 33.14 21.79 EDT [s] 1.05 0.73 0.55 0.27 0.27 0.41 0.49 0.39 0.66 0.39 T20 [s] 0.93 0.77 0.64 0.3 0.31 0.49 0.64 0.61 0.68 0.56 r T20 1 0.97 0.99 0.98 0.99 1 1 1 0.99 1 T30 [s] 0.84 0.74 0.67 0.33 0.36 0.52 0.65 0.61 0.71 0.6 r T30 0.99 0.98 0.99 0.99 0.99 1 1 1 0.99 1 Tuser [s] 0.98 0.64 0.65 0.26 0.32 0.43 0.63 0.55 0.55 0.49 r Tuser 1 0.94 0.98 0.99 0.99 0.99 0.99 0.99 0.98 1 9.3 12.12 4.48 7.39 6.79 11.49 37.5 26.99 Tabla 6. Posición 2. Medición 1. Recinto sin tratamiento. Freq, [Hz] 63 125 250 500 1000 2000 4000 Signal [dB] 64.69 86.71 82.3 78.49 80.76 77.79 79.62 79.69 91.01 87.26 Noise [dB] 44.44 57.54 40.58 25.74 24.61 30.1 37.82 38.27 58.17 46.42 strenGth[dB] ‐4.31 17.71 13.3 9.49 11.76 8.79 10.62 10.69 12.01 10.26 5.85 8000 Lin 8.74 A C50 [dB] 0 1.52 5.27 10.07 9.52 6.49 C80 [dB] 3.39 3.76 9.2 18.32 16.64 11.44 D50 [%] 50.02 58.64 77.11 91.04 89.96 81.67 79.35 88.21 73.39 84.66 Ts [ms] 90.15 62.79 39.09 24.26 24.43 31.32 33.79 21.83 38.04 9.32 12.13 4.41 7.42 6.66 11.46 27.2 EDT [s] 1.05 0.74 0.52 0.27 0.28 0.42 0.49 0.39 0.66 0.39 T20 [s] 0.93 0.77 0.63 0.29 0.33 0.49 0.63 0.6 0.69 0.57 r T20 1 0.98 0.99 0.98 0.99 1 1 1 0.99 1 T30 [s] 0.85 0.74 0.65 0.35 0.37 0.52 0.65 0.61 0.71 0.6 r T30 0.99 0.98 0.99 0.98 0.99 1 1 1 0.99 1 Tuser [s] 0.98 0.72 0.67 0.26 0.3 0.46 0.64 0.55 0.56 0.5 r Tuser 1 0.94 0.99 0.98 0.99 0.99 0.99 0.99 0.98 1 8000 Lin Tabla 7. Posición 2. Medición 2. Recinto sin tratamiento. Freq, [Hz] 125 250 500 1000 2000 4000 Signal [dB] 62.88 79.95 77.8 72.15 74.31 71.61 73.48 75.16 85.25 81.61 Noise [dB] 52.25 54.28 42 23.29 19.76 18.3 21.41 25.09 57.91 41.82 strenGth[dB] ‐6.12 10.95 8.8 3.15 5.31 2.61 3.46 9.34 13.32 20.02 C80 [dB] 5.72 10.86 12.52 25.44 D50 [%] 59.65 68.93 89.57 Ts [ms] 73.61 55.28 C50 [dB] 63 1.7 4.48 A 6.16 6.25 4.61 19.72 23.18 25.47 6.6 16.17 31.88 31.85 32.68 36.97 13.79 23.28 95.55 99.01 98.95 99.52 99.72 82.05 97.64 30.76 18.17 11.65 12.16 7.85 4.64 24.21 9.87 0.28 0.31 0.17 0.15 0.14 0.12 0.45 0.17 EDT [s] 0.76 ‐‐ T20 [s] 0.53 0.5 0.35 0.18 0.15 0.15 0.13 0.13 0.42 0.23 r T20 0.98 0.96 0.93 0.98 0.99 0.99 0.98 0.97 0.97 0.99 T30 [s] 0.46 0.48 0.32 0.21 0.15 0.15 0.16 0.14 0.43 0.32 r T30 0.92 Tuser [s] r Tuser 0.98 0.97 0.97 1 1 0.98 0.99 0.99 0.97 0.66 ‐‐ 0.49 0.22 0.19 0.15 0.11 0.1 0.3 0.22 0.99 ‐‐ 0.98 0.91 0.98 0.99 0.95 0.94 0.94 0.97 Tabla 8. Posición 1. Medición 1. Recinto tratado Freq, [Hz] 63 125 250 500 1000 2000 4000 Signal [dB] 65.51 82.41 80.22 74.67 77.07 74.17 76.05 77.73 87.76 84.19 Noise [dB] 52.14 56.17 35.91 27.65 22.14 20.39 43.97 35.87 57.78 46.67 Strength[dB] ‐3.49 13.41 11.22 5.67 8.07 5.17 7.05 8000 Lin A 8.73 8.76 7.19 24.1 24.99 6.59 16.31 C50 [dB] 1.43 3.4 9.21 13.16 20.71 20.11 C80 [dB] 5.24 10.79 12.6 25.25 31.72 32.34 35.81 32.43 13.81 23.42 D50 [%] 58.17 68.64 89.28 95.39 99.16 99.03 99.61 99.68 82.01 97.71 30.79 18.11 11.47 12.63 7.66 0.29 0.3 0.16 0.15 0.14 0.12 0.45 0.16 Ts [ms] 77.1 55.8 5 24.26 9.87 EDT [s] 0.82 ‐‐ T20 [s] 0.61 0.5 0.35 0.17 0.15 0.14 0.13 0.14 0.44 0.23 r T20 0.98 0.97 0.94 0.98 0.99 0.99 0.98 0.97 0.97 0.99 T30 [s] 0.55 0.5 0.33 0.2 0.15 0.14 0.15 0.22 0.47 0.33 r T30 0.96 0.98 0.97 0.98 1 1 0.99 0.91 0.99 0.97 Tuser [s] 0.73 ‐‐ 0.49 0.22 0.17 0.14 0.11 0.09 0.31 0.21 r Tuser 0.99 ‐‐ 0.98 0.93 0.99 0.99 0.95 0.94 0.94 0.97 8000 Lin Tabla 9. Posición 1. Medición 2. Recinto tratado Freq, [Hz] 63 125 250 500 1000 2000 4000 A Signal [dB] 59.15 85.29 79.38 74.6 75.79 74.09 76.78 76.51 88.59 83.83 Noise [dB] 38.69 56.31 41.61 25.8 28.02 23.16 strenGth[dB] ‐9.85 16.29 10.38 5.6 6.79 5.09 27.8 30.67 53.6 40.25 7.78 9.59 7.51 6.83 C50 [dB] 3.28 5.31 7.21 14.97 17.96 19.49 22.64 24.79 6.97 15.15 C80 [dB] 6.82 7.65 15.17 21.99 25.86 28.12 30.86 32.52 9.89 19.62 68.06 77.27 84.03 96.91 98.42 98.89 99.46 99.67 83.26 97.04 D50 [%] Ts [ms] 55.32 44.74 28.42 16.71 13.18 10.61 6.17 4.74 25.1 10 EDT [s] 0.89 0.68 0.41 0.16 0.16 0.16 0.12 0.09 0.48 0.15 T20 [s] 0.63 0.55 0.44 0.24 0.19 0.17 0.16 0.15 0.55 0.35 r T20 0.98 0.99 0.96 0.99 0.99 0.99 0.99 0.99 0.99 0.97 T30 [s] 0.55 0.52 0.43 0.27 0.22 0.2 0.2 0.19 0.54 0.44 r T30 0.98 0.99 0.98 0.98 0.98 0.99 0.99 0.98 1 0.97 Tuser [s] 0.77 0.58 0.37 0.23 0.19 0.16 0.12 0.12 0.57 0.23 r Tuser 0.98 0.95 0.92 0.97 0.97 0.99 0.97 0.97 0.97 0.96 Tabla 10. Posición 2. Medición 1. Recinto tratado. Freq, [Hz] 63 125 250 500 1000 2000 4000 Signal [dB] 59.42 85.32 79.71 75.25 75.93 74.25 76.87 76.69 88.74 84.03 Noise [dB] 40.12 56.55 43.98 28.27 28.04 23.32 27.21 30.67 56.3 43.37 Strength[dB] ‐9.58 16.32 10.71 6.25 6.93 5.25 7.69 9.74 7.03 22.04 24.57 7.46 15.41 7.87 8000 Lin A C50 [dB] 3.04 5.58 7.47 14.7 18.8 19.1 C80 [dB] 6.47 8.13 14.61 21.76 25.52 28.59 30.8 32.77 10.31 19.81 D50 [%] 66.81 78.31 84.81 96.73 98.7 98.78 99.38 99.65 84.78 97.2 Ts [ms] 57.17 42.65 28.84 17.29 13.16 10.13 6.09 4.68 23.71 9.86 EDT [s] 0.9 0.68 0.4 0.15 0.16 0.15 0.12 0.09 0.44 0.16 T20 [s] 0.64 0.54 0.41 0.25 0.19 0.18 0.16 0.15 0.53 0.33 r T20 0.98 0.98 0.97 0.99 0.99 1 0.99 0.99 0.99 0.98 T30 [s] 0.57 0.51 0.42 0.28 0.22 0.2 0.19 0.18 0.52 0.42 r T30 0.98 0.99 0.99 0.98 0.98 0.99 0.99 0.98 0.99 0.97 Tuser [s] 0.79 0.56 0.38 0.24 0.18 0.17 0.12 0.13 0.62 0.22 r Tuser 0.98 0.92 0.94 0.95 0.97 0.99 0.98 0.98 0.94 0.97 Tabla 11. Posición 2. Medición 2. Recinto tratado. Figura 34 Medición del recinto en los dos puntos, sin acondicionamiento Figura 35 Medición del recinto tratado Como los datos lo indican, el tratamiento consiguió reducir el tiempo de reverberación del recinto por 0.2 segundos aproximadamente en la mayoría de bandas de frecuencia. A excepción de las frecuencias igual o menores a 250 Hz, el recinto posee tiempos de reverberación que lo hacen adecuado para una reproducción ambiofónica, sin embargo, no es ideal, ya que aún hay problemas en frecuencias bajas. Como se puede ver en las figuras previas, el acondicionamiento consistió en ubicar material poroso en las superficies paralelas, para evitar los fuertes ecos fluctuantes existentes en tres pares de segmentos de las superficies del lugar, estos son, la pared frente a la ventana isolada y la ventana misma, la pared frontal y la pared trasera (solo la frontal fue tratada) y la parte frontal de muro ubicada en la misma pared de la ventana, en esta última habían ecos evidentes en frecuencias altas, lo cual se redujo con un resonador en una parte y material en la otra. Los materiales se dispusieron de forma tal que no quedaran exactamente paralelos a las paredes contrarias. Por ende es de esperarse que al reproducir el material, este sea claro en frecuencias altas (las más importantes de acuerdo al método) y que existan ciertos inconvenientes en frecuencias bajas. Cabe recordar que las frecuencias medias bajas también poseen tiempos de reverberación relativamente altos y que el método de ambiofonía asegura que este tipo de frecuencias no se ubican específicamente en el centro como suele ser el caso en estéreo para una audición real. Un factor en contra resulta ser también, el hecho de que existe una gran diferencia entre los tiempos de reverberación promedio y el menor tiempo de reverberación a lo largo del espectro. Diferencia que según Glasgal no debe superar al 25% del valor del RT promedio, lo cual en este caso no se cumple. Es probable que un material más grande y poroso, diseñado especialmente para absorber acústicamente hubiese solucionado el problema; medida no ejecutada por cuestiones de presupuesto. Por otra parte, al realizar la grabación en el auditorio y revisar los resultados obtenidos, se puede ver que la espacialidad se ve afectada en algunos casos, en especial, por la mayor presencia del violín frente a la guitarra –esta última es fácilmente localizable- ya que el nivel de este es muy alto y en algunos momentos hace parecer que está ubicado en el centro cuando realmente no lo está. Esta impresión está ligada la frecuencia y nivel de la nota reproducida. Esto pudo deberse a que los pre-amplificadores no son de la calidad más alta y además de generar cierto ruido, pueden afectar la naturalez ay claridad de la respuesta d elos micrófonos. Además, los micrófonos tiene forma cilíndrica y por lo tanto no se sujetaron a la superficie de la cabeza como los micrófonos pequeños similares a los lavaliers que se utilizan para grabaciones binaurales, esto quiere decir que hubo un pequeño aumento en la distancia entre los dos oídos que se pretende simular con la técnica ambiofónica. Estos problemas ocurrieron a pesar de que las señales fueron calibradas para tener una respuesta tan equivalente como fuese posible y los valores respecto a nivel que estas generaron son prácticamente iguales. El desempeño y características del RACE actual se usaron para la configuración y calibración del sistema de reproducción y en general para el estudio de los diferentes elementos tratados en el proyecto. Mientras que el diagrama de bloques generado en Simulink sirvió para realizar un acercamiento a la composición interna del procesador, resultaron ciertos factores de error discutidos en la sección de desarrollo ingenieril. Debido al tiempo necesario para generar los archivos de audio desde simulink (aproximadamente veinte minutos para un archivo de 10 segundos de duración) solo se utilizaron muestras procesadas para la evaluación, ya que no era fiable ni conveniente calibrar los sistemas con el diagrama en simulink. Evaluación subjetiva del material recolectado En la siguiente encuesta se evalúan diferentes materiales de acuerdo al contenido recolectado para cada uno de los casos posibles. Después de realizar la encuesta a diez personas (estudiantes y docentes de ingeniería de sonido entre los 22 y 30 años) se obtuvieron los siguientes datos de acuerdo a cada pregunta. Pregunta 1 1- ¿En cuál presentación de la canción Lil´ David considera usted que existe una imagen sonora más amplia en el plano horizontal? A- Primera versión (RACE OFF) B- Segunda versión (RACE ON) C- Ns/Nr. Resultados Pregunta 1 Versión 2 (RACE ON Versión 1 (RACE off) Audiomulch) 3 NS/NR 6 1 Pregunta 2 Versión 2 (RACE ON Versión 1 (Stereo) Audiomulch) 2 NS/NR 8 0 Pregunta 3 Versión 1 (Stereo) Segunda versión (Simulink) 3 NS/NR 7 0 Pregunta 4 Grabación original Segunda versión (Simulink) 0 7 Tabla 12 Resultados encuestas pregunta 1 a la 4 Pregunta 1 Material ambiofónico en Audiomulch Versión 1 (RACE off) Versión 2 (RACE ON Audiomulch) NS/NR Gráfica 1 resultados pregunta 1 Observaciones NS/NR 3 • “El cambio es poco aparente, ambas poseen gran espacialidad pero la segunda tiene mayor nivel” • “La versión 2 está más centrada” Apreciaciones La mayoría de encuestados estuvieron de acuerdo en que la versión del RACE ampliaba el espacio horizontal de campo sonoro, sin embargo, pruebas fuera de la encuesta acordaron que la diferencia es mayor para frecuencias más altas, este material en especial contenía mayor presencia de fuentes cuyas frecuencias más relevantes se encuentran por debajo de las frecuencias medias. Por ende se puede asociar este fenómeno al hecho de que a frecuencias bajas-medias hay un comportamiento acústico de menor calidad en el recinto. 2- ¿En cuál presentación de la canción en stereo considera usted que existe una imagen sonora más amplia en el plano horizontal? A- Primera versión (Stereo) B- Segunda versión (Ambio) C- Ns/Nr. Pregunta 2 Archivo estereo Procesador Audiomulch Versión 1 (Stereo) Versión 2 (RACE ON Audiomulch) NS/NR Gráfica 2 resultados pregunta 2 Observaciones • “Se escucha más definición en algunos sonidos en la segunda versión”. • “Existe una mayor espacialidad en la B pero es más aparente el cambio en la pregunta 1”. Apreciaciones La segunda apreciación es bastante acertada ya que como se ha dicho en capítulos anteriores, el estéreo se verá mejorado por el RACE más no habrá una diferencia demasiado apreciable en ciertos materiales respecto a otros. Es probable que los sonidos a los cuales se refiere la primera observación estén concentrados en frecuencias altas. Pruebas iniciales realizadas con otros materiales en estéreo muestran que la profundidad también crece además de la claridad de la presentación auditiva. 3- ¿En cuál presentación de la canción considera usted que existe una imagen sonora más amplia en el plano horizontal? A- Primera versión (Stereo) B- Segunda versión (procesamiento por SL) C- Ns/Nr. Pregunta 3 Archivo estéreo procesador simulink Versión 1 (Stereo) Segunda versión (Simulink) NS/NR Gráfica 3 resultados pregunta 3 Observaciones • “Se siente más amplia horizontalmente y más profunda” Apreciaciones La observación resulta de gran alivio ya que esto indica que el diagrama de simulink consiguió ampliar tanto horizontalmente como a nivel de profundidad a la señal estéreo. Quizás exista cierto desacuerdo porque la calidad de la señal resultante de simulink se ve afectada no solo por los factores en contra (en especial la fase) sino por el deterioro de la señal que ocasiona el propio sistema. Habrá algo más de ruido y distorsión en una señal de salida de simulink así no exista demasiada variación en sus componentes ni en el paso por el sistema. 4- ¿En cuál presentación de la canción considera usted que existe una imagen sonora más amplia en el plano horizontal? A-) Primera versión (grabación original) B-) Segunda versión (Procesamiento por SL). C- Ns/Nr. Pregunta 4 Grabación original Procesador Simulink Grabación original Segunda versión (Simulink) NS/NR Gráfica 4 resultados pregunta 4 Observaciones • “La versión 2 se siente como si uno como oyente estuviera ubicado en un entorno más amplio” Apreciaciones Se corrobora un buen comportamiento del sistema de simulink, esta es una de las preguntas más importantes ya que implica el uso del material grabado y el procesador usado. En este caso el archivo fue seleccionado porque era el que mayor diferencia mostraba – espacialmente- entre una señal y la otra. Se puede afirmar que aunque no muestra una diferencia tan significativa como Audiomulch, el procesador RACE generado en Simulink si logra una diferencia importante en el campo sonoro. Pregunta 5 Respecto al video de la firma Noach, responda: ¿Qué diferencias o semejanzas encuentra usted entre la reproducción ambiofónica y la reproducción stereo en términos de naturalidad, profundidad, definición de centros y extremos y localización de fuentes? Resultados Todos los encuestados afirmaron que hay mayor naturalidad, espacialidad y definición de extremos en la reproducción, aunque algunos mencionaron que el centro es más claro en estereo y otros opinaron lo contrario. También se comentó que el campo de ambiofonía es mucho más difuso. Una persona comentó que había sonidos que parecían venir de las paredes laterales. Apreciaciones Este material en especial no fue procesado por la versión de RACE para Audiomulch sino que fue generado por la firma Noach, quienes poseen un Plug-in VST que ejecuta el procesamiento de RACE sobre sistemas como DAW o reproductores multimedia para computadores. El material ya venía procesado, por ende solo tuvo que ser reproducido. En el se hace una comparación de fragmentos de películas y de su presentación en Ambio y en Estereo. Lo que resulta interesante de este video además de la gran diferencia de campos sonoros, es el hecho de que este material al ser reproducido no se ve demasiado afectado por la acústica del recinto. De hecho, parece generar un sweet spot mayor al de Audiomulch, y por la calidad del mismo, se podría pensar que hubo algún tipo de procesamiento extra además de la cancelación recursiva ambiofónica. Algunos encuestados sugirieron que reverberaciones extra pudieron ser empleadas y que el sonido suena mucho más claro por lo que pudo ser procesado por algún otro sistema externo. Esta afirmación resulta de vital importancia para el proyecto ya que esto nos indica que se podría disminuir el rigor acústico exigido por las salas de reproducción ambiofónica y el resultado esperado por la ambiofonía podría generarse en recintos de poco o nulo tratamiento. Pregunta 6 Respecto al material ambiofónico, sugiera un valor de 1 a 5 para los siguientes factores propuestos por test de Ceoen: • NATURALIDAD • PROFUNDIDAD • DEFINICION DE EXTREMOS • DEFINICION DE CENTRO • DEFINICION DE CENTROS PARCIALES 1 4 5 PROMEDIO NATURALIDAD 8 2 4.2 PROFUNDIDAD 1 9 4.9 DEFINICION DE EXTREMOS 6 4 4.4 4 2 3.7 DEFINICION DE CENTRO 2 1 3 3 DEFINICION DE CENTROS 3 PARCIALES 7 4.7 Tabla 13 resultados sobre valores subjetivos en percepción ambiofónica Resultado total de valores por Test de Ceoen 6 5 4 3 2 1 0 DEFINICION DE CENTROS PARCIALES DEFINICION DE CENTRO DEFINICION DE EXTREMOS PROFUNDIDA D NATURALIDAD PROMEDIO Gráfica 5 Resultados promedio por Test de Ceoen Apreciaciones Para este punto algunos encuestados pidieron escuchar más ejemplos de la reproducción ambiofónica óptima, y como los datos lo muestran, la profundidad, los centros parciales y los extremos son bastante claros. Aunque para algunos los extremos más abiertos suenan un poco difusos, lo cual es de esperarse ya que el mismo método lo aclara. Es importante discutir el factor de definición de centro ya que acá existen opiniones encontradas. Debido a que en una reproducción estéreo la sumatoria de energía de ambos parlantes es empleada para generar un centro muy grande (que afecta a los centros parciales) se puede considerar la idea de que, al trabajar en estéreo se está habituado a esperar una respuesta mucho mayor en el centro respecto al resto de la imagen sonora. Algunos sugirieron que el centro es más claro mientras que otros se opusieron a la afirmación. Entonces existen dos posibilidades para interpretar el resultado: el centro es más claro, pero menor en nivel (gracias a la cancelación recursiva) y su presencia es igual a la de los centros parciales y los extremos claros y nuestra costumbre por centros fuertes nos puede engañar o por el otro lado, la configuración del ambiopolo evita que existan centros claros y la cancelación recursiva juega como factor en contra para la misma definición central. Personalmente, consideraría la primera idea ya que las fuentes centrales poseen el mismo nivel que los centros parciales tal como en la audición real para el caso de ambiofonía, y la idea de que la imagen estereo es deficiente para centros parciales es bastante contundente y fácil de comprobar. Como aspecto relevante se considera el hecho de que la imagen estereo genera desordenes en frecuencias bajas por lo que se tienden a dejar en e centro al momento de realizar una mezcla o un proceso en particular. En el caso de ambiofonía las frecuencias bajas y las medias bajas pueden venir de varios espacios del campo sonoro. De hecho en el video de Noach existe una escena de la película “Apocalypse Now” en la que un barco se encuentra a la izquierda generando una fuerte presencia de frecuencias bajas hacia el lado izquierdo, entre los centros parciales y los extremos. Pero la sensación auditiva no es de incomodidad, sino por el contrario resulta totalmente concordante con la imagen y el resultado que habría de esperarse en una situación real similar. Por lo tanto, hay ciertos factores subjetivos que entran en guerra respecto a los dos tipos de reproducciones, sin embargo es apenas natural que ocurran y el método propuesto por Glasgal nos ayuda a desarrollar además de conceptos a niveles teóricos y tecnológicos, un mejor criterio sobre que se requiere y se busca a nivel ingenieril respecto a la reproducción sonora. 6. CONCLUSIONES Para la grabación ambiofónica vale la pena no limitarse a realizar las grabaciones en sillas específicas de la sala, ya que de acuerdo a los análisis, sería utilizar este punto de grabación solo para la técnica panambiofónica (grabación ambiofónica con grbación extra se reflexiones traseras y posterior convolución) o modelos ambiofónicos que impliquen el uso de más de dos parlantes. Por ende, para un resultado eficaz en el método con dos altavoces se deben evaluar técnicas desde el punto central del proscenio o entre este y la silletería. Cabe mencionar también que al momento de elegir una técnica específica se debe tomar en cuenta la cantidad y distancia relativa de los instrumentos a interpretar. De ser una orquesta amplia si habrán de considerarse técnicas desde una de las primeras filas del público. En conclusión, mientras más amplio sea el campo a capturar en el eje horizontal, mayor debe ser la distancia entre el ambiófono y las fuentes sin que el ambiófono deba ubicarse obligatoriamente en una de las primeras filas. Se debe mantener como medida de referencia los 140 grados de captura directa del ambiófono y el rango de posibilidad de posición del ambiófono será entre el inicio del proscenio hasta la fila ideal para grabación de fuentes ocupando la totalidad del proscenio (orquesta) La herramienta Simulink no genera una calidad óptima ni eficacia de trabajo para el procesamiento del RACE. Presenta falencias en la fase y amplitud de la repuesta en frecuencia. Se puede optar por procesamiento adicional (no incluído en el diagrama de bloques de RACE según Glasgal) para remendar los errores presentados pero un mayor procesamiento implica una menor calidad del material final. De ser ejecutado en un DSP, el sistema en simulink podría beneficiarse por procesamiento final que busque la restauración de la perdida generada por el procesamiento de señales respecto a la calidad del audio, tales como dithers de salida. El sistema de RACE ejecutado en audiomulch presenta una respuesta fiel a los principios teóricos del método. Un procesamiento adicional en el sistema y diagrama de RACE puede llevar a mejores resultados que ayuden a una espacialidad mayor, más real y de menor factor de error acústicamente como lo demuestra el video comparativo de técnicas de la firma Noach. Por lo tanto, el RACE cumple efectivamente su labor, sin embargo se necesita de una mayor definición y procesamiento para mejorar la adaptabilidad del método ambiofónico en sistemas más comunes. El sistema ambiofónico genera una mejor percepción espacial que el sistema estereo mejorando la profundidad, naturalidad y definición de extremos de una señal. El sweet spot en la reproducción ambiofónica es bastante reducido y de difícil calibración, pero mientras mejor sea el tratamiento acústico y en especial el procesamiento, se lograran mejores resultados. La tan discutida sensación de “estar ahí presente” al momento de escuchar un material de audio se cumple con ambiofonía por lo menos en gran parte del campo sonoro y con todo tipo de material. No obstante, mientras más se acerque el material reproducido a las condiciones ideales de la ambiofonía, mejor será el resultado. La técnica de grabación ambiofónica aunque es eficiente, requiere de componentes de alta calidad, mientras mejor sea el campo sonoro capturado, mayor será la diferencia generada por RACE. El procesador tiende a abrir los campos sonoros, pero no puede hacer mucho por grabaciones muy cerradas. Por ello no funciona con grabaciones binaurales regulares. De mejorar el sweet spot, el requerimiento acústico y la confiabilidad de los procesadores, la ambiofonía puede ser la exitosa sucesora de la técnica estereofónica, además su implementación se hace más inmediata a medida que evoluciona y se da a conocer el método. 7. RECOMENDACIONES Al momento de adecuar una sala de reproducción ambiofónica, hay que asegurarse de realizar varias pruebas con diferentes medidas para el, ambiopolo. Los archivos de prueba de libre acceso disponibles en ambiophonics.org son la mejor guía para la percepción subjetiva, mientras que el ruido rosa limitado en bandas también disponible en la página es gran ayuda para calibrar el Nivel de Presión Sonora emitido por los parlantes. Al hacer una grabación ambiofónica se sugiere salir un poco de las reglas del método y probar distintas ubicaciones, como por ejemplo, dejar el ambiófono a una altura considerable en el punto central inferior del auditorio o sala de conciertos determinada. Si se desean hacer pruebas ambiofónicas sin tener los medios para la sala normal, se sugiere buscar el lugar más cercano al estado ideal en la medida de lo posible y probar dimensiones de ambiopolos menores a las recomendadas por el método ya que dichas medidas funcionan para cuartos acústicamente tratados. Aunque la diferencia no sea muy grande, hacer pruebas iniciales con ambiopolos pequeños da una idea inicial útil. Es importante que los intérpretes a grabar realicen un trabajo en conjunto y cuiden de no sobrepasar un nivel que enmascare a sus compañeros, ya que esto conduce a factores muy difíciles de controlar en una “post-producción” del material grabado. Para realizar pruebas sobre los valores de los componentes del procesador RACE se sugiere realizarlas con retardos grandes (por ejemplo mayores a 250ms) no solo para revisar que funcionen sino para probar diferentes tipos de combinaciones que produzcan un retardo prolongado que no ocasione retroalimentación reiterativa y de necesitar una referencia una vez estén configurados los retardos pequeños, utilizar la misma pieza de audio en Audiomulch u otro cancelador confiable para comparar. El archivo ideal para realizar lo antes dicho es sin duda el test de ancho L y R disponible en ambiophonics.org BIBLIOGRAFÍA • “Ambiophonics: Achieving Physiological Realism in Music Recording and Reproduction” Glasgal, Ralph. AES Convention paper 111th Convention 2001. • “Ambiophonics 2nd Edition: Replacing Stereophonics to Achieve Concert-Hall Realism” Glasgal, Ralph. 2001 • “The effects of interaural crosstalk on stereo reproduction and minimizing interaural crosstalk in nearfield monitoring by the use of a physical barrier” Bock, Timothy. Keele Jr, Don. 81st AES convention paper. Los Angeles, California, 1986. • “Ambiophonic Principles for the Recording and Reproduction of Surround Sound for Music” Angelo Farina, Ralph Glasgal, Enrico Armelloni, Anders Torger. • “Constrasting ITU 5.1 and Panor-ambiophonic 4.1 Surround Sound Recording Using OCT and Sphere Microphones” Robert E. (Robin) Miller III 2002. • “Scalable Tri-play Recording for Stereo, ITU 5.1/6.1 2D, and Periphonic 3D (with Height) Compatible Surround Sound Reproduction” AES. Convention paper. Robert E. (Robin) Miller III 2003. • “Real Time partitioned convolution for ambiophonics surround sound”. Angelo Farina, Anders Torger. 2001 IEEE Workshop on Applications of Signal Processing to Audio and Acoustics. • “360° Localization via 4.x RACE Processing”. Glasgal, Ralph. AES 123rd convention paper. • “The ambiophone derivation of a recording methodology optimized for ambiophonic reproduction”. Glasgal, Ralph. AES 19th International Conference on Surround Sound Techniques, Technology, and Perception. Germany 2001. ANEXOS Anexo 1. Vista parcial del contenido de la cabeza del ambiófono Anexo 2. Vista trasera ambiófono-proscenio. Anexo 3. Configuración ambiofónica y mediciones Anexo 4. Vista frontal modelo cabeza humana de ambiófono FECHA 23/10/09 NÚMERO RA PROGRAMA AUTOR (ES) TÍTULO Ingeniería de sonido CABEZAS, Christian Camilo Implementación y análisis de un sistema ambiofónico a partir del procesador RACE. PALABRAS CLAVES DESCRIPCIÓN Ambiofonía, ambiófono, ambiopolo, binaural, RACE, dipolo estereo, crosstalk, ILD, ITD, comb-filtering, dsp, matlab, siulink, Tact, audiomulch, ambisonics. El presente documento pone a prueba y analiza los componentes de un sistema ambiofónico en todas y cada una de sus etapas. El método ambiofónico busca mejorar la percepción auditiva de campos sonoros mediante técnicas de grabación, procesamientos de señal y reproducciones específicas. Todas argumentadas, evaluadas y discutidas en el documento. FUENTES BIBLIOGRÁFICAS • “Ambiophonics 2nd edition” Glasgal, Ralph. • “The Effects of Interaural Crosstalk on Stereo Reproduction and Minimizing Interaural Crosstalk in Nearfield Monitoring by the Use of a Physical Barrier” Bock, Timothy. Keele Jr, Don. • 360° Localization via 4.x RACE Processing NÚMERO RA PROGRAMA Ingeniería de sonido CONTENIDOS 1. PLANTEAMIENTO DEL PROBLEMA El problema se basa en la importancia de un conocimiento claro acerca de la manera en la cual se debe implementar el sistema de ambiofonía con el fín de evaluar si su uso es viable y si está en la capacidad de mejorar la percepción espacial proporcionada por el estéreo. Como base se plantea la pregunta: ¿Cómo se debe implementar el método de ambiofonía en cada una de sus etapas desde grabación a reproducción, usando el procesador RACE y cómo se puede mejorar el mismo? Como objetivo general se desea implementar y analizar el métodos y los objetivos específicos son: • Adecuar un recinto para realizar pruebas iniciales sobre el método con material existente. • Realizar el montaje y posterior grabación con un ambiófono. • Diseñar y programar la función de un DSP en el software Matlab a partir del diagrama de bloques con el cual funciona el eliminador RACE para procesar el material grabado. • Seleccionar y adecuar un recinto para la reproducción del material ambiofónico. • Realizar una encuesta para valorar la respuesta del resultado obtenido. • Establecer posibles correcciones del procesador, de las ecuaciones propuestas por el método y de la implementación del sistema para distintos lugares. 2. MARCO REFERENCIAL En este capítulo se enuncia la teoría detrás del método ambiofónico, lo cual incluye el problema con los sistemas actuales y las maneras de evitarlos de acuerdo a la ambiofonía. Se revisa además cada una de las etapas en la cadena de grabaciónreproducción del método. Se examinan factores relevantes como el crosstalk, el combfiltering y lo defectos del triángulo equilátero estereo. 3. METODOLOGÍA Describe el enfoque y línea de la investigación. Discute cada parte del método aclarando lo que se busca en cada etapa con base en el marco referencial, incluye un resultado anticipado de la investigación (hipótesis) y las variables presentes. Además se ven las posibilidades existentes respecto a cada punto importante del sistema. 4. DECISIÓN INGENIERIL Se describen las elecciones tomadas respecto a los problemas encontrados con el fin de cumplir las etapas del sistema bajo la mayor calidad posible. Los resultados se toman a partir de un punto de vista teórico y se llevan a la práctica. 5. ANÁLISIS DE DATOS Los datos obtenidos se consignan en este capítulo, vienen acompañados por el análisis respectivo y los razonamientos que han de llevar a las conclusiones. Se encuentran datos de mediciones y tabulación de datos a partir de una encuesta de valoración subjetiva. NÚMERO RA PROGRAMA Ingeniería de sonido METODOLOGÍA 1 ENFOQUE DE LA INVESTIGACIÓN El trabajo a realizar tiene un enfoque empírico-analítico, porque se orienta a lo técnico y a la transformación del mundo material. Busca información más confiable y eficaz a través de la obtención de datos y análisis de los mismos. Utiliza modelos matemáticos y teoría específica para verificarla en la práctica. Esto es, teoría psicoacústica y comportamiento de señal, procesamiento digital y evaluación de criterios subjetivos. Este proyecto se enmarca en la línea de investigación “Tecnologías actuales y sociedad” de la Universidad de San Buenaventura ya que como su nombre lo indica, se está examinando un nuevo método partiendo de una tecnología específica que es la binaural y se relaciona con el impacto social en la medida en que es un sistema que puede llegar a cambiar todos los sistemas de reproducción habituales. A su vez se ubica dentro de la sublínea de investigación de Facultad “Procesamiento de señales digitales y/o analógicas” ya que el flujo de señal convencional desde grabación hasta reproducción señala a ese tema. HIPÓTESIS La grabación ambiofónica ha de realizarse exclusivamente con el ambiófono ubicado en la posición de un asiento central entre la tercera o quinta fila de acuerdo a la profundidad del espacio del público en la sala de conciertos, una menor distancia cerrará la espacialidad en el eje X (horizontal) y provocará una respuesta difusa y poco clara en los extremos. La percepción de profundidad (eje Z) es óptima y esto se ve en el campo sonoro de la reproducción. El procesador RACE diseñado en Matlab presenta cierta distorsión debido a la calidad del procesamiento. Sin embargo alcanza el objetivo planteado por el principio teórico inicial del método de cancelación ambiofónica recursiva, la fase y la amplitud se mantienen ideales. Para mayor efectividad se opera a 70 useg de retardo entre las dos señales y a una atenuación de -2.5 dB. El resultado subjetivo es bastante similar al percibido con el software Audiomulch. Los recintos de reproducción no alcanzan las condiciones ideales en especial en el RT60 ya que este es difícil de reducir a los 0.2 seg requeridos. Mientras que los fenómenos acústicos sean controlados en el punto de audición, y el tiempo de reverberación promedio descienda tanto como sea posible (ojalá a menos de 0.5 seg) se podrán apreciar los resultados favorables del método ambiofónico. La mejor distancia entre los parlantes estará cercana a los 55 cms y la cabeza del oyente respecto al centro del triángulo ambiofónico deberá estar localizada a 2 metros de distancia. Las medidas variarán de acuerdo a las dimensiones y condiciones acústicas del lugar. Se sugiere hacer pruebas. No obstante, el ambiopolo suele ser más eficaz para distancias de -20° entre los dos parlantes, incluso más que en -30°. Variables independientes • • • • Implementación de ambiófono. Operación del RACE. Sistema de altavoces usado y ubicación. Material procesado. Variables dependientes • Percepción de espacialidad. • Facilidad de ubicación de fuentes. Determinación de instrumentos a partir de sus rangos en frecuencia. CONCLUSIONES En conclusión, mientras más amplio sea el campo a capturar en el eje horizontal, mayor debe ser la distancia entre el ambiófono y las fuentes sin que el ambiófono deba ubicarse obligatoriamente en una de las primeras filas. La herramienta Simulink no genera una calidad óptima ni eficacia de trabajo para el procesamiento del RACE. Presenta falencias en la fase y amplitud de la repuesta en frecuencia. Un procesamiento adicional en el sistema y diagrama de RACE puede llevar a mejores resultados que ayuden a una espacialidad mayor, más real y de menor factor de error acústicamente como lo demuestra el video comparativo de técnicas de la firma Noach. El sistema ambiofónico genera una mejor percepción espacial que el sistema estereo mejorando la profundidad, naturalidad y definición de extremos de una señal. La tan discutida sensación de “estar ahí presente” al momento de escuchar un material de audio se cumple con ambiofonía por lo menos en gran parte del campo sonoro y con todo tipo de material.