Download so MICHAEL DOMJAN Y BARBARA BURKHARD
Document related concepts
Transcript
1 MICHAEL DOMJAN Y BARBARA BURKHARD PRINCIPIOS DE APRENDIZAJE Y CONDUCTA CAPITULO 3 : “EL CONDICIONAMIENTO CLÁSICO : FUNDAMENTOS” PAVLOV Y LOS PRIMEROS AÑOS DEL CONDICIONAMIENTO CLASICO El condicionamiento clásico se sigue asociando todavía hoy, cincuenta años después de su muerte, con el nombre y el trabajo de Ivan Pavlov. Pavlov comenzó sus investigaciones en Rusia a finales del siglo XIX. El fenómeno del condicionamiento clásico fue también descubierto independientemente por Edwín B. Twitmyer, en 1902, en la lectura de su tesis doctoral que presentó en la Universidad de Pennsylvania (véase Twitmyer, 1974). Sin embargo, Twitrnyer no llevó a cabo un programa extenso de investigación, y sus hallazgos fueron ignorados durante muchos años. Aunque los escritos de Pavlov se difundieron ampliamente en los Estados Unidos, la crítica académica más minuciosa y la comprobación de sus ideas las realizaron por primera vez, en Polonia, Konorski y sus colaboradores (véase Konorski, 1948). Las investigaciones de Pavlov sobre condicionamiento clásico eran una prolongación de sus investigaciones sobre los procesos de la digestión. Gran parte de su trabajo sobre condicionamiento tenía relación con las acciones de las glándulas salivares. La mayoría de las personas asocian la digestión antes que nada con las actividades del estómago y de los intestinos. Sin embargo, la digestión empieza en la boca, donde la comida se mastica y se mezcla con la saliva. Así pues las glándulas salivares son las primeras glándulas que intervienen en la descomposición de la comida. Son unas glándulas grandes y tienen unos conductos cerca de la superficie, que se pueden observar fácilmente. Los conductos de las glándulas submaxilares, por ejemplo, están situados a lo largo de cada lado del fondo de la boca, unos al lado de otros, liberando saliva cerca de los dientes inferiores. (Se pueden ver con claridad esos conductos mirando debajo de la lengua con un espejo.) Los submaxilares pueden separarse fácilmente del tejido que le rodea. Se pueden extraer haciendo una incisión en el fondo de la boca y luego coserlos con un punto a la superficie exterior de la piel. Con esta modificación quirúrgica, las secreciones de las glándulas se pueden recoger, medir y analizar (véase la figura 3.1). El interés inicial de Pavlov por las funciones digestivas estaba relacionado con temas puramente fisiológicos. Estaba interesado en los sistemas neurológicos responsables de la salivación que provocaba la comida en los perros. Sin embargo, encontró que los perros que había utilizado en varios experimentos no esperaban para salivar a que se les colocara la comida en la boca: empezaban a salivar en cuanto veían la comida. Esta salivación anticipatoria le dificultó el estudio de la salivación como respuesta a la comida. Si el perro se ponía a salivar antes de que se le presentara la comida, esta secreción no se podía atribuir fácilmente a la presentación de la comida. Enfrentados a ese problema, científicos menos astutos que Pavlov podrían haber restringido su investigación a animales menos habituados a la situación experimental y que no producían una salivación anticipada. Pavlov, en cambio, redefinió los objetivos de su investigación y comenzó una extensa investigación acerca de los mecanismos que controlan la salivación anticipatoria . (Paylov, 1927). 2 3 ¿Por qué los perros con una experiencia previa comienzan a salivar antes de recibir la Comida? Uno de los primeros estudiantes de Pavlov que trabajó en el problema, Anton Snarsky, sugirió que la visión de la comida hacía que los perros pensaran en ella y esto producía una salivación anticipatoria- Pavlov rechazó esta interpretación por ser mentalista, y consideró, en cambio, la salivación anticipatoria como la manifestación de una nueva respuesta refleja, provocado por el estímulo de la comida. Si se asume que la salivación anticipatoria de los perros con una experiencia previa es una reacción a los estímulos que se presentaron emparejados con la comida, surgen entonces numerosas cuestiones experimentales. ¿Qué clase de estímulos pueden llegar a producir salivación? ¿De qué forma adquieren los estímulos la capacidad de provocar salivación? Los estímulos que llegan a producir una salivación anticipatoria, ¿pierden alguna vez esta función? ¿Pueden los animales aprender a inhibir, o suprimir, la salivación en respuesta a un estímulo, de la misma forma que pueden aprender a producirla? Pavlov dedicó la última parte de su carrera científica a responder a preguntas como éstas, y a lo largo de dicho proceso realizó gran cantidad de descubrimientos sobre los mecanismos del condicionamiento clásico. EL PARADIGMA DEL CONDICIONAMIENTO CLASICO La mayoría de las personas están familiarizadas con el procedimiento que Pavlov utilizó para estudiar la salivación anticipatoria. En el procedimiento intervenían normalmente dos estímulos importantes. Uno de ellos era un ruido o una luz que se encendía. En su primera presentación, estos estímulos podían provocar una respuesta de orientación, pero no producían salivación. El otro estímulo de la situación fue la comida o el sabor de una solución ácida colocada en la boca. En contraste con el primer estímulo, el segundo provocaba no sólo movimientos de orientación, sino también una fuerte salivación, incluso la primera vez que se presentaba. Pavlov se refirió al tono o a la luz como estímulo condicional debido a que la capacidad de este estímulo para provocar salivación dependía de (estaba condicionada a) que se presentara repetidamente junto a la comida. Por el contrario, el estímulo de la comida o del sabor ácido fue denominado estímulo incondicional porque su capacidad para provocar salivación no dependía de que los sujetos tuvieran un entrenamiento previo. A la salivación producida eventualmente por el tono o la luz se le llamó respuesta condicional, y a la salivación producida siempre por la comida o el sabor ácido se le llamó respuesta incondicional. Así pues, los estímulos y respuestas cuyas propiedades y aparición no dependían de un entrenamiento previo fueron llamados incondicionales; a los estímulos y respuestas cuyas propiedades y aparición dependían de un entrenamiento especial se les llamó «condicionales. EL CONDICIONAMIENTO DEL PARPADEO EN LOS CONEJOS El paradigma del condicionamiento del parpadeo en los conejos fue desarrollado por Gormezano. Se suelen utilizar conejos albinos. Gormezano los escogió para estudiar la respuesta de parpadeo porque los conejos rara vez parpadean si no ha existido un entrenamiento especial. Por tanto, si se observa que el animal parpadea después de la presentación de un estímulo, puede casi asegurarse que la respuesta ocurrió a causa del estímulo, y que de otra manera no se hubiera producido. 4 5 En los experimentos de condicionamiento del parpadeo se coloca al conejo en un soporte de plástico, como muestra la figura 3.2. La cabeza del animal sobresale del soporte y se sujeta un extremo de hilo fino al párpado superior del ojo. El otro extremo del hilo va unido a un pequeño potenciómetro. Los movimientos del párpado producen movimientos en el potenciómetro y éstos se transforman en señales eléctricas que permiten un registro preciso de las respuestas de parpadeo. El estímulo incondicionado es un soplo de aire en la superficie del ojo, o una breve descarga (de 1 seg, por ejemplo) en la piel de debajo del ojo. Los animales parpadean rápidamente como respuesta al EI. Se han utilizado distintos estímulos como EC, entre los que se incluyen luces, tonos o la vibración del abdomen del animal con un aparato manual para masajes. En el experimento típico de condicionamiento, el estímulo condicionado se presentaba durante 500 mseg y terminaba con la aparición del estímulo incondicionado. El estímulo incondicionado da lugar a que los párpados se cierren fuerte y rápidamente. Cuando el EC se presenta emparejado con EI de forma repetida, la respuesta de parpadeo también llega a darse con el EC. En el procedimiento normal, los investigadores registran en cada prueba si el parpadeo tiene lugar durante el EC, antes de que se presente el EI. Los datos se presentan en términos del porcentaje de ensayos en los que se observa la RC, considerando bloques de pruebas. El condicionamiento de parpadeo es, con frecuencia, un proceso relativamente lento, y aun en el caso de sujetos sometidos a un entrenamiento intenso no aparecen respuestas condicionadas en todos los ensayos. CONDICIONAMIENTO DEL MIEDO El condicionamiento del miedo se estudia habitualmente con ratas y, más raramente, perros. En la mayoría de los experimentos, el estímulo aversivo incondicionado es una descarga eléctrica en los pies, enviada a través de un suelo metálico enrejado. La intensidad de la descarga es considerablemente mayor que la que se utiliza en el condicionamiento del parpadeo. El estímulo condicionado suele ser un tono o una luz que se enciende, y el miedo condicionado se mide indirectamente midiendo la forma en que el estímulo condicionado al miedo altera la actividad que está llevando a cabo el animal. Una técnica de medida indirecta del miedo condicionado se denomina procedimiento de la respuesta emocional condicionada (o supresión condicionada), que se abrevia REC. Este procedimiento, ideado por Estes y Skinner (1941), se ha utilizado desde entonces ampliamente en los estudios de condicionamiento pavloviano (Kamin, 1965). El animal más utilizado en los experimentos de supresión condicionada es la rata. A los animales, colocados en una cámara experimental pequeña, se les entrena primero a presionar una palanca para obtener comida como premio . Tras un entrenamiento suficiente de presión de la palanca, llegan a presionar la palanca a un ritmo estable, obteniendo un premio de comida cada 2 o 3 min. La fase de condicionamiento clásico del experimento se inicia una vez que las respuestas de presión de la palanca han quedado bien establecidas. La duración del EC es, por lo general, más larga que en el condicionamiento del párpado de los conejos (3 min, por ejemplo), y asimismo, el EI de descarga es normalmente más largo (5 seg, por ejemplo). El procedimiento típico de condicionamiento implica la presentación del EI de descarga al final del estímulo condicionado. El intervalo entre pruebas suele ser de 15 a 30 min. Se hace evidente el progreso del condicionamiento del miedo cuando el estímulo condicionado desbarata la respuesta de presión de la palanca para obtener comida. Si el sujeto no se ha encontrado antes con el estímulo condicionado, la primera vez que éste se presenta puede aparecer una ligera desorganización de la respuesta de presión de la palanca. Si el EC no se presenta junto con la descarga, esa ligera supresión de la respuesta inicial se habitúa. Antes de 3 ó 4 ensayos, el EC no tiene efecto alguno en la conducta de la rata. Sin embargo, si el EC se empareja con la descarga en el pie, inmediatamente queda condicionado a la descarga, y el animal suprime la respuesta de presión de la palanca en cuanto se presenta el EC. Si la intensidad de la descarga es eficaz, en 3 o 5 ensayos de condicionamiento, la supresión condicionada de las respuestas de presión de la palanca puede llegar a ser completa (Kamin y Brimer, 1963). Los animales pueden no presionar la palanca en absoluto cuando se presenta el EC. La supresión de la respuesta, sin embargo, es específica para el EC. En cuanto cesa el EC, el animal reanuda la conducta premiada con comida. 6 El grado de supresión de la respuesta producida por el estímulo condicionado se calcula normalmente dividiendo el número de respuestas de presión de la palanca que el sujeto da durante el EC por la suma del número de respuestas que da durante el EC, y las que da durante un período de tiempo igual de largo, antes de la presentación del EC. La fórmula es: RAZÓN DE SUPRESIÓN = RESPUESTAS AL EC. RESPUESTAS AL EC. + RESPUESTAS ANTES DEL EC 7 Este índice tiene un valor de cero si el sujeto deja de presionar la palanca por completo durante la presentación del EC, porque el numerador de la razón es cero. En el extremo opuesto, si la rata no altera en absoluto su ritmo de presión de la palanca cuando se presenta el EC, el índice adquiere un valor de 0,5. Se puede confirmar esto considerando algunos casos hipotéticos. Por ejemplo, supongamos que el EC se presenta durante tres minutos y que en un período normal de tres minutos la rata da 45 respuestas. Si el estímulo condicionado no altera la conducta de presión de la palanca, el animal dará 45 respuestas durante el EC, de forma que el numerador de la razón será 45. El denominador será 45 (las respuestas del EC) +45 (las respuestas anteriores al EC), es decir, 90. Por tanto, la razón será 0,5. Los valores de razón entre 0 y 0,5 indican grados decrecientes de supresión de la respuesta, o de miedo condicionado. EL SEGUIMIENTO DEL SIGNO Otro procedimiento para el estudio del condicionamiento clásico que ha ensanchado nuestra perspectiva del condicionamiento clásico es el que se denomina Seguimiento Del Signo O Automoldeamiento. Los animales tienden a acercarse y contactar con aquellos estímulos que señalan la disponibilidad de la comida. En el ambiente natural, la disponibilidad de comida viene indicada normalmente por algún aspecto de la comida misma. Al aproximarse y contactar con las señales de la comida, los animales se ponen, en realidad, en contacto con la comida. Para un depredador, por ejemplo, la vista, los movimientos, el olor y quizá los ruidos de la presa son señales que indican la posibilidad de alimento. Siguiendo esos estímulos, es probable que el depredador coja su presa. El seguimiento de signo se puede investigar en el laboratorio presentando un estímulo discreto y localizado, justo antes de cada entrega de una pequeña cantidad de comida. El primer experimento de este tipo fue realizado por Brown y Jenkins (1968) con palomas. Los animales fueron colocados en una cámara experimental con una pequeña tecla circular que se podía iluminar y que las palomas podían picotear (véase figura 3.5). 8 A los animales se les daba periódicamente una pequeña cantidad de comida. Inmediatamente antes de cada entrega de comida, la tecla se iluminaba durante ocho segundos. Las palomas no tenían que hacer nada para que se presentara la comida. La comida se suministraba automáticamente después de cada iluminación de la palanca, independientemente de lo que el animal hiciera. En caso de que los animales tuvieran hambre, se podía predecir que, cuando vieran la tecla iluminada, irían al plato de comida y esperarían la siguiente presentación de comida. Curiosamente, sin embargo, no fue esto lo que ocurrió. En vez de valerse de la luz para averiguar el momento de ir al plato de comida, las palomas comenzaron a picotear la propia tecla. Esta conducta era llamativa porque no se requería que picotearan la tecla para obtener comida en esta fase del experimento. Estos experimentos han mostrado que el seguimiento del signo es una técnica muy útil para investigar la manera en que se aprenden las asociaciones entre un estímulo y otro. En los experimentos de seguimiento del signo con palomas, el estímulo condicionado es la iluminación de una tecla, y el estímulo incondicionado es la presentación de comida. Como ocurre en otros procedimientos de condicionamiento, se da el aprendizaje más rápidamente cuando se presenta el EC justo antes del El, y el aprendizaje no tiene lugar si el EC y el EI se presentan de forma aleatoria, uno respecto del otro (Gamzu y Williams, 1971, 1973). Cada extremo del corredor tenía un disco circular que se podía iluminar. La presentación de comida venía siempre precedida por la iluminación del disco de un extremo del corredor. El estímulo visual del extremo opuesto no estaba correlacionado con la comida. Es importante señalar otro aspecto del experimento. Una vez que se presentaba, la comida estaba disponible sólo 4 segundos. Por tanto, si el animal no iba al recipiente de la comida durante esos cuatro segundos, no conseguía comida en ese ensayo. Después de que se repetía varias veces la presentación de una luz encendida en un extremo del corredor junto con el suministro de comida, las palomas comenzaban a hacer una cosa bastante llamativa: en cuanto se encendía la luz corrían a ese extremo del corredor, picoteaban el disco iluminado y luego corrían al centro del corredor a coger la comida. Como el corredor era muy largo, las palomas no siempre regresaban al plato de comida del centro antes de que desapareciera. Esta conducta de seguimiento del signo resultaba sorprendente porque era totalmente innecesaria. Los animales no tenían que picotear el disco iluminado para conseguir el premio de comida. Podían haberse sentado en medio del corredor y esperar simplemente su ración de cada ensayo- El hecho de que no lo hicieran, prueba la atracción que ejercen las señales condicionadas clásicamente cuando el premio es la comida. Por el contrario, los sujetos no se acercaron de forma constante a la luz del otro extremo de la caja, la cual no estaba correlacionada con las presentaciones de la comida (véase Boakes, 1979). El seguimiento de signo o señal es también evidente en la conducta humana. Mucha gente mientras sube en el ascensor mira los números de los botones cuando se encienden indicando el piso por el que se está pasando. El hecho de mirar fijamente los números de los pisos no hace que el ascensor llegue más rápido a su destino, exactamente igual que el picotear la señal de la comida en el experimento de la caja alargada no adelanta la obtención de comida. Los números del ascensor son signos de cuándo se van a abrir las puertas. Estimulan una conducta de «seguimiento» debido a su significación informativa. Las personas siguen la de aquellos estímulos que suministran información acerca de unos hechos importantes y prometedores, de la misma que las palomas siguen la iluminación de una tecla que señala la presentación de comida. EL APRENDIZAJE DE AVERSIÓN AL SABOR La técnica del condicionamiento de aversión al sabor consistía en dar de beber a los animales una solución con sabor, y se hizo que enfermaran inyectándoles una droga o exponiéndoles a una radiación aversiva. Debido a que experimentan los efectos de la enfermedad tras la exposición al sabor, los animales adquieren una aversión al sabor. La preferencia por una solución con sabor y su ingestión voluntaria se suprimen con el tratamiento de condicionamiento. El aprendizaje de aversión al sabor es el resultado de presentar unidos el EC (en. este caso un sabor) y el EI (la inyección de la droga o la exposición a una radiación), exactamente igual que en otros muchos ejemplos de condicionamiento clásico. El aprendizaje de aversión al sabor difiere de otras situaciones o aspectos importantes. En primer lugar, se puede aprender una fuerte aversión al sabor con el primer emparejamiento de sabor y enfermedad. Aunque el aprendizaje con un solo ensayo se observa también en el condicionamiento del miedo, el aprendizaje con un solo ensayo rara vez se observa, si es que se llega a observar, en el condicionamiento del parpadeo, en el condicionamiento salivar y en el seguimiento del signo. La segunda característica diferencial 9 del aprendizaje de aversión al sabor , es que el aprendizaje se produce aun en el caso de que el animal se ponga enfermo hasta varias horas después de la exposición a un sabor. El intervalo entre el EC y el EI en el condicionamiento de parpadeo por ejemplo, es normalmente menor de un segundo porque se da muy poco condicionamiento, si es que se llega a dar, cuando transcurre más tiempo entre los dos acontecimientos. En contraste con los cortos intervalos entre EC-EI que son necesarios en las situaciones de condicionamiento salivar, de miedo y de seguimiento del signo, los animales aprenden una aversión a una solución con sabor aun en el caso de que el estímulo incondicionado no se presente en varias horas (García, Ervin y Koelling, 1966; Revusky y García, 1970). 10 A MAYOR TIEMPO DE PRESENTACIÓN DEL E.I. CON RESPECTO AL E.C. , MENOR SERÁ EL APRENDIZAJE EL CONDICIONAMIENTO PAVLOVIANO EXCITATORIO Durante el condicionamiento excitatorio, los sujetos aprenden una nueva respuesta al estímulo condicionado que es congruente con el estímulo incondicionado. Los perros aprenden a salivar en respuesta a una campana que precede a la comida, los conejos aprenden a parpadear en respuesta a un tono que precede a una breve irritación de la piel que rodea el ojo, las ratas aprenden a paralizarse de miedo como respuesta a una luz o a un tono que precede a una descarga eléctrica dolorosa; las palomas aprenden a acercarse y picotear una tecla encendida que precede a la entrega de comida, y las ratas aprenden a evitar el beber la sacarina que precede a la enfermedad. En todos estos casos, y como resultado del emparejamiento del EC y el EI, el estímulo condicionado activa o «excita» una respuesta condicionada que era coherente con el EI. PROCEDIMIENTOS DEL CONDICINAMIENTO EXCITATORIO 1. El condicionamiento simultáneo. La forma más obvia de exponer a los sujetos al EC emparejado con el EI es presentar los dos estímulos a la vez. Este procedimiento, llamado condicionamienro simultáneo , es el procedimiento representado en la figura 3.7. El caracter esencial de este procedimiento es que los estímulos condicionado e incondicionado se presentan al mismo tiempo. 2. El condicionamiento de demora corta. El EI puede presentarse poco después del EC. Este procedimiento, llamado procedimiento «de demora corta», es la técnica que se usa con más frecuencia. El carácter esencial de este procedimiento es que la aparición del EC precede a la aparición del EI por un período de tiempo corto (menos de un minuto), y que el EI se presenta durante el EC o inmediatamente después. 3. El condicionamiento de huella. El condicionamiento de huella es similar al procedimiento de demora corta, excepto que el EI no se presenta hasta que el EC no termina. El intervalo entre el final del EC y el principio del El se llama intervalo de huella. 11 4. El condicionamiento de demora larga. Este procedimiento también es similar al procedimiento de condicionamiento de demora corta en el que el EC precede al El. Sin embargo, en este caso el EC está presente mucho más tiempo (cinco-diez minutos) antes de que se presente el EI. 5. El condicionamiento hacia atrás. El último procedimiento representado en la figura 3.7 difiere de los demás en que el EC se presenta poco después, en vez de antes, que el EI. A esta técnica se le llama «condicionamiento hacia atrás»- MEDICIÓN DE LA RESPUESTA CONDICIONADA Una técnica consiste en medir la rapidez con que se produce la respuesta condicionada después de la presentación del estímulo condicionado. Esta medida de la fuerza de la respuesta se llama Latencia De La Respuesta Condicionada. La latencia es la cantidad de tiempo que transcurre entre la presentación del estímulo condicionado y la aparición de la respuesta condicionada. La medida de la latencia de la respuesta puede informarnos del desarrollo del condicionamiento solamente si la respuesta condicionada tiene lugar antes del EI en ese procedimiento concreto de condicionamiento. Este puede ser el caso de los procedimientos de demora corta, demora larga y condicionamiento de huella porque en todos esos casos la respuesta condicionada puede empezar antes de que se presente el estímulo incondicionado. Sin embargo, en los procedimientos de condicionamiento simultáneo y hacia atrás, la latencia de la respuesta no puede usarse como un índice de condicionamiento. En esos casos la conducta observada durante el EC no se debe claramente sólo a la presencia del EC. Esto es así particularmente en el caso del condicionamiento simultáneo. Usando tal procedimiento, cualquier conducta observada durante el EC podría haber estado suscitada por el EI más que por el EC, ya que se presentan al mismo tiempo. En el condicionamienco hacia atrás, la conducta observada durante el EC puede haber sido provocada por el EI que ocurrió antes del EC. De la misma forma, las medidas de latencia de la respuesta en los procedimientos de condicionamiento de demora corta, demora larga y de huella pueden no indicar el grado de aprendizaje que se ha producido si resulta que la respuesta condicionada no se materializa hasta después de la presentación del estímulo condicionado. Una forma de evitar e1 problema descrito arriba es comprobar el grado de condicionamiento presentando periódicamente el EC solo (sin el EI). En ese caso, las respuestas provocadas por el EC pueden observarse sin la contaminación de las respuestas provocadas por el EI. Los ensayos con el EC solo que se introducen periodicamente para medir el alcance del aprendizaje se llaman Ensayos De Prueba. Los ensayos de prueba permiten medir no sólo la latencia sino también otros aspectos de la respuesta condicionada. Cuando Pavlov estudiaba la salivación, por ejemplo, con frecuencia medía la cantidad de gotas de saliva que eran liberadas. Tales medidas de la intensidad de la respuesta se dice que reflejan la Magnitud De La Respuesta. Se puede también calcular el porcentaje de ensayos de prueba con el EC solo en los que se observa una respuesta condicionada. Esto proprociona un indicador de la Probabilidad De La Respuesta Condicionada. LA CONTIGÜIDAD Y LAS RELACIONES DE SEÑAL ENTRE LOS ESTIMULOS CONDICIONADO E INCONDICIONADO La idea más simple es que el condicionamiento clásico excitatorio se debe a que el EC y, el EI se experimentan al mismo tiempo. A esto se le llama Contigüidad Del Estímulo. Se dice que dos 12 acontecimientos son contiguos si ocurren a la vez. Sin embargo, la revisión de los procedimientos de condicionamiento excitatorio que se describió antes muestra que la simple noción de la contigüidad del estímulo no proporciona una explicación, adecuada del condicionamiento clásico. La presentación del EC y el EI al mismo tiempo, como en el procedimiento de condicionamiento simultáneo, no es particularmente eficaz para producir condicionamiento excitatorio. El procedimiento que obtiene más éxito en el condicionamiento clásico excitatorio es el procedimiento de condicionamiento de Demora Corta, en el que el EC se inicia ligeramente antes de la presentación del EI. Los problemas con el principio de contigüidad simple han fomentado también el desarrollo de ideas alternativas sobre los mecanismos de condicionamiento clásico. Uno de los mas sobresalientes se basa en la noción de que el condicionamiento clásico implica el aprendizaje de una relación de señal entre el estímulo condicionado y el incondicionado. De acuerdo con esta idea, es más probable que los organismos aprendan a dar una respuesta condicionada al EC si las presentaciones del EC sirven como señal de la inmediata aparición del EI. Los procedimientos en que el EC no se puede tomar como base para predecir el EI, no suelen facilitar una rápida adquisición de la respuesta condicionada. EJEMPLOS DE RELACIONES DE SEÑAL Cuando pensamos en situaciones de la vida real en que se utilizan señales, podemos valorar fácilmente lo útil que resulta que un estímulo condicionado prediga el estímulo incondicionado. Existen muchas situaciones así. Las sirenas, por ejemplo, señalan normalmente la aproximación de un vehículo de emergencia, como una ambulancia o un coche de bomberos. La sirena es análoga al estímulo condicionado, y la llegada del vehículo de emergencia es análoga al estímulo incondicionado. Si oyéramos la sirena siempre justo antes de la llegada de la ambulancia, aprenderíamos rápidamente a apartarnos de su camino. En ese caso la sirena sería un buen predictor, o señal, de la llegada de la ambulancia. Este procedimiento es análogo al procedimiento de condicionamiento de demora corta, en el que el EC es un buen predictor del EI. Por el contrario, si no oyéramos nunca la sirena hasta que la ambulancia estuviera en escena, no habría razón para reaccionar ante la sirena. La sirena no nos proporcionaría una información útil sobre la llegada de la ambulancia. Simplemente nos apartaríamos de su camino cuando llegara. Este caso es análogo al del procedimiento de condicionarnienro simultáneo, en que la relación de señal entre el EC y el EI no es muy buena. Tendríamos menos motivos aún para apartarnos del camino cuando la sirena sonara, si sólo la oyéramos una vez que la ambulancia ya se hubiese ido. Este caso es comparable al procedimiento de condicionamiento hacia atrás. Si hay algo que se aprende en estas circunstancias, es que la sirena indica que la ambulancia ha partido. El análisis es un poco más complicado si la relación entre el sonido de la sirena y la presencia de la ambulancia es comparable al procedimiento del condicionamiento de huella. En este caso la sirena pararía antes de que llegara la ambulancia. Por tanto, la presencia de la sirena indicaría que la ambulancia todavía va a tardar un rato en llegar. El mejor indicador de la llegada de la 13 ambulancia sería, pues, el cese de la sirena. Así, con el procedimiento de huella es más probable que dejemos paso a la ambulancia cuando la sirena ya no suene. Sí experimentáramos algo comparable al procedimiento de condicionamiento de demora larga, oiríamos siempre la sirena mucho tiempo antes de la llegada de la ambulancia. En ese caso, aprenderíamos a ignorar la sirena al principio de oírla, y, nos preocuparíamos de dejar paso sólo después de que la sirena llevara sonando un rato. La experiencia de la mayoría de las personas con las sirenas y los vehículos de emergencia es muy parecida al procedimiento de condicionamiento de demora larga. Quizá por este motivo los conductores rara vez responden inmediatamente cuando oyen una sirena mientras van al volante. 14 LA CONTINGENCIA EC-EI Rescorla resaltó que la calidad de un estímulo como señal de otro depende no sólo del modo en que los dos estímulos van emparejados, sino también de la cantidad de veces que cada elemento se da por separado. De hecho, el número de veces que el EC y el EI aparecen solos puede ser más importante para determinar la intensidad del condicionamiento que la forma en que se emparejan cuando se presentan juntos. Una segunda idea importante en la que Rescorla puso énfasis es que las relaciones de señal no necesitan ser siempre positivas: también pueden ser negativas. Es decir, un estímulo puede señalar la ausencia de otro estímulo de la misma forma que un estímulo puede señalar la presencia futura de otro hecho. Las ideas de Rescorla sobre las relaciones de señal quedan resumidas formalmente en su concepto de la contingencia entre los estímulos condicionado e incondicionado. La contingencia entre el EC y el EI se determina a partir de la comparación de dos probabilidades, la probabilidad de que el EI se dé junto al EC, simbolizada como p(EI/EC), y la probabilidad de que el EI se dé en ausencia del EC, simbolizada como p(El/no EC). Si el EI se presenta sólo con el EC y el EC nunca se presenta solo, como en el procedimiento de condicionamiento de demora corta, las apariciones del EI se pueden predecir perfectamente a partir de las apariciones del EC. Esto ilustra una contingencia positiva perfecta entre el EC y el EI. En términos de las dos probabilidades que definen la contingencia, el EI ocurre con toda seguridad una vez que el EC ha ocurrido. Así pues, p(EI/EC) = 1,0. Por el contrario, es absolutamente seguro que el EI no se dará si el EC no se ha dado aún. Así pues, p(EI/no EC) = 0. Esas dos probabilidades definen una contingencia positiva perfecta. Si se puede predecir la aparición del EI a partir de la presencia del EC, es que existe una contingencia positiva entre los dos estímulos. La contingencia positiva perfecta descrita arriba ilustra un caso extremo. Podemos predecir el EI a partir del EC siempre y cuando el EI tenga más probabilidad de aparecer con el EC que sin él. Así pues, se dice que existe una contingencia positiva entre el EC y el EI siempre y cuando p(EI/EC) sea mayor que P(EI/no EC). Los cazadores de ciervos, por ejemplo, hacen uso de una contingencia positiva imperfecta cuando predicen la presencia del ciervo a partir de la visión de sus excrementos. No se ve invariablemente un ciervo cuando se encuentran excrementos de ciervo. Sin embargo existe una contingencia positiva entre los dos hechos porque es más probable localizar ciervos en áreas donde haya excrementos que en otros lugares. Mientras que la contingencia positiva permite la predicción de un hecho basándose en la aparición de otro estímulo, no es posible en cambio una predicción de tal naturaleza cuando la contingencia entre los dos estímulos es cero. Se dice que existe una contingencia cero entre el EC y el EI si la probabilidad de que se dé el EI con el EC es la misma que sin el EC. Así pues, en una contingencia cero, p(EI/EC) = p(El/no EC). También existen contingencias en las que el EC predice la «ausencia» del EI. Tal es el caso cuando el EI se presenta con más probabilidad en ausencia del EC que en su presencia. Estos casos suponen una contingencia negativa entre el EC y el EI. En una contingencia negativa p(EI/EC) es menor que p(EI / no EC). De la experiencia común se pueden extraer también muchos ejemplos de contingencia negativa. Por ejemplo, los. médicos utilizan los síntomas de peso, presión sanguínea y ritmo cardiaco normales para predecir la ausencia de enfermedad, ya que es menos probable que estén enfermas aquellas personas que presentan valores normales que aquellas cuyo peso, presión sanguínea y ritmo cardíaco son anormales. Al especificar que el aprendizaje depende de la contingencia entre el EC y el EI, el modelo de contingencia destaca que el emparejamiento del EC y el EI no es suficiente para que se produzca el condicionamiento clásico. No se puede predecir lo que los animales van a aprender, si es que aprenden algo, a partir de la exposición a un EC emparejado con un EI cierto número de veces. Por ejemplo, supongamos que a un perro se le presenta un tono cien veces, y alrededor de cincuenta de esas presentaciones van seguidas inmediatamente por la entrega de comida. En base a esta información no podernos predecir lo que el perro va a aprender, puesto que no sabernos qué probabilidades tiene de obtener comida en la situación experimental cuando el tono está ausente. Si al animal nunca se le da comida en ausencia del tono, existirá una contingencia positiva débil entre el tono y la comida. En esas condiciones el perro aprenderá a salivar ante el tono. Sin embargo, si al perro se le alimenta con la misma frecuencia en ausencia del tono que inmediatamente después del tono, la contingencia entre el EC y el EI será cero. En este caso puede que el perro aprenda a no hacer nada como respuesta al tono. Por último, si al perro se le alimenta con más frecuencia en ausencia del tono que inmediatamente después de él, existirá una contingencia negativa entre el EC y el EI, y el perro puede aprender a considerar el tono como una señal débil para la ausencia de comida. EL CONDICIONAMLENTO PAVLOVIANO INHIBITORIO Aprender que un estímulo señala la ausencia de un EI se denomina condicionamiento inhibitorio. La inhibición condicionada enseña a los animales a inhibir o retener una respuesta condicionada. La inhibición de la respuesta condicionada es tan importante en la organización de la conducta 15 como la capacidad de dar respuestas condicionadas. Además, las señales que indican qué estímulos no van a presentarse, suministran tanta información acerca del mundo como las señales que le dicen al organismo las que sí van a hacerlo. PROCEDIMIENTOS PARA EL CONDICIONAMIENTO INHIBITORIO Un prerrequisito importante al condicionar un estímulo para que señale la ausencia de algún EI es que este EI se presente periódicamente en la situación experimental. En nuestra vida diaria existen muchas señales que indican la ausencia de hechos. Los carteles de «cerrado», «no funciona», «prohibida la entrada», son todos de ese tipo. Sin embargo, esas señales suministran una información significativa e influyen en nuestros actos solamente si indican la ausencia de algo que esperábamos ver. Por ejemplo, si nos encontramos con el cartel de «no hay gasolina» en una gasolinera, nos frustramos y desanimamos, y, por tanto, no entramos. El cartel de «no hay gasolina» suministra una información importante porque normalmente esperamos que las estaciones de servicio dispongan de gasolina. Sin embargo, ese mismo cartel carece de interés para nosotros si se coloca a la puerta de una joyería, y en tal caso, lo más probable es que no nos disuada de entrar en la tienda a mirar joyas. Este ejemplo ilustra la regla general de que el condicionamiento inhibitorio y el control inhibitorio de la conducta se dan sólo si existe un contexto excitatorio para el estímulo incondicionado en cuestión . 1. El procedimiento estándar para la inhibición condicionada. Pavlov reconoció la importancia de un contexto excitatorio para el condicionamiento de las tendencias inhibitorias de la respuesta y se preocupó de proporcionar ese contexto elaborando un procedimiento estándar para condicionar la inhibición . Cuando aparece el EI, uno de los estímulos condicionados lo anuncia, es el EC+ (un tono, por ejemplo). En el otro tipo de ensayo, el EC+ se presenta junto con el segundo estímulo condicionado, el EC- (una luz, por ejemplo). El EI no se presenta en esos ensayos. Los ensayos en que el EC - y el EC + se presentan sin el EI son ensayos de condicionamiento inhibitorio. El contexto excitatorio para este condicionamiento lo proporciona la presencia del EC + en los ensayos de condicionamiento inhibitorio. Al ir emparejado el EC + con el EI en varios ensayos, el EC + se condiciona a provocar una expectativa de EI. La ausencia del EI en los ensayos de condicionamiento inhibitorio se produce, por tanto, en un contexto en el que el sujeto espera el EI. 16 El procedimiento de inhibición condicionada estándar es análogo a aquellas situaciones en que se introduce un elemento que impide un desenlace que de otro modo sería altamente probable. Un semáforo en rojo en un cruce con mucho tráfico es una señal (EC +) de peligro potencial (el EI). Sin embargo, si un policía de tráfico nos indica que debemos cruzar la calle a pesar de la luz roja (quizá porque los semáforos están estropeados), lo más probable es que no tengamos un accidente. Es probable que la luz roja (EC +) unida a los gestos del agente (EC -) no vaya seguida de peligro. Los gestos actúan como un EC- para inhibir o bloquear nuestra vacilación en cruzar la calle a causa de la luz roja. 2. La inhibición diferencial. Se llama inhibición diferencial a otro procedimiento que se utiliza con frecuencia para lograr la inhibición condicionada. Este procedimiento es muy parecido al procedimiento estándar descrito arriba. Como ocurría en el procedimiento estándar, el EI se presenta en algunos ensayos, y su aparición viene siempre anunciada por la presentación del EC+. En otros ensayos, el EI no se presenta, y los animales experimentan sólo el EC -. Así pues, el procedimiento de inhibición diferencial implica dos modalidades de ensayo: EI seguido de EC + y EC - seguido de ausencia de EI (véase figura 3.9). Como en el procedimiento estándar, el EC- se convierte en estímulo inhibitorio condicionado. El procedimiento de inhibición diferencial es análogo a dos semáforos en un cruce, uno rojo y otro verde. La luz roja (EC +) señala el peligro (EI) de pasar por el cruce, mientras que la luz verde (EC-) señala la ausencia de peligro (no EI). Si se atraviesa el cruce mientras está encendida la luz verde (EC-), uno puede confiar en que no va a tener un accidente. No está tan claro qué es lo que proporciona el contexto excitatorio para que se condicione la inhibición en el procedimiento de condicionamiento diferencial como lo está en el procedimiento estándar. En el procedimiento estándar la presencia del EC + en los ensayos iniciales del condicionamiento inhibitorio provoca alguna expectativa de que aparezca el EI. El EC + no está presente en los ensayos de condicionamiento inhibitorio del procedimiento de condicionamiento diferencial. De hecho, esta es la única diferencia importante entre los dos procesos. Sin embargo, existe otro factor en el procedimiento de condicionamiento diferencial que puede producir un contexto excitatorio durante los ensayos de condicionamiento inhibitorio (EC-, no EI) 17 LA MEDIDA DE LA INHIBICIÓN CONDICIONADA Los sistemas de respuestas bidireccionales.: La identificación de tendencias de respuesta opuestas es muy fácil con los sistemas de respuesta que pueden cambiar en direcciones opuestas a partir de una actuación de línea de base (una actuación normal). Esto es habitual en muchas respuestas fisiológicas. El ritmo cardiaco, la respiración y la temperatura, por ejemplo, pueden aumentar o disminuir a partir de un nivel normal. Ciertas respuestas comportamentales son también bidireccionales. Por ejemplo, los animales pueden acercarse a un estímulo o alejarse de él, y la cantidad de veces que presionan la palanca puede aumentar o disminuir. En esos casos, la excitación condicionada produce un cambio en la conducta en una dirección, y la inhibición condicionada produce un cambio de conducta en la dirección opuesta. El procedimiento de seguimiento del signo es el usado con más frecuencia para demostrar el condicionamiento inhibitorio de respuestas bidireccionales. Como ya se puso de manifiesto anteriormente, las palomas se acercan a estímulos visuales que señalan la inminente presentación de comida. Si se utiliza por el contrario un procedimiento de condicionamiento inhibitorio, de forma que el estímulo visual se convierte en una señal de ausencia de comida, las palomas se alejan del EC. También se han obtenido pruebas de condicionamiento inhibitorio de respuestas bidireccionales usando la técnica de supresión condicionada en las ratas. Como ya se vio, los estímulos que han sido condicionados para señalar una descarga eléctrica posterior suprimen en las ratas las respuestas de presión de la palanca con la que obtienen comida. Por el contrario, los estímulos que han sido condicionados a señalar la posterior ausencia de descarga aumentan la tasa de respuestas de presión de la palanca para conseguir comida. La preferencia de sabor es otro buen ejemplo de bidireccionalidad. Ya hicimos la observación de que los animales reducen su preferencia por los sabores que se han emparejado con una enfermedad. Aumenta su preferencia, sin embargo, por aquellos sabores que han sido condicionados a predecir la ausencia de enfermedad . La prueba del estímulo compuesto o prueba de la sumación: El procedimiento más versátil para valorar la inhibición es la prueba del estimulo compuesto o prueba de la sumación. Este procedimiento tuvo una especial divulgación gracias a Pavlov y en las investigaciones contemporáneas está empezando a ser considerado como el procedimiento más aceptable para medir la inhibición condicionada. Las dificultades que crean las respuestas con un bajo nivel de línea de base se superan con la prueba del estímulo compuesto, ya que se presenta un estimulo excitatorio condicionado que provoca la respuesta condicionada. La inhibición condicionada se mide entonces en términos de reducción o inhibición de estas respuestas condicionadas. Así pues, la prueba consiste en observar los efectos de un EC inhibitorio «en composición» con un EC + excitatorio. Otra forma de considerar el procedimiento es observar la «sumación» de los efectos de un estímulo inhibitorio (EC-) y un estímulo excitatorio (EC+). 18 La prueba del retraso en la adquisición: Otra prueba indirecta usada frecuentemente para medir la inhibición condicionada es la prueba del retraso en la adquisición. El fundamento de esta prueba es también bastante sencillo: si un estímulo inhibe activamente una respuesta concreta, sería extremadamente difícil condicionar ese estímulo para que provocara esa misma conducta. En otras palabras, el ritmo de adquisición de una respuesta condicionada concreta debería retrasarse si el estímulo provoca inicialmente una inhibición de la respuesta. Aunque en las Investigaciones sobre inhibición condicionada se ha empleado con frecuencia la prueba del retraso en la adquisición, los estudios recientes sugieren que esta prueba no es tan útil, para valorar la inhibición condicionada, como la prueba del estímulo compuesto. Una dificultad seria es que son muchos los factores que pueden retrasar el curso del condicionamiento clásico excitatorio. LA EXTINCION Del mismo modo que les conviene a los animales aprender nuevas respuestas a los estímulos, es adaptativo para ellos que decrezca esa conducta una vez que las circunstancias ya no precisan de ella. El proceso por el que las respuestas condicionadas a los estímulos van decreciendo se llama extinción. El proceso para extinguir un estímulo condicionado es presentar repetidamente el EC sin el estímulo incondicionado, o sin que exista ningún tipo de relación de señal con el EI. Si el animal ha sido condicionado para salivar como respuesta a una campana, por ejemplo, y la campana se presenta de forma repetida sin la comida, la salivación ante la campana irá decreciendo. Una advertencia sobre terminología: los procedimientos de extinción se dice que extinguen las respuestas y/o los estímulos condicionados, no los organismos. Los animales no mueren cuando están expuestos a condicionamientos de extinción. Otro comentario importante sobre la definición es que la pérdida de la respuesta condicionada que se produce por la extinción no es la misma que puede ocurrir a causa del olvido. En la extinción, las presentaciones repetidas del EC son responsables por sí solas del descenso gradual de la respuesta condicionada. Olvidar, por el contrario, consiste en un declive en la intensidad de la respuesta condicionada que puede ocurrir simplemente por el paso del tiempo. La extinción implica una experiencia especial con el estímulo condicionado. El olvido ocurre cuando de forma prolongada no se da una exposición al estímulo condicionado. LA EXTINCIÓN Y LA HABITUACIÓN Tanto la extinción como la habituación implican la presentación repetida de un estimulo. La diferencia esencial entre ellas es que, en la extinción, el estímulo que intervenía había sido condicionado de antemano. En cambio, no se requiere una fase previa de condicionamiento para la habituación. Teniendo en cuenta que los procedimientos de la extinción y de la habituación son similares, se podría esperar que existieran semejanzas en los resultados que se obtienen. 19 Los investigadores comienzan a descubrir estas semejanzas. Los estudios recientes han mostrado, por ejemplo, que los efectos del intervalo entre las sucesivas presentaciones de un estímulo son similares en los modelos de habituación y de extinción . Otra característica importante de la habituación es que, con el paso del tiempo, el estímulo recobra su capacidad de evocar la respuesta. Este fenómeno se llama «recuperación espontánea» de la habituación. Un efecto parecido se observa con los estímulos y/o las respuestas que se extinguen. Si después de una serie de ensayos de extinción, se le da al animal un período de descanso fuera del ambiente experimental, puede producirse la recuperación espontánea de la respuesta extinguida. Sería de esperar una menor recuperación espontánea después de sucesivas series de ensayos de extinción, como ocurriría en la habituación. Finalmente, no habría recuperación después de los períodos de descanso. Los efectos que ejercen los estímulos novedosos sobre la pérdida de disponibilidad a responder son similares en la habituación y en la extinción. La presentación de un estímulo extraño a menudo produce una recuperación de la respuesta elicitada por el estímulo habituado (deshabituación). Se da un efecto comparable en la extinción. Si después de una serie de ensayos de extinción se presenta un estímulo novedoso, puede producirse una recuperación de la respuesta al EC extinguido. Esta recuperación de la respuesta condicionada producida por la novedad se llama desinhibición. Es importante distinguir entre desinhibición y recuperación espontánea . Aunque los dos procesos sean formas de recuperación de la respuesta condicionada, en la recuperación espontánea la recuperación ocurre simplemente por el paso del tiempo, y en la desinhibición ocurre por la presentación de un estímulo novedoso. QUÉ SE APRENDE EN LA EXTINCIÓN El fenómeno de la extinción se ajusta a nuestra definición de aprendizaje en tanto que implica un cambio en la conducta (la pérdida de la disponibilidad a responder al estímulo) como resultado de la experiencia (presentaciones repetidas de EC). Sin embargo, uno se puede preguntar qué es lo que realmente se aprende. Una respuesta obvia es que la extinción no supone el aprendizaje de algo nuevo, sino, simplemente, el desaprendizaje de la tendencia de respuesta previamente condicionada. Según este punto de vista, el descenso gradual de la respuesta condicionada debido a la extinción refleja simplemente la pérdida de aquello que se había aprendido antes. En vez de adoptar ese punto de vista, Pavlov (1927) sugirió que, durante la extinción, los animales aprenden a inhibir de forma activa la materialización de la respuesta condicionada en presencia del EC. De acuerdo con esta interpretación, la extinción de una respuesta condicionada no supone la pérdida del aprendizaje original, sino, más bien, el aprendizaje de una tendencia a responder antagónica o inhibitorio. Esta inhibición condicionada impide entonces la aparición de la respuesta condicionada. La prueba primordial para la interpretación de la extinción como inhibición condicionada fue suministrada por el fenómeno de la desinhibición. Pavlov hizo el siguiente razonamiento: si la 20 extinción consiste en aprender a inhibir la respuesta condicionada al EC, entonces la respuesta debería recuperarse si esta inhibición fuera interrumpida mediante algún tratamiento. La presentación de un estímulo novedoso presumiblemente alteraría la inhibición, provocando así una recuperación en la respuesta condicionada, fenómeno que conocemos como desinhibición. Las pruebas efectuadas hasta este momento indican que la extinción no produce el mismo tipo de inhibición de la conducta que el que se aprende en los procedimientos de inhibición condicionada. Evidentemente, los procedimientos de extinción producen la supresión de la conducta a través de alguna otra clase de mecanismo para inhibir la respuesta. La naturaleza precisa de ese mecanismo no ha podido ser comprendida todavía . Sin embargo, es evidente que la extinción no implica el desaprendizaje de una respuesta condicionada y el retorno del sujeto a su estado primitivo. 21