Download Primeras Investigaciones sobre el Condicionamiento Instrumental
Document related concepts
Transcript
Condicionamiento Instrumental. Fundamentos Domjan 5 Condicionamiento Clásico Estimulo Conducta EI RI Condicionamiento Operante ED NO causa la conducta. Simplemente es una señal que le indica al sujeto que el reforzamiento está disponible Conducta Operante La frecuencia de ocurrencia de una operante está influenciada en gran medida por las consecuencias ambientales que produce. Consecuencia Placenteras aversivas ED Presencia del fiscal de transito NO causa la conducta, sólo indica la posibilidad del reforzamiento Conducta Operante Consecuencia Infracción Cometer una infracción (castigo) Afecta la ocurrencia futura de la conducta Primeras Investigaciones sobre el Condicionamiento Instrumental Inventó una serie de cajas problema, en las que ubicaba a un perro, a un pollo o a un gato hambriento. Fuera de la caja colocaba algo de comida. La tarea del animal (generalmente un gato), consistía en aprender cómo salir de la caja Thorndike (1874-1949) Primeras Investigaciones sobre el Condicionamiento Instrumental Cuando un gato se situaba inicialmente en una caja, desplegaba una variedad de respuestas típicas de un animal confinado. Alguna de esas respuestas eventualmente daban como resultado la apertura de la puerta Primeras Investigaciones sobre el Condicionamiento Instrumental Primeras Investigaciones sobre el Condicionamiento Instrumental Eso hizo hipotetizar a Thorndike que el aprendizaje se compone de una serie de conexiones entre un E R que se fortalecen cada vez que generan un estado de cosas satisfactorio para el organismo. Aproximaciones Modernas al Estudio del Condicionamiento Instrumental Procedimientos de ensayo discreto: cada ensayo de entrenamiento termina con la retirada del animal del aparato y la respuesta instrumental se realiza sólo una vez durante cada ensayo. Ejemplo: método de Thorndike Procedimientos de operante libre: permiten que el animal repita la respuesta instrumental una y otra vez sin restricciones. Ejemplo: método de Skinner Ensayo Discreto Vs. Operante Libre Ensayo discreto: Ej: cajas problemas, laberintos Sólo se da una respuesta instrumental en cada ensayo Ensayo Discreto Vs. Operante Libre Ensayo discreto: Ej: cajas problemas, laberintos El experimentador decide cuándo puede responder el animal Medimos la Latencia: tiempo que tarda en abandonar la caja de salida (en el laberinto) o en dar la respuesta correcta (caja-problema) Medimos la Velocidad de la carrera (en el laberinto) Aproximaciones Modernas al Estudio del Condicionamiento Instrumental Respuesta operante: se produce a partir del efecto que produce en el ambiente. Las actividades que producen el mismo efecto conductual se consideran ejemplos de la misma respuesta operante Entrenamiento y moldeamiento al comedero: El entrenamiento se lleva a cabo por condicionamiento clásico: se aparea el comedero con el sonido que hace el dispensador de comida al entregar el alimento El moldeamiento se hace a través de dos procedimientos: Reforzamiento de aproximaciones sucesivas No reforzamiento de formas de respuesta más tempranas Operante Libre (Skinner) Unidad de medida La tasa de respuesta es la medida que suele usarse en el condicionamiento operante Medimos la tasa de ocurrencia de la respuesta operante. Ej: “8 pulsaciones de la palanca por minuto”. Cuanto más probable es la conducta, mayor tasa de respuesta. Según la ley del efecto, una conducta seguida de una consecuencia positiva aumenta su tasa de ocurrencia Procedimientos de Condicionamiento Instrumental Reforzamiento positivo El reforzamiento siempre produce un incremento de la respuesta operante Reforzamiento negativo La respuesta produce un estímulo apetitivo Evitación: La respuesta previene la ocurrencia de un estímulo aversivo Escape: la respuesta elimina la presencia de un estímulo aversivo El castigo siempre produce un decremento de la respuesta operante Castigo Positivo: la respuesta produce un estimulo aversivo Negativo: la respuesta elimina la ocurrencia de un estímulo apetitivo (también se le conoce como entrenamiento de omisión) Elementos Fundamentales del Condicionamiento Instrumental La respuesta instrumental Normalmente el reforzamiento produce conductas estereotipadas, ya que reduce la variabilidad de la conducta Conductas variadas ------reforzamiento------conductas estereotipadas Pero también es posible reforzar la variabilidad. Con lo que aumentamos la variabilidad de la conducta mediante reforzamiento Ej: sólo recompenso al animal cuando lleva a cabo un patrón de respuestas novedoso Elementos Fundamentales del Condicionamiento Instrumental Elementos Fundamentales del Condicionamiento Instrumental Elementos Fundamentales del Condicionamiento Instrumental Elementos Fundamentales del Condicionamiento Instrumental Elementos Fundamentales del Condicionamiento Instrumental Elementos Fundamentales del Condicionamiento Instrumental Sistemas de conducta y La efectividad del condicionamiento instrumental para el limitaciones en el incremento de la respuesta operante, dependerá de la condicionamiento compatibilidad de esa respuesta con la organización preinstrumental existente en el sistema de conducta Elementos Fundamentales del Condicionamiento Instrumenta Elementos Fundamentales del Condicionamiento Instrumenta Contraste positivo Contraste negativo Elementos Fundamentales del Condicionamiento Instrumenta Elementos Fundamentales del Condicionamiento Instrumenta Contigüidad y Contingencia El reforzamiento inmediato es más efectivo que el demorado. Por qué el condicionamiento es tan sensible a la demora?. Una de las explicaciones es que en el intervalo que existe entre la respuesta (R1) y el reforzador, están ocurriendo otras conductas (R2, R3, R4…etc). Se hace difícil que el animal establezca la relación entre R1 y el reforzador, cuando el reforzador se entregó en R6. Contigüidad y Contingencia Existen dos procedimientos para evitar esto: • Usar un reforzador condicionado secundario: se usa el reforzador secundario (un click) en cuanto el animal realiza la conducta operante, aunque posteriormente se entregue el reforzador primario (comida) • Procedimiento de marcado: se hace distinguible la conducta operante correcta de otras incorrectas. Por ejemplo, retirar al animal del ambiente experimental y ubicarlo en un espacio distinto, mientras transcurre la espera del reforzador Contigüidad y Contingencia Diferencias entre contingencia y contigüidad. Contingencia: la entrega del reforzador es dependiente de la ocurrencia de la conducta Contigüidad: la cercanía entre la emisión de la conducta y la entrega del reforzador Algunas investigaciones han llegado a concluir que es la contigüidad y no la contingencia el elemento clave en el reforzamiento instrumental Un experimento clave en esta discusión fue el experimento de superstición de Skinner. Según el cual la entrega reforzamiento temporal originó conductas supersticiosas. Skinner lo interpretó como que la contigüidad entre el reforzador y la conducta operante “X” había dado lugar a conductas supersticiosas. Contigüidad y Contingencia Contigüidad y Contingencia Contigüidad y Contingencia Efecto de la controlabilidad de los reforzadores. Una contingencia fuerte entre una respuesta y la entrega de reforzador significa que la respuesta controla el reforzador Cuando esto no ocurre se produce el fenómeno conocido como indefensión aprendida: Los experimentos de indefensión aprendida utilizan el modelo triádico Efecto de la controlabilidad de los reforzadores. Una contingencia fuerte entre una respuesta y la entrega de reforzador significa que la respuesta controla el reforzador Cuando esto no ocurre se produce el fenómeno conocido como indefensión aprendida: Los experimentos de indefensión aprendida utilizan el modelo triádico Experimento de Indefensión Aprendida Luz roja, indica cuando comenzarán las descargas LADO A las rejillas del piso suministran descargas eléctricas LADO B las rejillas del piso no suministran descargas eléctricas En la primera fase: cuando se enciende la luz roja, se comienzan a suministrar descargar eléctricas en el lado A de la jaula, el perro logra escapar saltando hacia el lado B que no está electrificado En la segunda fase: vuelve a darse descargas eléctricas cuando se enciende la luz, pero el perro no puede saltar hacia el lado B porque la barrera es muy alta. El perro queda confinado al lado A En la tercera fase: se vuelve a poner la barrera a la altura inicial, pero ya el perro no intenta saltar. Se ha instaurado la indefensión aprendida Diseño triadico en la Indefensión Aprendida Grupo Fase de exposición Grupo E Descarga escapable Fase de Condicionamiento descarga escapable Prueba aprendizaje rápido del escape Grupo A Descarga acoplada inescapable descarga escapable aprendizaje lento del escape Grupo C Confinado al aparato aprendizaje rápido del escape descarga escapable por la exposición a descargas inescapables e incontrolables los sujetos aprenden que las descargas son independientes de su conducta, que son incontrolables