Programas de Reforzamiento y Conducta de Elección Domjan Cap. 6 Profesora: Carolina Mora.
Domjan 10 Control aversivo, evitación y castigo Prof: Carolina Mora.
-
Upload
lidia-paez-castillo -
Category
Documents
-
view
351 -
download
6
Transcript of Domjan 10 Control aversivo, evitación y castigo Prof: Carolina Mora.
2
En el procedimiento de evitación el individuo realiza una respuesta específica para impedir la presentación de un estímulo aversivo
A través del uso frecuente del cepillado evito las caries
Evitación
3
Orígenes del estudio de la conducta de evitación
Bechterev
Indicó a los participantes que colocaran un dedo sobre una bandeja de metal, luego presentaba un estímulo de advertencia (EC) que era seguido de una breve descarga (EI). Después de unos cuantos ensayos, aprendieron a levantar el dedo ante la señal de advertencia
Originalmente se considero erróneamente que este era un ejemplo de condicionamiento clásico común, aún cuando en el procedimiento pavloviano típico la realización de la respuesta condicionada no cancela la presentación del EI
4
cobayo
Grupo de condicionamiento clásico
Sonaba el EC (tono) y 2 seg después se aplicaba una descarga eléctrica.
El cobayo no podía hacer nada para evitarlo
Grupo de evitación
Sonaba el EC (tono) y si los animales movían la rueda mientras estaba presente el tono (EC), se omitía la descarga (EI)
El grupo de evitación aprendió muy pronto a dar la RC y a los 8 días de entrenamiento respondía a la totalidad de los ensayos,. En contraste, el grupo de Cond clásico nunca alcanzó este nivel de desempeño
El experimento de Brogden demostró que el Cond clásico es diferente al condicionamiento de evitación
5
El Procedimiento de Evitación Discriminada
Ensayo de EvitaciónEn este tipo de procedimiento se utilizan ensayos discretos. Cada ensayo se inicia con el estímulo de advertencia (EC). Los eventos que ocurran posteriormente dependen de lo que haga el participante. Si el sujeto emite la respuesta, el EC termina y el EI se omite en este ensayo.
Ensayo de Escape.Si el sujeto no emite le respuesta requerida, la descarga programada se presenta y se mantiene hasta que ocurra la respuesta
6
Evitación de Vaivén
Al inicio del ensayo se presenta un EC, por ejemplo: luz, si el animal cruza al otro lado, la descarga no se presenta
Evitación de vaivén en dos sentidos: el animal se desplaza de izquierda a derecha en el primer ensayo, y cuando se vuelve a encender la luz, debe desplazarse en sentido inverso.
Evitación de vaivén en un solo sentido. El animal empieza cada ensayo en el mismo lado del aparato y siempre se mueve en la misma dirección
7
Teoría de los dos procesos de la evitación
Proceso Descripción
Condicionamiento clásico del miedo al EC
El EC se ha emparejado en varias ocasiones al EI en los ensayos en que el organismo no da la respuesta de evitación. Dado que el EI es un estímulo aversivo, el EC llega a provocar miedo a través del condicionamiento clásico
Reforzamiento instrumental de la
respuesta de evitación
El aprendizaje de la respuesta instrumental ocurre debido a que esta termina con el EC y por lo tanto reduce el miedo condicionado
Es necesario destacar dos aspectos de la teoría de los dos procesos1. La dependencia mutua entre el condicionamiento clásico e instrumental. El
reforzamiento instrumental por medio de la reducción del miedo no es posible hasta que el miedo no se ha condicionado (por cond. Clásico
2. La explicación de la conducta de evitación en términos del escape del miedo condicionado más que en términos de la prevención de la respuesta
8
Análisis Experimental de la Conducta de Evitación
Experimentos sobre la pulsión adquirida
Este tipo de experimento se denominó originalmente de pulsión adquirida, pues la motivación para realizar la conducta instrumental (el miedo) no es innata (como el hambre o la sed) sino que se aprende por medio del condicionamiento clásico. Recientemente el procedimiento ha llegado a conocerse como Paradigma de Escape del Miedo (PEM)
9
La estrategia básica consiste en condicionar el miedo a un EC por un procedimiento de condicionamiento clásico puro en el que el EC se empareja con el EI sin importar lo que haga el sujeto.
En la siguiente fase del experimento, los sujetos son expuestos periódicamente al EC que provoca el miedo y se les permite realizar una respuesta instrumental que elimine el EC
Experimentos sobre la pulsión adquirida
Análisis Experimental de la Conducta de Evitación
10
Los experimentos de pulsión adquirida o de escape del miedo, por lo general, confirman las predicciones de la teoría de los dos procesos,. Es decir, la terminación de un estímulo aversivo condicionado es un reforzador eficaz de la conducta instrumental
Experimentos sobre la pulsión adquirida
Análisis Experimental de la Conducta de Evitación
11
Medición independiente del miedo durante la adquisición de la conducta de evitación
Este enfoque se basa en la suposición de que si el miedo motiva y refuerza la respuesta de evitación, entonces el condicionamiento de éste y el condicionamiento de la conducta instrumental deberían ir de la mano. Sin embargo, contrario a esta predicción, el miedo condicionado y la respuesta de evitación no siempre presentan una correlación elevada
12
Grupo ADe evitación
Grupo BNo evitación
Grupo CControl
Presencia del Estímulo discriminativo
Color A Color B Color C
Presencia del EI Descarga eléctrica Descarga eléctrica
NO EI = No hay descarga
Respuesta instrumental
Si el sujeto presiona el botón correcto puede escapar de la descarga
Sin importa lo que hiciera el sujeto, No había escape de la descarga
Respuesta de temor
Iba disminuyendo con los ensayos. Los participantes no tenían miedo al estímulo A porque habían aprendido a impedir la descarga
Iba aumentando con los ensayos
No hay
13
Extinción de la conducta de evitación por medio del impedimento de la respuesta y la exposición al EC solo
Un procedimiento de extinción de la conducta de evitación que resulta eficaz y ha sido ampliamente investigado se denomina inundación o prevención de respuesta. El procedimiento implica la presentación del EC en una situación de evitación sin el EI, pero con el aparato modificado de tal forma que el participante no pueda emitir la respuesta de evitación
Análisis Experimental de la Conducta de Evitación
14
Evitación NO discriminada (operante libre)
La teoría de los dos procesos hace mucho hincapié en el papel de la señal de advertencia o EC. Sin embargo Sidman (1935) ideó un procedimiento de evitación que no implicaba un estímulo de advertencia
Análisis Experimental de la Conducta de Evitación
15
Descarga eléctrica Descarga eléctrica
Intervalo E-E (intervalo entre descargas). En este ejemplo es de 5 segundos. Si el sujeto no da ninguna respuesta de evitación, al
finalizar los 5 segundos recibirá otra descarga
Período de seguridad porque aquí no ocurren descargas (este período es de 5 segundos)
Emisión de la respuesta instrumental de evitación. Esta respuesta la puede dar el sujeto en cualquier momento
Descarga eléctrica
Nuevo período de seguridad, aquí no ocurren descargas (este período es de 15 segundos)
Intervalo R-E (respuesta descarga) desde el momento en que el sujeto da la respuesta de evitación pasan 15 segundos antes de que aparezca otra nueva descarga
16
La conducta de evitación de operante libre supone un desafío para la teoría de los dos proceso, ya que no hay un EC explícito. Sin embargo, se ha argumentado que dado que los intervalos E-E y R-E usados en los procedimientos por lo general son breves (menos de un minuto) y se mantienen fijos durante el experimentos, es fácil predecirlos (condicionamiento temporal
Análisis Experimental de la Conducta de Evitación
Evitación NO discriminada (operante libre)
17
Si es cierto que se trata de un condicionamiento temporal, los sujetos no distribuirán sus respuestas al azar, sino que concentrarán sus respuestas al final del intervalo R-E, pues es aquí cuando las señales temporales provocan supuestamente la mayor cantidad de miedo y las respuestas instrumentales producen la mayor reducción del mismo
Análisis Experimental de la Conducta de Evitación
Evitación NO discriminada (operante libre)
18
Explicaciones Teóricas alternativas de la conducta de evitación
1. Reforzamiento positivo a través de la inhibición condicionada del miedo o de las señales condicionadas de seguridad
Las señales de seguridad que acompañan a la respuesta de evitación pueden proporcionar reforzamiento positivo para la conducta de evitación.
Dado que la mayoría de los experimentos de evitación no introducen indicadores especiales del período de seguridad. Debe suponerse que la introducción de un estímulo de retroalimentación explícito facilitaría el aprendizaje de una respuesta de evitación. Lo cual ha sido corroborado por muchos experimentos
19
Explicaciones Teóricas alternativas de la conducta de evitación
2. Reforzamiento de la evitación a través de la reducción de la frecuencia de la descarga
Las respuestas de evitación impiden la presentación de la descarga y por ende reducen la frecuencia de las descargas que recibe un organismo. De acuerdo a esta teoría la reducción de la frecuencia de descarga es fundamental para el reforzamiento de la conducta de evitación
20
Explicaciones Teóricas alternativas de la conducta de evitación
3. Evitación y reacciones de defensa específicas de la especie (RDEE)
Bolles suponía que las situaciones y los estímulos aversivos provocan fuertes respuestas incondicionadas innatas: huir (correr), congelarse (permanecer vigilantes pero inmóviles, excepto por la respiración, la búsqueda de áreas oscuras, la tigmotaxia (aproximarse a las paredes)
21
La configuración del ambiente determina qué reacción de defensa específica es la que ocurre:
La huida puede prevalecer cuando se dispone de una ruta de escapa
El congelamiento puede predominar si no hay salida
Una predicción importante de la teoría es que algunas respuestas de evitación se aprenderán más rápidamente que otras
22
Explicaciones Teóricas alternativas de la conducta de evitación
4. La inminencia depredadora y las conductas defensivas de recuperación
Distingue entre las respuestas defensivas, que reflejan la anticipación de un suceso dañino, y las respuestas recuperativas, que se asume que se realizan después del estímulo aversivo.
Las respuestas de defensa típicas de la especie, es más probable que ocurran en anticipación a los daños más que en respuesta al daño en sí mismo. El daño actual estimula respuesta recuperativas. En la hipótesis de la inminencia depredadora, se asume que la selección entre posibles respuestas defensivas no sucede mediante la supresión (castigo), de las que resultan ineficaces, sino mediante los diferentes niveles del daño percibido.
23
Se supone que a diferentes niveles de inminencia ocurren diferentes respuestas de defensa
Nivel de inminencia Conducta de defensa
Si una rata se ve obligada a buscar comida en un lugar donde frecuentemente hay serpientes
Ajusta su patrón de comida: sale menos frecuentemente de la madriguera y come más en cada excursión
Aparece una serpiente Congelamiento para que el depredador no la vea, ni la escuche .
La serpiente toca a la rata
La rata salta (a esta conducta se le llama respuesta de ataque inminente)
La rata no logra escapar del depredador
Agresión defensiva
24
Nivel de inminencia Conducta de defensa
Nivel más bajo de peligro percibido
preocupación
Nivel medio de peligro percibido
Miedo y vigilancia
Nivel más alto de peligro percibido
Pánico
En seres humanos
25
Castigo
El procedimiento básico del castigo es sencillo: se presenta un estímulo aversivo después de una respuesta instrumental. si el procedimiento es eficaz, la respuesta objetivo es suprimida
26
Análisis Experimental del Castigo
Los estudios de castigo en el laboratorio por lo regular empiezan con una fase preliminar en la que se establece la respuesta objetivo con reforzamiento positivo. Por ejemplo, una paloma puede ser reforzada con comida por picotear una tecla. Luego se sobrepone un procedimiento de castigo al programa de reforzamiento positivo, lo cual produce un conflicto entre responder para obtener el reforzamiento positivo y no hacerlo para evitar el castigo
27
Características del estímulo aversivo y del método con que se introduce
Estímulos aversivos:
Descargas eléctricas
bofetadas
Jugo de limón en la boca
28
Ráfaga de aire repentino
Estímulos aversivos:
Ruido fuerte
Infracción en la entrega del trabajo
Valor (-1 pto)
No incluyó índice -1
No incluyó resumen -1
Las citas de APA son incorrectas
-1
Restar puntos
29
Estímulos aversivos:
Tiempo fuera: se refiere a la eliminación de la oportunidad de obtener reforzamiento positivo
30
Estímulos aversivos:
La sobrecorrección implica pedir a la persona no solo que corrija lo que hizo mal, sino que sobrecorrija el error.
Si una persona no limpio su cuarto, la sobrecorreción implicará tener que limpiar toda la casa
31
Administración del castigo
Desde el inicio una descarga de alta
intensidad
La respuesta se suprime por completo
El castigo sólo alcanza una intensidad elevada
después de un aumento gradual
La supresión de la respuesta es menor
32
Estimulación aversiva contingente a la respuesta o independiente de la respuesta
La estimulación aversiva independiente de la respuesta puede producir cierta supresión de la conducta instrumental. Sin embargo, si el estímulo aversivo es ocasionado por la respuesta instrumental, la supresión de la conducta es significativamente mayor
33
Efectos de la demora del Castigo
Aumentar la demora del castigo produce menos supresión de la conducta. Si no puede castigar la respuesta objetivo de inmediato, más valdría no castigarla
34
Efectos de los Programas del Castigo
Cuando cada respuesta recibía una descarga (Castigo RF 1), el picoteo cesó por completo. Con los otros programas de castigo, la tasa de respuesta dependía de lo intermitente del castigo. Los programas con razones fijas más altas permitían que más respuestas quedaran sin castigo
35
Tipos y Programas de Reforzamiento Positivo
En la mayoría de las situaciones de castigo, la respuesta objetiva es mantenida al mismo tiempo por un programa de reforzamiento positivo: un estudiante que es castigado por violar el código de vestimenta al mismo tiempo es reforzado por la aprobación social de los pares por romper las reglas
36
Pelloux, Everitt y Dickinson, entrenaron ratas para presionar dos palancas: una palanca de búsqueda que funcionaba con un programa (IV 120) y permitía que apareciera otra palanca de consumo que conducía a recibir cocaína endovenosa como recompensa.
Palanca de búsqueda Palanca de consumoCocaina endovenosa
Durante la línea base los sujetos realizaron de 200 a 250 respuestas de búsqueda por sesión
37
La introducción del castigo (una descarga cada vez que se iniciaba la conducta de búsqueda) sólo fue efectivo para el grupo con entrenamiento moderado
Grupo 1:8 sesiones
Grupo 2:22sesiones
38
La resistencia al castigo es una consecuencia del uso de la cocaína como reforzador o dichos efectos pueden observarse luego del entrenamiento extensivo con otros reforzadores?
Pelloux y cols utilizaron sucrosa como reforzador y entrenaron a las ratas con un procedimiento idéntico al anterior. La búsqueda de sucrosa fue suprimida por el castigo independientemente de que los sujetos recibieran entrenamiento moderado o extensivo
39
Cuando la conducta es mantenida por un programa de IF o IV, el castigo produce una disminución de la tasa total de respuesta, pero la distribución temporal de la conducta no se ve alterada. Por ejemplo, el programa de IF se observa el típico patrón de festoneado.
En los programas de razón fija, el castigo suele producir una pausa post reforzamiento más larga pero tiene poco efecto sobre la carrera de razón
40
Disponibilidad de fuentes alternativas de reforzamiento positivo
Si la respuesta castigada es la única actividad de que dispone el sujeto para obtener reforzamiento, el castigo será mucho menos eficaz que si además de castigar al sujeto se le proporciona una fuente alternativa de reforzamiento.
Es decir disponer de una respuesta alternativa para obtener reforzamiento positivo incrementó considerablemente los efectos supresivos del castigo
41
Los niños castigados por divertirse con ciertos juguetes mostraban una probabilidad mucho menor de jugar con ellos, si a cambio se les permitía recrearse con otros juguetes
42
Efectos de un estímulo discriminativo para el castigo
Si la respuesta es castigada en presencia de un estímulo discriminativo pero no se castiga en su ausencia. Dicho procedimiento se denomina castigo discriminado. Con el entrenamiento del castigo discriminado los efectos supresivos del castigo quedarán limitados a la presencia del estímulo discriminativo
Los niños aprenden qué maestros son estrictos en relación con la disciplina y a suprimir su conducta bravucona con esos maestros más que con otros
43
El castigo como señal de la disponibilidad de reforzamiento positivo
Es posible que se busque el castigo si sólo se dispone de reforzamiento positivo cuando la respuesta instrumental también es castigada.
Primero se entreno a las palomas para picotear una tecla. En la siguiente fase del experimento se alternaron períodos en que estaba en efecto el castigo con otros en que no, pero la respuesta de picoteo sólo era reforzada con comida durante los períodos de castigo. En estas circunstancias ocurrieron tasas más altas de picoteo durante los períodos de castigo que durante los períodos seguros
44
Teorías del Castigo
La teoría de la Evitación del castigo
la teoría de la Respuesta Emocional
Condicionada
La mayor parte de ellas ha sido motivada por curiosidad empírica: ya que los investigadores estaban interesados
en averiguar cómo influyen diversas manipulaciones en el castigo
El castigo y la ley negativa del efecto
Teorías más destacadas
45
La Teoría de la Respuesta Emocional Condicionada
La supresión condicionada o respuesta emocional condicionada implica la supresión de una conducta que es provocada por un estímulo que se asoció con estimulación aversiva
Procedimiento de la supresión de la respuesta condicionada
Enseñamos a la rata a realizar continuamente una conducta (Ej: pulsar una palanca para obtener comida).
Paso 1 (pre-entrenamiento):
46
Procedimiento de la supresión de la respuesta condicionada
Paso 2 (entrenamiento):Entrenamos a la rata en el condicionamiento del miedo. Un EC (luz) se presenta antes de un EI aversivo (descarga), desencadenando una RI (se queda quieta por el miedo y deja de pulsar la palanca).
EC=Luz
EI Aversivo =Descarga
RI=Miedo
47
Procedimiento de la supresión de la respuesta condicionada
Paso 3 (Prueba):
EC=Luz RC=Miedo
No se presenta el EI, y vemos cuánta RC produce el EC por sí solo. Si la rata realmente tiene miedo, se quedará quieta, y por lo tanto dejará de hacer lo que estaba haciendo en ese momento (pulsar la palanca). Suprimirá esa respuesta de pulsación de palanca (Supresión).
48
Ya que los procedimientos de castigo por lo regular no involucran un EC explícito que señale la presentación del estímulo aversivo, esta función pasa a desempeñarla los estímulos y experiencias individuales que están presentes justo antes de emitir el castigo.
La vaca se acerca demasiado a la cerca eléctrica (conducta) y recibe una descarga (Estímulo aversivo). La respuesta castigada “ir demasiado lejos” se asocia con varias señales de los limites del campo (p.e el color o forma de las barra que forman la cerca) y esas señales adquieren propiedas aversivas condicionadas que pueden llegar a provocar el congelamiento, que es incompatible con la conducta castigada
La Teoría de la Respuesta Emocional Condicionada
49
La Teoría de la Evitación del Castigo
Se acepta la idea de que los estímulos que acompañan a la respuesta instrumental adquieren propiedades aversivas cuando la respuesta es castigada, pero además propuso que los organismos aprenden a escapar de los estímulos aversivos condicionados relacionados con la conducta castigada
Ahí está otra vez esa cara, la que puso cuando destruyó la oficina, mejor me voy antes de que se de cuenta que estoy aqui
50
La teoría de la evitación del castigo sugiere que todos los cambios producidos por el condicionamiento instrumental aversivo pueden ser explicados por los mecanismos de evitación, por lo que todos los problemas teóricos que se le achacan a la evitación pasan a ser parte de esta teoría
Otra dificultad para la teoría es que sus elementos fundamentales no están planteados de forma que se facilite su comprobación o refutación. Por ejemplo:• los estímulos que supuestamente adquieren propiedades aversivas no están
bajo el control de l experimentador sino que son eventos que experimenta el organismo.
• También están mal especificadas las respuestas de evitación que supuestamente son adquiridas, por lo que la teoría no puede predecir cuáles serán esas respuestas o cómo podríamos identificarlas o medirlas
La Teoría de la Evitación del Castigo
51
El Castigo y la ley negativa del efecto
Thorndike (1911) propuso que el reforzamiento positivo y el castigo involucran procesos simétricamente opuestos. Así como el reforzador positivo fortalece la conducta, el castigo la debilita
52
Rasmussen y Newland (2008) trabajaron con estudiantes universitarios utilizando un programa concurrente. Por acertar a unos blancos móviles que aparecían en una pantalla se le daba a los sujetos 4 centavos y el estímulo aversivo era la pérdida de 4 centavos
Imponer un castigo en un programa concurrente sesgó las respuestas a favor de la alternativa no castigada
El castigo fue tres veces más eficaz que el reforzamiento. Los autores concluyen que la pérdida de un centavo es tres veces más aversiva que lo reforzante que puede ser la obtención del mismo centavo
53
El Castigo fuera del laboratorio
Los procedimientos de castigo son sumamente susceptibles al abuso. Incluso si se aplican de manera apropiada, existen serias restricciones éticas al uso del castigo
El castigo por lo general no se aplica de manera eficaz. Cuando se introduce suele hacerse con intensidades bajas y es posible que el estímulo aversivo no se presente inmediatamente después de la respuesta, sino que se demore hasta quesea conveniente aplicarlo
54
Es raro que el castigo sea acompañado por fuentes alternativas de reforzamiento, pues es mucho más fácil reaccionar a las transgresiones que asegurar el reforzamiento de las conductas apropiadas
A menudo existen estímulos discriminativos claros para el castigo. La conducta no deseada sólo puede monitorearse en momentos particulares o por una determinada persona, lo que hace probable que la conducta castigada solo se suprima en esos momentos
55
Un acto de castigo por frustración puede violar muchas de las directrices para el uso eficaz del castigo. Castigar a alguien en un acto de enojo y frustración no es una forma de entrenamiento sistemático sino de abuso
56
El castigo corporal se asocia con consecuencias no planeadas, como la agresión por parte de los niños, problemas en su salud mental y problemas en la relación padre hijo
57
Los padres que son propensos al uso del castigo pueden ser fríos y distantes en la relación con sus hijos y estar menos dispuestos a recompensarlos por el buen comportamiento, o pueden ser severos y punitivos de distintas maneras, una de las cuales es el castigo corporal