Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

25
TEMA 14 EL CONDICIONAMIENTO OPERANTE. PARADIGMA Y MODELOS 1. EL ENSAYO Y ERROR. LA LEY DEL EFECTO En el condic clásico la causalidad es lineal, el refuerzo (EI) aparece antes de la RC. En el condic operante la causalidad es circular, hay un feedback o retroalimentación el refuerzo aparece después de la RC; esto supone un nivel superior en el aprendizaje. Thorndike señaló que lo que se producía en el condic era una conexión a nivel neural entre un estímulo y una respuesta (E-R), en lugar de conexión entre estímulos. Construía “cajas problemas” especie de jaulas cuya puerta tenía que abrir el animal, manipulando un resorte, para salir y conseguir la comida que se le colocaba en el exterior. Después, enunció la ley del efecto indicando que: cuanto mayor es la satisfacción o desagrado que acompaña a la conducta de un sujeto, mayor será el fortalecimiento o debilitación del vínculo (conexión E-R). Cayó en la cuenta de que la segunda parte de la ley no era cierta. La consecuencia de desagrado no produce debilitación de la conexión. Esta ley fue muy criticada por Skinner, ya que no le interesaban las conexiones neurales en el cerebro sino la respuesta operante, entendida como acto del organismo que produce un efecto específico en el ambiente. Si para Thordike aprender es reforzar la conexión E-R, para Skinner es aumentar la probabilidad de que el organismo emita la respuesta. Según éste, lo que se refuerza no es la conexión E-R, sino la respuesta operante; así, transforma la ley del efecto en la ley del refuerzo. Si Thorndike había convertido el ensayo y error en condic instrumental, Skinner convierte el condic instrumental en condic operante. Thorndike enseña que de todos los movimientos que ensaya el animal se condiciona aquel que es “instrumento” para conseguir el refuerzo (la comida). Para Skinner, en cambio, una operante que se emite libremente y es reforzada se condiciona, sin

Transcript of Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

Page 1: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

TEMA 14EL CONDICIONAMIENTO OPERANTE. PARADIGMA Y MODELOS

1. EL ENSAYO Y ERROR. LA LEY DEL EFECTO En el condic clásico la causalidad es lineal, el refuerzo (EI) aparece antes de la RC. En el condic operante la causalidad es circular, hay un feedback o retroalimentación

el refuerzo aparece después de la RC; esto supone un nivel superior en el aprendizaje.

Thorndike señaló que lo que se producía en el condic era una conexión a nivel neural entre un estímulo y una respuesta (E-R), en lugar de conexión entre estímulos.

Construía “cajas problemas” especie de jaulas cuya puerta tenía que abrir el animal, manipulando un resorte, para salir y conseguir la comida que se le colocaba en el exterior.

Después, enunció la ley del efecto indicando que: cuanto mayor es la satisfacción o desagrado que acompaña a la conducta de un sujeto, mayor será el fortalecimiento o debilitación del vínculo (conexión E-R).

Cayó en la cuenta de que la segunda parte de la ley no era cierta. La consecuencia de desagrado no produce debilitación de la conexión.

Esta ley fue muy criticada por Skinner, ya que no le interesaban las conexiones neurales en el cerebro sino la respuesta operante, entendida como acto del organismo que produce un efecto específico en el ambiente.

Si para Thordike aprender es reforzar la conexión E-R, para Skinner es aumentar la probabilidad de que el organismo emita la respuesta. Según éste, lo que se refuerza no es la conexión E-R, sino la respuesta operante; así, transforma la ley del efecto en la ley del refuerzo.

Si Thorndike había convertido el ensayo y error en condic instrumental, Skinner convierte el condic instrumental en condic operante. Thorndike enseña que de todos los movimientos que ensaya el animal se condiciona aquel que es “instrumento” para conseguir el refuerzo (la comida). Para Skinner, en cambio, una operante que se emite libremente y es reforzada se condiciona, sin que entren en consideración ninguna conexión ni ninguna finalidad.

2. ¿CONDICIONAMIENTO INSTRUMENTAL O CONDIC.OPERANTE? Se llama condicionamiento instrumental, porque convierte a la respuesta (conducta)

en un instrumento para conseguir una consecuencia, ya que la respuesta no es elicitada sino emitida voluntariamente. La emite el organismo espontáneamente y nada más: es como una conducta voluntaria. En el caso de la respuesta elicitada la iniciativa la tiene el estímulo, en el caso de la respuesta emitida la iniciativa la tiene el organismo.

Thorndike usó la técnica de los ensayos discretos (emitir una sola respuesta en cada ensayo).

Otro aparato utilizado con la técnica de ensayos discretos es el laberinto de dos brazos o laberinto en T y el corredor recto, en cuyos costados hay células fotoeléctricas que ponen en funcionamiento y que paran el cronómetro.

Skinner llamó a cada realización de una especie de conducta una operante. Así la conducta de pulsar una palanca espontáneamente es una operante, cada picoteo de una paloma en el estímulo determinado es una operante.

Page 2: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

Skinner ideó la técnica de operante libre (emitir cuantas respuestas desee en cada ensayo), permitiendo estudiar una conducta de una manera continua, a través de registros acumulativos, facilitando la división de la misma en unidades significativas, que igualmente se pueden medir.

De este modo, las respuestas operantes se llegaron a utilizar habitualmente en el estudio del condic instrumental, y éste pasó a denominarse: condicionamiento operante.

Skinner ideó una situación experimental especial mediante la creación de su célebre “caja de Skinner”, que tiene en su interior una palanca que cuando el animal la presiona hace que un dispositivo automático suministre en su comedero una cantidad fija de comida. El uso de la palanca se hace con ratas y el uso de un disco donde picotear con palomas.

Por otra parte, cada vez que el animal presiona la palanca, la conducta es registrada por un aparato llamado “registrador acumulativo”. El aparato posee un rollo de papel que lo va suministrando de una manera continua y con una velocidad constante. Una aguja que traza continuamente una línea sobre el papel pautado, se desplaza y marca en el papel cada respuesta, con lo que se obtiene lo que se llama un registro acumulativo. Cuando no hay respuestas la línea que marca la aguja es recta, pero con cada respuesta se produce un escalón.

En la caja de Skinner no hay ensayos discretos. No hay pues, número de ensayos, sino tasa de respuestas.

3. REFORZADOR, REFUERZO Y REFORZAMIENTO Reforzador: estímulo apetitivo o premio (comida) que aparece o al estímulo

aversivo (shock eléctrico) que desaparece cuando se ejecuta una conducta operante. Refuerzo (o reforzar): es la situación o procedimiento experimental de presentar o

hacer desaparecer un reforzador si se emite una condcuta determinada. Puede ser de dos tipos:

- refuerzo positivo: si se da una respuesta aparece el reforzador (contingencia positiva)

- refuerzo negativo:si se da una respuesta desaparece el reforzador (contingencia negativa)

Reforzamiento: proceso interior de fortalecer la conexión entre un estímulo y la respuesta

Tudela señala que reforzamiento se refiere al proceso subyacente de lacrado que se supone que fortalece o aumenta la probabilidad de una respuesta.

Reforzador---------se refiere a --------estímulo Refuerzo------------------“------------- la situación o procedimiento experimental Reforzamiento---------- “--------------fortalecimiento de un proceso interior En el castigo se debilita la respuesta o se anula. La contingencia sólo indica la situación de relación entre una conducta y el estímulo

que le sigue, no es el proceso de refuerzo.

4. CONTIGÚIDAD Y CONTINGENCIA Si el condic clásico es expresado en términos de contigüidad (simultaneidad), el

condic operante se expresa en términos de contingencia (probabilidad).Así:

- dos sucesos son contiguos cuando ocurren simultáneamente o en rápida sucesión dentro de un determinado período temporal

Page 3: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

- dos sucesos son contingentes cuando ocurren conjuntamente según una cierta probabilidad.

5. EL PARADIGMA DEL CONDIC. OPERANTE Es conocido como: paradigma E-R, aprendizaje por relación de un estímulo con una

respuesta. En el paradigma del condic operante se pueden realizar sólo dos acciones:

- Reforzar: aumentar la probabilidad de una respuesta.- Castigar: disminuir la probabilidad de una respuesta.

El condic operante es aprendizaje, porque es un cambio de la conducta como fruto de la experiencia.

Tanto el refuerzo como el castigo pueden ser positivos o negativos. Positivo significa que está el estímulo que refuerza o que castiga una conducta

(contingencia positiva) Negativo significa que no está el estímulo que refuerza o que castiga una conducta

(contingencia negativa) Para determinar los modelos o subparadigmas del condic operante, hay que conjugar

dos variables:- la contingencia respuesta-reforzador: positiva o negativa- la naturaleza del reforzador: agradable (premio) o aversivo (nocivo).

Es el tipo de reforzador (premio o estímulo aversivo) y la presencia o ausencia de él lo que determina los cuatro modelos del condic operante. Se establecen cuatro modelos o subparadigmas del condic operante:

- Condicionamiento de recompensa (refuerzo positivo): es el modelo más tradicional y típico del condic operante. Su función es aumentar el vigor de una respuesta por ser ésta contingente con un premio.

- Castigo (castigo positivo): es el condic con estímulo aversivo presente. Su función es la desaparición de una respuesta por ser ésta contingente con el estímulo aversivo.

- Condicionamiento de evitación (refurezo negativo): se refuerza la aparición o vigor de una conducta negativamente. La evitación es reforzante, porque es la consecución del “no castigo”, y la omisión es castigante porque es la consecución del “no premio”. Presenta dos modalidades: Evitación: la emisión de la respuesta hace que no aparezca el estímulo

aversivo Escape: la emisión de la respuesta hace que desaparezca el estímulo

aversivo.- Condicionamiento de omisión (castigo negativo): la emisión de la respuesta

es contingente con la ausencia del premio. Su función es la debilitación o desaparición de la respuesta.No debe confundirse con la extinción del condic de recompensa, pues en la omisión el reforzador está presente en el ambiente y la respuesta lo omite; en la extinción el reforzador no está presente en el ambiente y la respuesta no hace que aparezca.

Con

ting

enc

ia +Recompensa

(Refuerzopositivo)

Castigo(Castigopositivo)

Page 4: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

Res

pues

ta/

Ref

orza

dor -

Omisión(Castigo negativo)

Evitación(Refuerzonegativo)

Apetitivo AversivoNaturaleza del

Reforzador

6. VARIABLES EN EL CONDIC. OPERANTE El reforzador: es cualquier estímulo apetitivo o aversivo que hace aumentar la

probabilidad de emisión de una respuesta o el vigor de la misma.Skinner lo define en función de su efecto sobre la respuesta contigua anterior. Sin embargo, esta concepción no explica los siguientes fenómenos:

- la polidipsia: es el fenómeno que presentan algunos animales, como las ratas, de consumir una extraordinaria cantidad de agua cuando estando hambrientas reciben comida, según un programa de intervalo fijo

- la conducta supersticiosa: es un fenómeno que muestran algunos animales, como, palomas, consistente en la aparición de unas conductas personales (cada uno la suya), cuando se suministra el reforzador con independiencia de la conducta que realiza el animal, cada cierto tiempo. El refuerzo, ene ste caso, no provoca el aumento de probabilidad de una respuesta, sino la direccionalidad de la conducta.

La respuesta: es una conducta espontánea y activa, no una conducta respondiente y pasiva.

- No todas las respuestas pueden condicionarse, existen limitaciones filogenéticas.

- El concepto de preparación de Seligman indica que la conducta que tiene preparación filogenética se condiciona con mucha mayor facilidad.

El estímulo discriminativo: es la clave explícita que se destaca en la situación, indicando únicamente cuando está o no disponible el refuerzo. No provoca la respuesta, sólo informa de ella.La conexión E-R en el condic operante no es la conexión de la luz (estímulo discriminativo) y oprimir la palanca (respuesta operante), sino que es la conexión de la percepción de la palanca con la respuesta de presionarla.

El tiempo de privación: es la variable más utilizada para motivas al animal, siendo necesaria para que un estímulo reforzante cumpla con su condición de ser refuerzo (ej, privar de alimento unas horas).

7. LA MEDIDA DE LA RESPUESTA EN EL CONDIC. OPERANTE La medida de la respuesta se realiza fundamentalmente por dos parámetros:

- tasa de respuestas en un período de tiempo dado. Es un concepto genérico. En la caja de Skinner la tasa de respuestas es el número de veces que se presiona la palanca durante un período.También es tasa de respuesta la medida de la velocidad con que un sujeto ejecuta una operación. (en el corredor recto la tasa de respuesta es el tiempo que tarda el animal en recorrer el pasillo hasta llegar a la meta).Cuando se trata de medir una respuesta continua, como la actividad de deambular un animal el instrumento más usual es la rueda de actividad, una rueda en la que deambula el animal y que va girando conforme el animal camina.

Page 5: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

La tasa de respuesta por tanto, puede significar: * el número de veces que se ejecuta una conducta, * la velocidad de realizar una conducta, * el espacio a lo largo del cual se ejecuta una conducta.

- latencia de la respuesta.Es el tiempo que pasa desde que el sujeto se encuentra en la situación hasta que emite la respuesta.

Existen otros parámetros: número de ensayos, intervalo entre ensayos, magnitud y demora del refuerzo.

8. PROGRAMAS DE REFUERZO O CASTIGO Son una pauta para presentar el premio o el estímulo aversivo. Los más tradicionales

son:- Programa de razón fija (RF): se refuerza la primera respuesta después de

emitir un número predeterminadas de ellas. si ponemos RF 3, quiere decir que se refuerza siempre la respuesta

número 3, desde el último refuerzo suministrado. se aumenta la velocidad con que se emiten las respuestas. La latencia

de la respuesta disminuye.

- Programa de razón variable (RV): se refuerza según un índice de razón también, aunque éste no es fijo, sino una serie aleatoria con una razón media definida.

al símbolo RV se le añade el número que indica el índice de razón media.

se produce tasa de respuestas alta y estable. Alta porque cuanto más rápido se responde más pronto se recibe el refuerzo. Estable , porque la variabilidad del programa hace que sea difícil descubrir la respuesta que será premiada, por tanto se responde constantemente.

- Programa de intervalo fijo (IF): se refuerza la primera respuesta que ocurre después de un intervalo fijo de tiempo transcurrido a partir del último refuerzo suministrado.

IF 5 significa que se refuerza la primera respuesta después de haber pasado cinco minutos desde el refuerzo anterior

produce una pausa en la emisión de la respuesta después de haber conseguido el refuerzo y un aumento significativo de la tasa de respuestas cuando se acerca al final del intervalo.

- Programa de intervalo variable (IV): se refuerza la primera respuesta después de transcurrido un tiempo, cuya duración es aleatoria (variable), siendo su valor medio constante.

IV 5 significa que el intervalo medio entre dos refuerzos es de cinco minutos, pero los intervalos reales son diferentes (tres, cinco, nueve.,etc)

no se puede averiguar el momento en que el refuerzo está disponible, por lo que la tasa de respuesta es constante, pero baja.

9. PROGRAMAS DE REFUERZO CONCURRENTES Y PROGRAMAS DE REFUERZO ENCADENADOS. EL ESTUDIO DE LA CONDUCTA DE ELECCIÓN

Page 6: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

En estudio experimental de los programas de refuerzo ante situaciones complejas se realiza a través de la conducta de elección.

Se entiende por conducta de elección aquella en que se deja al animal elegir entre varias opciones, que llevan cada una a un programa de refuerzo por un tiempo determinado; una vez finalizado éste, se le permite una nueva elección.

Se han utilizado, fundamentalmente, dos programas de refuerzo ante situaciones complejas:

- Programas encadenados: se presentan al animal varias alternativas, cuando escoge una, la conducta del organismo queda encadenada durante un tiempo a un programa de refuerzo. Con este tipo de programas se ha puesto de manifiesto la importancia que tiene la inmediatez en la obtención del refuerzo, ya que el animal elige este programa aunque con otros se dispensaran a la larga más reforzadores.

- Programas concurrentes: se permite al organismo escoger entre alternativas, siempre presentes, estando cada una de ellas sustentada por un programa de refuerzo.

Los programas concurrentes permiten estudiar la elección más frecuente que hace el animal y la influencia que tiene el programa de refuerzo en la elección, midiendo: la tasa relativa de respuestas y la tasa relativa de refuerzos.

Para la ley de la igualación de Herrnstein, la conducta de elección se realiza según la tasa relativa de refuerzos; así, la tasa relativa de respuestas a una alternativa es igual a la tasa relativa de refuerzos que se recibe en esa alternativa. Para explicar esta ley, existen dos hipótesis:

- la hipótesis de la optimización del refuerzo, que puede ser de dos maneras: optimización global (molar): se escoge distribuyendo las respuestas

entre varias alternativas, de tal manera que globalmente, en un período de tiempo, se obtenga la mayor cantidad de refuerzo

optimización molecular (momentánea): se escoge siempre la alternativa con más probabilidades de ser reforzada en ese momento.

- la hipótesis de la mejora: lo que hace que el animal cambie de alternativa entre una conducta y otra es la mejora de la tasa puntual de refuerzo que están recibiendo. Esta hipótesis sí explicaría el mecanismo que subyace a la ley de la igualación.

10. ALGUNA CONSIDERACIÓN SOBRE LAS TEORÍAS DEL REFUERZO Entre las teorías sobre el refuerzo, las más importantes son:

- La teoría de la reducción del impulso (Hull): hace referencia a la motivación señalando que la consecución de la comida reduce su impulso de hambre.

- La teoría de la expectativa (Bolles): se centra en el incentivo que produce la mayor cantidad de comida o su mejor calidad en el animal; así explica que el refuerzo refuerce.

- La teoría de la estimulación cerebral (Olds y Milner) en conexión con estas teorías motivacionales

- Frente a todas ellas está la teoría de la prepotencia de la respuesta (Premack): sostiene que el reforzador es una respuesta que tiene más probabilidad de ser emitida que la respuesta reforzable.

TEMA 15CONDICIONAMIENTO OPERANTE DE RECOMPENSA

Page 7: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

1. ADQUISICIÓN DEL APRENDIZAJE INSTRUMENTAL DE RECOMPENSA

La adquisición en el condic de recompensa consiste en:- un aumento de la frecuencia con que se emite una conducta operante, o- en la aparición de una nueva conducta operante que no existía con

anterioridad. Lo característico de la adquisición es:

- esperar a que dicha conducta ocurra, para que después pueda ser reforzada- crearla a través del procedimiento de modelado (shaping) usando una

combinación de refuerzo y no-refuerzo, que permite cambiar respuestas simples ya existentes en respuestas nuevas más complejas. La razón del modelado o shaping es que cuando reforzamos una respuesta reforzamos indirectamente otras actividades en conexión con esa respuesta.

2. PARÁMETROS EN LA RECOMPENSA La variable más importante es el reforzador, de ella podemos medir varios

parámetros:- Cantidad de refuerzo. Tiene dos acepciones:

cantidad de reforzador: el condic es mejor conforme es mayor la cantidad y calidad del reforzador

la tasa de refuerzo que se suministra: en general, al aumentar la tasa de refuerzo aumenta la tasa de respuesta

- Efecto de contraste: consiste en varias la magnitud de la recompensa durante el período de adquisición. Si cambiamos de poca a mucha recompensa, el condic mejorará. Los efectos de contraste pueden ser: positivos, y lo llamamos elación negativos, y lo llamamos depresión.

- Deprivación: cuanto más deprivado esté un organismo mayor será la acción de reforzamiento que produzca el reforzador. La deprivación afecta tanto a la ejecución como al aprendizaje. Ésta es la parte observable de una función ps activadora compleja que se conoce como motivación. Así, la motivación es: el impulso que el animal siente, por la necesidad provocada con la

privación una función activadora, no programadora de la conducta como lo es el

aprendizaje un impulso autorregulativo del organismo que activa la conducta para

conseguir un equilibrio- Demora del refuerzo, ésta provoca tres tipos de efectos:

existe un límite de tiempo máximo de demora, en el que ya no se produce el aprendizaje

retrasa la adquisición del aprendizaje disminuye el rendimiento en la ejecución del aprendizaje ya adquirido.

3. LA EXTINCIÓN DEL CONDICIONAMIENTO OPERANTE DE RECOMPENSA

Entendemos por extinción en el condic de recompensa a la acción de suprimir el refuerzo a una conducta, con el fin de que el sujeto no pueda, de ninguna manera, obtener dicho refuerzo.

Existen dos fenómenos generales de la extinción:

Page 8: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

- al inicio de la extinción, la tasa de respuesta aumenta y se hace más vigorosa. Inmediatamente después de este corto período la tasa de respuesta comienza a declinar

- el fenómeno de la recuperación espontánea o aumento de la tasa de respuesta en la sesión posterior.

Las variables que afectan a la extinción, se relacionan con la resistencia a la extinción, son:

- magnitud del reforzador: a mayor magnitud durante la adquisición, mayor resistencia

- número de refuerzos recibidos: a más esfuerzos durante la adquisición, mayor resistencia

- esfuerzo requerido para realizar la respuesta: cuanto más esfuerzo, mayor resistencia

- programa de refuerzo: en general, los programas de refuerzo parcial producen mucha mayor resistencia a la extinción que los programas de refuerzo continuo

- magnitud de la motivación durante la extinción: a mayor motivación mayor resistencia

4. APRENDIZAJE DISCRIMINATIVO Y CONTROL DE ESTÍMULOS Al reforzar una respuesta, la ponemos bajo el control de los estímulos presentes

durante el refuerzo; esto es muy importante, porque si controlamos esos estímulos, controlamos, a su vez, la conducta.

Los estímulos discriminativos son aquellos que controlan una conducta. No provocan o elicitan una conducta, sólo indican que el refuerzo está o no disponible si se ejecuta la respuesta.

El aprendizaje discriminativo es el realizado mediante la discriminación de estímulos.

El poner una respuesta bajo control de un estímulo produce un proceso de generalización de estímulos parecidos, que sólo se diferencian en su valor. Igualmente, la respuesta bajo control se generaliza a otras respuestas.

La generalización y discriminación de estímulos son procesos complementarios. Así, la generalización es el punto de partida para la discriminación

El aprendizaje realizado mediante los procesos de discriminación de estímulos se llama aprendizaje discriminativo.

5. CONDICIONAMIENTO OPERANTE DE SEGUNDO ORDEN Los reforzadores secundarios (o condicionados) son estímulos contiguos a un

reforzador primario que se condicionan clásicamente para producir sus mismos efectos de reforzamiento.

Así, al condic que se establece mediante estos reforzadores secundarios se le llama condicionamiento de segundo orden.

Pasos del proceso:- existe un estímulo que no tiene consecuencia sobre la conducta anterior

contingente con él- es necesario que esta experiencia de aparecer asociado el estímulo ineficaz

con el reforzador primario se produzca repetidas veces- este reforzador condicionado, se dice que está basado en el reforzador

primario experimentado por el organismo. La medida de la fuerza de un reforzador secundario se establece por su:

- durabilidad: veces que el reforzador condicionado tiene efectos de reforzador primario

Page 9: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

- potencia: magnitud relativa en mantener una conducta. Depende de varios factores:

número de veces que se aparea con el reforzador primario nivel de motivación bajo el que se produce el apareamiento con el

reforzador primario distancia entre el reforzador condicionado y el reforzador primario en

una cadena de conducta Siempre la potencia de un reforzador secundario es menor que la de un reforzador

primario.

TEMA 16CONDIC. OPERANTE CON ESTÍMULO AVERSIVO

1. INTRODUCCIÓN Hay tres situaciones de condic en que se utiliza el estímulo aversivo:

- Castigo: la emisión de una respuesta hace aparecer el estímulo aversivo de manera ineludible e inescapable.

- Escape: la emisión de una respuesta permite huir del estímulo aversivo que estaba presente.

- Evitación: la emisión de una respuesta tiene como consecuencia que no aparezca el estímulo aversivo.

Con respecto al efecto que estas situaciones producen en la conducta, podemos decir que:

- el castigo tiene por efecto el que no emitamos una conducta: en él no hay reforzamiento

- el escape y la evitación tienen como efecto aumentar la posibilidad de la conducta de escape o de evitación del estímulo aversivo; por tanto, hay reforzamiento, y por eso reciben ambas el nombre de refuerzo negativo. es refuerzo, porque el estímulo aversivo incrementa o mantiene la

respuesta de escape o evitación es negativo, porque lo que se refuerza es la conducta que hace que no

esté el estímulo (reforzador)

2. REFUERZO NEGATIVO2.1. Escape Consiste en dar una respuesta que haga desaparecer un estímulo aversivo, una vez

que éste ha comenzado a estar presente- no hay castigo porque huímos del estímulo aversivo y hay un incremento o

mantenimiento de una conducta: la conducta de escapar.- tampoco hay evitación, porque el estímulo aversivo siempre se presenta,

aunque luego escapemos de él. La adquisición y mantenimiento del condic de escape sigue las mismas reglas que el

condic de recompensa. En el condic de escape el estímulo discriminativo es el mismo estímulo aversivo. Se diferencia de la conducta de defensa, en que esta última es una conducta

respondiente, condicionada clásicamente y evocada por el estímulo, mientras que el escape es una conducta operante que no es evocada o elicitada, sino que es reforzada.

Hay dos situaciones de provocar extinción en el condic de escape:

Page 10: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

- se mantiene presente el estímulo aversivo, aunque se emita la conducta de escape; produce indefensión en el animal y un decremento de la respuesta de escape lento y errático, como señala Reynolds

- no se presenta el estímulo aversivo; produce una extinción más rápida.

2.2. Evitación Consiste en que si el sujeto emite una respuesta cuando aparece el estímulo

discriminativo, previo al estímulo aversivo, éste último no aparecerá. La evitación es más eficaz para establecer una conducta motora que el condic

clásico de defensa. Mowrer elabora una teoría para explicar el aprendizaje de evitación: la teoría de los

dos procesos, señalando que lo que primero ocurre es un proceso de condic clásico de respuesta emocional de miedo a un EC y, después, es el refuerzo de la respuesta de escape lo que reduce ese miedo.

El paradigma de evitación de Sidman es un paradigma experimental (no teórico) que utiliza un procedimiento con dos programas de intervalos para conseguir un aprendizaje de evitación sin estímulo discriminativo.

En el primer programa, programa A, el intervalo es fijo y aparece el estímulo aversivo cada x tiempo (un segundo o dos). Si el animal emite entonces una conducta de evitación (por ejemplo, presionar una palanca) se interrumpe este programa y aparece el segundo programa, el programa B, según el cual el estímulo aversivo se retrasa (por ejemplo, diez segundos). Al cabo de esos diez segundos aparecería de nuevo el programa A, pero si antes de esto el animal presiona de nuevo la palanca, viene una nueva demora del estímulo aversivo de diez segundos, con lo cual el animal puede llegar a evitar duraderamente la aparición del estímulo aversivo.

El paradigma de evitación de Sidman se trata de un aprendizaje de evitación sin estímulo discriminativo.

Existen dos procedimientos de extinción en el condic de evitación:- impedir la conducta de evitación no dejando al animal dar la respuesta, con

lo que el animal puede asociar la no emisión de la respuesta de evitación y la no presentación del estímulo aversivo.

- suministrar el estímulo aversivo aunque el animal emita la conducta de evitación; en este caso, la extinción tiende a ser más lenta, creándose situaciones perturbadoras de indefensión.

3. CASTIGO Es el proceso por el que un estímulo aversivo es contingente con la emisión de la

respuesta. En él no hay refuerzo, porque su efecto es la disminución o supresión de la

respuesta; por eso, es castigo no refuerzo. Su objetivo es entrenar a los sujetos a que no den una respuesta concreta. Su

principal efecto es la supresión de una conducta operante. Thorndike consideraba que el castigo no era eficaz; en cambio, la moderna

investigación demuestra de modo innegable la eficacia del castigo. Actualmente, se tiende a explicarlo en interacción con las respuestas específicas innatas de los organismos antes los estímulos aversivos.

Las principales características del castigo como aprendizaje operante son:

Page 11: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

- para ser eficaz tiene que ser continuado; si se suprime, la conducta tiende a aparecer de nuevo, incluso con mayor frecuencia

- conforme el castigo es más fuerte, la supresión de la conducta castigada es mayor

- los castigos de más duración suprimen la conducta más que los castigos de corta duración

- su demora tiene los mismos efectos atenuantes que la demora del refuerzo en la recompensa.

Sobre los efectos perjudiciales del castigo, las investigaciones actuales indican que no produce neurosis de modo necesario, aunque puede producir síntomas neuróticos en situaciones de mala aplicación.

3.1. El entrenamiento de omisión Consiste en que la emisión de una respuesta impide la aparición de un premio; en

esta situación no hay reforzamiento, por lo que se denomina, también: castigo negativo.

Ha sido muy utilizado el enfoque discriminativo de la omisión o de período de tiempo fuera, cuyo efecto es la supresión de la respuesta cuando un estímulo discriminativo señala que el premio no está disponible.

La versión no discriminativa del condic de omisión no ha sido muy utilizada.

TEMA 18ASPECTOS COGNITIVOS EN EL CONDIC OPERANTE:

Procesos interiores en el refuerzo parcial. El aprendizaje observacional

1. LOS ESTÍMULOS INTERIORES O PROCESOS INTERIORES EN EL REFUERZO PARCIAL

Los estímulos interiores, que son diferentes de los estímulos internos o interoceptivos, son hechos o eventos de conciencia, cognitivos o emocionales que actúan como auténticos estímulos consiguiendo hacer aparecer, mantener y controlar una conducta. Con ellos se da paso a un nivel de conducta más superior: el nivel cognitivo.

En los programas de aprendizaje con refuerzo parcial aparecen dos fenómenos que se explican por la existencia de un proceso interior que hace las veces de reforzador, cuando el estímulo externo ha dejado ya de actuar.

- la resistencia a la extinción en el refuerzo parcial es mucho mayor que con refuerzo continuo, por eso los estudios sobre la resistencia a la extinción sirven tanto para distinguir el condic clásico del operante como para separar el condic operante del modelo de aprendizaje con estímulo o procesos interiores

- el efecto patterning . En él se invierte la ley general del aprendizaje instrumental, de tal manera que a un refuerzo sigue una menor probabilidad de la respuesta. Consiste en que si sometemos a un sujeto experimental a un programa de refuerzo parcial en secuencia alternativa regular N R N R N R, donde N indica ensayo no reforzado y R indica ensayo reforzado, encontramos que el animal corre más después de los ensayos N que tras los ensayos R.- Su estudio es importante porque lleva también a la admisión de procesos

cognitivos:

Page 12: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

se considera efecto, porque en él se invierte la ley general del aprendizaje instrumental

se considera patterning, porque el refuerzo ® y no refuerzo (N) siguen un determinado patrón.

Del estudio de ambos fenómenos ha surgido la controversia Amsel-Capaldi, los dos autores que postulan dos teorías que explican el proceso de la interiorización del estímulo reforzante. Estas teorías discrepan en cuál es el mecanismo que interioriza o hace las veces del estímulo reforzante y en la naturaleza de los estímulos reforzantes interiorizados:

- para la teoría de la frustración condicionada (Amsel), el mecanismo que interioriza el estímulo es un mecanismo de aprendizaje, según los modelos clásico e instrumental.

- no hay apelación a algún proceso cognitivo- los estímulos reforzantes interiorizados son de naturaleza emocional

- para la teoría secuencial de Capaldi, el mecanismo interiorizador del estímulo reforzante se trata de un proceso cognitivo

- los resultados del proceso de interiorización son de naturaleza sensorial

las interpretaciones teóricas de la resistencia a la extinción en el refuerzo parcial son cuatro:

- hipótesis de la discriminación: explicaría la resistencia a la extinción en el refuerzo parcial, porque los animales no discriminarían entre el proceso de adquisición y el de extinción

- hipótesis de la unidad de respuesta: lo explica suponiendo que lo que se aprende no es a contestar después de cada refuerzo, sino que la respuesta es una al conjunto de la secuencia refuerzo no-refuerzo.

- hipótesis de los refuerzos condicionados: al estar presentes los refuerzos condicionados en todos los ensayos, el animal contesta en los ensayos no-refuerzo, por la presencia de éstos

- decremento por generalización: con el refuerzo parcial los sujetos aprenden en situaciones similares a la extinción y, por tanto, generalizan menos el decremento de la respuesta ante el no-refuerzo. Según Mackintosh esta hipótesis está a la base de las posiciones de Amsel y Capaldi, aunque con diferentes explicaciones.

Se han dado dos tipos de explicaciones del efecto patterning:- acudiendo a estímulos externos, hay otras tres explicaciones:

- 1) el animal huele la comida en la caja-meta antes de realizar una carrera reforzada

- 2) actúan las feromonas que los animales irían dejando en el recorrido (feromonas son sustancias que dejan los animales y que informan a éstos de ciertos hechos)

- 3) los postefectos del refuerzo o restos de comida que quedarían en la boca del animal

- acudiendo a los estímulos interiores o procesos cognitivos, estarían las hipótesis:- a) la hipótesis de la frustración (Ansel): cuando hay una secuencia N R

N R, la primera R produce una expectativa en el animal, a continuación la N produce la frustración que energetiza la conducta y la R siguiente refuerza esa frustración, con lo que el animal la aprende. Esta frustración aprendida en las carreras N hace que el animal corra más en las carreras

Page 13: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

R que le siguen secuencialmente. Esta hipótesis desarrolla la teoría anticipatoria de Hull, señalando que el mecanismo que hipotetiza es un mecanismo de aprendizaje, no un proceso cognitivo. Este mecanismo presenta muchas dificultades

- b) la hipótesis secuencial (Capaldi): lo explica porque los postefectos que produce la carrera N no son la frustración condicionada, sino trazos de memoria que perduran en el siguiente ensayo R, produciéndose un condic por el que el trazo de memoria se convierte en estímulo discriminativo, que señala que en la carrera siguiente está disponible el refuerzo. Esta hipótesis presenta dos tipos de defectos: metodológico: consiste en computar los daatos de las dos primeras

carreras N-R, como efecto patterning, cuando en la realidad no lo son, sino que la tardanza en la carrera N y la posterior velocidad en la carrera R, se deben a un cambio en las motivaciones del animal. En la primera carrera, el animal explora, por eso es muy lento en su carrera.

de conceptualización; pues se hace una referencia a la memoria muy vaga y general.

2.EL APRENDIZAJE OBSERVACIONAL Definición de aprendizaje observacional según Bandura:

“aprendizaje sobre una base vicaria, por medio de la observación de la conducta de otra persona y de las consecuencias que dicha conducta tiene sobre ella”.

También es conocido como: modelado, aprendizaje vicario, aprendizaje por imitación, aprendizaje social; enfatiza los aspectos cognitivos.

Se llama observacional porque se fundamenta en la observación, y se llama social porque requiere la participación de, al menos, dos personas: el modelo y el observador.

Este aprendizaje no consiste en la formación de una asociación E-R, sino en la adquisición de representaciones cognitivas de la conducta del modelo. El estímulo (conducta del modelo) no provoca la ejecución de la imitación, sino su aprendizaje en un plano cognitivo.

Los procesos básicos en el aprendizaje observacional son tres: atención y discriminación. Para que se produzca este aprendizaje es

necesario que el observador atienda a la conducta que realiza el sujeto que hace de modelo y que el observador discrimine los aspectos más relevantes de dicha conducta. Este proceso atencional es influenciado por: las características del modelo :

- que sea del mismo sexo que el observador y edad semejante- el prestigio, estado y poder social del modelo- su competencia y experiencia en la conducta que realiza- trato afectivo que el modelo establece con el observador

características del observador :- sexo y edad- el nivel de inteligencia de la persona que observa- su educación anterior o historia de aprendizaje- sus características afectivas o emocionales

características estimulares:- que los aspectos relevantes de la conducta del modelo sean

fácilmente discriminales

Page 14: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

- que la conducta del modelo sea expuesta de modo real, mediante imágenes o por descripción verbal.

proceso de retención o registro. Consiste en el almacenaje y recuperación del material perceptual adquirido por la observación. Se puede realizar por imágenes o símbolos verbales

procesos de elaboración cognitiva. Es la reelaboración que hace el sujeto del material que ha observado. Esta reelaboración puede consistir en realizar un esquema general de la conducta observada.

Los procesos básicos de la ejecución del aprendizaje por observación son :- procesos de reproducción motora. Las variables que influyen

fundamentalmente los procesos de reproducción motora son las capacidades físicas de los sujetos

- procesos de refuerzo. El nombre de condic vicario consiste en que se recibe el refuerzo en virtud del refuerzo que recibe el modelo en la conducta que ejecuta. El refuerzo del modelo hace las veces del refuerzo del observador. Lo mismo que el observador recibe refuerzo de la conducta imitada en virtud del refuerzo que recibe el modelo, también la conducta a imitar puede ser castigada vicariamente, en virtud del castigo que recibe el modelo por ejecutar esa determinada conducta.

En general, constituye un modelo muy adecuado para el aprendizaje humano en el que se evitan muchas dificultades propias del condic clásico y operante; aunque todo lo que se puede aprender por estos condic se puede aprender también por aprendizaje observacional.

El aprendizaje por el modelo observacional recibe el nombre de “modelado” (no confundir con el shaping)y es un aprendizaje social.

TEMA 19PANORAMA ACTUAL DE LA PS DEL APRENDIZAJE

1. LA COGNICIÓN ANIMAL Los estudios de cognición animal son el estudio de procesos cognitivos en animales,

dentro de la ps del aprendizaje, y con la metodología del análisis experimental de la conducta.

Se centran en el estudio de procesos interiores, inferidos desde la conducta que hacen referencia a procesos de pensamiento; como una representación neurológica bien a través de registros o de imágenes mentales que puede explicar una conducta, que no se explicaría por los estímulos externos sólo.

Estos estudios pretenden investigar:- cómo se forman esas representaciones neurológicas,- qué información representan,- cómo es el mecanismo que las almacena, y- cómo guían posteriormente la conducta.

Por tanto, no estudian los procesos en sí, sino los procesos básicos del aprendizaje a los que pretende dar una interpretación cognitiva, ya que no son suficientes las cadenas de estímulos para explicarlo, sino que hace falta representaciones mentales de esas asociaciones.

Estas investigaciones han dado lugar a diversos paradigmas experimentales, que pretenden estudiar diversos procesos cognitivos como: memoria, formación de conceptos, razonamiento y lenguaje en las especies animales.

Page 15: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

En general, el estudio de la cognición animal tiene como objetivo el conocimiento de la conducta animal, y a través de ello, se pretende conocer la evolución de la cognición humana.

La cognición animal comenzó con el estudio de la memoria. La memoria es el proceso que permite el almacenaje y la reproducción de lo

adquirido en el aprendizaje. En los estudios sobre memoria animal se consideran dos tipos:

- memoria de trabajo: se trata de una retención en la memoria de un estímulo o relación, sólo para la ejecución de una tarea determinada; su duración es corta

- memoria de referencia: se trata de un almacenamiento a largo plazo para una ejecución acertada de la información que el animal acaba de aprender; es de larga duración.

La mayor parte de las investigaciones sobre memoria de trabajo se refieren al estudio de la memoria espacial, que sirve para localizar un lugar determinado en un espacio complejo.

Fue Tolman el primero en hablar del aprendizaje espacial en términos de mapas cognitivos, a través de su aprendizaje perceptivo u observacional. Para él, lo que el animal aprende es a poner en relación una configuración estimular con otra, que es igual que conectar un signo con su memoria de referencia. De este modo, el animal reacciona instrumentalmente, según un mapa cognitivo.

La memoria espacial en los animales, que se concreta en la representación o mapas cognitivos, es hoy en día un campo de investigación dentro de la cognición animal.

El tiempo por sí mismo no produce olvido. Se han estudiado las alteraciones de la memoria en los animales, concretamente las inferencias proactiva y retroactiva o aquellos acontecimientos y/o procesos que provocan que olvidemos lo anterior o posteriormente aprendido.

Otros estudios sobre cognición animal, se han centrado en el pensamiento, investigando la formación de conceptos perceptuales, ya que se sabe que los animales pueden organizar la percepción de los estímulos en categorías y responder a un estímulo que pertenezca a una determinada.

Las representaciones de las categorías de estímulos perceptuales son los conceptos perceptuales.

Se ha señalado que los animales para formar tales conceptos perceptuales, aplican reglas que les permiten identificar las características del estímulo, sin tener que considerar una característica determinada.

Otra investigación sobre cognición animal es el estudio del aprendizaje de pautas seriales.

Actualmente Capaldi, dentro de su teoría secuencial, señala que el animal aprende pautas seriales de refuerzo, haciendo la abstracción de una regla a partir de una secuencia de estímulos; siendo el conocimiento de esa regla lo que explica que responda correctamente a las diferentes pautas de estímulos.

2. ESTUDIOS DE APRENDIZAJE HUMANO Dentro de los estudios de aprendizaje con experimentación en humanos, el problema

está en la existencia o no de dos sistemas de aprendizaje:- uno explícito en que actúan mecanismos conscientes- otro implícito en el que actúan mecanismos no conscientes.

Para el estudio del aprendizaje implícito se acudió primero a la estimulación subliminal, para luego cambiar por la estimulación percibida conscientemente.

Page 16: Psicologia General - Apuntes Examenes Psicologia Uned Esquemas Resume

Lo implícito no está en el conocimiento consciente del estímulo en sí, sino de la adquisición del conocimiento de las relaciones del estímulo con otros. Lo fácil sería que el sujeto manifestase si es consciente de esa relación o no, pero en el aprendizaje implícito no es posible; por eso su evaluación es tan complicada.

Para dilucidar cómo es la accesibilidad a la conciencia de un conocimiento implícito y cuál es su naturaleza, se ha utilizado el aprendizaje de gramáticas artificiales y el aprendizaje de secuencias.

Existe otros dos tipos de aprendizaje:- el aprendizaje procedimental que hace referencia a la adquisición de reglas

de condición-acción. Explica la adquisición de diferentes habilidades: motoras, sociales y cognitivas

- el aprendizaje declarativo que tiene que ver con la adquisición de conocimientos de hechos o proposiciones.

La distinción entre ambos ha sido utilizada para explicar disociaciones en la ejecución de sujetos amnésicos en algunas tareas de memoria, porque parece que los amnésicos mantienen la habilidad del aprendizaje procedimental pero no la del declarativo.