Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la...

33
1 Agente adaptable, aprendizaje y estructura del ambiente: Un enfoque alternativo. Arturo Lara Rivero “Somos como marineros que tenemos que reconstruir siempre nuestro barco en un mar abierto sin anclar nunca en un dique seco” Quine (1960) Introducción 1 Uno de los fundamentos de la teoría económica evolutiva se encuentra en el concepto de “rutina”. ¿Cuán fecundo ha sido este concepto, delineado en el libro “An Evolutionary Theory of Economic Change” de Nelson y Winter de 1982? ¿A propósito del pasado, tiene futuro el concepto de rutina? Una de las respuestas a esta interrogante la formulan Nelson y Winter, y otros autores, más de 20 años después (Becker, Lazaric, Nelson, Winter, 2005). Es una respuesta que identifica las debilidades y fortalezas del concepto. Becker, et al. (2005) identifican dos problemas críticos. El primero, que el concepto no ha estimulado trabajo experimental riguroso que permita refinar la teoría, y el segundo, la ambigüedad del concepto. Otros autores, cercanos a la teoría económica evolutiva, frecuentemente admiten las dificultades de su definición (Cohen, Burkhart, Dosi, Egidi, Marengo, Warglien and Winter, 1996); la anarquía terminológica y perdida de coherencia (Dosi, Nelson, Winter, 2000 b , Becker, 2004, Felin and Foss, 2004); las persistentes dificultades teóricas del programa de investigación y el estatus empírico (Murmann, Aldrich, Levinthal and Winter, 2003; Winter, 2003; Becker, 2004ª, 2004 b ) ¿Es posible que estas dificultades estén asociadas a la representación del agente a la que dio lugar el concepto de “rutina”? ¿En qué medida el comportamiento del actor económico está gobernado por rutinas? Existen diferentes respuestas a esta pregunta. La teoría económica neoclásica concibe al agente como un demonio, con propiedades míticas, con una capacidad de cómputo inmensa; en particular con habilidades refinadas de un extraordinario matemático. En la teoría económica evolutiva, domina una concepción del agente gobernado por rutinas; mucho más limitado, miope; torpe si lo 1 Agradezco las valiosas sugerencias a este trabajo de Alejandro García, Bruno Gandlgruber; Salvador Estrada, Eunice Taboada y Carlos Sampere.

Transcript of Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la...

Page 1: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

1

Agente adaptable, aprendizaje y estructura del ambiente: Un enfoque

alternativo.

Arturo Lara Rivero

“Somos como marineros que tenemos que

reconstruir siempre nuestro barco en un mar

abierto sin anclar nunca en un dique seco”

Quine (1960)

Introducción1

Uno de los fundamentos de la teoría económica evolutiva se encuentra en el concepto

de “rutina”. ¿Cuán fecundo ha sido este concepto, delineado en el libro “An

Evolutionary Theory of Economic Change” de Nelson y Winter de 1982? ¿A propósito del

pasado, tiene futuro el concepto de rutina? Una de las respuestas a esta interrogante

la formulan Nelson y Winter, y otros autores, más de 20 años después (Becker,

Lazaric, Nelson, Winter, 2005). Es una respuesta que identifica las debilidades y

fortalezas del concepto. Becker, et al. (2005) identifican dos problemas críticos. El

primero, que el concepto no ha estimulado trabajo experimental riguroso que

permita refinar la teoría, y el segundo, la ambigüedad del concepto. Otros autores,

cercanos a la teoría económica evolutiva, frecuentemente admiten las dificultades de

su definición (Cohen, Burkhart, Dosi, Egidi, Marengo, Warglien and Winter, 1996); la

anarquía terminológica y perdida de coherencia (Dosi, Nelson, Winter, 2000b,

Becker, 2004, Felin and Foss, 2004); las persistentes dificultades teóricas del

programa de investigación y el estatus empírico (Murmann, Aldrich, Levinthal and

Winter, 2003; Winter, 2003; Becker, 2004ª, 2004b) ¿Es posible que estas

dificultades estén asociadas a la representación del agente a la que dio lugar el

concepto de “rutina”?

¿En qué medida el comportamiento del actor económico está gobernado por

rutinas? Existen diferentes respuestas a esta pregunta. La teoría económica

neoclásica concibe al agente como un demonio, con propiedades míticas, con una

capacidad de cómputo inmensa; en particular con habilidades refinadas de un

extraordinario matemático. En la teoría económica evolutiva, domina una concepción

del agente gobernado por rutinas; mucho más limitado, miope; torpe si lo

1 Agradezco las valiosas sugerencias a este trabajo de Alejandro García, Bruno Gandlgruber; Salvador Estrada, Eunice Taboada y Carlos Sampere.

Page 2: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

2

comparamos con el agente de la teoría económica neoclásica. La teoría económica

evolutiva ha desarrollado un modelo de agente atrapado en la vecindad de su

conocimiento local, que aprende de la experiencia del ensayo y del error. Marco de

explicación que, por lo demás, no encaja sino sólo incidentalmente con la evidencia

científica actual. ¿Es posible sostener aquella concepción del agente que postula la

teoría económica evolutiva? El debate debe resituarse y erigir una imagen del agente

más como sujeto, que como un autómata. El agente está programado, pero también

tiene capacidades racionales para enfrentar la incertidumbre construyendo modelos

internos y expectativas acerca de la estructura y dinámica del mundo.2 Es necesario

representar al agente con imaginación, voluntad y conciencia. Utilizando el marco

teórico de Darwin – lo que Hodgson (2007, 2004, 2001) y Hodgson y Knudsen

2004) ) denominan “darwinismo universal”3 -, y a partir del concepto de práctica,4 se

busca reconstruir los procesos de aprendizaje del agente adaptable (Simon, 1969;

Holland, 2004, Nooteboom, 2000).

Las preguntas centrales del presente trabajo son las siguientes:

1.- ¿En la reconstrucción de la conducta de los agentes adaptables es necesario

combinar la perspectiva racional con la programada?

2.- ¿Cuáles son los principales mecanismos de aprendizaje que debemos

atribuirle al agente adaptable? ¿Es posible estudiar estos procesos utilizando

el marco teórico desarrollado por Darwin?

3.- ¿Por qué es necesario considerar la estructura del mundo, y en qué medida

interacciona con las restricciones cognitivas del agente adaptable?

2 Resulta ineludible rescatar la tradición de Simon (1957), Cyert y March (1963) para reconstruir el concepto de racionalidad limitada. Gegirenzer y Selten (2001) ofrecen una revisión y propuesta rica en implicaciones en torno a este debate; abren una de las vías más fecundas de reflexión sobre racionalidad limitada, muy en sintonía con la tradición teórica profunda de Simon. 3 El “darwinismo universal” afirma que los principios teóricos desarrollados por Charles Darwin, pueden ser extendidos para explicar los sistemas complejos adaptativos, ya sean biológicos, económicos, institucionales, etc. Estos principios explicativos son: mecanismos de variación (mutación), mecanismos de orden (herencia) y mecanismos de selección (Hodgson, 1999, 2007). Para Kauffman (1995) si se desea explicar los distintos regimenes de complejidad existentes en la naturaleza, se requiere agregar al programa darwinista, el principio de la auto-organización. 4 El concepto de práctica, desarrollado por Philip Kitcher (1993) y Sergio Martínez (2003), permite explicar el progreso de la ciencia de una manera realista y coherente. Considero que se puede extender este concepto desde la filosofía de la ciencia, a la teoría económica; toda vez que permite examinar con precisión la evolución de los agentes adaptables. Otra razón, que justifica esta integración, es que tanto el programa teórico de Philip Kitcher (1993) como el de John Holland (1998; 2004), Holland, et.al. (1989) y Jeffrey Hodgson (1999, 2007) buscan explicar los procesos evolutivos desde una perspectiva darwiniana.

Page 3: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

3

4.- ¿Es necesario un nuevo concepto que integre: i) el aprendizaje ex ante y el

aprendizaje ex post; ii) lo cognitivo y lo emocional, así; iii) como los procesos

automáticos y controlados?

El trabajo está dividido de la siguiente manera. En la sección 1, se pone en debate dos

imágenes: Agente programado vs. Agente complejo adaptable. En la sección 2, se

examina y desarrolla una nueva visión relacionadas con el aprendizaje y la estructura

del agente. La sección 3, amplia el análisis introduciendo el papel de la

retroalimentación en los procesos de aprendizaje. La sección 4 apunta a construir una

imagen del agente a partir de los conceptos de modelo interno y práctica, así como de

aprendizaje ex ante y el aprendizaje ex post. En la sección 5, se describe cómo la

resolución de problemas está sujeta a restricciones, por ello se considera el

aprendizaje con arreglo a medios y fines. Finalmente se concluye.

1.- Agente programado (basado en rutinas) VS Agente complejo

adaptable.

Con la “rutina” como concepto fundamental, la teoría económica evolutiva despega

después de la publicación de Nelson y Winter (1982). Cohen, Burkhart, Dosi, Egidi,

Marengo, Warglien and Winter (1996) definen a la rutina como “ (A)n executable

capability for repeated performance in some context that has been learned by an

organization in response to selective pressures” (Cohen, et.al., 1996:683) Concepto

que se convierte en la unidad de análisis de la teoría económica evolutiva (Becker,

2004). Y, en torno del concepto de rutina se desarrollará /derivará en la literatura de

administración estratégica, los conceptos de capacidades (Teece et al., 1997),

competencias (Henderson and Cockburn, 1994) y capacidades dinámicas (Eisenhardt

and Martin, 2000).

Nelson y Winter (1982:72) establecen, como analíticamente equivalentes, las

habilidades individuales y las rutinas organizacionales. Por habilidad (skills)

entienden: “… a capability for a smooth sequence of coordinated behavior that is

ordinarily effective relative to its objectives, given the context in which it normally

occurs” (Nelson and Winter, 1982:73). La equivalencia conduce a los autores a

enfatizar dimensiones de los procesos de aprendizaje que implican: especialización y

pérdida de flexibilidad; replicación del conocimiento que resultan en

comportamientos estereotipados y mecánicos. El concepto de rutina, en Nelson y

Winter (1982) adicionalmente se sobrecarga de otros significados como: variedad de

comportamientos (heurísticas y estrategias); dimensiones cognitivas (memoria

Page 4: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

4

organizacional) e incentivos y motivaciones (tregua organizacional). ¿Cuáles han sido

las consecuencias de esta forma de caracterizar a las rutinas? Primero, la ambigüedad

del concepto5. En segundo lugar la supresión del agente y su substitución por la

“organización”; Nelson y Winter (1982) apuestan por la primacía del colectivismo

metodológico (Hodgson, 2007), diluyendo la necesidad de una teoría tanto del agente

como de la organización, como realidades no reductibles6. En tercer lugar, la ausencia

de una explicación darwiniana de las rutinas y de las habilidades; Nelson y Winter

(1982) no explicitan cuáles son los mecanismos y propiedades evolutivas de las

rutinas y mucho menos de las habilidades del agente individual. Y por último no

plantean una pregunta clave que vincula la racionalidad limitada del agente con la

estructura del ambiente: ¿cómo, desde el punto de vista cognitivo, interacciona el

agente (individuo) y la estructura del ambiente?

¿Cuándo se trata de estudiar a los agentes adaptables, tiene sentido tomar

como unidad de análisis la rutina, tal y como lo proponen Nelson y Winter (1982)?

Desde la perspectiva de la biología evolutiva y de la historia, se argumenta en esta

sección y en lo que sigue, una respuesta distinta.

Durante millones de años nuestra especie ha construido programas,

seleccionados mediante la selección natural. ¿Tiene sentido el que la naturaleza haya

programado de manera exhaustiva el comportamiento? ¿El agente es un simple

autómata programado? Tomar decisiones mientras se conduce un vehículo a elevada

velocidad, aprender un idioma nuevo, interactuar con grupos humanos a través de

internet, etc., plantean requerimientos nuevos, no hay posibilidad alguna de que la

5 Como lo expresan Becker, M., N. Lazaric; R. Nelson; S. Winter (2005: 784) :“(R)esearchers often chosen different terms and definitions for describing routines, contributing to making accumulation of our knowledge on routines difficult. Even within the Nelson and Winter (1982) inspired literature, convergence to a widely agreed-upon conceptualization and terminology has not yet taken place”

6 Desde esta perspectiva la teoría de Nelson y Winter se separa de la tradición de Herbert

Simon. Mientras que Simon se concentra en el proceso de toma de decisiones del agente individual caracterizado por formas de racionalidad semifuertes: los agentes económicos son “intencionalmente racionales, sólo en forma limitada” (Simon, 1988, P. xxv); Nelson y Winter (1982) desplazan el foco de atención del individuo a la organización, para dar la primacía a esta última. Para Simón, a diferencia de la explicación evolutiva, señala es necesario darle “un lugar al comportamiento racional” (Simon, 1988, p. xxv). De esta manera se entiende que, Williamson (1989:56) considere que, Nelson y Winter (1982) asumen formas de racionalidad débil u orgánica. Débil si se compara con la forma fuerte de racionalidad – maximizadora - del enfoque neoclásico, y orgánica, debido a que la teoría evolutiva atribuye formas de racionalidad, en primer lugar, no a los agentes individuales, sino a la organización. Optar por reducir el actor individual en el actor colectivo tiene serías implicaciones metodológicas, aspecto sobre la que Hodgson (2007) ha desarrollado tanto la crítica como la alternativa teórica. Es necesario reconocer la doble causalidad entre el individuo y la organización. Ambos niveles de la realidad social, con formas de existencia y propiedades diferentes, que es necesario estudiar.

Page 5: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

5

evolución haya tenido tiempo para preprogramar el comportamiento. Resultaría

incomprensible que la evolución tenga la capacidad de construir un vasto número de

programas y sobre todo, anticipar las contingencias o situaciones insólitas que en la

práctica del agente emergen. Sería un programa que consumiría demasiada memoria,

y cuya “pérdida de flexibilidad resultante sería catastrófica” (Ehrlich, 2005:235) Lo

que es contraintuitivo y antinatural. Para refutar la explicación reduccionista, es

necesario tener en mente que:

“(E)xisten unos 100 000 genes en el genoma humano, mientras que hay entre

100 y 100 000 billones de conexiones(sinapsis) entre las más de un billón de

células nerviosas que hay en nuestros cerebros. (..) (E)xisten al menos 1000

millones de sinapsis por gen (…). Es claro que las características de esta red

nerviosa sólo puedan ser parcialmente especificadas por la información

genética; el ambiente y la evolución cultural deben desempeñar un papel muy

grande, con frecuencia dominante, en el establecimiento de las complejas

redes nerviosas que modulan la conducta humana. (…) Podemos decir que

tenemos una “escasez de genes”, (Ehrlich, 2005:233).

Los genes no tienen capacidad para programar una respuesta apropiada para cada

evento posible de conducta. En el transcurso de la historia evolutiva, nuestra

capacidad cognitiva sólo ha registrado una pequeña parte de los potenciales

estímulos existentes en el ambiente. Existen miles de miles de millones de

posibilidades de conectarnos y representar el mundo. Esta misma reflexión puede

extenderse al análisis de comportamiento programado7 versus comportamiento

basado en el libre albedrío.

“La enorme complejidad de nuestros cerebros puede también, (…), explicar el

“libre albedrío”. Ninguna computadora moderna, aún si hubiera comenzado a

trabajar cuando inició la vida en la Tierra (quizá hace unos 4000 millones de

años), podría calcular con la suficiente velocidad para especificar todas las

posibles ramificaciones de interacciones (…). (E)n la práctica los cerebros de

los seres humanos han evolucionado de forma que pueden escoger

deliberadamente opciones reales. ‘Cablear’ el cerebro para que almacene

instrucciones específicas sería un grave ‘error de diseño’. La información del

ambiente humano es muchísimo más extensa que la del genoma humano, y

7 Programados, ya sean por los genes o por la cultura.

Page 6: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

6

mucho de ella ha sido creada por acciones humanas.” (Ehrlich 2005: 233-

234-235)

Estas consideraciones pueden extender a todos los agentes complejos adaptables, no

sólo humanos. Margulis y Sagan (2005:178), señalan que, “quizás todos los seres

vivos compartan nuestro sentido del libre albedrío”. Desde el punto de vista

evolutivo, no tendría viabilidad un agente sustancialmente programado, y por lo

tanto que esté impedido de generar y elegir opciones.

La naturaleza ha creado organismos hábiles para enfrentar situaciones

complejas, variables e inciertas. La selección natural nos ha provisto de capacidad

para construir, actualizar y refinar modelos internos del mundo, en contextos de

acción inéditos ó mundanos (Selten, 2001). Los agentes que producen

comportamientos estereotipados, tienen menor probabilidad de sobrevivir que los

agentes con comportamiento más flexibles. Tiene mayor probabilidad de sobrevivir,

el agente que construya un sistema cognitivo flexible - como para no caer en una

situación caótica - y lo suficientemente estable, para retener estructuras exitosas de

conocimiento – sin caer en la rigidez -. Esto es, programas conductuales

parcialmente cerrados y abiertos. Mientras que el primero, establece con precisión la

conducta del agente - que le permite explotar el conocimiento exitoso -, el segundo

deja abiertas alternativas – que le permite adaptarse y explorar el ambiente

cambiante. Desde esta perspectiva el agente esta comprometido en dos tipos de

actividades cognitivas de explotación y, exploración. (Cf. Tabla No.2)

• Las actividades de explotación buscan utilizar el conocimiento

existente. Su principal objetivo es el explotar el conocimiento local,

dentro de los límites de lo conocido. Este tipo de actividad se orienta

más a la selección y estandarización de las prácticas exitosas. Por esta

razón la actividad de explotación no genera novedad, sino estabilidad

y reforzamiento de las rutinas

• Las actividades de exploración, transforman el espacio de búsqueda de

soluciones; buscan abrir nuevas oportunidades de aprendizaje,

eliminando rutinas y creando otras; generando nuevos problemas e

incertidumbre. Las actividades de exploración transforman o amplían

el espacio de posibilidades de solución.

Page 7: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

7

Una de las funciones centrales de la historia evolutiva del agente es la de ayudar a

crear valores y hechos, que le permitan: combinar actividades de explotación y

explotación; simplificar y focalizar el espacio de soluciones; representar la realidad de

una forma acotada y manejable, y; dotar de significado la práctica del agente. La

historia del agente, contribuye tanto al establecimiento de restricciones de la

atención, como a la creación de recursos cognitivos, organizacionales y materiales

que potencian su práctica. La historia constriñe pero también permite.

Tabla No. 2.

Actividades de exploración/explotación Exploración Explotación

Se asocia con el aprendizaje que transforma el espacio de posibles soluciones.

Se relaciona con el aprendizaje y la obtención de alguna ventaja en la disputa por la competencia de recursos escasos.

Es requerida para sobrevivir en el largo plazo.

Es requerida para mantenerse en el corto plazo.

Involucra desarrollo de nuevas capacidades o cosas.

Involucra el uso eficiente de las capacidades existentes.

Se asocia con situaciones que implican: riesgo, variación, experimentación, juego, flexibilidad, descubrimiento e innovación.

Se asocia con términos como el refinamiento, opción, producción, eficiencia, selección, implementación, ejecución.

Los agentes adaptables que se comprometen en actividades de exploración en detrimento de la explotación, probablemente obtienen bajos beneficios y presentan ideas subdesarrolladas con pocas capacidades distintivas.

Los agentes adaptables que se introducen en la explotación en detrimento de la exploración es probable que se encuentren atrapados en un equilibrio sub-óptimo.

Se asocia con la creación de nuevas prácticas, productos y procesos

Se asocia con la estandarización de prácticas, productos y procesos.

Incrementa la probabilidad de lograr niveles de desempeño por arriba o debajo de la tendencia de la trayectoria histórica.

Es probable que mantenga la línea de tendencia histórica.

Cuestiona lo establecido, pueden implicar una pérdida de control y coordinación.

Requiere conservar la identidad, conocimiento y prácticas existentes con cierta cantidad de control y coordinación,

Fuente: Elaboración propia con datos de Nooteboom (2000); March (1991); Dijksterhuis, Van den Bosch y

Volberda, (1999); Lewin, Long, y Carroll (1999); Abernathy y Utterback, (1978), Moreno y Lara, (2007) ; Croguennec y Lara (2007).

¿Con qué recursos cuenta el agente para explotar /explorar problemas

complejos? Es posible identificar un conjunto de componentes – recursos - de la

práctica individual, que permanecen relativamente “estables” durante un periodo.

¿Qué es una práctica individual? Los componentes de la práctica individual son: i) El

lenguaje que utiliza para resolver problemas; ii) las preguntas que reconoce como

problemas importantes; iii) los enunciados (imágenes, diagramas); iv) el conjunto de

patrones (o esquemas) – buenos y defectuosos - que subyacen en sus explicaciones;

Page 8: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

8

v) los ejemplos estándar; vi) los paradigmas de experimentación y observación, viii)

junto con los instrumentos y herramientas. 8

Estos componentes son fruto de: i) las interacciones sociales (entre agentes),

y; ii) las interacciones asociales (interacción agente – objeto). Como resultado de

estas interacciones, se generan al interior de cada componente, como entre los

componentes de las prácticas, tensiones y conflictos. La característica de la práctica

es que, es específica, diversa, dinámica y multidimensional.

Utilizando este marco analítico, en la sección siguiente se describen, de

manera estilizada, los procesos implicados en la evolución de un agente complejo

adaptable.

2.- Mecanismos, Propiedades y Estructura del agente

Muy extendido en la ciencia de la inteligencia artificial, el concepto de agente

complejo adaptable, nos ayudará a contar con una nomenclatura y con una

representación más precisa. Este concepto designa a elementos de la naturaleza que

tienen la capacidad de adaptación. Un agente puede ser una persona, una ameba, etc.

El agente es complejo, porque está integrado por un número elevado de elementos,

que interaccionan de una forma no-lineal. La manera en la que el agente responde a

su ambiente y persigue sus objetivos, puede incluir deliberación o nula deliberación.

A estas características se debe agregar la dimensión física del agente. Para Herbert

Simon, es necesario:

“llamar la atención sobre la importancia crítica del interfaz entre el medio y el

sistema inteligente: los órganos sensoriales y motores que el último posee.

Este interfaz plantea algo que de diferentes maneras es el problema más

delicado del diseño de un sistema adaptativo.(...)”(Simon, 1987:32)

Resulta útil por esta razón, identificar los componentes que definen al agente

adaptable. Se entiende por arquitectura del agente, tanto los sensores físicos –

medios que le permiten recoger información del mundo -, como los actuadores físicos

– medios que le permiten transformar el mundo objetivo-. Los sensores y los

actuadores, funcionan como interfaces entre el medio interno y el ambiente. Se

entiende por “programas” al conjunto de reglas que orientan al agente. La función

del programa es: i) interpretar el flujo de información que ingresa al sistema

8 En nuestro trabajo, integramos en el concepto de práctica, dos dimensiones básicas ausentes en Kitcher (1993) el de aprendizaje ex ante y aprendizaje ex post. Conceptos esenciales para entender la naturaleza de la exigencia de adaptación en condiciones de incertidumbre.

Page 9: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

9

cognitivo del agente; ii) insertar esa información en la secuencia histórica del agente,

y; iii) orientar sus acciones. Así, se define:

AGENTE = ARQUITECTURA + PROGRAMAS

Un agente complejo adaptable tiene la habilidad de interactuar con su ambiente,

utilizando una arquitectura específica y programas o modelos internos específicos.

Holland (2004) identifica un conjunto de mecanismos y propiedades, comunes a los

sistemas complejos adaptables, las cuales se sintetizan a en la tabla 1.

Tabla 1: Mecanismos y Propiedades de

los Sistemas Complejos Adaptables

Propiedades Mecanismos

Agregaciones. Se considera esencial, el despliegue de comportamientos complejos a partir de interacciones agregadas de agentes menos complejos. Cuando los agentes se agregan se los considera como meta-agentes. No-linealidad. Son sistemas altamente sensibles a las condiciones iniciales. La interacción no puede ser explicada por la simple suma de las actividades individuales de los agentes. Se requiere representar la trayectoria histórica del agente. Flujos. Los agentes están conectados con el ambiente, para intercambiar energía, información o materia. Los agentes son nodos – procesadores – en tanto, que los conectores determinan las posibles interacciones. La diversidad. En la lucha competitiva por la sobrevivencia, los agentes aprenden y transforman el mundo, generando nuevos recursos. Estos recursos permiten la emergencia de nuevos agentes. La diversidad es el producto de la adaptación.

Marbetes o etiquetas. Facilita la visibilidad de propiedades (internas y externas) facilitando así, la interacción selectiva. Es un arma útil para la especialización y la cooperación. Modelos internos. Un agente que tiene capacidad de representar – con muestras limitadas de - su medio ambiente, puede anticipar las consecuencias. Las oportunidades de supervivencia del agente serán mayores cuánto mas precisas sean las predicciones producidas por sus modelos. Bloques de construcción. El agente tiene la capacidad de descomponer en partes una escena compleja, y reagrupar los componentes en distintas combinaciones. Para, posteriormente, reutilizar esas combinaciones en una variedad de situaciones. De esta forma se crean las jerarquías.9

Fuente: Elaboración propia a partir de Holland (2004)

¿Cómo se han conformado estos distintos mecanismos y propiedades?. La

explicación darwinista considera la capacidad cognitiva del agente, como una red

neuronal plástica y en blanco, que la historia evolutiva marcó y configuró (Dennet,

9 Por ejemplo, la naturaleza tiene en los quarks uno de sus bloques de construcción fundamentales. A partir de ese elemento y de su combinación se forman la secuencia: quark/nucleón/ átomo/molécula/organelo/ célula, etc. (Gell-Man, 1995, Holland, 2004)

Page 10: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

10

1999; Dawkins, 1993).10 El agente ha evolucionado en un mundo que tiene estructura,

y por ende su capacidad cognitiva representa en gran medida la estructura del mundo

(Smith, 2003; Simon, 1956, 1969). Su forma de organizar el mundo no es arbitraria.

La teoría y los experimentos efectuados por la neurociencia y por la

neuroeconomía, establecen que, el ser humano, combina procesos cognitivos y

emocionales, distribuidos en diferentes subsistemas, organizados de manera

jerárquica y, con propiedades y mecanismos no reductibles. Esta nueva imagen,11 se

presenta en la Tabla 3.

Tabla 3

Dos Dimensiones de Funcionamiento Neuronal

Cognitivo Afectivo

Procesos controlados

• Serial

• Mucho esfuerzo

• Deliberadamente evocado

• Buen acceso introspectivo

I

II

Procesos automáticos

• Paralelo

• Sin esfuerzo

• Reflexivo

• Sin acceso introspectivo

III

IV

Fuente: Camerer, et.al. (2005: 16)

La tabla 3, tiene como objeto identificar dos dimensiones claves del funcionamiento

neuronal. El proceso controlado procesa la información de manera serial, y;

cuando hay problemas tiende a ser evocado de manera deliberada, asociada con un

10 Esta concepción tiene raíces filosóficas dentro del empirismo ingles de Locke y el “asociacionismo” de Mill; así como dentro del conductismo que dominó desde los años veinte hasta los sesenta del siglo XIX. Locke así como pensadores de la ilustración sostenían, en contra de la iglesia y de la monarquía, la primacía de la experiencia en contra de explicaciones de diferencias innatas. Escuela representada por Skinner y Pavlop (Pinker, 2003). 11 Esta nueva cartografía de la capacidad evolutiva del agente, se apoya en resultados experimentales asociados a la neurociencia. La neurociencia informa de sus resultados a la psicología cognitiva y ésta a la economía. Y recientemente, y sobre todo a partir de los trabajos de Camerer, et.al. (2005), la neurociencia informa directamente a la economía, si mediación alguna; campo convergente que se denomina neuroeconomía.

Page 11: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

11

sentimiento de esfuerzo.12 En tanto que el proceso automático, que es el modo

normal de funcionar del pensamiento, opera de manera paralela, sin esfuerzo y no es

accesible a la conciencia.

“Because of the massively interconnected “network” architecture of neuronal

systems, computations done in one part of the brain have the potential to

influence any other computation, even when there is no logical connection

between the two”. (Camerer, et.al. 2005:21)

La posibilidad de procesar información en paralelo facilita la respuesta rápida;

permite efectuar de manera masiva multitareas, y; provee redundancia.13 El proceso

automático se interrumpe cuando el agente se enfrenta a eventos inesperados, o

situaciones emocionales fuertes. Particularmente durante las crisis, se requiere

modular la pugna que se produce entre sus propensiones automáticas y sus

necesidades de deliberación. ¿En este proceso, qué papel juegan las emociones? Para

Herbert Simon (1989) un programa teórico que busque explicar la racionalidad como

adaptación evolucionista, debe explicar el papel de las emociones:

“(A) fin de contar con algo similar a una teoría completa de la racionalidad

humana, (tenemos) que comprender el papel que juega la emoción. (…) Una

teoría conductual de la racionalidad, interesada en el foco de atención como

principal determinante de la elección, no disocia la emoción del pensamiento

humano; tampoco, bajo ningún concepto, subestima los poderosos efectos de

la emoción al establecer la agenda para la resolución de problemas humanos.

(Simon 1989:44-45)

Para la mayoría de los científicos estudiosos de las emociones, la función central de

las emociones no reside en los estados afectivos asociados, sino en su papel en la

12 La herramienta clásica de la teoría económica como la programación dinámica y del árbol de decisión, pueden ser vistas como representaciones estilizadas de este proceso controlado (Simon, 1970). 13 Aunque fue uno de los primeros en reconocer el papel del comportamiento programado, subconsciente, y rutinario, Herbert Simon, examinó el proceso de resolución de problemas desde la perspectiva del conocimiento experto, explícito, secuencial y conciente. Tanto sus modelos de inteligencia artificial, como la resolución de problemas lógicos y criptoaritméticos por parte de seres humanos – que tanto le gustaba -, son explicados siguiendo las pautas que los expertos expresaban verbalmente. Para Herbert Simon, la inteligencia no es sino el conocimiento extraído de los expertos a través de “protocolos verbales”. Estas reglas del pensamiento –conocimiento experto - no evolucionaban, sólo se combinaban sin dar lugar a la evolución y emergencia de verdades nuevas y significativas. No logró establecer una explicación de la inteligencia coincidente con la explicación darwiniana. Una crítica interna al modelo de Simon y su alternativa en Holland, et.al. (1989), y Holland (2004).

Page 12: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

12

motivación, y en la formación de tendencias de acción, necesarias para sobrevivir

(Frijda 1986; Berkowitz 1999).

“ (C)oncentrar la atención – señala Herbert Simon - es una de las funciones

principales de los procesos que llamamos emociones. (…) Nuestra habilidad

para arreglárnoslas con esa limitación y sobrevivir a pesar de ir paso a paso

depende de los mecanismos, particularmente emotivos, que garantizan a los

nuevos problemas de gran urgencia una suprema prioridad en la agenda”

(Simon 1989: 33-34)

Las emociones tienen valencia: ellas son de signo positivo o negativo. Los estados

emocionales producen interrogantes del tipo “go/no-go”, que motivan la adopción o

el rechazo de determinados comportamientos (Zajonc 1998). En contraste, los

procesos cognitivos generan respuestas tipo: verdadero ó falso. El sistema cognitivo

por si mismo no produce acción; para influir en el comportamiento humano requiere

del concurso del sistema afectivo - aunque es necesario reconocer que no están

perfectamente correlacionados-.(Camerer 2005) Una gran parte del sistema

cognitivo – percepción y lenguaje - y emocional – hambre, sed, dolor, pasión, deseo

sexual - operan de manera automática (Buck 1999).

¿De qué manera la selección natural elige a los agentes? Los agentes que no

han sido capaces de conectarse causalmente y emocionalmente con el mundo,

perecen;14 los agentes que sí, se reproducen ó se apropian de más recursos. De esta

manera, la naturaleza se convierte en un mecanismo de “selección natural” de la

conducta.15 Representación que resulta coherente con los nuevos resultados de otros

campos disciplinarios, e ilustra bien el interés de la comunidad científica - biólogos

evolutivos, neurocientíficos, inteligencia artificial, psicología cognitiva, matemáticos

y economistas - por explicar las capacidades de los agentes adaptables.

14 Por razones de brevedad, de aquí en adelante, cuando se aluda a “cognición” se incluye en el concepto tanto la dimensión cognitiva, como la emocional. 15 El conductismo establece la primacía de la experiencia y del mundo exterior sobre el agente. No le interesa ni el fondo genético, ni la historia evolutiva de la especie, sólo tiene relevancia el ambiente. No le interesa qué clase de organización interna caracterizan al agente. En esta teoría lo que cuenta es la capacidad del agente para retener la estructura causal del mundo y almacenar esa información. La estructura del mundo determina la conducta del organismo. El conductismo estricto en psicología es sólo motivo de interés histórico; como corriente del pensamiento está extinta. Esta forma de representar al agente se recupera, aunque no con las formas extremas del conductismo, en la teoría conexionista de Rumelhart y McClelland (1986). Para la teoría conexionista, la realidad y en particular los estímulos son los encargados de imprimir sobre las redes neuronales del agente, las conexiones causales que luego le permitirán adaptarse y sobrevivir. Holland (, 1998; 2004) se encuentra cerca del programa teórico conexionista.

Page 13: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

13

3. Aprendizaje, retroalimentación y estructura del ambiente.

Cuando se requiere explorar el espacio de soluciones y no se cuenta con información

alguna sobre las distintas alternativas y consecuencias, no queda otra opción que

buscar de manera ciega.16 En alguna medida todos los procesos de resolución de

problemas se implementan por la vía del ensayo –error. Y, “cuanto más difícil y

novedoso sea el problema, - señala Herbert Simon - más probable será que se

requieran más casos de ensayo error para encontrar una solución.” (Simon; 1969:95)

Se puede estilizar la secuencia evolutiva de aprendizaje ensayo y error, del siguiente

modo. Sea “P” el problema, “TS” soluciones tentativas, y “EE” la eliminación de

errores.

Esquema. 1: Evolución del Conocimiento Básico

TS1

TS2 P1 . EE P2 . . TSn

Fuente: Popper (1992: 225)

El esquema No. 1, describe cómo al inicio, un problema (P1) dispara el proceso de

generación de soluciones tentativas (TSn), al final del cual, vía selección natural, se

eliminan los errores y se retienen los ensayos exitosos (EE).17 El mecanismo de

selección elimina o fortalece, parcial o totalmente: las hipótesis, o las estrategias, o al

agente (Axerold y Cohen, 2000). Como resultado de la práctica, el agente extrae

información acerca del mundo y de sus recompensas. La naturaleza refuerza

determinados tipos de comportamientos en la medida que cumplen con un conjunto

de condiciones:

16 Todas las teorías relacionadas con el aprendizaje contienen un componente de ensayo y error (Campbell 1997: 61). Desde esta misma perspectiva, se puede representar la evolución de los organismos. “Todo organismo – señala Popper - se puede considerar como un sistema jerárquico de controles plásticos (…). Los subsistemas controlados hacen movimientos de ensayo y error que el sistema de control en parte suprime y en parte restringe.” (Popper, 1966:23) 17 La creación de nuevas hipótesis, se puede interpretar como mutación.

Page 14: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

14

i) Para que el agente retenga la relación entre una acción concreta y su

resultado, es necesario que la relación causal entre la acción y la consecuencia

se “manifieste” claramente;

ii) Cuando el resultado es positivo, el agente debe estar capacitado para

explotar aquellas acciones concretas que tienen una relación causal aparente

con el resultado;18

iii) el agente evitará aquellas acciones que tengan una relación causal

aparente con el resultado indeseable.

El refuerzo instruye acerca de cuáles son las condiciones deseables y las indeseables;

ello presupone que las señales que envía el ambiente no sean ambiguas, y ocurran

inmediatamente después de la acción. ¿Es esta, la manera general en la que los

agentes adaptables adquieren nuevos conocimientos fácticos del mundo, en tanto el

ambiente los va seleccionando? La explicación previa resulta incompleta, se requiere

adicionalmente examinar atributos adicionales, tanto de los problemas, como del

agente. Esto es, depende de la estructura del aprendizaje, sintetizada por Hogarth

(2002) de la manera siguiente:

La tabla 4 busca estilizar dos dimensiones que definen la estructura del

aprendizaje. Una es la consecuencia de los errores – eje vertical - y la otra, la calidad

de la retroalimentación – eje horizontal -. La hipótesis central que sostiene esta

taxonomía es que, el aprendizaje depende, en primer lugar, de la retroalimentación

del ambiente, y del tipo de consecuencias implicadas. Así, si la calidad de la

retroalimentación es ambigua, se retrasa, o es incierta, el agente no cuenta con

indicaciones o pistas para reconocer las consecuencias de sus acciones. Una

información pobre puede disolver las conexiones y el refuerzo, y crear ruido en la

estrategia del aprendizaje. Una retroalimentación clara, rápida y precisa, permite

corregir y mejorar rápidamente la estrategia de aprendizaje implicada.

En el eje vertical se representa dos tipos de ambiente, uno exigente y el otro

benévolo. Un ambiente exigente se caracteriza por demandar decisiones precisas.

Por ejemplo, las valoraciones y procedimientos de un cirujano, o de un corredor

profesional de vehículos de carrera, son rápidamente expresados por el curso de los

acontecimientos, que puede significar en el caso del médico, la vida o la muerte del

paciente; llegar a la meta o sufrir un accidente con consecuencias fatales e

irreversibles en el caso del piloto de coches de carrera. Existen por otro lado,

18 Aparente en tanto que puede o no expresar la causalidad del mundo – nivel óntico -; a veces los agentes infieren causalidad donde no existe, ó, a veces no reconocen nexos causales cuando si existen, etc.

Page 15: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

15

ambientes benévolos de aprendizaje, como por ejemplo cuando cometemos errores al

conducir un vehículo y tomamos la calle equivocada, podemos corregir el evento y a

bajo costo.

Tabla 4

La estructura del aprendizaje

Fuente: Hogarth 2002: 124

La tabla 4, combina esas dos variables en cuatro cuadrantes con el fin de identificar

las posibles tensiones o exigencias de aprendizaje en cada uno de los distintos

ambientes. El aprendizaje será más fácil cuando la calidad de la retroalimentación

sea relevante, y será cada vez mejor mientras se transite de un ambiente benévolo a

uno exigente, que demanda precisión. Cuando la calidad de la retroalimentación sea

pobre, ambigua o con ruido y el ambiente sea benévolo, el agente puede permanecer

atrincherado en una concepción supersticiosa del mundo, sin consecuencia o costo

alguno. No así cuando la calidad de la retroalimentación es pobre y la consecuencia

de los errores exigentes.

Distintos problemas asociados a diferentes estructuras del ambiente,

plantean la interrogante en torno a ¿Qué estrategias siguen los agentes para

identificar soluciones? Se examina a continuación distintas formas de aprendizaje

que apuntalan formas también distintas de exploración de posibles soluciones.

Relevante-exigente Irrelevante-exigente Relevante-benévolo Irrelevante-benévolo

Exigente

Consecuencia de los errores

Benévolo

Relevante Irrelevante

Calidad de la retroalimentación

Page 16: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

16

4.- Aprendizaje basado en modelos internos y problemas débilmente

definidos

El agente ha evolucionado, en un mundo caracterizado por problemas débilmente

definidos;19 con mensajes contradictorios ó de múltiples sentidos; con información

incompleta; con circunstancias abigarradas que favorecen la emergencia de familias

de problemas. En este contexto, no busca establecer la “verdad” o la consistencia

lógica, el agente está comprometido continuamente con la solución de problemas con

recursos cognitivos restringidos. La exactitud y las reglas fijas son pobres estrategias

para sobrevivir. La lógica solo funciona si la información es completa.20 Este

ambiente exige velocidad y economía en la construcción de hipótesis. Por ello,

sobrevive aquel que aprovecha los pequeños indicios o pistas que emergen en el

ambiente para luego, amplificar e integrar esos fragmentos de información dentro de

su representación del mundo (Simon, 1956, Selten, 2001).

¿Qué estrategia sigue el agente cuando no cuenta con experiencia ni

conocimientos que le permitan identificar pistas o claves para resolver problemas?

Supongamos inicialmente que es un agente reactivo simple; esto es, sólo responde a

sus percepciones actuales y no guarda memoria de sus éxitos o fracasos. ¿En qué

condiciones objetivas puede tener éxito este tipo de agente? Primero, es necesario

que sea totalmente observable para que pueda representar el problema, las

alternativas y las consecuencias asociadas. En segundo lugar, que la

retroalimentación del ambiente sea rápida, y clara, de tal suerte que el agente pueda

asociar la consecuencia con su acción de una manera clara y temporalmente próxima.

Y, en tercer lugar, que tenga la capacidad de procesar esa información en poco

tiempo y a bajo costo.

Los problemas no son totalmente observables; la respuesta del ambiente no

siempre se desencadena después de la acción, bien puede retrasarse y adicionalmente

no expresar claramente cuál es la consecuencia de la acción. Y finalmente, aún

19 De acuerdo al grado de estructuración de los problemas, Newell y Simon (1977) identificaron dos clases de problemas: i) problemas bien definidos y; ii) problemas débilmente definidos. En los problemas bien definidos, el agente puede considerar todos los elementos del problema. El estado inicial, los operadores, las medidas de promesa y los estados de solución son no-ambiguos, están bien definidos. De esta manera el agente puede elegir una solución satisfactoria. A diferencia de los problemas bien definidos en este, los elementos del problema son desconocidos. Los operadores y los estados de solución están débilmente definidos o son ambiguos. Requieren la integración de diferentes dominios de conocimiento. Posee usualmente múltiples soluciones (ó es insoluble), así como también múltiples criterios para evaluarlas. 20 El agente no sigue las reglas de la lógica o el cálculo de probabilidades – como sostiene la teoría económica neoclásica -, sino responde a la necesidad de enfrentar, con recursos limitados, problemas débilmente definidos. (Simon, 1969; Kahneman, Slovic and Tversky, 1982; Gigerenzer and Selten, 2001; Gigerenzer, 2001)

Page 17: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

17

contando con información clara y con señales rápidas, los problemas de búsqueda de

complejidad- exponencial no pueden resolverse sin la acumulación de información

previa, salvo en casos pequeños. La forma más efectiva que tienen los agentes de

manejar la visibilidad parcial es almacenar información de las partes del mundo que

no puede ver. ¿Cómo? A través de modelos internos. Se puede imaginar un proceso

de selección natural, en el que los agentes que logren construir modelos internos

congruentes con el mundo, se desempeñan mejor y tengan mayores posibilidades de

reproducirse y de subsistir. Los agentes que no, perzcan.21

El método o heurística del ensayo-error “ciego”, ¿hasta donde puede explicar

el aprendizaje de los agentes adaptables? Desde la perspectiva de Johnson - Laird:

“(El) método puro de “ensayo-error” se parece a la evolución de las especies,

con arreglo a una teoría neodarwiniana. Funcionará sólo si hay una

oportunidad razonable de converger en el programa requerido mediante una

serie de pasos graduales, en cada uno de los cuales exista una probabilidad

razonable de que se produzca por azar, y en los que cada uno podría

mantenerse con éxito con el fin de conducir a la siguiente mejora. Las

oportunidades de adquirir alguna habilidad relevante utilizando un método

neodarwiniano no restringido son prácticamente insignificantes, tal y como

los trabajadores de la inteligencia artificial descubrieron en los años sesenta

cuando fracasaron los programas basados en dicho método” (Johnson-Laird,

2000: 127).

El método de ensayo y error “no opera mediante ensayos azarosos o aleatorios (..)

debe haber al menos una “secuela” (Popper, 1992: 227). La razón de ello es que el

agente construye un modelo del mundo que le permite aprender de sus errores. Para

Simon “(E)l ensayo y error no es completamente azaroso o ciego; de hecho es

altamente selectivo” (Simon, 1969:95). Si bien es cierto que el aprendizaje por ensayo

y error depende de la repetición de la misma tarea, también es cierto que, “(s)in

esperar, pasivamente, que las repeticiones nos impriman o impongan regularidades,

tratamos activamente de imponerle regularidades al mundo” (Popper, 1963: 46).22

21 El conocimiento acerca de “cómo funciona el mundo” tanto si está implementado con un circuito booleano simple o con teorías científicas completas se denomina modelo del mundo. Se reconocen dos tipos de modelos, los modelos internos y los modelos externos. (Holland, 2004) 22 En esta misma dirección, Herbert Simon (1989) expresaba que se debía ser un poco cauto al aplicar las ideas evolucionistas darwinianas a la sociedad. En particular respecto a las suposiciones estadísticas de la teoría evolutiva. “(S)i aplicamos las ideas evolucionistas a la sociedad… tenemos que preguntarnos si es factible la selección estadística por medio de ensayos repetidos. ¿Cuántas explosiones nucleares se necesitaran para determinar qué

Page 18: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

18

Esto es posible, en tanto representamos el mundo a través de modelos internos y nos

servimos de esa representación para construir expectativas.23 Como se examina a

continuación.

Aprendizaje Basado en Modelos internos y Aprendizaje ex ante.

El agente aprende de revisar, organizar y mejorar sus modelos internos. Por

ejemplo, el arquero que busca mejorar sus disparos, revisando sus conjeturas. Esta es

una vía privilegiada para mejorar su desempeño, toda vez que, en este caso, el

ambiente provee señales pobres acerca de la complejidad de la trayectoria de cada

disparo. En este ejemplo, el proceso de aprendizaje es fruto de un agente que procesa

el mundo de una manera activa. (Gigerenzer, 2001; Todd, 2001)

El agente procesa la información proveniente de los órganos de los sentidos;

reconoce y correlaciona el estímulo con experiencias previas y elabora una

respuesta.24 El agente a través de la práctica, retiene distintas redes de conexiones

causales mediante la regla “si ⇒ entonces” (condición – acción)25 que, a la postre, se

traducirán en capacidad para el reconocimiento de patrones (Newell y Simon, 1977;

Holland, 2004). 26

Cada vez que el agente se expone a un mismo acontecimiento, fortalece las

viejas conexiones.27 Y cuanto más cercanas y semejantes sean sus experiencias,

mayor será el grado de interacción de las distintas redes de conexiones. Lo cual

contribuye a que, una población de esas conexiones se transforme de memoria de

corto plazo, a memoria de largo plazo (Johnson-Laird, 2000). Lo que se convierte en

memoria de largo plazo, es el núcleo común de las redes superpuestas. Este núcleo

común, no representa una conexión singular, sino un conjunto de propiedades

especies resultan suficientemente aptas para sobrevivir en el orbe?. (…) Si consideramos la evolución como un proceso de prueba en el que los errores son eliminados por las fuerzas de la selección, este modelo se vuelve inapropiado cuando sólo hay un ensayo y no hay lugar siquiera para un solo error.” (Simon, 1989:56) 23 A diferencia de la teoría psicológica conductista, la teoría psicológica cognitiva, considera al agente como un actor activo. 24 Una cosa es reconocer la importancia de las recompensas y otra muy distinta, buscar sustituir la explicación del agente por el nexo asociativo de acción – recompensa. Explicación última asociada al conductivismo. 25 Bloque de construcción del agente complejo adaptable ( Holland, 2004) 26 El cerebro puede ejecutar hasta doscientos billones de operaciones en un segundo y de manera paralela. La deliberación conciente sólo puede ser una parte diminuta de la inteligencia. Algunos psicólogos creen que el pensamiento serial y deliberativo representa sólo el 3% de nuestra inteligencia. El contar con una memoria procedimental, tácita permite que la parte deliberativa, esté libre para explorar o resolver problemas. Este 3% resulta crítico en la construcción de modelos internos y en la formación de estrategias con pocos recursos y poco tiempo disponible. 27 El conexionismo actual, en la psicología cognitiva, combina el programa del conexionismo de Rumelhart y McClelland (1986) con teorías que reconocen estructuras innatas – genéticamente programadas - de aprendizaje (Pinker, 2003).

Page 19: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

19

compartidas por una clase extensa de circunstancias físicas, sociales o lingüísticas,

anidadas jerárquicamente, útiles para sobrevivir.28 No son las conexiones

individuales, aisladas, lo relevante en este proceso, sino el patrón de interacción29 y

de agregación de los modelos internos. 30 Desde esta perspectiva, un solo modelo

interno, así como una sola neurona no pueden hacer mucho por si solos. La

capacidad de resolución de problemas es una propiedad emergente de los modelos

internos que interaccionan, unos, de manera masiva y paralela, y otros, de manera

secuencial.31

Es interesante notar cómo, los modelos internos, compiten y cooperan32 entre

si, buscando influir en el proceso de decisión y comandar el curso de acción.33 Así

como la experiencia reconfigura continuamente a la población de modelos internos,

así también la población de modelos internos, modifica la forma como el agente

experimenta su trato con el mundo, modificando la realidad y simultáneamente su

propia naturaleza interna.34

Gell-Man (2003) describe, de manera estilizada, la evolución del proceso

cognitivo, mediante el cual el agente procesa información (Cf. Esquema No. 2).35 El

ciclo se inicia cuando el agente, a partir de datos previos - incluido el

comportamiento y sus efectos-, percibe regularidades, condensándolo en un esquema

o modelo interno. Los modelos internos le permiten a su vez anticipar consecuencias

y elegir la mejor alternativa posible. Un recurso cognitivo fundamental es que la

revisión se efectúe “internamente”, simulando las distintas posibilidades prácticas, y

eligiendo ex ante la senda a seguir. De esta forma no pone en riesgo, sus recursos,

28 La estructura innata tiene la función de reconocer información “crítica” para retenerla. Esta estructura innata permite la evolución en la conformación de patrones de reconocimiento a una velocidad mayor que una estructura ciega o no jerárquica. 29 Propiedad de no-linealidad y de flujos del agente adaptable. (Holland, 2004) 30 Propiedad de agregación del agente complejo adaptable. (Holland, 2004) 31 Por ejemplo, a nivel organizacional, una de las maneras de descomponer los problemas en subproblemas, se efectúa a través de la división del trabajo y la especialización departamental. La departamentalización tiene varias funciones: contribuye a disminuir la complejidad de la interacción de la organización con el ambiente; permite simplificar el problema y comprometer recursos especializados en la solución de los problemas y; utilizar recursos de manera paralela en vez de forma secuencial. 32 Utilizando mecanismos de marbeteado. (Holland, 2004) 33 Los modelos internos cooperan cuando los modelos internos específicos no pueden representar el curso de acción, y por ende requieren el concurso de los modelos internos generales. Y al contrario cuando los modelos generales no son lo suficientemente precisos para organizar la práctica, emergen los modelos internos específicos, provistos de mayor y más precisa información (Holland, et.al, 1989; Holland, 2004). 34 Corriente causal de interacción ascendente y descendente (Hodgson, 1999). Carlos Marx denominó a esta dialéctica, sujeto - mundo, como “praxis.” 35 En lugar de “modelo interno”, Gell-Man utiliza “esquema”, ambos conceptos son equivalentes.

Page 20: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

20

tiempo, estrategia o su propia existencia.36 Una vez que una secuencia de modelos

internos toma el curso de la acción, se pone en tensión: la descripción causal del

evento, la predicción y el comportamiento desplegado en el mundo real. El proceso

de retroalimentación, ejerce “presión selectiva” sobre la población de modelos

internos en competencia, conservando los que contribuyan mejor a la resolución de

problemas y, eliminando los incorrectos.

Esquema 2

Fuente: Gell Man (2003: 43)

¿La capacidad de predicción y de elección es un atributo exclusivo de los seres

humanos?, ó, tal y como lo sostiene el darwinismo universal ¿es más bien, en

distintos grados y profundidad, una capacidad universal de los agentes adaptables?

Conviene no creer que la humanidad está organizada en una categoría aparte; que

nuestra especie es única y cualitativamente superior. Somos animales, y por ende no

36 Considerar el aprendizaje desde la perspectiva de los modelos internos, ayuda a detectar atributos, que en la tradición de la teoría económica evolutiva, son ignorados, por ejemplo el papel central de las expectativas, la conexión de las expectativas y el ciclo económico. Ausencia que tiene implicaciones profundas en el edificio teórico evolutivo.

FFuunncciioonnaammiieennttoo ddee uunn SSiisstteemmaa CCoommpplleejjoo AAddaappttaattiivvoo

Consecuencias

(mundo real)

Datos previos,

incluido el comportamiento y sus efectos

Datos

presentes

Descripción, predicción, comportamiento

(mundo real)

Esquema que resume y permite hacer predicciones

(uno de entre muchas variantes en competencia)

Identificación de regularidades

y compresión

Efecto selectivo sobre

la viabilidad de

los esquemas

y la competencia

entre ellos

Page 21: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

21

estamos por “encima” de la naturaleza. Por esta razón resulta instructiva la manera

cómo, los biólogos, representan a los agentes adaptables, ya sean amebas, ó seres

humanos.37

“Cuando se les ofrecen alimentos variados, las bacterias nadadoras, los

ciliados, los mastigotos y otros microbios móviles eligen, seleccionan. Con sus

pseudópodos retráctiles, Amoeba proteus encuentra apetecible a

Tetrahymena, pero evita a Copromonas. Paramecium prefiere ingerir

pequeños ciliados, pero si no tiene mas remedio se alimenta de Aeromonas y

otras bacterias.” (Margulis y Sagan, 2005:179)

Los agentes adaptables no sólo asimilan nutrientes del mundo que los rodean, sino

que procesan, con diferentes grados y profundidad hechos, experiencias e

impresiones sensoriales (Ehrlich, 2005). Desde la perspectiva de Kauffman (2003),

se puede plantear este problema desde el terreno de la semántica. Por ejemplo un

agente molecular que se introduzca en un agente autónomo puede ser: alimento;

veneno; una señal; un ente neutro; u otra cosa. El agente sobrevive, en tanto cuenta

con una semántica interna – de naturaleza química – que le permita predecir, por

ejemplo, que “hay más glucosa en esa dirección, que en aquella”.

“(E)n un agente autónomo la simple química puede alojar símbolos y signo en

el pleno sentido de estas palabras.” (Así), “si el receptor es un agente

autónomo, tal como una bacteria, y la molécula entrante es el signo-símbolo

de “paramecio ameba a la vista” y, gracias a ello, la bacteria evita convertirse

en almuerzo nadando lejos, esa secuencia de eventos está cargada de

semántica. (…) (U)n agente autónomo es una cierta conjunción de materia,

energía y organización a la que es posible atribuir propósito en el sentido de

capacidad de obrar en su propio beneficio” (Kauffman, 2003:160)

Desde esta perspectiva la bacteria, representa su mundo, y se sirve de ese

conocimiento para adaptarse. Conocimiento, que se pueden representar bajo la forma

de una regla que establece que, dado una condición específica le corresponde una

respuesta u acción: si A entonces B. Estas reglas, - que Holland (2004) denomina

“modelos internos”, y que se comprimen en los genes o en la cultura - condensan las

37 El texto que sigue es posible que, un economista de la escuela evolutiva, lo encuentre similar al esquema explicativo de la teoría económica neoclásica, toda vez que se explica al agente, no siguiendo rutinas o hábitos, sino “eligiendo” alternativas de acción.

Page 22: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

22

lecciones de supervivencia aprendidas en el transcurso de millones de años de

evolución. El bioquímico Daniel Koshland reflexiona en torno a las capacidades de las

procariotas:

“Elección”, “discriminación”, “memoria”, “aprendizaje”, “instinto”, “juicio” y

“adaptación” son palabras que normalmente identificamos con procesos

nerviosos superiores. Pero en cierto sentido, se puede decir que una bacteria

posee todas estas propiedades…Sería insensato concluir que las analogías son

sólo semánticas, ya que parece haber relaciones subyacentes en mecanismos

moleculares y funciones biológicas. Por ejemplo, el aprendizaje en las especies

superiores implica sucesos a largo plazo e interacciones complejas, pero

ciertamente la síntesis enzimático inducida debe considerarse uno de los

dispositivos moleculares más probables para la fijación de algunas conexiones

neuronales y la eliminación de otras. La diferencia entre instinto y

aprendizaje se convierten en una cuestión de escala temporal, no de

principio” (Koshland, 1992: 1055-1063)

A través de los modelos internos –sujetos a variación y a presiones selectivas -, los

agentes han desarrollado un mecanismo fundamental de anticipación – implícita y /o

explícita - de las consecuencias de sus acciones, o de las acciones de los otros agentes.

Los procesos evolutivos han creado agentes adaptables con “poder cognitivo” para

predecir estados del mundo, moldeándolo en su propio beneficio (Gell-Mann, 2003).

¿Cuál es la diferencia esencial entre el aprendizaje ex post y el aprendizaje ex

ante? Mientras que en el aprendizaje ex post no hay incertidumbre, los

acontecimientos están consumados; durante el aprendizaje ex ante, el agente debe

tomar decisiones riesgosas contando con poco tiempo, con pocos recursos y elevada

incertidumbre. ¿Qué implicaciones tiene el hecho que los agentes tengan capacidades

de explorar más allá de su experiencia, de simular el futuro? El concepto de

“aprendizaje ex ante”, ayuda a dilucidar la naturaleza del descubrimiento inductivo, y

por ende de la expansión de conocimiento.

Modelos internos, inducción y heurística del descubrimiento

El agente dotado de modelos internos, capaz de simular internamente secuencias

complejas de acción, puede requerir de un solo ensayo para inferir exitosamente, y no

de la acumulación voluminosa de datos o estímulos variados del mundo.38 Todo

38 Como resultado del proceso de aprendizaje, los agentes generan nuevos órganos instrumentos, conductas o nuevas hipótesis.

Page 23: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

23

agente debe resolver problemas, y este proceso lo conduce a explotar lo que sabe; a

extender sus conocimientos a otros dominios. El agente aprende a asociar el evento

A, con el evento B. Este proceso de inducción y generalización, no se debe a ninguna

reducción y comparación lógica de las distintas conjeturas, sino al proceso

darwiniano de competencia /cooperación de los modelos internos.

“Because people have little or no introspective access to these processes, or

volitional control over them, and these processes were evolved to solve

problems of evolutionary importance rather than respect logical dicta, the

behavior these processes generate need not follow normative axioms of

inference and choice”. (Camerer, 2005:11)

Por esta razón interesa cómo el agente efectúa sus procesos de inducción. Desde este

horizonte teórico, interesa integrar la heurística del descubrimiento de Bart

Nooteboom (2000), en la medida que permite, en primer lugar, reconstruir y explicar

el proceso de expansión del conocimiento y, en segundo lugar, explicar cómo

evolucionan la práctica de explotación /exploración.39 La heurística del

descubrimiento, está constituida por las siguientes fases: consolidación,

generalización, diferenciación y reciprocación.40 (Cf. Esquema 3) Las cuales, se

describen a continuación:

� Consolidación: Durante la fase de consolidación, tecnología, organización,

conocimiento y lenguaje se consolidan en prácticas estándares, lo cual se

convierte en base para una explotación eficiente. En esta fase los problemas

mal o débilmente definidos se convierten en problemas bien definidos.41 El

producto de la consolidación puede: i) servir como plataforma para la

expansión de nuevas aplicaciones, y por lo tanto la base para la actividades de

generalización, ó; ii) conducir a la repetición ciega e inercial de las prácticas.42

39 Esta explicación evita los dos extremos metodológicos: agente perfectamente racional versus agente programado sobre-socializado. 40 De acuerdo con Kitcher (1993) es posible identificar distintas formas de progreso conceptual, que coinciden de manera significativa con la explicación ofrecida por Nooteboom (2000), estas formas son: introducción de esquemas incorrectos; eliminación de esquemas incorrectos; generalización de los esquemas; y extensión explicativa. 41 Lo que se puede interpretar como transición de conocimiento tácito a explicito. 42 El resultado de este proceso puede no ser óptimo y tampoco único. Este proceso requiere arreglos institucionales adecuados. La emergencia, velocidad y la eficiencia de la estandarización depende de la presión competitiva.

Page 24: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

24

Reciprocidad

Combinación novedosa

Diferenciación Generalización

Consolidación

Exploración

Explotación

Variedad de

contenido cerrada

Variedad de

contenido abierta

Abriendo la variedad de contexto

CAOS

INERCIA

Fuente: Nooteboom B. (2000:184)

Esquema No. 3)

Heurística del descubrimiento

Page 25: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

25

� Generalización: Una de las vías para probar una práctica es la de buscar su

generalización en contextos nuevos, por ello la consolidación provee la base

para la generalización.43 La práctica de la generalización conduce a

actividades de exploración si: ilumina las limitaciones de las prácticas;

identifica los elementos de las prácticas que deben ser preservadas y; plantea

el uso de prácticas vecinas.

� Diferenciación: En la medida en que el agente se mueve en distintos

contextos, la práctica requiere ajustarse a cada ambiente específico. En esta

fase, a diferencia de la consolidación, se requiere elaborar prácticas asociadas

a nuevos contextos.

� Reciprocación: En esta fase se adoptan elementos de prácticas ajenas

encontradas en contextos novedosos. O también elementos de prácticas

existentes se transfieren a prácticas externas de otros contextos. La fase de

reciprocación, puede conducir al establecimiento de prácticas novedosas, ó a

la exploración caótica y desorganizada.

La heurística del descubrimiento, condensa una extensa experiencia inductiva

extraída de la práctica; son el resultado de millones de años de procesos analíticos

condensados, acumulados y explotados, generación tras generación, por los sistemas

complejos adaptables. Desde esta perspectiva, este tipo de conocimiento, no se opone

a la experiencia analítica consciente; la heurística del descubrimiento es el resultado

de la capacidad analítica del agente, por ello es postanalítica, y no preanalítica o no

analítica.

Aprendizaje supone procesar activamente la información que se obtiene del

ambiente.44 Esta experiencia está inscrita dentro de la historia del agente y dentro de

una ecología de acciones de otros agentes en los que co-evoluciona. El universo es

creativo y emergente (Kauffman, 1993, 1995, Watts, 2003).

43 La transición de la consolidación a la generalización, puede producirse o no; no es automática. Esta fase se beneficia de la explotación de contextos variados. 44 ¿Aprendemos de la experiencia? Existen muchas y distintas respuestas. Una respuesta frecuente en la literatura es que, aprender de la experiencia depende de la capacidad del agente de representar el ambiente. En segundo lugar, que el aprendizaje basado en la experiencia no conduce inexorablemente al establecimiento de prácticas óptimas. En tercer lugar, la experiencia no necesariamente enviar señales claras, y por ello es un mal maestro. Y dependerá del agente extraer inferencias correctas. En cuarto lugar los individuos al igual que las organizaciones tienen limitaciones asociados a: sesgos cognitivos, conflicto, y naturaleza de la división del trabajo manual / intelectual. (Kahneman, Slovic y Tversky, 1982; Kahneman, D., A. Tversky, 1979)

Page 26: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

26

5.- Resolución de problemas y aprendizaje medios /fines

¿Es posible estudiar la resolución de problemas, sin considerar las restricciones del

agente? El proceso de búsqueda está sometido a limitacioes. El agente, dotado de

energía limitada, requiere para sobrevivir, administrar su tiempo y energía

disponible. La magnitud e intensidad del proceso de búsqueda, depende de los

recursos - materiales, energía, información45 - disponibles (Simon, 1956; March y

Simon, 1958 ; Cyert y March, 1963; Gegirenzer y Selten, 2001, Todd, 2001).46 Por

ejemplo, para alimentarse, un animal (ratón, conejo, etc.) necesita explorar el espacio

de posibles soluciones. Suponga que el alimento está localizado al final de cada

camino; distribuido de distintas maneras. El alimento puede estar, concentrado en

un grupo de caminos adyacentes, o, repartido aleatoriamente. Existen tres formas de

explorar el espacio, de manera: i) exhaustiva; ii) aleatoria, ó; iii) selectiva. ¿Cuáles

pueden ser los posibles resultados si, se siguen cada una de estas distintas formas de

explorar el espacio?:

i) La búsqueda exhaustiva, se puede aplicar con éxito a circunstancias

simples, por lo demás poco frecuentes en la vida. Si el problema se

caracteriza por elevada complejidad temporal y de espacio, esta

estrategia no resulta factible.47

ii) La exploración aleatoria, contiene promesas y amenazas. En la

medida que depende de la suerte, es una estrategia altamente

riesgosa. Es útil e inevitable cuando: i) no se dispone de

45 Y también del grado de aversión al riesgo del agente. 46 Desde el punto de vista organizacional, el mantenimiento de inventarios tiene una doble función. Cuando no se cuenta con inventarios: las contingencias se vuelven observables de manera más rápida; los problemas no son ocultados o diluidos por la existencia de inventarios, y; facilita y convierte en obligatoria la interacción entre los agentes. No tener inventarios o tener “cero inventarios” contribuye a la creación de estrechos vínculos organizacionales.

Por otro lado, contar con inventarios, facilita a la organización el diagnóstico de los problemas, particularmente cuando éstos son problemas débilmente definidos, y se requiere tiempo para representarlos. Una de las funciones del mantenimiento de inventarios, es disminuir la presión del tiempo sobre la organización.

Por ello, la existencia de inventarios tiene una doble función: a) facilita la interpretación de los problemas, y; b) no contar con inventarios permite la detección de problemas (Cyert y March, 1963). 47 La teoría económica neoclásica se ha concentrado en problemas de optimización, dado un conjunto finito y computable de operaciones. La programación lineal, por ejemplo, permite encontrar una solución óptima pero sólo de problemas bien definidos y sencillos, poco mundanos por lo demás. Para los problemas frecuentes y complejos, con explosión combinatoria, o problemas débilmente definidos, la teoría económica neoclásica, no cuenta ni con instrumentos ni con un programa de investigación (Simon, 1998; Hodgson, 1999).

Page 27: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

27

información y experiencia previa; ii) se requiere escapar de una

región sin soluciones, o; iii) se encuentra en un subóptimo bajo.48

iii) La estrategia de buscar de manera selectiva, aprovechando las

señales o pistas del ambiente, parece ser la más racional, acertada y

plausible para explicar el comportamiento de los agentes

adaptables.49

Si se busca examinar profundamente este proceso, se debe considerar el impacto que

tienen el éxito o fracaso, sobre las expectativas y la intensidad de la búsqueda. El

grado de éxito, puede modificar o sustituir el proceso de búsqueda. 50 De manera

sintética se puede señalar que, el agente responde a los resultados de su acción

dependiendo de: la intensidad de la búsqueda; el nivel de aspiración y de sus recursos

y; la estructura del mundo.51

Conclusión

La teoría de Nelson y Winter (1982) supone que gran parte del comportamiento está

gobernado por rutinas. El excesivo énfasis en las rutinas, ha conducido a construir

explicaciones sobre la naturaleza del aprendizaje, interesantes pero erróneas. Esta

representación del agente ha alejado cada vez más a la teoría económica evolutiva, de

una explicación del comportamiento racional conciente y deliberado. La omisión del

comportamiento racional, deliberado, de las expectativas, de la imaginación y de la

práctica, no son sino la consecuencia del concepto ambiguo de “rutina.”

48 Desde la perspectiva de la biología evolutiva, a través de las mutaciones genéticas, la naturaleza explora espacios de posibilidad no adyacentes - no correlacionados con la trayectoria histórica genética de la especie -. La mutación permite escapar al encierro al que puede conducir la historia evolutiva del agente (Kauffman, 1993, 1995, 2003; Holland, 2004) 49 En la teoría darwiniana, esta forma de explorar el espacio de posibilidades se asocia con la reproducción sexual, a la que se considera como una forma de experimentar espacios de posibilidades de solución estrechamente correlacionados (Holland, 2004). Una de las capacidades críticas que se reconoce a los agentes adaptables es de construir modelos mentales que les permiten detectar “señales” o “pistas” en el ambiente, y con base en esa información crear expectativas. 50 Cyert y March (1963), consideran que, el éxito disminuye la intensidad de la búsqueda, incrementa el nivel de recursos y amplia los objetivos del agente. El fracaso, intensifica la búsqueda, al tiempo disminuye tanto el nivel de recursos, como de los objetivos. Debe considerarse en este proceso, la velocidad con la que se ajustan las aspiraciones, y los recursos. Un texto de economía evolutiva – de la tradición norteamericana - que avanza en esta línea de reflexión es la de Samuel Bowles (2004). Basado en anécdotas, comunes en la teoría psicológica organizacional, Argyris (2001) ofrece una explicación, sobre la manera en la que, el grado de éxito o fracaso de los procesos de búsqueda modifican el equilibrio desempeño /aspiración del agente. Indicaciones, no cabe duda útiles, que llaman la atención sobre la necesidad de examinar con cuidado la interacción del ambiente con las preferencias del agente adaptable. 51 Esta visión del agente se corresponde muy de cerca con el concepto de racionalidad ecológica expuesta por Vernon L. Smith (2003), Gegirenzer y Selten (2001).

Page 28: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

28

Para la teoría económica resulta extremadamente útil e ineludible examinar e

integrar los resultados experimentales de distintos campos disciplinarios, en

particular de la psicología cognitiva y de la neuroeconomía. Vivimos en una época

intensa y estimulante, en la que las distintas comunidades científicas construyen

puentes para unir sus diferentes programas de investigación y tejer, con hilo más

fino, una explicación coherente y verosímil de la cognición. Lo que nos enseñan estas

ciencias es que debemos considerar la dimensión cognitivo / emocional y los procesos

automático/ controlado de la toma de decisiones. La capacidad cognitiva,

considerada como evolución de la población de modelos internos generales y

específicos que, incrustados en diferentes subsistemas, compiten y cooperan,

siguiendo pautas evolutivas darwinianas. El agente elimina las conjeturas con base en

las señales que envía el ambiente (causalidad ascendente) y con base a la revisión de

los modelos internos (causalidad descendente).

Es necesario sustituir la imagen del agente programado por un agente

complejo adaptable, caracterizado por una arquitectura y programas específicos. Un

agente que aprende de diferentes maneras, vía retroalimentación con el ambiente; vía

ensayo-error; vía aprendizaje medios- fines y vía aprendizaje basado en modelos

internos. Resulta útil integrar todas estas formas de aprendizaje dentro de la

heurística del descubrimiento.

La práctica de los agentes debe ser explicada a partir de los procesos de

variabilidad, orden y mecanismo de selección, siguiendo pautas evolutivas

darwinianas. El concepto de práctica se convierte en la unidad de análisis, porque

permite: i) desagregar en unidades discretas la multidimensionalidad de la práctica;

ii) redimensionar y privilegiar las presiones – asociadas a la estructura del ambiente -

que enfrenta el agente adaptable, y; iii) la integración del aprendizaje ex post y el

aprendizaje ex ante.

El agente es su historia, pero también es más que eso; es un sistema biológico

que tiene libre albedrío, tiene espacio para explorar dentro de sí y en el ambiente

márgenes de acción no acotados por su historia. El agente es fruto de una historia de

millones de años de logros inductivos. El concepto de práctica, ayuda a representar al

agente como un sujeto hábil, inteligente, imaginativo, creador y anticipador. Esta es

la apuesta teórica del presente trabajo.

Page 29: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

29

Bibliografía

Abernathy, W. y J., Utterback (1978), “Patterns of Industrial Innovation”, Technology Review, Vol. 81, pp. 41-47. Axerold, R., M. Cohen. (2000) Harnessing Complexity: Organizational Implications of a Scientific Frontier; Basic Books; U.S.A. Argyris, Chris (2001) Sobre el aprendizaje Organizacional, Oxford University Press. México. Becker, M. (2004) “The Concept of Routines Twenty Years Alter Nelson and Winter (1982): a Review of the literature”, Industrial and Corporate Change, 4: 643-677. Becker, M., N. Lazaric; R. Nelson; S. Winter (2005) “Applying organizational routines in understanding organizational change”, Industrial and Corporate Change, Vol. 14, No. 5. pp. 775-791. Berkowitz, Leonard (1999) “Anger” in Handbok of Cognition and Emotion. Tim Dalgleish and Mick J. Power, eds. New York: Wiley, 411-28. Bowles, Samuel (2004) Microeconomics: Behavior, Institutions, and Evolution. Princeton University Press, New Jersey. Buck, Ross (1999) “The Biological Affects: A Typology.” Psychological Review 106(2): 301-336 Camerer, Colin; George Loewenstein, Drazen Prelec (2005) Neuroeconomics: How Neuroscience Can Inform Economics, en J. of Economic Literature Vol. XLIII (March), pp. 9-64. Campbell D. (1977), “Epistemología Evolucionista”, en Martínez y L. Olivè, Epistemología Evolucionista, Paidos, UNAM, México. Campbell, Jeremy (1994) La Máquina Increíble: Lo que Revelan los Nuevos Descubrimientos de la Inteligencia Artificial sobre el Verdadero Funcionamiento de la Mente. FCE, México. Cohen, M.D., R. Burkhart, G. Dosi, M. Egidi, L. Marengo, M. Warglien and S. Winter, (1996) “Routines and Other Recurrent Action Pattern of Organizations: Contemporary Research Issues”, Industrial and Corporate Change 5: 653-698. Cyert, R. and March, J. (1963). Behavioral Theory of The Firm, Ed. Prentice Hall Inc. USA. Dawkins Richard (1993), El Gen Egoísta: las Bases Biológicas de Nuestra Conducta, Salvat, España.

Page 30: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

30

Dennet, Daniel (1999) La peligrosa idea de Darwin: Evolución y Significado de la Vida. Galaxia Gutemberg, Barcelona. Dijksterhuis, M., F. Van den Bosch y H. Volberda (1999),”Where do new organization forms come from? Management logics as a source of coevolution”, Organization Science, Vol. 10, issue 5, pp. 569-582. Dosi, G., R. R. Nelson and S. Winter (2000b) “Introduction: The Nature and Dynamics of Organizational Capabilities”, in Dosi, G., R. R. Nelson and S. Winter (2000a) The Nature and Dynamics of Organizational Capabilities. Oxford: Oxford University Press. Eisenhardt, K.; J. Martin (2000) “Dynamic capabilities: What are they?” Strategic Management Journal, 21: 1105-1121. Ehrlich, Paul R. (2005) Naturalezas Humanas: Genes, Culturas y la Perspectiva Humana. FCE, México. Felin, T., N. Foss (2004) “Organizational Routines: A Sceptical Look”, DRUID Working Paper No. 04 -13, Dinamarca. Frijda, Nico (1986) The Emotions. Cambridge: Cambridge University Press. Gell-Mann M. (1995), El Quark y el Jaguar: Aventuras en lo simple y lo complejo; Tusquets Editores, España. Gigerenzer, G. y Selten R. (2001).“Rethinking Racionality”. En Bounded Racionality: The adaptive toolbox. MIT. Gigerenzer, G. (2001) “The Adaptive Toolbook” en Gigerenzer, G. y Selten R. (Edit)(2001). En Bounded Racionality: The adaptive toolbox. MIT.

Croguennec y Lara (2007) “ Co-evolución de Clusters, Empresas e Instituciones en la frontera norte de México.” Arturo Lara (Edit) Co-Evolución de Empresas, Instituciones y Regiones: Una nueva Visión. UAM – ALTEC – M.A. Porrua , México. Henderson, R.; I.M. Cockburn (1994) “Measuring Competence? Exploring Firm Effects in Pharmaceutical Research”, Strategic Management Journal 15: 63 -84. Hodgson; Geoffrey (1999) Evolution and Institutions: On Evolutionary Economics and the Evolution of Economics; Edward Elgar, OK, USA.

Hodgson, Geoffrey M. (2001) ‘Is Social Evolution Lamarckian or Darwinian?’, en: Laurent, John y Nightingale, John (eds) Darwinism and Evolutionary Economics, Edward Elgar, Cheltenham, pp. 87-118.

Hodgson, Geoffrey M. y Thorbjørn Knudsen (2004) ‘The Firm as an Interactor: Firms as Vehicles for Habits and Routines’, Journal of Evolutionary Economics, 14(3), julio 2004, pp. 281-307.

Page 31: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

31

Hodgson, Geoffrey (2007) Economía Institucional y Evolutiva Contemporánea, Universidad Autónoma Metropolitana, México. Hogarth, Robin M. (2002) Educar la Intuición, Paidos, España. Holland, John., (1975) Adaptation in Natural and Artificial Systems, Ann Arbor, Mich. Holland, J., K. Holyoak, R. Nisbett; P. Thagard. (1989) Induction: Processes of Inference, Learning, and Discovery; The MIT press, London, England. Holland, J. (1998) Emergence; Addison Wesley L. Inc., U.S.A. Holland, J.(2004) El Orden Oculto: De Cómo la Adaptación Crea la Complejidad; FCE, México. Jonson-Laird, Philip (2000) El Ordenador y la Mente, Paidos, Barcelona. Kahneman, D., P. Slovic y A. Tversky (Edit) (1982), Judgment Under Uncertainty: Heuristics and Biases, New York, Cambridge Univesity Press. Kahneman, D., A. Tversky (1979) “Prospect Theory: An analysis of decision under risk”, Econometrica, No. 47. pp. 263-291. Kauffman, Stuart (1993 ) Origins of Order: Self-Organizations and Selecction in Evolution, Oxford University Press, Nueva York. Kauffman, Stuart (1995) At Home in the Universe: The Search of the Laws of Self-Organizations and Complexity, Oxford University Press, New York. Kauffman, Stuart (2003) Investigaciones: Complejidad, Autoorganización y Nuevas Leyes para una Biología General, Metatemas – Tusquets Editores, Barcelona. Kitcher P. (1993) The Advancement of Science; Oxford University Press, N.Y., U.S.A. Koshland, D.E. (1992) “A response-Regulated Model in a Simple Sensory System”, Science, 196, pp 1055-1063. Lewin, A., C. Long y T. Carroll (1999), “The Coevolution of New Organizational Forms”, Organization Science, Vol. 10, No. 5, pp. 535-550. March J.; H. Simon (1958) Teoría de la Organización, Ariel, Barcelona. March, J. (1991), “Exploration and Exploitation in Organizational Learning”, Organization Science, Vol. 2, No. 1, pp. 71-87. (Special Issue) Martínez, S. (2003) Geografía de las prácticas científicas: Racionalidad heurística y Normatividad; UNAM, México. Margulis, L.; D Sagan. (1995) ¿Qué es la Vida?, Metatemas, Brcelona.

Page 32: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

32

Murmann, J.P., Aldrich, H., Levinthal, D., and S. Winter (2003) “Evolutionary Thought in Management and Organizational Theory at the Beginning of the New Millennium”, Journal of Management Inquiry, 12: 1-19. Moreno, Ch. A.; A. Lara (2007) Instituciones de metrología e innovación en el sector automotriz: El caso CENAM y Volkswagen. (en prensa) Nelson R. y Winter S. (1982), An Evolutionary Theory of Economic Change, The Belknap Press of Harvard University Press, pp. 436. Newell, A., H. Simon. (1977) Human Problem Solving, Englewoods Cliffs, N.J. Prentice Hall. Nooteboom, B. (2000), Learning and innovation in Organizations and Economies, Oxford University Press, USA. Pinker, Steven (2003) The Blank Slate: The Modern Denial of Human Nature. Penguin Books, USA. Popper R. Karl. (1966) Of Clouds and Clocks: An Aproach to the Problem of Rationality and the Freedom of Man, St. Louis Missouri, Washington University. Popper R. Karl (1992), Conocimiento Objetivo, Tecnos, Madrid. Quine, W. O. (1960) Word and Object. New York: John Wiley and Sons, Cambridge: MIT Rumelhart, D. E., McClelland, J. L., and the PDP research group. (1986). Parallel distributed processing: Explorations in the microstructure of cognition. Volume I. Cambridge, MA: MIT Press. Selten R. (2001). “What is Bounded Racionality” en Bounded Racionality: The adaptive toolbox. MIT. Simon Herbert (1988), El Comportamiento Administrativo, Editorial Aguilar, Argentina, 337. Simon, H. A. (1956) Rational choice and the structure of the environment. Psychological Review 63: 129-138. Simon, H.A. (1957) Models of Man. Wiley. Simon, H. A. (1998b) Bounded rationality. en Eatwell, Milgate, M., Newman, edit. P. The New Palgrave A Dictionary of Economics, Macmillan Reference. Simon, H.A. (1969) The Sciences of the Artifitial. Cambridge, M.A. MIT Press. Simon H. A. (1962), “The Architecture of Complexity”, Proceedings of the American Philosophical Society, vol. 106 (6), December, pp. 467 – 82.

Page 33: Agente adaptable, aprendizaje y estructura del ambiente ... · internos y expectativas acerca de la estructura y dinámica del mundo.2 Es ... 1.- ¿En la reconstrucción de la conducta

33

Simon, H. (1987) “Ciencia Cognitiva: la más nueva ciencia de lo artificial”, en D. Norman (Edit) Perspectivas de la Ciencia Cognitiva, Piados, España- Simon H. A. (1989), Naturaleza y Límites de la Razón Humana, FCE, México. Simon, H. A. (2002) “Near decomposability and the speed of evolution”, Industrial and Corporate Change, 11 pp.587- 599. UNCTAD Simon, H. (1970) “Teorías acerca de la adopción de decisiones en economía y la ciencia del comportamiento”, en Panoramas contemporáneos de la teoría económica; H. Simon; R. Dorfman, et al; Alianza Editorial; España. Smith, Vernon L. (2003) “Constructivist and Ecological Rationality in Economics”. The American Economic Review, June, pp. 465- 508. Teece, D.J.; G.P. Pisano; and A. Shuen (1997) Dynamic Capabilities and Strategic Management. Strategic Management Journal, 18: 509-556. Todd P. (2001). “Fast and Frugal Heuristic for Enviromentally Bounded”. En Bounded Racionality: The adaptive toolbox. MIT. Watts, D. (2003) Small Worlds: The Dynamics of Networks Between Order and Randomness. Princeton University Press. Princeton. Winter, S.G. (2003) “Understanding Dynamic Capabilities”, Strategic Management Journal 24: 991-995.

Zajonc, Robert B. (1998) “Emotions” in Handbook of Social Psychology. Daniel T. Gilbert, Susan T. Fiske and Gardner Lindzey, eds. Mew York: Oxford University Press., 591-632.