Analisis Politico
description
Transcript of Analisis Politico
Alianza Universidad Textos
J arol B. Manheim y Richard C. Rich
Análisis político empírico Métodos de investigación en ciencia política
Versión española de Rosendo Gallego
Revisión técnica de Miguel Requena
Alianza Editorial
Las cuestiones políticas son siempre complejas. ¿Llevarán a una mayor igualdad las resoluciones judiciales que conducen a la integración racial en las escuelas públicas. o incrementarán las diferencias raciales al fomentar la ·fuga de los blancos» hacia los suburbios segregados? Sí el Presidente retira las tropas norteamericanas de Europa, ¿asegurari esto la paz mundial o causará la guerra al provocar la agresión sovíétíca? Si el Congreso rebaja el impuesto federal sobre la renta, ¿creará con eHo un nuevo gasto sufidente para reducir el desempleo o no hará otra cosa que aumentar la inflación? Emprendemos la investigación en ciencias sociales porque deseamos comprender el mt~ndo complejo que nos rodea, ya sea por la satisfacdón de conocer, ya sea porque queramos ser capaces de prever o incluso controlar los acontecimientos.
Así pues, Ja investigación científica empieza con algo que deseamos conocer~ Este es nuestro tema de investigación, que, por lo común, es de orden muy gene~ raL Tal vez deseemos saber~ por ejemplo, por qué algunos apoyan activamente la
protección del medio ambiente míentras que otros se oponen a ella o son indiferentes. El modo más eficaz de hallar una respuesta exacta (y, por lo tanto, titill consiste en emplear métodos reconocidos de lnvestigadón empírica para estudiar las relaciones que vemos en el mundo" Para poder emplear procedimientos cien~ tíficos en nuestro deseo de hallar una respuesta que sea de general aceptación, tenemos que convertir esa pregunta sumamente general en una o varias muy especificas. De lo contrario~ no sabremos qué observar para buscar la respuesta ni podremos comprender de qué modo se relaciona lo observado con nuestro tema de investigación.
Para transformar nuestra pregunta general en una o varias específicas, hace falta formular algunas explicaciones plausibles de lo que observamos. Podríamos, por ejemplo, sostener que en la opinión sobre Ja protección del medio ambiente influye el empleo del interesado, entre otras cosas porque ciertas ocupaciones se benefician de las medidas protectoras del medio ambiente, mientras que otras re~
30 AnBlisis polflico emplrico
sultan perjudicadas por éstas (al menos a corto plazo) .. También podríamos creer que la edad influye en la actitud para con la cuestión ecológica, porque los jóvene~. en su período de crecimiento, han cobrado conciencia de los problemas de la con~ taminación, en tanto que sus mayores crecieron antes de que se comprendieran esos problemas, '"
Estas explicaciones nos ayudan a reducir la complejidad de la vida social y nos ponen en situación de iniciar el estudio científico, Podemos aplicar la lógica y la información que ya poseemos sobre las relaciones empíricas al análisis de una serie de cosas que esperamos sean ciertas si nuestra amplia explicación es válida. Y ahora podemos formular preguntas como las siguientes: ¿apoyan los jóvenes la legislación sobre el medio ambiente más a menudo que los adultos? ¿Apoyan los oficinistas y los profesionales las medidas sobre el medio ambiente más a menudo que los trabajadores manuales? Podemos ídear el modo de hacer observaciones que nos permitan responder a esas preguntas y, una vez que hayamos explorado preguntas concretas en número suficiente, contestar por fin a la pregunta inida1 de nuestra investigación
Cuando intentamos formular explicaciones posibles de Jos acontecimientos, estamos teorizando o desarrollando teo~ rías. Creemos éstas en nuestro esfuerzo por comprender. Las teorías nos ayudan a orientar nuestra investigación y a determinar si nuestra comprensión es correcta. Por eso, Ja construcción de Ja teoría es la primera etnpa del proceso de ínvestigación1 y por eso es esendal que comprendamos la relación entre teoría e investigación,
U na teoría inadecuadamente desarrollada puede llevarnos a realizar una investigación que no sirva para dar respuesta a Ja pregunta que inicialmente suscitó
nuestro interés, Sin una teoría correcta no podremos afinnar por qué los «haHaZgosi• de nuestra investigación propordonan una respuesta a Ja pregunta que en ésta nos habíamos planteado. Supongamos que iniciamos Ja investigación soJamente con la pregunta antes expresada. Si preguntamos a una muestra adecuadamente seleccionada de 1 500 estadounidenses su opinión sobre la protección deJ medío am~ biente y les hacemos una serie de pregun~?.s sobre sus características, podemos utiÚZar nuestros resultados para describir los tipos de person.as que están a favor o en contra de la legislación sobre el medía ambientet pero no podemos afirmar por qué la apoyan o se oponen a ella.
Por otro lado, si partimos de una teoría que venga a explicar por qué los individuos apoyan las medidas de protección del medio ambiente o se oponen a ellas y formulamos nuestras preguntas para comprobar si eran acertadas las expectativas que lógicamente se seguían de dicha teo~ ría, nuestros resultados nos ayudarán a comprender por qué aquéllos adoptan una u otra actitud.
Para simplificar, supongamos que, según nuestra teoría, Ja primera preocupación de la gente es su bienestar económíco y que su postura sobre la protección del medio ambiente viene totalmente determinada por la manera en que, a su parecer, afectará a sus ingresos Ja legislación propuesta. Una expectativa o predicción que lógicamente se deriva de esta forma de x:azonar es que quienes esperen resultar económicamente perjudicados por las leyes de protección del medio ambiente se opondrán a ellas, mientras que quienes esperen resultar beneficiados las apoyarán, SI nuestra teoría es una explicación adecuada de cómo se adoptan dertas actitudes sobre la protección del medio ambiente, esa predicción deberá ser una afirmación exacta sobre )as relaciones del
mundo real Entonces podremos hacernos una idea de la utilidad de nuestra teoría comprobando la exactitud empírica de la predicción que lógicamente se sigue de ella. Por ejemplo, podríamos preguntar a la gente su opinión sobre la protección del medio ambiente y el efecto que, a su parecer, puede tener en sus ingresos, para averiguar si la predicción queda corrobo~ rada por lo que vemos en las relaciones reales. Cualquiera que sea el resultado, la investigacíón nos indicará así, en cierta medida, por qué los interrogados opinan de un modo determinado sobre esta cuestión. Si la investigación se ha realizado correctamente y la predicción resulta acertada, tendremos razones para cr,eer que hemos formulado una explicación satisfactoria para el comportamiento estu~ diado y buscar nuevas pruebas de su utilí· dad. Si la predicción resulta equivocada, a1 menos tendremos motivos para creer que esta teoría probablemente sea infructuosa para comprender Jas opiniones sobre el tema, y podremos empezar a inda~ gar otras explicaciones posibles"
Tanto si la iniciamos con una teoría como sin ninguna, la investigación puede mostrar los mismos hechos. Pero éstos sólo facilitarán nuestra comprensión sipodemos vincularlos entre sí mediante una teoría, Si sabemos que los oficinistas y profesionales tienen mayor tendencia que los trabajadores manuales a apoyar la protección del medío ambiente, esto sólo nos ofrecerá una explicación de las actitu~ des adoptadas sí podemos dar alguna razón por la que deban estar relacionadas la ocupación y la postura sobre la ecología. De otro modo, el hecho podría ser fortuito, y no por conocerlo estaríamos en mejo~ res condiciones de explicar las actitudes de la gente. Las teorías proporcionan conjuntos de razones por las que los hechos deben estar conectados de un modo determinado, y hacen que los hechos sean
Construcción de la teoría 31
útiles al ofrecernos una estructura para interpretarlos y pa.ra ver las relaciones entre ellos
El objeto de este capítulo es ayudarle a comprender cómo se desarrollan las teorías y cómo se utilizan para orientar la investigación. Expondremos en él ia naturaleza de Ja teorización en la ciencia social, los elementos de que constan Jas teorías, y la relación entre éstas y el resto del proceso de investigación Cuando haya terminado el capítulo, deberá ser capaz de empezar a pensar en las cuestio~ nes políticas que le interesan de una manera que le prepare para emprender la investigación empírica sistemática, a fin de dar respuestas válidas (si no completas) a dichas cuestiones.
Naturaleza de la teoría en Ciencia Social
Construimos teorías por dos razones .. En primer lugar, esperamos que nos sirvan para simplificar la realidad con el fin de comprenderla para controlarla mejor o adaptarla, En segundo lugar, una vez que hemos alcanzado esa comprensión, las teorías pueden guiarnos para comprobar su exactitud. Para ello~ nos ofrecen un fundamento lógico de expectativas o predicciones sobre el mundo que pueden compararse con la realidad mediante téc. nicas de investigación apropiadas. Cuando nuestras predicciones resultan funda~ das, también Jo es la interpretación que les sirve de base, y crece nuestra confianza en haber entendido cómo funcionan las cosas. Cuando nuestras predicciones resultan inexactas1 empezamos a poner en duda nuestra interpretación de los hechos y a buscar la manera de mejorarla"
Las teorías son conjuntas de símbolos lógicamente relacionados que representan lo que creemos que sucede en e/
32 Análisis político empin'co
mundo, Son, simplemente, herramientas nos una idea basándonos en la experienintelectuales. Es importante entender es- da personal, en la observación casual o en to, pues nos sirve para comprender que el pensamiento creador. Más a menudo1
las teorías no son, en sentido absoluto, comprobaremos Ja conveniencia de invesverdaderas ni falsasi tan sólo más o menos tigar lo que otros han averiguado sobre e! útiles. Así como hay más de una manera tema~ Las teorías eficaces se inician a de hacer un martillo, hay muchos modos partir de un conocimiento pormenorizado de desarrollar teorías que expliquen la de los sucesos que deseamos explicar" Sin vida política" Esto significa que no cabe tal conocimiento, probablemente no loesperar descubrir una teoría del mismo graremos comprender lo que ha de expJimodo que un explorador descubre una carse ni tendremos una idea de dóilde nueva isla. ¿Por qué? Porque las teorías hemos de empezar a buscar las relaciones no existen «ahí.> para descubrir1as. Son~" que nos servirán para explicar los sucesos, producto de Ja imaginación humana, de Los disturbios masivos que tuvieron luun arduo trabajo y, a veces, de la buena gar en numerosas ciudades norteamericasuerte. nas a fines de los años sesenta propordo-
Si )as teorías son esenciales para una nan un ejemplo de la importancia que investigación correcta pero no pueden tiene el conocimiento de Jos hechos para descubrirse simplemente examinando poder conceptualizar de manera adecuamontañas de salidas impresas de ordena- da los problemas de investigación, Cuandor durante horas interminables, ¿cómo do se produjeron por primera vez los dístrataremos de construir una teoría que turbios, muchos funcionarios públicos nos oriente en nuestro esfuerzo por com- dijeron que eran obra de un grupo de prender Jos aspectos de la vida política ciudadanos pobres sin vínculos estables que nos interesan? ¿Qué procesos inter~ con la sodedad., Si hubiéramos aceptado vienen? La respuesta no es clara ni senci~ esa interpretación e intentado comprenlla, pues Jas teorías se desarrollan de di- der los disturbios, habríamos definido versas maneras. No podemos esbozar una nuestra tarea diciendo que se trataba de serie de procedimientos para lograr una explicar por qué ese «populacho>) tan nuteoría útil deJ mismo modo que podríamos meroso se había concentrado en nuestras describir la manera de construir una apa- ciudades en aquellos momentos y qué le rato estereofónico, Pero podemos dar una había impulsado a la revuelta. Para expliexplicación de las principales ideas y eta- cario, muchos funcionarios públicos pas que generalmente conlleva Ja cons- adujeron la supuesta presencia de agitatrucción de una teoría. La primera es la dores exteriores, conceptualización del problema Sin embargo, los expertos en ciencia
Lógica de la construcción de la teoría
Empezando con el suceso o comportamiento que deseamos comprender, debe~ mos preguntarnos en primer lugar qué sabemos sobre el fenómeno que pudiera ayudarnos a explicarlo. Podemos formar-
s.odal realizaron entrevistas en las ciudades agitadas por los disturbios, y supimos que la revuelta no se limitaba al populacho, En realidad, los revoltosos, considerados como un grupo, diferían bien poco del sector general de la población negra de esas ciudades 1, Este hecho nos presen~
1 R. M y R. B. Hill, ><Who Riots? A Study of Pn>rticioatian ín the 1967 Rfots», en Sup-
ta una tarea de investigación muy diferente de la sugerida por la interpretación sobre el populacho" Ahora debemos tratar de comprender lo que impulsó a rebelarse a ciudadanos negros normales con empleos, familias y otros vínculos sociales, Las explicaciones subsiguientes se centran en variables tales como la reacción de los negros ante el racismo de los blancos más que en Ja de los agitadores exterioresº
En este caso, un conocimiento insufi~ ciente de los hechos podría habernos inducido a errores fundamentales en nues~ tra labor de construcción de la teoría" De ahí la importancia de la investigación exploratoria, destinada a establecer los hechos en un caso dado. De ahí, también, que hayamos de buscar en las publicaciones existentes información sobre los fenómenos que tratamos de explicar si aspiramos a desarroHar teorías válidas.
Pero una vez que nos hemos formado una idea del mayor núm"ero posible de hechos que están a nuestro akance1 ¿có~
mo construimos una teoría que explique esas observaciones? Por lo general, empezaremos por indagar en los hechos aquellas pautas que den razón de Jos sucesos observados.
Por ejemplo, cabría preguntarse qué provoca las protestas políticas en los campus universitarios- Para contestar a esta pregunta, habrá que explicar lo que lleva a los estudiantes a tomar parte en Jas protestas., Si hemos figurado entre los revoltosos o los hemos conocido, podremos hacernos una cierta idea de sus motivaciones, pero para formular una explica~ ción de por qué participan numerosos estudiantes hará falta información sobre un número de personas mucho más elevado Convendrá que intentemos obtener datos
pfemental Studies for the NationaJ Adw'sory Com· mission on Civil Disorders (1968}
Construcción de fa teoría 33
sobre las características y los motivos de los estudiantes rebeldes en general con el fin de formular nuestra explicación, Si entre los que protestan hallamos rasgos comunes que los distinguen de los que no protestan, podremos deducir que esas características ocasionaron su particiación en las manifestaciones,, Entonces, eJ predominio de aquéllas entre los estudiantes universitarios pasa a formar parte de nuestra explicación del motivo de la protesta"
Este proceso de generaHzacíón de lo que hemos observado a lo que no hemos observado o no podemos observar se Ha~ ma induccíón, y es la base de Ja t.eorfa científica, Las teorías construidas por inducción de observaciones se dice que son empíricamente fundadas
En el pro<;eso de inducción, partiendo de lo que sabemos que sucede en ciertas situaciones, inferimos lo que podría suceder en otras semejantes; establecemos un nexo lógico entre lo que hemos visto y la predicción de lo que no hemos visto, basándonos en el supuesto de que existe alguna pauta constante y subyacente en los sucesos del mundo. Todos aplicamos la inducción en la vida diaria, Si observamos cinco veces consecutivas que la puerta del ascensor se abre cuando pulsamos un botón que hay en la pared, pronto llegamos a la conclusión de que el botón hace que se abra la puerta. Esto es una generalización inductiva de los pocos casos que hemos observado (pulsando el botón cinco veces) a los ~asos que no hemos observado (pulsando el botón más veces o pulsando botones de ascensor en otros edificios) El proceso de inducción se muestra en el diagrama de la figura 2" la, que indica cómo se fundan en hechos las teorías construidas inductivamente.
Pero para construir ia teoría no basta con la inducción, pues la indicación de los hechos no proporciona una expiicadón, a
34 Análisis po/itico empirico
al INDUCCION
Gencrnliz::idón (condusicin i •
abstracta)
t lnduró"
Prui?ba {muchos hechos
específicos)
bl DEDUCCION
Genernliz::idón {supuesto)
1 Deducción
l Pruebt1
(predicciones sobre hechos especifico:;)
Tollos los republic::ino:;
son conservndores
t Por lo tnnto
1 Todos los republicnnos
de Midtlletown son conserv::idorcs
FIGURA L 1 Representación esquemática del razonamiento inductivo y deductivo
menos que podamos indicar también por qué esos hechos han llevado a los resultados observados. Volvamos al ejemplo de la protesta estudiantil. Supongamos que, según lo averiguado, los que protestan tienden a estar más insatisfechos con las medidas de actuación pública que los que no protestan, y que los primeros suelen también dar mucho menos crédito a la eficacia de la política convencional para modificar esas medidas. El establecimiento de este hecho constituirá una explicación de la protesta únicamente si podemos demostrar por qué esas actitudes deben conducir a un comportamiento de protesta. Para demostrarlo, probablemente hará falta formular algunos supuestos sobre el comportamiento político. Concretamente, habrá que suponer que
la gente interviene para cambiar las medidas de actuación a las que se opone firmemente, y que viene a adoptar un CO!Tiportamiento de protesta cuando cree que la participación política convencional (votar, escribir cartas, etc .. ) no va a modificar esas medidas.
En ese punto, estos supuestos (también llamados axiomas o postulados) pasan a formar parte de nuestra teoría, Describen las condiciones en las que esperamos que sea probada la explicación provisional alcanzada" Indican, mediante enunciados generales sobre el comportamiento político en ciertas condiciones, por qué esperamos que se produzca la protesta estudiantiJ por lo que sabemos de los estudiantes en los campus universitarios. Ahora podemos explicar el comportamiento específico (protesta) demostrando que éste se sigue lógicamente de un conjunto de supuestos teóricos.
Al hacerlo1 realizamos la operación inversa de la que hicimos cuando procedíamos al razonamiento inductivoº Ahora, partiendo de enunciados abstractos sobre relaciones generales, llegamos a enunciados concretos sobre comportamientos específicos. Este proceso de razonamiento de lo abstracto y general a lo concreto y específico se llama deducción" Todos nos servimos de la lógica deductiva en nuestra vida cotidiana. Si suponemos que los ascensores funcionan mediante un sistema de botones instalados en la pared y nos encontramos ante un ascensor, dedu
siremos generalmente que para entrar en él hemos de pulsar el botón que hay a nuestro alcance. Por medio de la deducción, hemos ido de una generalización a la predicción de un hecho específico" Este proceso se esquematiza en la figura 2" lbº
La deducción es el proceso que nos permite utilizar las teorías para explicar eventos del mundo rea/, Si podemos demostrar mediante un proceso de ded uc-
ción que cierto evento observado puede predecirse lógicamente basándose en el conjunto de supuestos que constituye nuestra teoría, ~sta aportará una explicación del evento observado. La teoría nos ayuda a comprender el evento dándonos una razón de por qué es como es, La deducción tiene por objeto proporcionar ese vínculo entre la teoría y nuestras observacionesº
Pero una teoría no es válida por el mero hecho de haberla ideado. Por lo general, podemos llegar a formular muchas teorías para explicar un hecho determinado. Lo que debemos preguntarnos es cuáles de ellas son las más útiJes para ayudarnos a comprender el mundo. Y para responder a esta pregunta, tendremos que cotejar distintas teorías con la realidad, Antes de ocuparnos de la contrastación de las teorías, es importante que comprendamos dos cosas, En primer lugar, hemos de conocer los rasgos que confieren utilidad a una teoría para saber cómo abordar la construcción de la misma, En segundo lugar1 debemos saber cómo están relacionados sus componentes entre sf y con la investigación empírica. Par·a que una teoría sirva para explicar las observaciones debe ajustarse a una serie de normas
l, Debe ser contrastableº ¿Podemos inferir de la teoría expectativas sobre la realidad lo bastante concretas y específicas como para hacer observaciones que las confirmen o no las confirmen? ¿Se puede establecer una relación entre la teoría y el mundo de manera sistemática, o la teoría sólo es un conjunto de abstracciones?
2c Debe ser lógicamente correcta. ¿Posee coherencia interna Ja teoría? ¿Son compatibles sus supuestos, e inequívocos los términos que contiene?
3,, Debe ser comunicableº ¿Pueden
Construcción de la teoría 35
comprenderla otras personas con formación adecuada de manera que, sirviéndose de ella, sean capaces de explicar los hechos y proponer ensayos de hipótesis derivadas de ella?
4. Debe ser general. ¿Es posible utilizarla para explicar diversos hechos en diferentes momentos y lugares? ¿Podemos deducir de ella predicciones que puedan comprobarse en diferentes circunstancias, o está vinculada demasiado estrechamente a un conjunto de observaciones?
5 Debe ser parsimoniosa, ¿Es lo bastante sencilla como para poder aplicarla y comprenderla fácilmente, o es tan compleja y profusa en condiciones y excepciones que resulta difícil extraer de ella expectativas explícitas sobre los hechos del mundo real?
Las teorías pueden tener cada una de esas características deseables en grados diferentes, y a veces tenemos que escoger entre ellas al desarrollar una teoría determinada. Tal vez hayamos de sacrificar un tanto la parsimonia, por ejemplo, para obtener una mayor generalidad o posibilidad de verificación" Habremos de tener presentes esos rasgos deseables cuando formulemos la teoría para que el producto de nuestra labor sea verdaderamente provechosoº
Componentes de la teoría en Ciencia Social
Las teorías se componen de conjuntos de conceptos que están relacionados por proposiciones lógicamente derivadas de un conjunto de supuestos. Esta es la estructura lógica de una teoría" Y es esta estructura Ja que nos permite utilizar Ja teoría para explicar los hechos, pues nos sirve para dar las razones por las que
53
36 AnáHsfs político empírico
podemos esperar lógicamente que las cosas sean como son,
Para elaborar una teoría eficaz se empieza por las decisiones que tomamos so~ bre los elementos de construcción de las teorías: los conceptos. Un concepto es simplemente una palabra o símbolo que representa alguna idea. Los conceptos no son nada extraordinario. Nos servimos de ellos a diario para afrontar la complejidad de la realidad clasificando las cosas que encontramos con arreglo a algunas de sus propiedades que tengan interés para nor. sotros. Clasificamos Jos animales de cuatro patas que vemos en vacas. gatos1 perros y otras especies, y esta cJasíficación, por sí soJat proporcíona la base de algunas expectativas importantes (por ejemplo, los perros no son buena fuente de leche). Asignando un nombre a algo, podemos predecir ciertas tosas sobre ello, porque el nombre es un símbolo de determinadas combinaciones de propiedades.
La misma finalidad cumplen los conceptos en la ciencia socíal. Indican las propiedades de los objetos (personas, sistemas políticos, elecciones} que tienen interés para un estudio deterrninado. Un observador put'!de estar interesado en la estructura de la personalidad de cierta persona, mientras otro estará interesado en la identificación de ésta con algún partido, y un tercero centrará su interés en su grado de alienación política, La persona posee todas esas propiedades (personalidad, identificación con un partí· dot grado de alienación) y otras muchas, pero sólo algunas de ellas interesan a una investigación concreta. Los tres observa~ dores abordan la misma realidad. Simplemente, optan por organizar sus percepciones de manera distinta, Los conceptos nos ayudan a determinar, entre numerosos rasgos o atributos, los que son importantes para nuestra investigación.
El hecho es que los conceptos, al igual
que las teorías, no tienen vida propia. Son instrumentos que creamos para fines es~ pecíficos y no pueden tildarse de verdaderos o falsos: sólo puede decirse que son más o menos útiles,
¿En qué consiste la utilidad de un concepto? Hay que hacer aquí tres consideraciones principales
En primer término, como hemos emprendido un estudio empírico, el concepto, para ser Util, debe referirse a fenómenos que~ al menos potencialmente, sean observables. En los tiempos medievales el concepto de Voluntad Divina jugaba un papel importante para explicar los acontecimientos_ Sin embargo1 no podemos comprobar tales explicaciones 1 porque no podemos observar la Voluntad Divina para afirmar si está presente o ausente en un caso dado .. Si ha de tener algún valor científico, el concepto debe referirse a algo que, de algún modo, sea mensurable a través de los sentidos.
No significa esto que todos los conceptos deban referirse a cosas directamente observables. Algunos de los conceptos más útiles en las ciencias sociales se refieren a propiedades que no podemos observar de manera directa, La gente no tiene, sin más~ un rango social del mismo modo que puede ser pelirroja, pero si sabemos ciertas cosas de ella (sus ingresos o su ocupacíón1 por ejemplo), podemos inferfr su rango sociaL Análogamente, las naciones no tienen sistemas políticos autoritarios o democráticos del mismo modo que tienen montañas o desíertos1 pero pode'fnos inferir el grado de democracia que existe en una nación observando ciertas características de su vida política (como, por ejemplo, la índole de las elecciones y las disposiciones sobre libertades civiles).
La pregunta es: ¿podemos idear un conjunto de procedimientos para utilizar nuestros sentidos a fin de reunir informa~ ción que nos permita juzgar la presencia,
ausencia o magnitud en el mundo real de aquello a lo que el concepto se refiere? Si Ja respuesta es afirmativa, se dice que el concepto tiene referentes empíricos: se refiere a algo que es directa o indirec~ tamente observable.
En segundo lugar. además de tener referentes empíricos, los conceptos deben ser precisos-- Se han de referir a un conjunto de propiedades de algún fenómeno y solamente a uno. Debemos saber exactamente de qué hablamos cuando utilizamos un concepto para describir un objeto. ¿Forma parte la raza de la clase social de una persona, o viene determinada esta clase exclusivamente por factores ajenos a la raza tales como los ingresos y la educación? El grado de desigualdad en la distribución de la riqueza de una nación ¿forrna parte de lo que llamamos su sistema político democrático o autoritario, o la naturaleza del sistema político viene dada exclusivamerite por otros factores? La precisión es importante porque nos índica lo que hemos de observar para ver cómo se manifiesta un concepto en un caso dado. Sólo cuando lo vemos podemos emplear el concepto en explicaciones em~ píricamente fundadas.
La precisión nos ayuda también a determínar nuestros referentes empíricos y hacer distinciones entre los fenómenos observados. Si el grado de democracia significa sólo la presencia o ausencia de elecciones populares para cargos públicos, tanto la Unión Soviética como Estados Unidos son democráticos" ¿Deseamos tratar a estas dos nadones como ejemplos del mismo tipo de sistema político para los fines de nuestra investigación? De no ser así, tendremos que afinar el concepto, hacerlo más preciso, para que en nuestro estudio podamos hacer una distinción entre ambas nacione:;
Por último, Jos conceptos, para ser útiles. han de tener alcance teórico, Un con-
Construcción de la teoría 37
cepto tiene valor teórico cuando está relacionado con otros conceptos de la teoría en nUrnero suficiente como para desempeñar un papel importante en la explicación de los hechos observados,
En nuestra explicación hipotética de la protesta estudiantil empleamos dos con~ ceptos. Uno de ellos era la intensidad de fas preferencias sobre políticas públicas, y el otro, la percepción de la eficacia de la acción política convencional para modifi~ car esas políticas públicas. Estos dos con~ ceptos quedaron vinculados por los supuestos de que la gente intervendría para cambiar las normas con las que estuviera en profundo desacuerdo, y de que recurriría a la protesta cuando le pareciera que otros medios de influencia no iban a dar resultado. Dados estos supuestost al encontrar la combinacíón concreta de actitudes a la que hemos aludido, vendremos a esperar un comportamiento de protesta. Cada concepto es esencial para la explicación y está vinculado tanto a los supuestos teóricos como al otro concepto. Ambos tienen valor teórico porque desempeñan un papel necesario en nuestra explicación.
Podernos empezar a comprender ahora que la teoría da eficacia a los conceptos vinculándolos de manera que puedan utilizarse al formular las explicacionesc La teoría une entre sí los conceptos estableciendo relaciones entre ellos, cuyos enunciados adquieren la forrna de proposi· ciones derivadas de nuestros supuestos.
Las proposidonesf en general, postulan uno de dos tipos principales de relación entre los conceptos: covariación y causalidad. Las relaciones de covariación indican que dos o más conceptos tienden a cambiar simultáneamente: a medida que uno aumenta (o disminuye}, aumenta (o disminuye) el otro. Estas relaciones nada nos dicen sobre lo que hace cambiar los conceptos simultáneamente, Por
38 Análísis político empírico
ejemplo, podríamos predecir que el grado de información política y la probabilidad de voto covarían 1 que a medida que crece el uno, crece la otra __ Pero ¿es más probable que se vote porque se tiene más informaciónt se obtiene más información porque se piensa votar y se quiere tomar una decisión correcta1 o el grado de información y la probabilidad de voto dependen ambos de un tercer factor, como, por ejemplo, el interés por la política o el criterio que se tiene del deber cívico? La proposición no nos Io dice. ~'.
Las relacíones causales indican que los cambios producidos en uno o más conceptos llevarán a que se produzcan cambios en uno o varios conceptos diferentes o conllevarán dichos cambios. Por ejemplo1
podemos sostener que cuanto más fuerte sea la identífic.ación con un partido, mayor será la probabilidad de voto, El hecho de sentirse miembro de un partido puede impulsar a votar, pero la probabilidad de votar no crea la identificación con el partido.
Todos estarnos acostumbrados a pensar en términos de causa a efecto en nuestra vida diaria, pero solemos utilizar estos conceptos de manera imprecisa. A menudo, es muy dificil determinar las causas o consecuencias deJ comportamiento huma~ no: cuando más importante es el hechot más dificil es deslindar sus causas, ¿Qué provoca la guerra? ¿Un movimiento social o la creación de un nuevo partido político?
A causa de esta complejidad, debemos ser cautelosos y no postular relaciones causales más que cuando se cumplan cuatro condiciones simultáneamente: primew ra, que la causa y el efecto postulados cambien juntos, o covaríen; segunda: que la causa preceda al efecto; tercera, que podamos determinar un vínculo causal entre la causa y el efecto supuestos {lo que significa que hemos de poder estable-
cer el proceso por el que los cambios en A ocasionan cambios en B), y cuarta 1 que la covarianza de ios fenómenos de causa y efecto no se deba a su relación simultánea con un tercer factor..
Esta última condidón nos previene so~ bre el problema de las relaciones espurias. Cuando A y B varían a la vez porque ambas son causadas por e y no covariarían en ausencia de C, la relación aparente entre A y B se denomina espuria .. Es esencial que analicemos cuidado~ samente los supuestos que formulamos para descubrir la posible falsedad en las relaciones1 antes de incorporarlos a nuestras teorías como si fueran producto de una interacción causaL Un ejemplo clásico de relación espuria es el caso en que un investigador averigua primeramente que el precio del ron importado y los sueldos de los ministros fluctúan al mismo tiempo~ y de ello deduce que los cambios en el precio del ron causan los de los sueldos de los ministros. Es más probable que los precios del ron y los sueldos de los ministros varíen como consecuencia de la modificación de las condiciones económicas generales y del nivel global de los precios. La relación entre las dos primeras varia~ bles es de covaríadón, pero no causaL
Es importante reconocer otras dos características de la causalidad social. En primer lugar, un fenómeno puede causar otro de manera directa o indirecta: puede que A sea causa de B sólo en la medida en que lo es de C, que es causa directa de B, Debemos tener presente el papel que 'cumple la causalidad indireeta para que nuestra teoría sea Jo más completa posible.. En segundo lugar, hemos de prestar atención al hecho de que, en general, el comportamiento humano se debe a más de una causa. A1 teorizar, deberemos evitar la simplificación excesiva, y reconocer el papel que cumple la causalidad múltiple en la vida social. F,,sto
Región
Población pobre
Antigüedad del representante
Población de color
Construcción de la teoria 39
UrbanizadOn
FIOURA 2 ,2 Modelo causal de los determinantes del apóyo de Jos representantes a Ja legislacíón sobre asistencia social en el Congreso de los Estados Unidos, (De Richard G Rich, "The Representation o[ the Poor in the Policy Process; Changes irt Congressional Support for Welfare» En Robert Eyestone (ed .. ), PubHc Poticy Formation (Greenwícll, CT~ )Al Press,
1984), p~ J:J5 .. Reproducción autorizada).
quiere decir, sendHamente, que todo he~ cho puede tener varias causas diferentes y que, a veces, deben reunirse muchos hechos para causar uno determinado2
::i Figuro una amplia exposición del papel que desempefi:m las relaciones causales en la teoriz¡¡dón de Ja cienda social en Hubert M B1alock, Jr. C;;msal Jnferences in Nonex:perimental Research
Para abordar toda esta complejidad, generalmente conviene esbozar un modelo causal de 1a teoría1 esto es, un diagrama donde se especifican con claridad todas las reJaciones planteadas en la teoría~ con lo que se ven más fácilmente las implica~
(Chapel Hiil: University of North Carolina Press. 1964)
40 Análisis político empírico
dones de nuestros argumentos. La figura 2.2 presenta un ejemplo de ese modelo Cada una de las flechas representa una influencia causal, y la dirección en que apunta indica la variable que, segtin la teoría, ha de ser dependiente1 y la que ha de ser independiente, La teoría esquematizada en la figura 2.2 afirma que influyen diversos factores en la decisión de un representante de votar a favor o en contra de la legislación de asistencia social, y eHo de manera directa e indirecta, Por ejemplo, se índica que la magnitud de,,_ la población pobre del distrito electora! del representante influye en el voto sobre asistencia social tanto de manera directa (independiente) como indirecta a través de la pugna electoral del distrito y del grado de antigüedad del representante
Tanto las relacion€s de covariación como las causales pueden ser positivas o negativas. Esto significa que los dos conceptos pueden cambiar ya sea en la mis~ ma dirección, ya sea en direcciones opuestasA Sí cambian en la misma dirección, la relación es positiva. Una rela~ dón positiva viene representada por el enunciado siguiente: cuanto mayor es la pobreza relatíva de los sectores minoritarios en una sociedad, mayor es la probabilidad de violencia política. La relación negativa se expresará mediante el enunciado siguiente: cuanto m.;zyor es el grado de alienación política que siente una per~ sona, menor es la probabilidad de que participe en actividades políticas convencionales. Nuestras teorías deben especificar si esperamos relaciones positivas o negativas entre !os conceptos" Esta información se puede añadír a los diagramas causales colocando un signo más ( +) o menos ( - J en cada trayectoria para indicar si se piensa que la relación es positiva o negativa.
Contrastación y elaboración de la teoría
Las teorías no deben considerarse nun~ ca como productos acabados, sino como instrumentos que ocasionaimente hay que analizar y que a menudo pueden mejorarse, Empezamos con un tema de investigación que requiere una expJicación de los hechos observados Seleccionamos conceptos que, segUn esperamos, han de servir para explicarlos, y relacionamos Jos conceptos mediante proposicio~ nes lógicamente derívadas de un conjunto de supuestos que optamos por formular para lograr una explicación, Y he aquí que ahora estamos entre la espada y Ja pared: ¿servirá de algo esta bonita estructura? Al parecer, explíca lo que deseamos comprender, pero ¿podemos comprobarla de alguna manera? ¿Podemos verificar su utilidad para saber la confianza que podemos depositar en ella y convencer a los demás de su valor?
La contrastación de la teoría es el núcleo del proceso de investigaciónA Como nuestras teorías se desarrollan por lo general partiendo de fracciones de conocimiento sobre relaciones reaJes 1 la tarea de contrastación de la teoría consiste esencialmente en utilizar esta última para formular algunas expectativas acerca de otras relaciones que no hemos observado, y verificar luego si las observaciones reales se corresponden con lo que esperamos obtener. No podemos confiar en las relaciones que ya hemos observado1 pues no hábria contrastadón alguna al indicar que fa teoría conduce a esperar Jas propias relaciones que tratábamos de explicar al construir) a
En nuestro ejemplo del ascensor, después de observar los ascensores de un edificio estaremos bien seguros de que fUncionan en respuesta a un sistema de botones instalados en la pared. Incluso
estaríamos dispuestos a generalizar, partiendo de nuestras observaciones, y llegar a la conclusión de que todos los ascensores funcionan de ese modo, Sólo podemos verificar la validez de esta conclusión probando realme~te otros ascensores. Pero esto no nos sirve para confirmar la comprobación sobre los ascensores del edíficio inicial, porque sabemos ya que funcionan en respuesta a los botones. y no por ello nos sentiremos más seguros de que otros ascensores también Jo hacen. Tenemos que jr a otros edificios y ver cómo funcio~ nan sus ascensores. Finalmente. nunca podemos probar que nuestra teoría sobre el funcionamíento de los ascensores es correcta, pues no podemos llegar a observar todos los ascensores del mundo. A medida que veamos más ascensoíes que fundonan de ese modo sin encontrar nin~ guno que no lo haga, crecerá nuestra confianza en la validez de nuestra generalización" Si no encontramos ningún otro ascensor que funcione mediante botones1 pronto deduciremos que nos hemos equivocado al generalizar las observaciones iniciales a todos los demás ascensores.
La contrastación de la teoría en ciencias sociales obedece al mismo principio. Debemos pasar de lo que hemos observado al idear la teoría a lo que no hemos observado 1 para descubrir si ésta nos proporciona un conjunto correcto de expectativas sobre et mundo, Supongamost por ejemplo, que deseamos construir una teoría para explicar e) comportamiento de voto, Consultamos las investigaciones ya realizadas sobre e] tema y descubrimos que, en Io relativo a los ciudadanos de Estados Unidos, la educación superior está positivamente relacionada c~n la inclinación a votar. A un mayor número de años de escolarización corresponde una mayor probabilidad de voto. Basándonos en esta observadón1 incluimos en nuestra teoría el supuesto de que Jos niveles más
Construcción de Ja teoría 41
altos de educadón conllevan una probabi~ lidad de voto más alta Sabemos que estos factores guardan relación en los Estados Unidos, pero ¿y en otras naciones? ¿Po~ demos hacer, sin temor a equivocarnos, esta generalización de las observaciones de los Estados Unidos a las relaciones en otras naciones? ¿Habrá algo exclusivo del sistema educativo de este pais que cree esa relación? El único modo de averiguarlo consiste en observar a la gente de otras naciones.
Basándose en el supuesto de que la educación acrece Ja probabilidad de voto, podría predecirse que quienes poseen una cierta educación universitaria serán más propensos a votar que los que no han pasado del título de enseñanza secunda~ ría. Se puede comprobar esta predicción viendo si refleja fielmente las relaciones halladas en los datos de diversos países. Cuanto mayor sea la frecuencia con que encontremos pruebas acordes con la predicción, más seguros estaremos de que nuestra teoría sirve para predecir el comportamiento humano, Nunca podremos estar absolutamente seguros de que la teoría es ..:verdadera»t pues no podemos observar todos los casos ni saber con certeza cómo pueden cambiar con el tiempo las relaciones empíricas" Pero podemos adquirir más o menos confianza en la utílídad de la teoría comparando las predicciones de ella derivadas con observaciones. La teoría será útil si nos permite predecir con exactitud lo que no hemos observado previamente,
Las teorías, como conjuntos de conceptos, supuestos y proposiciones, nunca son, en definitiva, probadas ni refutadas: cobramos confianza en la utilidad de una teoría a medida que acumulamos obser~ vadones coherentes con las expectativas o hipótesis derivadas de ella, Por el contrariot nuestra confianza decrece a medida que acumulamos observaciones discor~
56
42 Análisis político empirico
dantes con Jas hipótesis teóricamente derivadas. Y así, lo que hemos Hamado contrastación de ta teoría se reduce, en reaH~ dad 1 a contrastación de hipótesis, La e/a~ boración de la teoría se basa ampliamente en un proceso en el que se comparan las condiciones formuladas en la hipótesis con ]a reaHdad y, una vez que tenemos Jos resultadost se modifica nuestra teoría de modo que las hipótesis derivables de ella sean cada vez más acordes con Jo que observamos, Por eso, es muy importante observar cómo se convierten Jos interrd~ gantes de nuestra investigación en hipóte~ sis que puedan orientar los estudios empíricos y darnos indicios del grado en que son correctas nuestras explicaciones teóricas,
El papel de las hipótesis
Una hipótesis es esencialmente un enunciado de lo que, según creemos, co~ rresponde a los hechos. Expresa lo que esperamos averiguar cuando efectuamos observaciones de la realidad adecuadamente organizadas" Las hipótesis son frases declarativas que indican relaciones previstas entre los fenómenos a los que se refieren nuestros conceptos. Por Jo gene~ ral, se expresan de la forma siguiente:
Cuanto más alto {más bajo, mayor, más amplioJ más lento, etc.) es más alto (más bajo, mayor, más amplio, más lento, etc.) es
Los espacios en blanco se llenarán con los nombres de los fenómenos que esperamos cambien conjuntamente. Por ejemplo, partiendo del modelo de teoría representado en la figura 2 2, podríamos formular la hipótesis siguiente:
Cuanto mayor es la proporción de lapo· blación pobre de un distrito, mayor es la
probabilidad de que su representante vo· te a favor de la legislación de asistencia socW.
Esta es una hipótesis predictiva. No nos dice cómo se determlna el voto registrado, pero apunta algo que podemos observar a fin de obtener alguna prueba sobre la coincidencia entre nuestra teoría y la realidad.
La obtención de esa prueba mediante observación empírica requiere que pasemos del nivel muy general de la teoría a un nivel más específico en el que podamos organizar las observaciones. Para ello, hemos de empezar a pensar en términos de variables. U na variable puede definirse como una característica empíri~ camente ob•ervable de algtln fenómeno que puede asumir más de un valor .. El sexo y la nacionalidad son dos variables que sólo pueden asumir un número limitado de valores y pueden •(medirse>' sólo cualitativamente por medio de designaciones tales como «masculino,, o .{británi~ co)¡. La edad y la renta anual son dos variables que pueden asumir una gama mucho más amplia de valores: se pueden medir cuantitativamente contando,
Las variables nos permiten convertir enunciados que contienen solamente conceptos abstractos en enunciados con referentes empíricos más precisos, de modo que pueda evaluarse la exactitud empírica de los enunciados. No es necesario emplear términos diferentes para desigJlªf Jos conceptos con referentes empíricos claros como la edad o el sexo; pero si se usan conceptos más abstractos, posible~ mente habrá que convertirlos en variables para que puedan orientar nuestra investigación. Por ejemplo, el concepto de pluralismo desempeña un papel im· portante en la ciencia política, pero sus referentes empíricos no son nada darosº Para comprobar la exactitud empírica de
cualquíer enunciado sobre el pluralismo con alguna otra cosa, tenemos que convertir el concepto en alguna variable o conjunto de variables con claros referentes empíricosº Podríamos optar por utiii~ zar el número de gn1pos organizados de intereses de una nación como variable para representar el concepto de pluralismo en nuestra investigación, Luego, podemos reflexionar sobre nuestra observación de las relaciones entre las variables para evaluar la validez empírica de los enunciados sobre las relaciones entre los conceptos, Si estamos dispuestos a suponer que la variable número de grupos organizados recoge el sentido esencial del concepto pluralismo, optaremos por admitir que esta variable está relacionada con alguna variable (como el nivel de gastos del gobíerno en atenciones sociales) como prueba de que el pluralismo también está relacionado con esa otra variable o con el concepto que la representa,
Las variables ocupan un lugar cemral en el proceso de investigación por dos razones, En primer término, nos ayudan a determinar lo que habremos de observar para contrastar nuestra teorfa, pues proporcionan referentes empfrkos más pred ... sos" En segundo lugar, podernos organizar nuestras observaciones conociendo el papel que desempeñan las variables en las hipótesis. Las variables cuyo valor se piensa que cambia en respuesta a los cambios de valor de otras variables se denominan variables dependientes. Su valor depende del valor de otras variables. Las variables que influyen en el valor de otras mediante los cambios de sus propios valores se llaman variables independientes.
U na variable será dependiente o independiente segtln sea la relación expresada por las hipótesis que la contienen. Una misma variable puede ser dependiente en un estudio e independiente en otro. Por
Construcción de la teorla 43
ejemplo~ un teórico, al observar los esfuerzos de presión de los grupos de intereses, puede deducir que cuanto mayor sea el número de grupos organizados de intereses de una nación~ más alto será el nivel de gastos del gobierno en programas de asistencia soda.L En este caso, el número de grupos es la variable independiente (o VI), y el nivel de gastos es la variable dependiente (o VD). Un segundo teórico pensará tal vez que los grupos organizados de intereses se forman cuando se cree en la posibilidad de obtener beneficios del gobierno, por lo que, en su razonamiento, deducirá que cuanto mayores sean Jos gastos del gobierno en atenciones sociales, mayor será el número de grupos organizados de intereses. En este otro caso, los gastos del gobierno son la variable independiente, y el número de grupos es la variable dependiente, La diferencia entre estas dos perspectivas de las relaciones en cuestión se representa en el diagrama de la figura 2 ,3
Esto es ;mnrnrtont"
proyecto de requerido vie-ne determinado en parte por el papel asignado a las diferentes variables. Si afinnamos que el aumento del número de grupos de intereses conlleva el de los gas~os del gobierno, no nos interesa observar el aumento de los gastos del gobierno entre 1960 y 1970 y ver luego el cambio que se haya producido en el número de grupos organizados entre 1970 y 1980, No se puede atribuir a este incremento el nivel de gastos que lo ha precedido, En cambio, si en nuestra hipótesis supone~ mos que el aumento de los gastos ocasiona el aumento del número de grupost será adecuada la estrategia de observación que acabamos de describk El conocimiento del carácter dependiente o inde~ pendiente de nuestras variables nos sirve para organizar la labor investigadora, por lo que en nuestras hipótesis se habrá de
s:r
44 Anillisis político empirico
indicar dicho carácter con toda claridad. Un detenido examen de la figura 2. 3
revela otro tipo de variable importante en el análisis sociaL En la teoría resumida en el diagrama de la figura 2.3a, la actividad de presión es una de las variables intervinientes: actúa entre el número de grupos organizados de intereses y el nivel de gastos del gobierno. Las variables interVinlentes aportan el nexo entre las variables independientes y las dependientes. En este caso los grupos de intereses no afectarían al nivel de gastos del gobier:: no si no presionaran para obtener fondos adecuados a su causaº Si las organizaciones tuviesen prohibido cabildear en la legislatura, la aparición de organizaciones representantes de grupos de intereses no estaría relacionada con el nivel de gastos del gobierno.
En la figura 2 .. 3b, la eventual obtención de beneficios sirve de variable interviniente" La organización de grupos de intereses no estaría relacionada con el nivel de gasto público si los integrantes de los grupos no creyeran que puedE;!:n obtener alguna ventaja organizándolos. Por ejemplo, si casi todo el gasto del gobierno se destinase a proyectos de defensa y muy poco a programas internos, muchos ciuda-
danos probablemente no verían beneficio alguno en que se aumentara el gasto público ni se organizarían en grupos aun cuando éste creciera rápidamente,
Las variables intervinientes condicionan las relaciones entre las otras variables. Esto significa que el valor alcanzado por las variables intervinientes puede influir en la solidez y dirección de ]as relaciones entre las otras variables. Si en la figura 2.3a es escasa la actividad de presión, también lo será la relación entre la organización de grupos de intereses y el gasto público. Si dicha actividad es intensa, habrá una marcada relación entre las otras variables.
Como las variables intervinientes condicionan las relaciones entre las otras, el conocimiento del papel que desempeñan influirá en nuestras expectativas sobre las relaciones entre variablesº Si en nuestra teoría suponemos que la actividad de presión interviene entre la organización de grupos y el aumento del gasto, podemos hacer las siguientes predicciones:
La organización de grupos de intereses estará positivamente relacionada con el aumento de los gastos del gobierno cuando sen intensa la actividad de presión.
a) Los grupos como variable independiente y el gasto como variable dependiente
Formación de grupos ------de intereses
Esfuerzos de ------------ Aumento del presión gasto del
gobierno
b) Los grupos como variable dependiente y el gasto como variable independiente
Aumento del gasto -------- Posibilidad de --------->~ Formación de del gobierno beneficios que grupos de
esperan obtener intereses los grupos por iníluencia política
FIGURA 2 .3. Teorías alternativas que explican la relación entre la actil:idad de los grupas de intereses y los niveles de gastos del gobierno
La organización de grupos de intereses estará sólo escasamente relacionada con el aumento de los gastos del gobierno cuando la actividad de presión sea muy limitada.
No nos daremos por satisfechos con predecir simplemente que la organización de grupos de intereses estará relacionada con el aumento de los gastos del gobierno, pues creemos que el que las dos variables estén relacionadas depende del valor de la variable interviniente, la actividad de presión. Por eso, debemos especificar el orden de relaciones y el papel que juega cada variable en nuestras teoríasº
Un último tipo de variable que es importante a este respecto es la variable antecedente. Mientras que las variables intermedias se sitúan entre las variables independientes y dependientes, las antecedentes intervienen antes de la variable independiente. Los estudios realizados sobre el comportamiento de voto en los Estados Unidos revelan que quienes se identifican fuertemente con un partido político son más propensos a votar que quienes no lo hacen. Y así, supondremos tal vez en nuestra teoría que la identificación con un partido conlleva u ocasiona la frecuencia en el voto" Pero ¿qué hace que algunos se identifiquen fuertemente con un partido y otros no? Cabría pensar que la firmeza de la identificación de los padres con el partido desempeña un papel importante en este sentido, en cuyo caso esa identificación de los padres con un partido será una variable antecedente en la cadena causal que produce la f recuencia de voto.
El empleo de variables intermedias y antecedentes en nuestras teorías ayuda a clarificar las cadenas causales que intervienen en la creación de lo:> fenómenos que deseamos explicar. Esto nos proporciona una base cabal para deducir hipóte-
Construcción de la teoría 45
sis con las que comprobar la utilidad de nuestras teorías, pues las hipótesis son esencialmente enunciados de relaciones entre las variab/esc Aportan una base para reunir pruebas sobre la utilidad empírica de nuestra estructura teórica. Cuaqdo más numerosas y detalladas sean las relaciones que postulamos, más predicciones podremos hacer sobre el mundo y, por lo tanto, más contrastaciones potenciales tendremos de nuestra teoría
Falta saber cómo llegamos a esas predicciones o hipótesis: ¿cómo determinar las relaciones que hemos de expresar en forma de hipótesis, en torno a las cuales podamos construir los proyectos de investigación?
Formulación de las hipótesis
Llegamos a las hipótesis por el razonamiento inductivo o el deductivo. Utilizaremos uno u otro según la etapa que hayamos alcanzado en el proceso de investigación. Si empleamos todavía el método del ensayo y el error para construir una teoría, podríamos elaborar las hipótesis mediante un proceso de generalización inductiva. Por ejemplo, si observamos que entre los estados de los Estados Unidos el grado de participación política popular varía directamente con el de industrialización, podríamos hacer una generalización diciendo que esa relación entre variables se comprueba también cuando comparamos unas naciones con otras, Si obtenemos pruebas de Ja hipótesis, nos sentiremos más seguros para incluir la industrialización como variable en una teoría ideada para explicar la participa~ ción política, Sin embargo, hasta que no dispongamos de una teoría que revele por qué están relacionadas la industrialización y la participación, no nos servirá el
46 An{llfsis político empírico
hecho de su relación para explicar la participación política.
Las hipótesis obtenidas inductivamente pueden ser importantes en la investiga~ ción exploratoria, que nos ayuda a construir las teorías 1 pero no nos sirven para eKplicar los fenómenos" Una vez que hemos establecido una teoría que ponga en relación nuestras variables en un sistema lógicamente coherente, podemos deducir hipótesis de dicha teoría mediante el razonamiento deductivo" Como estas hipótesis son predicciones sobre eI mundo que están lógicamente implícitas en Ja teoría en la que trabajamos, su corroboración nos ayuda a explicar los hechos, pues refleja la validez del sistema teórico del que hemos extraído las hipótesis.
El razonamiento deductivo es una disciplina sumamente desarroHada, por Jo que no intentaremos expJicar sus reglas3 ,
Digamos1 sin embargo -pues esto es importante-- que la lógica deductiva es un proceso por el que se puede hacer explícita Ja información contenida en un conjunto de enunciados- Por la sola. deducción no podemos saber nada nuevo sobre las relaciones. La utilizamos sólo para extraer toda la información posible de lo que ya suponemos de ellas. Usamos la deducción para aclarar las implicaciones de nuestros supuestos1 y esa darificac:ión es lo que produce las hipótesis.
Ello queda ilustrado en la deducción contenida en la figura 2. Ib. Si el supuesto en ésta establecido es correcto, esto es. si el partido republicano atrae sólo a los conservadores, cualquier conjunto de miembros de ese partido será también conservador, y como Jos republicanos de Middletown son miembros de él, serán
,::i Wesley V Salmon ofrece una introducción de füdl lectura a estu materia en l,ogic, 2 "ed (Englew wood Ctiffs, N J.: Prentíce-HaU, 1963)
igualmente conservadores. Es éste el tipo de razonamiento a que nos referimos al decir que una conclusión «se sigue lógicamente;. de otra, La conclusión de que todos los republicanos de Middletown serán conservadores está lógicamente implícita en el supuesto de que el partido republicano atrae sólo a los conservadores.
La tarea de elaboración de la hipótesis consiste~ lógicamente, en extraer este tipo de conclusión de los supuestos que forman nuestras teorías. Precisamente porque las hipótesis se deducen de Jas teorías de este modoi Ja contrastación de aquéllas aporta una contrastacíón indirecta de nuestras teorías, Si entrevistamos a una muestra adecuadamente escogida de republicanos de Middletown y averiguamos que no todos son conservadores~ tendremos buenos motivos para dudar de la validez de nuestro supuesto" La existencia de liberales entre los republicanos de Middletown demuestra que el partido no atrae sólo a los conservadores~ En tal caso, optaremos por modificar nuestro supuesto a fin de que la teoria reíleje más fielmente la realidad, expresándolo, por ejemplo, en los siguientes términos: «EJ partido republicano tiende a atraer más a los conservadores que a los liberales». De este supuesto podemos deducir Ja hipótesis siguiente: <(Entre "tos miembros deJ partido republicano de Middletown habrá más conservadores que liberales))
Si vemos que hay unos pocos liberales Y numerosos conservadores entre los republicanos de Middletown, podemos decir que Ja prueba es consecuente con la hipótesís y con el supuesto modificado del que se ha extraído. No podemos dar todavía mucho crédito a la validez del supuesto, hasta que éste quede confirmado por la prueba sobre el carácter conservador o liberal de una muestra más amplía del partído republicano nacional. Después de
todo, puede que Middletown sea, de alguna manerat excepcional Tal vez haya tan sólo diez liberales en toda la ciudad y el hecho de que solamente unos cuantos miembros del partido republicano sean liberales obedezca a ello, y no a la relativa atracción que ejerza el partido sobre liberales y conservadores.
Lo importantet én este aspectot es que las pruebas de la exactitud de las hipótesis son pruebas de la exactitud de una teoría solamente cuando las hipótesis están vinculadas a la teoría por lógica deductiva. Sólo entonces podemos apoyarnos con verdadero fundamento en Ja prueba de la validez de una hipótesis para enjuidar la teoría de la que ésta procedeº Las teorías se desarrollan, amplían y mejoran mediante este proceso que con~ siste en deducir lógicamente las hipótesis, cotejarlas con la realidad y evaluar la teoría a la luz de Jos resultados,
Hay un tipo de hipótesis que desempeña un papel especialmente crucial en este proceso: la hipótesis rival alternativa. Todo hecho tiene múltiples explicadones posibles. Algunas de ellas serán totalmente coherentes entre sí, y más de una puede ser correcta, Pero en algunos casos las explicaciones serán opuestas unas a otras: si una es correcta, no puede serlo la otra, Si expresamos nuestras explicaciones en forma de hipótesis, llamaremos hipótesis rivales alternativas a las que sean incongruentes entre sí. Son alternativas porque aportan diferentes modos de observar o comprender el hecho que se ha de explicar. Son rivales porque no pueden ser válidas las dos: si una es correcta, Ja otra tiene que ser incorrecta. No podemos comprobar ni comparar todas las hipótesis alternativas posibles reladonadas con un hecho, pero si hemos de dar algún crédito a la exactitud de cualquier hipótesis, debemos tratar de contrastar las principales hipótesis rivales para asegurarnos de que
Construcción de la teoda 47
no estamos desorientados por nuestras observaciones.
Una forma común de hípótesis rival alternativa es aquélla en que la relación entre dos variables cualesquiera es espu~ ria y Jos cambios producidos en ambas obedecen, de hecho, a un tercer factor. Este tipo de hipótesis rival alternativa es especialmente ütil en la contrastación de la teoria, pues sugiere una conclusión que nos proporciona una base sólida para determinar cuál de las dos hipótesis en cuestión es más exacta.
Recordemos, por ejemplo, nuestro ejemplo en el que se infiere una relación causal entre los precios del ron y los sueldos de los ministros partiendo del hallazgo de que las dos variables están en realidad estadísticamente relacionadas- Una importante hipótesis rival alternativa es que esas flúctuaciones de ambas se deben a las modificaciones de las condiciones económicas generalest representadas por el nivel de los precios, Si esta hipótesis es correcta, Ja relación entre los precios del ron y los sueldos de los ministros desaparecerá cuando ((controlemos» (esto es, cuando mantengamos constante) el efecto del nivel de precios. Los procedimientos estadísticos y los planes de investigación nos sirven para determinar sl este es el caso. Sí descubrimos que la relación estadística entre Jos precios del ron y los sueldos de Jos mínistros desaparece cuando mantenemos constante el nivel general de los precios, tendremos un fundamento para rechazar Jas hipótesis originales Y aceptar la hipótesis rival. Si la relación entre precios de] ron y sueldos persiste aun después de haber mantenido el nivel general de precios, daremos mayor crédito a la hipótesis de que ambas variables están verdaderamente relacionadas.
48 Análisis politico empírico
Conclusión
La teoría cobra credibilidad como instrumento intelectual eficaz cuando obtenemos pruebas de las predicciones de ella derivadas y eliminamos las hipótesis rivales alternativas, No obstante, debemos tener presente que ningún elemento de investigación proporciona por sí solo pruebas suficientes para aceptar o rechazar una teoría o parte de ella que corresponda a fenómenos ajenos a los incluidos en el estudio Siempre existe la posibili-'" dad de que una investigación ulterior arroje pruebas contrarias a la validez de la teoría, y siempre hemos de estar dispuestos a aceptar conclusiones opuestas y
recurrir de nuevo a la inducción para incorpnrar nu~vas pruebas a teorías más fructuosas. La construcción de la teoría es un proceso de interacción constante entre conjetura y evídendat entre razonamiento e investigación. Requiere a la vez habilidad creadora y empirismo realista. Confiamos en proporcionar una buena dosis de este último en los capítulos siguientes.
Sugerencias para otras lecturas
Las publicaciones sobre teoría de la ciencia s~cial suelen ser tan enígmáticas que, por lo general, sólo las comprenden quienes están familiarizados con el uso especializado de los términos que aparecen en la disciplina académica llamada filosofía de la ciencia. Con todo, esta complejidad no debiera ocultar el hecho de que ei proceso de construccíón de la teoría se funda en algunos principios fáciles de expresar y asimilar, Por su asequible tratamiento del tema y su valor didáctico, aconsejamos la lectura de los siguientes libros.
Uno de los análisis más arnpHos de los principios de la investigación en ciencia
socia) es Foundations of Behavioral Research, de F red N Kerlinger (Nueva York: Ho!t, Rinehart y Winston, 1964). Con relación a este capítulo, tiene especia! utilidad la exposición del pape! que desempeñan las hipótesís, contenida en el segundo capitulo de la obra de Kerlínger. Tres libros que se concentran más exclusivamente en el desarrollo y utilización de la teoría en el proceso de investigación son: The Elementos of Social Scientilic
Thinking, 3.ª ed., de Kenneth R Hoover (Nueva York: SL Martin's Press, 1984); A Primer in Theory Consfructionj de Paul Davidson Reynolds (Indianapo!is: Bobbs Merri!I, 1971), y The Logic of Science in Sociology, de Walter Wallace (Chicago: Aldine, 1971). (Edición en castellano: La lógica de la ciencia en la sociología, Madrid. Alianza, 1976 .. )
The Logíc of Survey Analysis, de Morris Rosenberg (Nueva York: Basíc Books, 1968), está dedicado esencialmente a los métodos del anáiisis de datost pero contiene también un excelente estudio de la naturaleza de las variables y las relaciones entre ellas, Una breve obra en Ja que se recorren con perspicacia y claridad las etapas de conceptualización, construcción de Ja teoría, generación de hipótesis Y contrastación de hipótesis es Ia titulada Democracy in the American South, de Charles F .. Cnudde (Chicago: Markham Publíshing Company, 1971) Su lectura ofrece una acertada imagen de los vínculos entre teoría e investigación" El mismo tjpo de ejemplo proporciona e! artículo « Work Life and Política! Attitudes: A Study of Manual Workers>., de Lewis Lipsitz, American Politica/ Scíence Revíew, 58 (diciembre 1964), pp. 951-62.
Ejercicios de investigación
l. La lista siguiente comprende varios conceptos que podrían utilizarse en inves-
tigación política Piense en una o más variables que puedan servir para representar cada uno de ellos. Indique hasta qué punto confía en que las variables escogidas para representar cada concepto adecuadamente reúnan todo lo que quie~ re expresar al utilizar el concepto, ¿Necesita varias variables para abarcar el signi~ ficado de algunos de los conceptos?
Desarrollo económico
Competencia de partidos
Ley y orden Tensiones
internacionales Igualdad política Urbanización
Representación política
Discriminación racial
Liberalismo Represión Terrorismo Poder
presidencial
2, Seleccione cuatro conceptos cualesquiera de los enumerados en el ejercicio 1 y establezca una hipótesis que prediga una relación entre cada uno de ellos y un concepto no incluido en la Hsta con el que pueda estar razonablemente relacionado en la realidad. Formule dos de las hipóte-
Construcción de Ja teon8 49
sis donde se establezcan relaciones positi~ vas, y dos que establezcan relaciones ne
gativas. .3, Seleccione una noticia sobre alguna
tendencia o suceso político en el que esté interesado, Imagine al menos dos explicaciones de ta tendencia o suceso y exprése!as con la mayor claridad posible. Haga una lista de los conceptos empleados en cada explicación y empareje cada uno de ellos con una variable correspondiente que pueda utilizar en un proyecto de investigación, índicando la índole de cada variable (independiente, dependiente, interviniente, antecedente). Represente en un diagrama el !lujo causal que conlleva cada una de las explicaciones
4,. Examine las explicaciones que ha imaginado en el ejercido 3 para determinar los supuestos que plantea sobre las relaciones en el mundo. Exprese estos supuestos del modo más claro posible. Reflexione sobre ellos para obtener alguna conclusión sobre los sucesos que deba ser válida si lo son los supuestos, Exprese esa conclusión en forma de hipótesis pre~
dictiva.
<O.-v~~rlw
J . .v-.ve,JT fv~.Jr;.~ ~
Ah, OJA \JO- \\.M,c~'-ol
e.J ~e.fo_, (2-0t:· u (.Q,
A Ó , I
Cada calidad se manifiesta en una cierta cantidad, y sin cantidad no puede haber calidad. ffe¡sta hoy rnuchos de nuestros camaradas todavía no comprenden que deben alcanzar el e¡specto cuantitativo de las cosas: las estadísticas básicas, los principales porcentajes y los límites cuantitativos que determinan la calidad de las cosas. No tienen «cifras» en la y, corno resultado de ello, no pueden dejar de cometer errores.
La investigación empírica es un medio de obtener respuestas a preguntas sobre la realidad. Nuestras preguntas pueden ser esencialmente prácticas o de interés principalmente académico. En cualquiera de los casos, lo probable es que las formulemos en términos abstractos. Y, sin embargo, las respuestas que deseamos suelen ser concretas y específicas. Uno de los primeros problemas de la investigación es el de idear el modo de obtener, partiendo del nivel abstracto de las preguntas, algunas observaciones concretas que nos permitan responder a ellas.
Para tomar un ejemplo ajeno a la política, supongamos que deseamos resolver la polémica sobre cuál de dos jugadores de defensa profesionales es el mayor atleta. Evidentemente, necesitamos compararlos de algún modo para establecer el argumento. Pero ¿sobre qué bases vamos a compararlos? Queremos determinar cuál demuestra poseer más cualidades de gran atleta, pero la grandeza atlética es un concepto abstracto. Si hemos de evaluar a cada uno de los jugadores de defensa en
67
Mao Zedong
función de su calidad, tendremos que cuantificar el concepto de grandeza atlética. Podríamos optar por contar los pases que realizan en los partidos televisados, dividir ese número por los pases que han intentado y atribuir a la cantidad resultante el valor de la grandeza atlética. O, más bien, podríamos efectuar varias de estas operaciones sobre diferentes aspectos de la actuación de los jugadores, con el fin de obtener un cuadro más completo de su calidad de juego en la posición de defensas, y combinarlas luego de alguna maner¡:i. Una vez que hayamos obtenido lo~ números correspondientes, estaremos preparados para hacer comparaciones concretas y resolver el debate.
Lo que acabamos de describir es, esencialmente, el proceso por el que, a partir de un concepto abstracto, llegamos a formular una observación concreta en la investigación en ciencias sociales. Es una fase crucial del proceso de investigación, pues sólo cuando se ha realizado correctamente, constituirá la información obtenida una prueba de la utilidad de nuestras
./63-
68 Análisis político empírico
temias o aportará respuestas a nuestras preguntas. El proceso de seleccionar fenómenos observables que representen conceptos abstractos se denomina operacionalización, y la especificación de los pasos que han de darse al formular observaciones se llama instrumentación. La aplicación de un instrumento da lugar a una medición, y ésta es la que finalmente nos sirve de prueba al tomar decisiones y contestar a las preguntas.
En este capítulo describiremos estos procesos en detalle y expondremos los problemas que pueden plantearse al tratar de operacionalizar y medir los conceptos. Cuando haya terminado el capítulo, estará en condiciones de formular las explicaciones que haya pensado tras la búsqueda de las publicaciones, en una forma que le permita cotejarlas con las observaciones reales. Las actividades que aquí exponemos son los últimos pasos que han de darse en el proceso de investigación antes de establece1· el proyecto y de iniciar verdaderamente el acopio de datos.
Operacionalización: El nexo entre teoria y observación
En el capítulo 2 hemos subrayado la importancia de contar con una teoría que oriente las observaciones. En el proceso de investigación, tal como lo hemos descrito, se trata sobre todo de comparar las observaciones reales con las expectativas sobre la realidad derivadas de nuestras teorías, para determinar qué confianza podernos depositar en éstas, es decir, hasta qué punto pueden expiicar los fenómenos políticos. Esas expectativas se han expresado en forma de hipótesis, que predicen ciertas relaciones entre las variables que representan los conceptos contenidos en la teoría. El objeto de este capítulo es exponer la manera de imaginar
observaciones que permitan hacer tales comparaciones. Se trata de saber córno podemos cuantificar nuestros conceptos para establecer, en enunciados precisos, si nuestras expectativas, deducidas teóricamente, son coIToboradas o no por lo que observan1os.
En este sentido, los problernas que se plantean en las ciencias sociales son básicamente los misrnos que en las ciencias físicas. Un sencillo ejemplo contribuirá a aclarar algunos aspectos. Deseamos con1-probar la hipótesis de que un abono químico echado en un maizal estimulará más el crecimiento que las sustancias nutritivas naturales que hay en otro. El creciniiento es un concepto abstracto. No podemos verlo directamente. Necesitamos convertir el crecimiento en una variable empíricamente observable para poder determinar cuándo ha crecido una planta
más que otra. Podemos hacer que la variable altura
alcanzada represente el concepto crecimiento, ya que las alturas relativas son empíricamente observables. Mas las plantas de maíz no llevan señales que indiquen su altura, y tenemos que comprobarla nosotros mismos. Pero ¿cómo? Podemos recurrir al discernimiento humano haciendo que algunos observadores clasifiquen las plantas de arnbos maizales en altas y bajas. Sin embargo, este procedimiento sólo permite hacer comparaciones toscas entre las plantas y está sujeto a todo tipo de errores, porque la gente difiere en sus apreciaciones. Necesitamos un medio más preciso y fiable de determinar las alturas si hemos de hacer cornparaciones válidas.
Lo que debemos hacer es convertir la variable altura a los términos de algún instrumento de medida que pueda utilizarse para obtener indicaciones precisas y normalizadas sobre el grado en que las distintas plantas de maíz poseen esa ca-
racterística. Podemos hacer que la altura venga representada por un indicador, como longitud en pulgadas, y medir las plantas con una cinta métrica. Las lecturas con ésta obtenidas Se convierten así en los valores que asignamos a las plantas en función de la variable altura, y son estos valores los que realmente comparamos al tratar de evaluar la exactitud de nnestra predicción: que el crecimiento será mayor en un campo que en otro.
Y así, hemos pasado del concepto abstracto crecimiento a la variable altura; y de ésta al indicador longitud en pulgadas. Esta transformación es lo que se llama operacionalización, pues hemos reducido un concepto abstracto a un conjunto de valores que pueden obtenerse mediante operaciones especificables. Por último, hacemos cornparaciones con arreglo a las cuales estimaremos la exactitud de nuestra hipótesis sobre el crecimiento relativo comparando los valores resultantes del proceso de medición (en este ejemplo, las lecturas oqtenidas con la cinta métrica). Cuando hablamos de observación en una investigación, nos referimos al proceso de aplicar un instrumento de medida para asignar valores de alguna característica o propiedad del fenómeno en cuestión a Jos casos estudiados. En otras palabras, la observación significa utilizar un instrumento para medir un rasgo o comportamiento.
Es importante comprender este punto, porque aclara el significado de la operacionalizacíón y la medición en el proceso investigador. Nunca podemos comparar verdaderamente los conceptos, aunque se formulen en conceptos nuestras teorías y, con frecuencia, los interrogantes de nuestra investigación. Lo que compara1nos son indicadores de conceptos. En nuestro ejemplo, no podemos cornparar el crecimiento de las plantas en los dos maizales; sólo podemos comparar las lecturas que
De lo abstracto a fo concreto 69
obtenernos con la cinta métrica, las rnedidas producidas por el indicador que, según hen1os decidido, representa el concepto.
Esto significa que nuestras comparaciones sólo pueden ser exactas en la medida en que los indicadores escogidos reflejen el concepto que tratamos de medir. Si no hemos operacionalizado adecuadamente nuestros conceptos, la relación entre los indicadores puede no ser un reflejo fiel de la relación entre los conceptos que aquéllos deben representar. Y si es así, será errónea cualquier conclusión que extraigamos de nuestras observaciones sobre los conceptos o la teoría de que forman parte.
La figura 4.1 ilustra esta situación. Nuestra teoría plantea una relación entre dos conceptos abstractos. Nuestra hipótesis predice una relación entre dos variables empíricamente observables, que reducimos a indicadores mensurables, y nuestras observaciones revelan una relación (o falta de relación) entre dos conjuntos de valores en esos indicadores. Evidentemente, sólo podemos inferir alguna cosa sobre la realidad de la relación teórica si las variables representan con exactitud los conceptos y los indicadores representan con exactitud las variables. La operacionalización supone casi inevitablemente alguna simplificación o pérdida de .significado, porque los indicadores raramente reflejan todo lo que queremos decir con un concepto. Casi siempre hemos de aceptar alguna pérdida de significado, pero necesitamos operacíonalizar de tal modo que esa pérdida se reduzca todo lo posible. Tenemos que buscar indicadores que reúnan un máximo de significado del concepto y representen al menos algunos aspectos de nuestros conceptos con la mayor fidelidad posible.
Podemos ver lo que todo esto implica en nuestro ejemplo agrícola. Una vez que/ 'b
./67-
70 Análisis político empírico
TEORIA: .¡,
HIPOTESIS: .¡,
HIPOTESIS DE TRABAJO: .¡,
OBSERVACION (MEDICION):
El concepto A está relacionado con el concepto B
i t La variable a está relacionada con la variable b
t t El indicador 1 está relacionado con el indicador 2
.¡, .¡, Valores en indicador 1
Valores en ·· indicador 2
FIGURA 4.1. Operacionalización: las relaciones de concepto, variable Y medida.
hemos iniciado la investigación, comprobaremos que en el concepto «crecimiento» hay algo más que altura, y que el indicador «altura en pulgadas» no recoge plenamente lo que deseamos medir. Por ejemplo, puede suceder que la magnitud de crecimiento sea sustancialmente distinta en los dos campos, pero que toda la diferencia radique en el diámetro de los tallos, la anchura de las hojas y el peso de las mazorcas, sin que la altura de las plantas sea sensiblemente distinta en los dos maizales. En ese caso, si sólo consideramos la altura al evaluar los efectos del abono, nos engañaremos gravemente porque el vínculo entre el concepto (crecimiento) y la variable que lo representa (altura) es imperfecto. La variable aquí utilizada no operacionaliza plenamente el> concepto que representa. No encierra todo el significado que contiene el concepto, y al emplearla nos engañamos respecto a la relación que existe en el mundo real.
El nexo entre variable e indicador también puede ser imperfecto. Supongamos que operacionalizamos la altura como la longitud en pulgadas indicada por una cinta métrica y enviamos a cuatro ayudantes a que midan las plantas en el campo. Si erróneamente les darnos cuatro cintas métricas que están calibradas de manera diferente, las medidas que obtengan no proporcionarán sino una comparación inexacta entre las alturas de las plantas, porque vendrán determinadas tanto
por el instrumento de medida empleado corno por la altura real de la planta. Los indicadores no representarán con exacti-tud nuestra variable. ,..
Con este tosco ejemplo se verá por qué es crucial la operacionalización para contrastar la teoría y para el proceso de investigación en general. No es fácil explicar la manera de obtener una operacionalización adecuada, porque para seleccionar variables que representen los conceptos e idear indicadores que correspondan a las variables hace falta no poca capacidad creadora, y no podernos reducir nuestra explicación a un conjunto de normas cuya fiel aplicación produzca indefectiblemente buenos resultados. Lo que podernos hacer es indicar algunos de los escollos que han de evitarse en el proceso y la manera de evaluar la idoneidad de las operacionalizaciones una vez que han sido seleccionadas. Es lo que hacemos en las secciones de este capítulo que tratan de la medición.
Deflnicion.es operacionales
Pero antes de ocuparnos de la medición en ciencias sociales, debernos considerar lo que supone la operacionalización de un concepto. Se realiza ésta mediante la especificación de un conjunto de procedimientos que se han de seguir o de operaciones que se han de efectuar para obte-
ner un indicador empírico de la manifestación de un concepto en un caso determi-· nado. Y así, estos procedimientos proporcionan una definición operacional del concepto y su correspondiente variable. El proceso de operacionalización se reduce esencialmente a seleccionar definiciones operacionales de los conceptos.
Para que sean útiles (esto es, para que aporten medidas válidas y fiables de nuestros conceptos), las definiciones operacionales deben indicarnos de manera precisa y explícita lo que hemos de hacer para determinar qué valor cuantitativo debe atribuirse a una variable en cada caso dado. Han de especificar, paso a paso, todo lo que se ha de hacer en el proceso de medición.
Hay por lo menos tres motivos para ser precisos en esto: en primer término, tenemos que estar en condiciones de decir a los demás exactamente lo que hemos hecho para obtener nuestras medidas, a fin de que puedan evaluar nuestro trabajo y
repetir quizá nuestro estudio para verificar sus resultados en otro marco de experimentación. En segundo lugar, si tenemos ayudantes que obtengan la información, las instrucciones que les demos habrán de ser lo bastante detalladas y precisas como para que cada uno de ellos realice la medición exactamente del mismo modo que los demás. Si nuestras instrucciones son vagas y nuestros ayudantes actúan de manera un tanto díferente para obtener las medidas, sus resultados no serán comparables y no podremos extraer conclusiones válidas de ellos. Por último, una indicación, precisa y pormenorizada del modo de operacionalizar las variables nos ayudará a evaluar los resultados que obtengamos y a eliminar las explicaciones rivales en que esencialmente se aduzca que los ·<hallazgos,, se han producido por los defectos del proceso de medición. (Nos extenderemos sobre este
De lo abstracto a lo concreto 71
punto en secciones subsiguientes de este capítulo).
La reflexión sobre el siguiente ejemplo hipotético servirá para apreciar lo que implica el desarrollo de una definición operacionaL Supongamos que una universidad le ha contratado para que evalúe los efectos de las bebidas no alcohólicas azucaradas en el rendimiento escolar de los alumnos, con el fin de determinar si se han de retirar del campus las máquinas distribuidoras automáticas. Esencialmente, esta tarea consiste en comprobar la hipótesis siguiente:
Cuanto mayor es el número de bebidas no alcohólicas azucaradas que consume un estudiante, menor es la calidad de su rendimiento escolar.
Para comprobarlo, tendrá que construir definiciones operacionales de los conceptos clave consun-10 de bebidas no alcohólicas y rendimiento escolar. Simplifiquemos imaginando que decide asignar la variable nota media al concepto rendimiento escolar, y que el otro concepta clave viene representado, a elección suya, pof las respuestas que den los estudiantes a una pregunta directa sobre su propio consumo de bebidas no alcohólicas. Después de escoger a los colegas y estudiantes que ha de incluir en el estusiio, deberá idear un procedimiento para obtener las medidas apropiadas, e instruir a sus ayudantes sobre el modo de aplicarlo. Para obtener los datos sobre la variable dependiente (rendimiento escolar), tendrá que especificar dónde pueden encontrarse las puntuaciones que hayan de aplicarse, cómo se ha de calcular la nota media y cómo registrar esa información en un formulario. Para obtener una medida de la variable independiente, tendrá que indir:ar con precisión las preguntas que deben hacerse y especificar exacta-
/ { J -
72 Análisis político empidco
mente la manera de registrar las diversas respuestas posibles a dichas preguntas.
Cuando en su investigación elabore las definiciones operacionales de las variables, deberá tener por norma formular por escrito una descripción de los procedimientos que vaya a seguir para obtener las medidas, con indicación por:menorizada de los diferentes pasos necesarios. No sólo le proporcionará esto un registro de su investigación y asegurará la normalización ge los procedimientos de medida, sino que además le dará una oportunidad de reflexionar sobre el acto de obtención de las medidas, permitiéndole descubrir posibles errores que podrían malograr la fiabilidad de los resultados.
Supongamos que querernos medir el grado en que los miembros de los dos partidos principales apoyan a su propio partido en la legislatura de un Estado. Podemos operacionalizar el concepto unidad del partido como votación conjunta en el registro de votos, y utilizar luego como indicador votación conjunta el porcentaje del promedio de votos de los miembros que coinciden con los de la mayoría de su partido. Pero si hemos decidido hacerlo, así, nos encontraremos ante una serie de opciones críticas en el' momento de operacionalizar realmente nuestra variable.
Podemos obtener información sobre el voto de cada legislador en los registros de la legislatura, pero después tendremos que decidir qué votos hemos de incluir en nuestro cálculo de entre los muchos registrados. Algunos de ellos son unánimes (como, por ejernplo, cuando se trata de la proclamación de alabanza de un héroe nacional) y no reflejan la unidad de partido porque no implican posiciones partidistas. La inclusión de todos los votos reduce el grado en que nuestra medida refleja el concepto. Debemos establecer criterios para seleccionar los votos que
hemos de incluir. Por ejemplo, podremos optar por incluir solamente los registrados en votaciones donde hayan votado como mínimo dos tercios de los legisladores y donde la posición perdedora haya obtenido no menos del 30 por ciento de los votos, para centrarnos únicamente en las cuestiones controvertidas.
Tenemos que establecer también el modo de idear un procedimiento que nos permita determinar cómo ha votado una mayoría del partido, para clasificar los votos de cada miembro en acordes o discrepantes con la posición de esa rnayoría. Tendremos que decidir cómo vamos a tratar las abstenciones: ¿las consideramos como una falta de apoyo al partido, o las excluimos de nuestro cálculo? Además, habremos de concretar un procedimiento que sirva, en primer lugar, para calcular los porcentajes de los votos afirmativos de cada legislador, y en segundo lugar, para obtener el promedio de aquéllos.
En cada operacionalización tendremos que tomar decisiones similares sobre el procedimiento exacto a seguir para obtener las medidas. U na definición operacional completa revela cómo hemos decidido afrontar esos problemas y no deja ambigüedad alguna sobre lo que realmente hemos hecho al tomar nuestras medidas.
La construcción de una definición operacional permite elaborar un instrumento con el que obtenerlas. En las ciencias físicas, se utilizan instrumentos tales como balanzas, fotómetros y micrómetros para obtener indicadores del grado en que las cosas poseen cierta propiedad. En las ciencias sociales los instrumentos de medida adoptan formas diferentes. Entre los más característicos figuran: una serie de preguntas en un cuestionario; instrucciones sobre la manera de hacer y registrar observaciones de ciertos hechos, como, por ejemplo, un debate en la asamblea de las Naciones Unidas, y un conjun-
to de números que han de tomarse de un libro de consulta y las reglas para combinarlos en una medida.
La adecuada instrumentación es tan importante en las c.iencias sociales como en las ciencias físicas. Del mismo modo que no intentaríamos medir el peso con una regla, no trataríamos de medir la alienación política con una serie de preguntas que no revelaran el grado de alienación que se siente. En la sección siguiente, al ocuparnos de la validez y fiabilidad de las medidas indicaremos algunas formas de comprobar los instrumentos elaborados en el proceso de operacionalización para adquirir una mayor seguridad de que miden aquello que deseamos.
Medición
Operacionalizamos las variables para contar con un medio de cuantificar los conceptos abstractos, de modo que podamos hacer comparaciones significativas entre fenómenos del mundo real en función de las propiedades que esos conceptos sugieren. Esta asignación de números que representan propiedades se llama medición 1
• El resultado de ésta es que tenemos un valor que podemos asociar con alguna variable en un caso dado2 .
1 Esta definición de medición se desarrolla en
Norman Campbell, What is Science? (Nueva York: Dover, 1952), p. 110.
2 Es esencial que distingamos entre una variable
Y sus va/ores. Reconocemos una variable por su capacidad de adoptar diferentes valores. La variable es un concepto traducido en términos empit'icos. Un valor es una magnitud o cualidad de la variable que pueden reflejar distintos casos. Por ejemplo, 23 años es un valor de la variable edad, 25.000 dólares es un valor de la variable renta anual; 12 por ciento es un valor de la variable porcentaje de población nacida en el extranjero, y «altan es un valor de (a variable condicíón socioeconómíca.
De lo abstracto a fo concreto 73
Esto significa, simplemente, que podemos hablar con más precisión del grado en que una unidad de observación determinada (por ~jemplo, una persona, una ciudad, una nación o una organización) manifiesta la propiedad presentada por la variable que se mide. En vez de decir que una ciudad tiene un «agudo problema de criminalidadn, podemos hablar de índices concretos de criminalidad; y en lugar de decir que un hombre o una mujer es «ferviente republicano (o republicana)», podemos decir que ha alcanzado un 5 en nuestra medida de la fuerza de identificación con e/ partido.
Niveles de medición
Los procedimientos de medición proporcionan un medio de clasificar y ordenar los fenómenos, pero no todos producen distinciones igualmente precisas y detalladas entre los hechos. Por eso hablamos de varios niveles de medición. Cuando decimos que un procedimiento produce un determinado nivel de medición, lo clasificamos con arreglo a la cantidad de información que nos proporciona sobre los fenómenos que se miden y las relaciones entre ellos. Los niveles de medición se denominan nominal, ordinal y de intervalo. " La medición nominal es la que proporciona menos información sobre los fenómenos. Sólo nos da un conjunto de categorías separadas que utilizamos al distinguir entre los distintos casos. La medición nominal se obtiene simplemente nombrando los casos mediante cierto esquema de clasificación predeterminado. La nacionalidad se «ni.ide" generalmente en el nivel nominal clasificando a los individuos en británicos, suizos, brasileños, etcétera. Esta «medición» no nos dice en qué proporción poseen la característica
./l("-
74 Análisis político empírico
«nacionalidad» los diferentes individuos ni nos permite ordenarlos por grados. El empleo de la medición nominal tan sólo nos sirve para agrupar los casos con arreglo a los nombres utilizados en el esquema de clasificación.
Para que tengan utilidad, los esquemas de medición nominal deben estar basados en conjuntos de categorías que sean mutuamente excluyentes y colectivamente exhaustivas. Esto significa que 1) no será posible asignar ningún caso a más de una categoría, y 2) las categorías deberán establecerse de manera que todos los casos puedan asignarse a alguna categoría. Si desearnos clasificar a los votantes de los Estados U nidos mediante un esquema de medición nominal, no podremos utilizar con éxito las categorías demócrata, republicano, liberal y conservador porque estas categorías no son mutuamente excluyentes. Corno los partidos políticos norteamericanos apelan a un amplio espectro de votantes, es posible que una persona sea a la vez demócrata y conservadora o liberal. o republicana y conservadora o liberal. Las categorías no nos permiten diferenciar a los votantes en todos los casos. Del mismo modo, si trata• rnos de clasificar a los votantes por su afiliación a un partido utilizando solamente dos categorías, republicanos y demócratas, comprobaremos que nuestras categorías no son colectivamente exhaustivas, ya que algunos votantes se consideran a sí mismos independientes o miembros de otros partidos.
Para facilitar el análisis, probablemen-te tendremos que sustituir cada categoría por un número en el esquema de medición nornínaL Pero hay que tener en cuenta --:Y esto es importante-- que tales números no tienen significado real en este contexto: son simplemente símbolos. Por el simple hecho de haber optado por sustituir la categoría republicano por un 5 y la
categoría demócrata por un 1, no podemos suponer que los republicanos están cinco veces más afiliados a su partido que los demócratas. Cualquier categoría de una medición nominal puede sustituirse por un número siempre que a cada categoría se le haya atribuido un único número.
La medición ordinal aporta más información, pues no sólo permite clasificar los fenómenos por categorías, sino también ordenarlos por grados. Con ella podemos asociar un número a cada caso. Y este número no solamente nos indica que el caso es diferente de otros, e incluso con respecto a la variable que se mide, sino que además nos dice cómo se relaciona con esos otros casos, esto es, en qué proporción manifiesta poseer una propiedad determinada. Con la medición ordinal podernos decir qué casos tienen la cualidad medida en mayor (o menor) proporción que otros, y podernos ordenar los casos con arreglo al grado en que manifiestan esa cualidad. Esta clasificación proporciona una información más detallada y precisa sobre los casos que la que obtendríamos con la medición nominal. El concepto clase social se suele medir a nivel ordinal, clasificando a los individuos por clase baja, media y alta.
La medición de intervalo proporciona aún más información. Cuando los casos se miden a este nivel, no sólo podernos clasificarlos y ordenarlos por grados, sino decir también en qué proporción mayor (o menor) contienen la propiedad medida respecto a los otros cases. La medición ordinal no se basa en ninguna unidad normalizada de la variable en cuestión, ni nos dice qué diferencia existe entre unos casos y otros con relación a la variable. Sólo permite afirmar que algunos son más afines que otros. La medición de intervalo se funda en la idea de que hay alguna unidad normalizada de la propiedad que se mide.
Mientras que las medidas ordinales sólo dan una idea aproximada de la relación entre los casos con respecto a una variable, las medidas de intervalo proporcionan información sobre la «distancia» entre los casos. La variable renta es un claro ejemplo de ello. Generalmente la renta se mide en unidades de moneda (dólares y centavos en los Estados U nidos). Como podemos utilizar unidades normalizadas en nuestra medición, podemos decir que la diferencia de renta entre 10.000 y l l .000 dólares anuales es exactamente la misma que entre 50.000 y 51.000, cosa que no podernos hacer con la medición ordinal. Si medirnos la renta ordinalrnente dividiendo a la gente en categorías tales como de renta inferior a 5.000 $ y entre 5.000 y 9.999 $, podremos decir que una persona tiene más o menos renta que otra, pero no podremos decir exactamente qué diferencia de renta hay entre ambas, pues ignorarnos en qué punto queda comprendido en la categoría un individuo dado: La diferencia de renta entre una persona de la categoría 1 (menos de 5.000 $) y una persona de la categoría 2 (de 5.000 a 9.999 $)puede ser tan sólo de un dólar (5.000 menos 4.999) o de hasta 9.999 $ (9.999 menos 0), según sea su renta exacta, pero no podernos hacer esta distinción pnrtiendo de una medida ordinal.
Además de ofrecernos información precisa sobre las diferencias absolutas entre los casos, la medición de intervalo permite formular enunciados exactos sobre las diferencias relativas entre los conceptos. Por ejemplo, podernos convenir en que una población de 50.000 personas es doblemente numerosa que una de 25.000, porque se puede hablar, no sin razón, de un lugar que no tenga población alguna: en las verdaderas medidas de intervalo existe un punto cero, y es por lo menos concebible que en tales medidas corres-
ponda el cero a un caso determinado. En una escala ordinal, el punto cero no tiene sentido, por lo que no cabe afirmar, por ejerqplo, que las personas de clase alta tengan dos veces más «clase» que las de clase baja: no sabeme>s lo que significa no tener rango de clase.
Sugiere esto un punto importante sobre los niveles de medición. La forma de medición nominal es la de menor utilidad cuando tenemos que comparar los fenómenos. Si la utilizamos cuando podernos aplicar un nivel de medición «superior» (más preciso), probablemente desaprovecharemos una información potencialmente valiosa. Si en un estudio sobre el comportamiento de voto nos limitarnos a clasificar a los individuos en republicanos, independientes y demócratas cuando podernos formular un conjunto diferente de preguntas y obtener una clasificación con arreglo a su mayor o menor identificación con un partido, es muy posible que prescindamos de una información que nos ayude a comprender las relaciones que observarnos. La medición de nivel ordinal es más provechosa que la nominal, pero también tiene sus limitaciones. La forma de medición más conveniente es la de intervalo, no sólo por el grado de detalle de la información que proporciona, sino también por los procedimientos matemáticos que nos permite aplicar a los datos
"que poseernos. (Nos extenderemos sobre este aspecto en los capítulos 17, 18 y 19).
Lo cierto es que, mientras sea posible y adecuado, debemos esforzarnos para que nuestras operacionalízaciones permitan la medición de intervalo. Pero ¿cómo saber el nivel de medición que es apropiado para los conceptos que hemos de operacionalizar? Para ello nos serviremos de la conceptualización y de la tecnología de la medición.
Al abordar en nuestra investigación la etapa de construcción de la teoda, debe-
./6~ ~ -
76 Análisis político empírico -~----~=--~~-*'~'"''>'»147<"·"-'""',...''·~·=n .: ,..~_,~,.,,.¿,.,,,~ .. ,~,..,~· '>~--'"'"~-·-• ,. ·,
mos preguntarnos ante todo si existe alguna constante subyacente en las diferencias que observarr1os entre los casos. En caso afirmativo, podemos idear mediciones ordinales e incluso de intervalo de un concepto que, de otro modo, sólo podría medirse por clasificación nominal. Un ejemplo contribuirá a aclara!' la importancia de este punto.
Supongamos que esta1nos estudiando los efectos de la nacionalidad de los inmigrantes en su grado de apoyo a los grupos políticos de las grandes ciudades de Estados Unidos a principios del siglo XX. Si operacionalizamos la nacionalidad a nivel nominal y clasificarnos el apoyo al grupo político en los distritos electorales urbanos, obtendremos un cuadro como el presentado en la figura 4.2a. No existe r·elación aparente entre la nacionalidad y el comportamiento de voto porque el hecho de conocer la nacionalidad dominante en un distrito no nos sirve para clasificarlo
Polaca
Sueca
Italiana
Alemana
Británica
IrJandesa
Siciliana
a)
Nacionalidad dominante en el dístrito electoral
' 1 1 o 25 50 75
Porcentaje de votos del distrito favorables
ai candidato
' 100
con relación a los demás. Pero al analizar nuestro razonamiento, concluir·emos tal vez que si suponemos relacionada la nacionalidad con el apoyo a un grupo político es porque los países de origen difieren en cuanto a las oportunidades de participación política que dan a sus ciudadanos. Podemos pensar que quienes han tenido escasa experiencia sobre la política democrática en su tierra natal serán más propensos a renunciar a su derecho de autonomía en favor de un líder político. Si podemos seguir este razonamiento y clasificar las naciones de origen con arreglo al grado de participación política que conceden a sus ciudadanos, podremos construir un gráfico como el de la figura 4.2b, donde se aprecia una relación entre la nacionalidad y el apoyo al grupo político. La ordenación por categorías en nuestra variable independiente permite descubrir una pauta en su relación con la variable dependiente.
Británica
Sueca
Alemana
lrlandesa
ItaHana
Siciliana
Pnlaca
bl
Nacionalidad dominante en ei distrito elf?ctoral (ordenada por el grado de participación en el país de origen)
' ' 1
o 25 50 75
Porcentaje de votos deJ distrtto favorables
al candidato
1
100
FIGURA 4.2. Ejemplo de la influencia del nivel de medición en la interpretación de los datos.
Si somos los bastante animosos, podemos incluso elevar nuestra medición de la variable independiente a un nivel de intervalo. Por ejemplo, podríamos contar las disposiciones jurídicas favorables a la participación política que se adoptaron en cada país en cuestión en los años inmediatamente anteriores al comienzo de la emigración efe~tiva a los Estados Unidos, y utilizar las cifras obtenidas para clasificar las nacionalidades según una escala de intervalo, haciendo comparaciones aún más precisas entre las variables independiente y dependiente.
Podremos lograr esa elevación de las variables del nivel nominal al nivel ordinal o de intervalo siempre que elaboremos la base teórica necesaria para ello y tengamos la posibilidad técnica de aplicar los procedimientos que producen las mediciones de nivel superior. Aun cuando podamos conceptualizar la nacionalidad en términos de intervalo, en nuestro eje1nplo, es posible que no tengamos acceso a los registros jurídicos necesarios para situar los países en la escala de intervalo. En este caso, la tecnologfa de la medición limita nuestras posibilidades de acción al tratar de reforzar nuestras medidas. Probablemente nos encontraremos con muchos casos semejantes. Por ejemplo, si estamos investigando la relación entre el sexo y el comportamiento de voto, y sostenemos que la masculinidad es una característica que la gente posee en varios grados (el menor de los cuales corresponde al sexo femenino), en principio podremos clasificar a las personas según una escala de masculinidad ordinal o de intervalos si establecernos un conjunto de p1·eguntas que revelen en qué proporción poseen esa cualidad (si la poseen). Pero si carecemos de los fondos necesarios para realizar una encuesta en la que la gente pueda responder a esas preguntas, lo más probable es que tengamos que recurrir a
De lo abstracto a lo concreto 77
la clasificación nominal hombre o mujer que hallamos en los registros de afiliación a los partidos.
Debí.do a estos factores circunstanciales, es difícil establecer reglas sobre la operacionalización de los conceptos que permitan lograr ciertos niveles de medición. Hay una, sin embargo, cuya aplicación nos parece aconsejable, y es la de W. Philips Shively3
• Recomienda éste que utilicemos las medidas más precisas que permita el tema objeto de estudio y que no desa¡::;rovechemos información con mediciones imprecisas. Por lo general, esto quiere decir que elevemos los procedimientos de medición cuanto sea posible para alcanzar niveles superiores: que no acometamos una operacionalización que conduzca a una medición nominal cuando sea teóricamente defendible y técnicamente posible la medición ordinal o la de intervalo.
Dicho esto, hemos de añadir una salvedad a la regla general. Hay casos en que realmente no conviene ser demasiado exactos en la medición. Shively ofrece un ejemplo de ello, que recogemos, adaptado, en la figura 4.3. Como vemos en él, la relación entre la edad y el voto en las elecciones presidenciales de 1968 se presenta de dos modos diferentes. En la figura 4.3a la edad se mide en años, y como son tan escasos los individuos comprendid"ós en cada grupo de edad (por ejemplo, 21-22, 35-36, 50-51), el gráfico no muestra una pauta clara en la relación entre ambas variables. En la figura 4.3b la edad se mide, con menos precisión, de cinco en cinco años, y como hay más casos en cada grupo, podemos ver que existe una pauta arnplia en la relación, donde la
3 W. Philips Shívely, The Crafte of Political Research, 2. ª ed. (Englewood Cliffs, N .. J.: PrenticeHall, l 980), pp. 66. 80.
./6!J.-
78 Análisis político empírico
100
75
1 >
" -c
" 50 ';;' E " ~ o o.
25
º'---~~~~-'-~~~~~;.....~~~~-'-~~~~~~~~~~~--~~~~
w m w ~ ~ ro ~
Edad
a) Edad y participación en las elecciones de 1968: edad medida en años
~
2 e: "' b >
"' -e
"' '"' E " ~ o.
100
75
50
25
º'--~~~~-'-~~~~~-'-~~~~-'-~~~~~-'-~~~~-'-~~~~---'
20 30 40 50 Edad
60 70 80
b) Edad y participación en las elecciones de 1968: edad m~dida en grupos de 5 a{lOs
FIGURA 4 . .3.. Ejemplo del efecto de la agrupación de datos en la interpretación (W. Philips Shive~y, The Ci:aft of Politícal R.eseai:ch, 2.·' ed .. Englewood Cliffs, N. J.: Prentice-Hall, 1980,
pp. 67-68. Rep;oducción autorizada).
probabilidad de voto aumenta a los 50 años y a partir de ahí tiende a disminuir.
Al renunciar un tanto a la exactitud en nuestra medición, hemos ganado una mayor facilidad de análisis. El trueque será provechoso siempre que, por un exceso de imprecisión, no perdamos nuevamente de vista las relaciones. Si medimos la edad de 20 en 20 años, advertiremos poca diferenciá en el porcentaje de cada grupo de edad que vota, de lo que podríamos deducir erróneamente que la edad no gw:.¡Ja relación con la probabilidad de voto. Como, en general, hasta que no procedemos al verdadero análisis de los datos no sabemos qué precisión será necesaria para descubrir las relaciones, deberemos seguir la regla de operacionalizar nuestros conceptos con la mayor exactitud posible. Siempre podremos prescindir de la precisión que nos parezca innecesaria «abatiendo las categorías» (pasando a unidades de diferen¡:::iación más amplias); pero si no empezamos por reunir la información, no podremos recurrir a ella más adelante.
Hipótesis de trabajo
La medición asigna ciertos valores a los casos con respecto a determinadas variables. Estos vaiores son los que utilizamos para representar los conceptos cuando comparamos las observaciones. Y para comprender las implicaciones que éstas tienen en nuestras teorías, hemos de convertir las hipótesis sobre las relaciones entre variables en hipótesis de trabajo, donde a su vez se enuncian las relaciones que esperamos hallar entre medidas o indicadores. La penúltima línea de la figura 4.1 sugiere la forma que adoptan las hipótesis de trabajo. Estas nos obligan a establecer los vínculos que, según creemos, ha producido nuestra operacionalí-
De lo abstracto a lo concreto 79
zación entre los indicadores y las variables.
Supongamos, tomando ,un ejemplo sobre el estudio de las relaciones internacionales, que estamos interesados en una teoría de la dominación en la esfera internacional. Partiendo de· la proposición teó-rica Cuanto más dominada esté una nación, más conformista será su política exterior, podemos formular la hipótesis A medida que aumente la dependencia económica de una nación, aumentará su apoyo a la política internacional del estado protector. Podemos operacionalizar la dependencia económica como el porcentaje de las exportaciones de la nación dirigidas al país protector. El porcentaje de las exportaciones pasa a ser nuestro indicador de la variable independiente dependencia. El apoyo puede medirse por el porcentaje de votos emitidos en la Asamblea General de las Naciones Unidas en que el voto de la nación cliente difiere del voto del estado protector. Un porcentaje de votos en las Naciones Unidas viene a ser nuestro indicador de la variable dependiente apoyo a la política del estado protector. Ahora podemos establecer una hipótesis de trabajo que enuncie la relación negativa que esperamos exista entre los indicadores: A medida que aumente el porcentaje de las exportaciones dirigidas al estado protector, disminuirá el porcentaje de votos discrepantes con el estado protector en las Nacíones Unidas.
Esta hipótesis de trabajo nos indica las observaciones que son acordes con nuestra hipótesis y nuestra teoría. Sugiere, además, la relación que prevemos entre variables e indicadores. Esta relación es la presentada en el diagrama de la figura 4.4.
Se ve en el diagrama lo importante que es analizar detenidamente la relación entre nuestras medidas y nuestras variables.
.169-
o "'
80 Análisis politico empírico
CONCEPTO: Dominación-- PROPOSICION: Cuanto más dominada----:;. CONCEPTO: Conformidad esté una nación por otra, más conforme será su política exterior a la de la nación dominante.
A medida que aumenta A medida que aumenta el concepto, aumenta el concepto, aumenta la variable. la variable.
i ~ VARIABLE: Grado de---- HIPOTESIS: Cuanto mayor sea el .._VARIABLE: Apoyo a la
dependencia económica
grado de dependencia económica, política exterior mayor será el apoyo a la política del protector
1
exterior de la nación protectora. l. A medida que aumenta A medida que aumenta
la variable, aumenta la variable, disminuye el indicador. el indicador.
i t INDICADOR: Porcentaje ---HIPOTESIS DE TRABAJO: Cuanto -;.INDICADOR: Porcentaje
de exportaciones al mayor sea el porcentaje de las de votos de las NU protector exportaciones de una nación contrarios al voto del
dirigidas al protector, menor será protector el porcentaje de votos de esa nación emitidos en las NU que sean contrarios al voto dél protector.
FIGURA 4.4. Especificación de las relaciones entre conceptos, variables e indicadores.
La relación prevista en la propos1c1on y en la hipótesis es positiva; pero la que se predice en la hipótesis de trabajo es negativa, porque también es negativa la re la-, ción entre la variable dependiente y su indicador. Quiere esto decir que, debido al modo en que hemos operacionalizado la variable dependiente, una relación negativa entre los indicadores aportará pruebas para una hipótesis y una proposición teórica que prevé relaciones positi
vas entre los conceptos y las variables. Hemos de tener esto presente para evitar una interpretación errónea de los datos y llegar a conclusiones correctas sobre la utilidad de nuestra teoría partiendo de nuestras observaciones.
Es tan importante la claridad requerida en la relación entre nuestros indicadores y las variables y los conceptos que representan que, en opinión de algunos exper-
tos en ciencia social, además de nuestras teorías sobre los fenómenos políticos, debemos ser capaces de formular una teoría
de la medición donde se indique por qué esperamos que nuestros indicadores estén relacionados con nuestros conceptos4 •
¿Por qué pensarnos que la dependencia económica ha de estar relacionada con la concentración de expm1:aciones? ¿Cómo es que la distribución de las exportaciones viene a reflejar lo que querernos decir al referirnos a la dependencia? Es este tipo de preguntas el que ayuda a responder una teoría de la medición bien elaborada.
4 Véase, por ejemplo, Hubert M. Blalock, Jr., «The Measurement Problem: A Gap Between the Languages of Theory and Research.,, en Methodology ín Socíal Research, Hubert M. Blalock, Jr. y Ann Blalock, eds. (Nueva York: McGraw-Hill, 1968), pp .. 5-27.
La teoría de la medición está formada por supuestos que explican por qué deben cambiar los valores de nuestros indicadores a medida que cambia el grado en que los casos manifiestan nuestros conceptos.
Los indicadores no se pueden escoger al azar, sino después de un cuidadoso razonamiento sobre la manera en que las cosas están relacionadas en el mundo. Este razonamiento es muy semejante al que seguirnos al construir las teorías sobre los fenómenos políticos. Es posible que las conclusiones que alcancemos estén equivocadas. De hecho, las propiedades a que nos referimos cuando utilizamos un concepto pueden no guardar relación con los indicadores que decidimos emplear corno medidas empíricas de aquél.
Volvamos a nuestro ejemplo del estudio destinado a determinar si el consumo de bebidas no alcohólicas afecta al rendimiento escolar. Optamos por ·medir dicho consumo mediante una sencilla encuesta en la que se pregunt~ a los estudiantes qué cantida¡:i de bebidas espumosas consumen en un lapso determinado, dando por supuesto que dirán la verdad y que a los que beben más se les atribuirá en nuestro indicador un valor superior que a los que beben menos. Pero supongamos que las respuestas de los estudiantes a nuestras preguntas dependen totalmente de que hayan adivinado o no la finalidad del estudio y de si quieren engañar a la universidad respeCto a la cantidad de bebidas espun1osas que consumen. En este caso, el vínculo esperado entre la variable y el indicador será inexistente, y no podremos extraer válidamente ninguna conclusión de nuestras investigaciones acerca de los efectos del consumo de tales bebidas a no ser que arbitremos alguna otra medida distinta.
Esta cuestión de si existe alguna correspondencia, por un lado, entre nuestros conceptos y variables, y, por otro lado,
De lo abstracto a lo concreto
entre nuestros indicadores o medidas, es el problema central de la medición en la ciencia. El interrogante de si los cambios producidos en nuestros indicadores obedecen realmente a los cambios en los conceptos que representan plantea los problemas de fiabilidad y validez que abordaremos en secciones subsiguientes de este capítulo. Lo que importa retener aquí es que la idea de una teoría de la medición apunta el modo en que debemos enfocar estos problemas en nuestra investigación.
Cada operacionalización de un concepto es, en esencia, una hipótesis. Cuando operacionalizarnos y decimos «Este indicador corresponderá a ese concepto», formularnos la hipótesis de que las cosas que querernos expresar al utilizar el concepto quedan verdaderamente reflejadas en el indicador escogido; y esa hipótesis vendrá o no corroborada por las observaciones. Nunca podremos dar por supuesta la idoneidad de nuestras medidas, sino que habre1nos de examinar nuestras observaciones con el fin de comprobar si representan lo que pretendernos con nuestros conceptos. En las ciencias sociales, la búsqueda de procedimientos de medición válidos y fiables es, en muchos aspectos, un proceso de verificación de hipótesis. Debemos estar dispuestos a admitir nuestros errores y a vol ver a empezar cuando las pruebas indiquen que los indicadores no r~flejan nuestros conceptos. La comprobación de las medidas obtenidas se plantea sobre todo cuando intentamos evaluar la validez y fiabilidad de los indicadores que hemos escogido.
Error de medición: el enemigo
Corno resultado del proceso de medición, se asignan diversos valores a los diferentes casos, con arreglo a la califica-
_¡ :¡.o ...
82 Análisis político empírico :, ·~,;_.,,~~-<=-.-----4'-"~·"
cíón que se dé a éstos en nuestros indicadores. Todas las diferencias de calificación pueden atribuirse a dos fuentes fundamentales. Una es la medida en que los casos demuestren poseer realmente distintos grados o aspectos de la propiedad que nos interesa. Se producen diferentes calificaciones cuando las medidas obtenidas recogen de verdad esas diferencias. En este caso, las diferencias reales en el concepto quedan reflejadas en nuestras medidas. La otra fuente de diferencias en las calificaciones es el grado en que algún aspecto de la propia medida o el entorno en el que se aplica hace que obtengan calificaciones distintas los diferentes casos. Entonces, . nuestras medidas muestran ciertas diferencias entre los casos que no son reales, en el sentido de que no reflejan diferencias auténticas en el concepto que deseamos medir. Cuando esto sucede, las diferencias que observamos se deben a incongruencias en el procedimiento de medición.
Si nuestras medidas fuesen perfectas, sólo revelarían el primer tipo de diferencias entre los casos; pero es raro -por no decir imposible-- que las medidas sean impecables. Inevitablemente, las diferen-, cías en los valores asignados a los casos no sólo reflejan diferencias reales en el grado en que esos casos manifiestan el concepto, sino también diferencias «artificiales" creadas por el proceso de medición. Las diferencias en los valores asignados a los casos que sean atribuibles a algo distinto a las diferencias reales se llaman errores de medición. No son diferencias reales entre los casos, sino diferencias que han sido erróneamente registradas por defectos del proceso de medición.
Esta distinción entre las verdaderas variaciones de los valores y las variaciones debidas a un error de medición es semejante a la que existe entre las diferencias de objetos perceptibles a simple vista
y de manera directa y las diferencias que advertimos cuando sólo miramos su imagen reflejada en un espejo. Este, en la medida en que deforme las imágenes, ocultará diferencias que veríamos por observación directa, o creará una impresión de diferencia que de otro modo no percibiríamos. En las ciencias sociales, raramente podemos ver nuestros conceptos clave de modo dírecto, y hemos de recurrir a procedimientos de medición análogos al espejo para reflejar esos conceptos en cada caso dado. Por lo tanto, la exactitud de nuestras impresiones del mundo depende de la precisión con que nuestras medidas reflejen la realidad.
¿Cuáles son algunas de las causas de deformación de las imágenes obtenidas en nuestra medición? Para contestar a esta pregunta, hemos de saber si vamos a controlar el error de medición o vamos a reconocerlo cuando se presente en nuestros datos. Podemos enumerar varias de las fuentes principales de los errores de medición señalando las fuentes comunes de diferencias en los valores asignados a los casos que sean distintas de las verdaderas dife~encias en las características que deseamos medír5
.
l. Diferencias en la distribución de otras características relativamente estables entre los casos que sean reveladas de forma involuntaria por nuestras medidas. Por ejemplo, las preguntas que representan nuestra medida de la ideología políti-
5 Se exponen con más detalle los puntos que siguen en Claire Selltiz, Lawrence S. Wrightsman y Stuart W. Cook, Research Methods in Social Relations, .3." ed. (Nueva York: Holt, Rinehart and Winston. 1976), pp. 165-68 .. Aunque su análisis es tributario de la tradición de !a psír.ología y corresponde esencialmente a la investigación sobre el ser humano, muchos de !as principios expuestos son aplícables a !a amplia gama de situaciones que examinamos,
ca pueden requerir un determinado grado de inteligencia para interpretarlas y res-ponderlas. En ese caso, las respuestas no sólo reflejarán diferencias de ideología política, sino también diferencias de inteligencia entre los entrevistados. Al observar los datos obtenidos, se confundirán los efectos de la inteligencia con los de la ideología polít.ica, y no seremos capaces de distinguir las diferencias de calificación que reflejan las diferencias ideológicas de las que reflejan las de inteligencia. De igual modo, otras características de nuestras unidades de análisis (como la ubicación regional de las ciudades, los rasgos culturales de las naciones o las fuentes de documentación) pueden reflejarse inadvertidamente en nuestras medidas y deformar nuestras percepciones de la manifestación de los conceptos de que hemos hecho nuestro objetivo. Cuando podamos detectar y medir esas influencias «Contaminantes», deberemos comprobar si manteniendo sus valores constantes · desaparecen, disminuyen o aumentan las diferencias en las calificaciones que los casos tienen asignadas en nuestras medidas6 •
2. Diferencias en la distribución de características provisionales entre los casos que se reflejan en nuestras medidas. La disposición de ánimo o el estado de salud de una persona puede afectar al modo de responder a los puntos de un cuestionario. La historia política reciente de las ciudades (como, por ejemplo, la revelación de corrupción entre los cargos públicos) puede crear diferencias sistemáticas aunque
6 Se expone con eficacia la manera de hacerlo en Donald F. Campbell, ·•Recommendations for APA Test Standards Regarding Construct, Trait, or Discriminant Valídity·., American Psychofo{jist, 15 (agosto de 1960), pp. 546-5.3, y Morrís Rosenberg, The L.ogic o[ Survey Analysis (Nueva York: Basíc Books, 19681
De lo abstracto a lo concreto 83
provisionales en el modo en que sus ciudadanos contestan a las preguntas de una encuesta. Un desastre natural de gran .magnitud puede ocasionar una modificación diástica, pero provisional, en la estadística con la que contamos para indicar el grado de desarrollo económico. Los efectos de esas «anomalías» temporales son más difíciles de detectar y controlar que los de las características estables de nuestros casos. La única forma de precavernos contra ellos es estar alerta ante los indicios de que los casos individuales están sujetos a esas influencias transitorias (por ejemplo, estudiando la reciente historia política de las ciudades incluida en nuestro ejemplo, o advirtiendo a nuestros encuestadores que no intenten entrevistar a una persona que esté temporalmente postrada en cama), y seguir los procedimientos que se indican en la correspondiente sección de este capítulo para comprobar la fiabilidad de nuestras mediciones.
3. Diferencias en la interpretación de los sujetos sobre el instrumento de medida. Este problema se plantea sólo cuando los entrevistados deben responder directamente a las preguntas, distinguiéndose del caso en que el investigador construye las medidas observando el comportamiento. Si nuestras preguntas están redactadas de manera ambigua, las distintas interpretaciones que les den los entrevistados pueden producir diferencias en su calificación en las medidas compuestas de esas preguntas. Imaginemos, por ejemplo, que en un estudio del comportamiento de voto nos conter..._tamos con preguntar: ¿Votó usted en las últimas elecciones? Si algunos de los entrevistados ignoran que la semana anterior se han celebrado elecciones locales, probablemente contestarán que han votado, creyendo que en la pregunta se alude a las últimas elecciones nacionales, aunque no hayan
./l-1-
'votado, en las elecciones a que nos referimos en nuestra pregunta. Debernos guardarnos de estos errores y de las consiguientes diferencias involuntarias en nuestra rnedicíón verificando de antemano las preguntas (corno se indica en el capítulo 7) y comprobando la fiabilidad de las medidas obtenidas.
4. Diferencias en el entorno donde se aplica la medida. También es ésta una fuente de errores de medición, sobre todo cuando en la investigación se tornan como medidas las respuestas personales a las preguntas. Por ejemplo, es bien sabido que en la investigación por encuesta la raza, el sexo y la edad de los entrevistados pueden influir en las respuestas. Estas (y, por lo tanto, las calificaciones que en la medición les asignemos) pueden diferir de un entrevistado a otro por el simple hecho de las características que tenga el entrevistador. Problemas similares pueden plantearse al margen de la investigación por encuesta; por ejernplo, si cometemos el error de hacer un análisis de contenido del noticiario nacional de un país y del noticiario de otro destinado únicamente al extranjero, en cuyo caso estarernos aplicando el mismo instrumen- , to en entornos muy diferentes y, por este solo hecho, cabrá esperar algunas diferencias en las calificaciones. Sólo podremos evitar esta fuente de errores de medición procurando que, en la medida de lo posible, no se apliquen nuestras medidas sino en situaciones normalizad&s.
S. Diferencias en la aplicación del instrumento de medida. Las calificaciones asignadas a los casos pueden diferir a consecuencia de diversos errores cometidos al obtener y registrar la información. Es posible que los entrevistadores hayan comprendido mal las instrucciones y hagan las preguntas en condiciones distintas de las que el investigador pretendía. Un alumbrado pobre puede hacer que el en-
trevistado marque erróneamente el cuestionario; los lapiceros pueden romperse y la tinta de los bolígrafos agotarse en el momento crítico, en un grupo de interacción, con lo que los observadores no lograrán quizá registrar hechos decisivos; un codificador aburrido o fatigado, probablemente no se ajustará a las instrucciones o prescindirá de ellas al codificar los documentos en un análisis de contenido. Estos tipos de variación en la administración de los instrumentos de medida provocan diferencias en las calificaciones, con independencia de las que pueda haber entre los valores reales de fa variable estudiada. Además de emplear solamente a ayudantes dignos de confianza, lo más importante para obviar esta fuente de errores de medición es verificar de antemano nuestros instrumentos. Un ensayo con el instrurnento nos ayudará a descubrir posibles problemas «mecánicos» (corno, por ejemplo, espacio insuficiente para registrar en forma codificada las respuestas características) y factores humanos que pudieran influir en los resultados (entre otros, el lapso de tiempo en que los observadores pueden trabajar sin fatigarse).
6. Diferencias en el tratamiento y análisis de los datos. Antes de ser analizada, la información se ha de someter a toda una serie de operaciones. Es frecuente que cambie de forrna varias veces. Por ejemplo, en no pocos casos, los entrevistadores registran las respuestas a las preguntas copiando cada una de las palabras que dice el entrevistado, y luego, al codificar las respuestas, se reducen a un solo número esos pasajes escritos. El número escrito se transferirá tal vez a una ficha de ordenador en forma de perforación o punch en la columna apropiada, y esta perforación se convertirá a su vez en un bit (o unidad de información) en un disco o cinta magnética. En cada una de estas etapas el análisis de datos se ha simplifi-
cado, pero también se han podido cometer errores q~e podrían reflejar diferencias inexistentes de los casos en una variable. Dada la posibiljdad de tales errores, siernpre será conveniente comprobar dos o tres veces cada transformación y consexvar la forma original para ulteriores referencias.
7. Diferencias_ en el modo de respuesta personal ante la forma del instrumento de medida. Este problema se plantea especialmente cuando nuestras unidades de análisis son los individuos. Los instrumentos de medida pueden adoptar formas tales como entrevistas orales, cuestionarios que ha de rellenar el sujeto, y observación por un investigador entrenado. Estas distintas formas exigen condiciones diferentes a las personas sometidas a estudio: por ejemplo, una entrevista requiere facilidad de palabra, y para rellenar un cuestionario hace falta saber leer y escribir. Si los individuos difieren en esas aptitudes, también diferirán las calificaciones que les asignemos aunque en realidad aquéllos sean iguales en la variable que operacionalizarnos. Para evitar este tipo de errores de medición, lo mejor es emplear más de una forma de medida al operacionalizar cada concepto. Trataremos este aspecto con más detalle en la sección de este capítulo dedicada a la validez.
Todos estos factores pueden introducir errores de medición en nuestra investig_ación. Los derivados de las siete fuentes de errores indicadas suelen clasificarse en sistemáticos y aleatorios. Errores sistemáticos son los que se deben a una confusión de variables en el mundo (como se índica en el apartado 1 de la lista precedente) o a la naturaleza del propio instrumento. Aparecen en cada ernpleo del instrumento y son constantes entre los casos y estudios donde se utiliza la misma
De lo abstracto a lo concreto
medida. Los errores constantes invalidan los resultados en el sentido de que las diferencias (o semejanzas) que nuestras medidas parecen revelar no reflejan con fidelidad las diferencias que creemos me-dir. Los errores aleatorios afectan a cada aplicación del instrumento de mane-ra diferente. Se producen al azar y obede-cen a características pasajeras de nuestros casos, variaciones de situación al aplicar el instrumento, defectos de aplicación y tratamiento, y otros factores que varían cuando cambia el rnodo de utilizar el instrumento. Invalidan nuestras medidas de manera muy parecida a la de los errores sistemáticos. Los errores aleatorios anu-lan la !labilidad de las medidas, pues si se producen al aplicarlas, no podernos obte-ner siernpre los mismos resultados.
¿Cómo evitar que los errores de medición falseen nuestros resultados y hagan inútil o equívoca nuestra investigación? Para contestar a esta pregunta habremos de prestar gran atención a !as cuestiones de validez y fiabilidad.
Validez
Es raro que podarnos obtener medidas directas de los conceptos utilizados en las teorías de la ciencia social. Conceptos ta-les como poder, democracia y representación no pueden ser cuantificados con la misma facilidad que los conceptos de longitt:.d y peso, por poner estos dos ejemplos. Tenemos que usar indicadores que corresponden sólo indirectamente a los conceptos que representan. Y así, siempre cabe la posibilidad de que los indicadores elegidos no reflejen adecuadamente los conceptos que hemos de medir. Validez es el término que empleamos para expresar en qué grado corresponden nuestras medidas a los conceptos que deben reflejar. Interrogarnos sobre la vali- . 9)
,/1.¿ -
86 Análisis político empírico
dez de una medida es tanto como preguntarnos si en realidad estamos midiendo lo que pensamos medir cuando la utilizamos. El logro de esa validez suele considerarse como el problema fundamental de medición en las ciencias sociales.
Para que una medida sea válida debe ser a la vez apropiada y completa. Si, por ejemplo, nos interesa comparar la calidad de los servicios públicos prestados en diferentes ciudades, tenderemos tal vez a utilizar el número de profesores de las escuelas como indicador de la calidad de los servicios educativos. Esta medida es inapropiada, porque el número de profesores de un sistema escolar vient:'! ampliamente determinado por el número de estudiantes y la magnitud de la ciudad, y probablemente tendrá poco que ver con la calidad de la enseñanza. Si utilizamos la proporción entre el número de estudiantes y el de profesores como indicador de los servicios educativos, tendremos una medida más apropiada, pues se reducirán o eliminarán las diferencias debidas a la magnitud de la ciudad. Sin embargo, la medida seguirá siendo incompleta. La enseñanza requiere más que profesores: exige también edificios escolares, ,películas, libros, medios docentes auxiliares y otros diversos elementos. Si consideramos cualquiera de estos factores por sí solo, lo más probable es que obtengamos una falsa impresión sobre la calidad total de los servicios educativos. Un sistema escolar puede tener una magnífica proporción alumnos-profesor pero, al mismo tiempo, unos medios y unos materiales de estudio insuficientes. Sería erróneo decir que ese sistema escolar es igual que otro con idéntica proporción alumnos-profesor y excelentes medios y materiales de estudio. Si hemos de alcanzar la validez, deberemos esforzarnos por construir medidas que sean a la vez apropiadas y cornpletas.
Esto plantea dos interrogantes: ¿cómo podemos crear medidas completas y apropiadas, y cómo saber si lo hemos logrado?
La respuesta a la primera pregunta empieza con el proceso de operacionalización. Podemos definir la validez como el grado en que las diferencias de calificación en una medida reflejan solamente las diferencias de distribución de los valores en la variable que intentamos medir. Como probablemente nunca podremos conseguir una validez completa y total, nuestro objetivo debe ser seleccionar medidas que puedan sufrir lo menos posible influencias ajenas a las diferencias de nuestra variable. Para ello, hemos de analizar cuidadosamente los procesos relacionados con nuestras medida::; y tratar de descubrir las posibles causas de las variaciones en la calificación. En este sentido, lo esencial es precaverse contra los efectos del error sistemático.
Imaginemos, por ejemplo, que querernos medir el grado de aprobación de los ciudadanos de diferentes naciones de las líneas de actuación de sus gobiernos, y que decidimos adoptar corno indicador de la aprobación o la discrepancia las respues-· tas a una serie de preguntas formuladas en una encuesta. Confiamos en que las diferencias entre las opiniones reales de los ciudadanos sean las únicas que motiven las diferencias reflejadas en sus respuestas. Pero si reflexionamos un momento, veremos que hay otra posible causa de variación: si alguna de las naciones incluidas en nuestro estudio tiene un gobierno autoritario que recurre a la policía secreta para reprimir la disidencia y considera cualquier crítica a sus actuaciones como un acto de traición, es muy posible que sus ciudadanos tengan miedo de expresar en una entrevista su desacuerdo con el gobie1no. En este caso, las calificaciones en la medición vendrán determina-
, das, por lo menos, tanto por la actitud dP
cada gobierno ante la disidencia como por las opiniones de los entrevistados. Es muy alta la probabilidad de que se produzca este tipo de error en la medición, por lo que las preguntas por encuesta constituyen una operacionalización inadecua
da. Asimismo, ya en los primeros pasos del
proceso de investigación, debernos tener en cuenta que la medición ha de ser completa. Sí vamos a medir la influencia relativa de los diferentes grupos de intereses en la legislatura estatal, podremos adoptar como indicador los informes de prensa sobre las intervenciones de esos grupos ante los comités legislativos. Pero debemos preguntarnos si el testimonio dado en las audiencias públicas es el único modo de ejercer influencia política. Esa actividad se considera, con razón, corno una parte del proceso de influencias, pero hay tantos medios de ejercerlas que una medición cuyo indicador sea exclusivamente el testimonio dado será necesariamente incompleta.
Así pues, para lograr operacionalizaciones apropiadas y relativamente completas, no sólo tendremos que conocer muy bien el tema de nuestro estudio, sino que además habremos de realizar un cuidadoso análisis lógico de otras posibles operacionalizaciones. Con todo, solamente podremos verificar la validez de nuestras mediciones para determinar sí hemos elaborado medidas correctas después de haber obtenido los datos. El proceso de evaluación de la validez de las medidas se denomina validación.
Son cuatro los métodos fundamentales de validación. Al primero se le suele llamar de validación pragmática, porque en ésta se estima la validez de una medida por las condiciones que demuestra poseer para facilitarnos la predicción de un comportamiento o un hecho determinado. Por ejemplo, si ideamos una me-
De lo abstracto a lo concreto 87
dida del grado de atracción que los candidatos a un cargo público ejercen sobre los votantes, podemos obtener alguna indicación de la validez de dicha medida aplicándola a todos los candidatos al Senado de los Estados Unidos en un año electoral determinado, y prediciendo las posibilidades de que resulten elegidos con arreglo a la calificación que obtengan en nuestra medida del influjo sobre los votantes. Cuanto mayor sea nuestro acierto en la predicción de la suerte electoral de los candidatos, mayor confianza podremos depositar en la validez de la medida, es decir, en q~1e ésta refl~ja con fidelidad el concepto deseado. Las medidas que nos permiten predecir fielmente sucesos futuros se dice que tienen validez predictiva.
Para que la validación sea pragmática, hace falta algún otro indicador que con cierta seguridad puede ser reflejo válido de ellas. Cotejamos nuestras medidas con ese otro indicador como podríamos cotejar las declaraciones verbales sobre la edad con los certificados de nacimiento. Por desgracia, en la investigación en ciencia social es raro que hayan otros indicadores verdaderamente válidos aplicables a los conceptos utilizados, por lo que, en general, hemos de recurrir al segundo tipo de validación: la validación construida.
La validación construida se obtiene infiriendo la validez de una medida, mediante pruebas, del grado en que las relaciones reales entre las calificaciones de diversas medidas corresponden a lo que esperarnos de la teoría que nos ha llevado a emplear un indicador determinado. Esto implica dos líneas de razonamiento.
Nuestra primera reflexión será: «Sí el concepto X tiene una relación positiva con el concepto Y y una relación negativa con el concepto Z (como dice nuestra teoría), también será cierto que las calificaciones en una medida válida de X ten-
./ J..J -
' f:.
88 Análisis político emptrico
drán una relación positiva con las calificaciones en una medida válida de Y y una relación negativa COI} las calificaciones en una medida válida de z,,. No podemos validar la medida comparando sus calificaciones con las de otra rnedida de la misma variable cuya validez nos consta
.<como en el caso del certificado de nacimiento). Pero podernos estirnar su validez viendo, al utilizarla como indicador de l}.uestra variable, hasta qué punto produce los tipos de relaciones que nos lleva a esperar nuestra teoría entre esa variable y otras distintas.
Supongamos, corno ejemplo, que realizamos un estudio sobre acuerdos internacionales. Podríamos crear una medida de la solidez de un acuerdo basándonos en el análisis de contenido de los artículos de prensa de los países en cuestión. ¿Es un indicador válido de la solidez del acuerdo entre dos países lo que los periódicos de cada uno dicen sobre el otro? Podemos hacernos una idea mediante el razonamiento siguiente: «Según nuestra teoría, cuanto más sólido sea un acuerdo entre dos naciones, con mayor frecuencia votarán en el mismo sentido en las Naciones U ni das y menores restricciones cornerciqles se impondrán rnutuamente. Por lo tanto, las calificaciones en una medida válida de la solidez del acuerdo estarán positivamente relacionadas con las calificaciones en las medidas de voto conjunto en las Naciones Unidas, y negativamente relacionadas con las calificaciones en las rnedidas de número de barreras comercia/es».. Seguidamente procedemos a efectuar el análisis de datos necesario para ver sí esta expectativa queda confirmada por nuestras observaciones. Si las relaciones son las que esperábamos, tendremos más confianza en la validez de nuestra medida de la solidez del acuerdo. Si no es así, pondremos en duda que sea correcta nuestra medida de ese concepto.
Lo que acabamos de describir suele llamarse validación externa. Supone la comparación de las calificaciones de la medida que validamos con las calificaciones de las medidas de otras variables. Por supuesto, para emplear este método de validación tenernos que incluir medidas de las otras variables en nuestra investigación; esto es, tenemos que empezar por pensar en la manera de validar nuestras medidas al principie del proceso investigador. Ciertamente, cuando estemos dispuestos a elaborar un plan de investigación, debemos saber cómo vamos a comprobar la validez de nuestras medidas para estar seguros de que reunimos cualquier otra información necesaria.
Con la validación externa solamente obtendremos pruebas convincentes de la validez de nuestra medida de una variable si tenemos gran confianza en la validez de las medidas que utilizamos para las otras variables. Y así, en el último ejemplo, no podríamos llegar a ninguna conclusión sobre la validez de nuestra medida de la solidez del acuerdo basándonos en las relaciones entre los valores de esta variable y los de las otras dos si no creyéramos en la validez de nuestros indicadores voto conjunto y barreras comercia/es. El método de validación externa debe aplicarse con cautela, pues en muchos casos es difícil encontrar indicadores claramente válidos de las variables con las que debe estar relacionada nuestra variable principal. Esto es algo muy semejante a la contrastación de hipótesis. Ningún resultado garantiza por sí solo la validez (o invalidez) de la medida, sino que nuestra confianza en su validez aun1enta a medida que acumulamos aciertos en nuestros intentos de validación. Por eso es conveniente seleccionar el mayor número posible de relaciones teóricamente previsibles para utilizarlas en la validación externa. Cuantas más verificaciones
1..liferentes hagamos de la validez, más sólido será nuestro argumento.
La misma lógica puede aplicarse al segundo tipo de validación construida: la validación interna o convergente. En ésta, se han de idear varias medidas de la misma variable y comparar los valores en esas medidas. Nuestro razonamiento es que si cada uno de los indicadores proporciona una medida válida del concepto en cuestión, los valores atribuidos a los distintos casos en las medidas deberán estar estrechamente relacionados. Si A, B y C son medidas válidas de X, todas las calificaciones de A, By C habrán de ser muy similares.
Por ejemplo, si queremos obtener un indicador de la calidad del alumbrado en las calles de los barrios residenciales en un estudio de la distribución de los servicios públicos, poden1os tomar como indicador las impresiones de los ciudadanos sobre el alumbrado público (recogidas en una encuesta), preguntar a una muestra de los ciudadanos de una barriada cuál es su opinión sobre la calidad del alumbrado en su zona, y tomar la evaluación media corno medida de la calidad del alumbrado público. Para efectuar una validación interna también podemos medir la calidad del alumbrado: 1) utilizando un fotómetro para obtener una medida física de la luminosidad y la distribución del alumbrado; 2) haciendo que evalúen el alumbrado
Concepto X
/l~ Valores en la
medida A
V a lores en la mcdkta B
Valores en !u medida e
------¿Relacionadas?-----"
::JJ Validación tconV<!rgenteJ interna
De lo abstracto a lo concreto
observadores adiestrados, y 3) pidiendo a los ciudadanos que comparen el alumbrado de su calle con el que se ve en una serie de fotografías que muestran calles con diferentes calidad de alumbrado, y calculando el promedio de sus clasificaciones para obtener una medida de la barriada. Esto nos proporciona cuatro medidas de la variable, y si cada una de ellas es válida, todas deberán estar estrechamente relacionadas. Esto podernos comprobarlo con estadísticas apropiadas. Si averiguamos que las calificaciones en la medida basada en las respuestas a las preguntas están poco relacionadas con las calificaciones de las otras tres medidas y que las de estas otras tres están estrechamente relacionadas entre sí, tendremos motivos para sospechar que no es válida nuestra primera rnedida.
Algo muy parecido sucede si pesamos un 1nismo objeto con tres balanzas diferentes: si cada una de éstas arroja un peso exacto y no tenernos motivo para suponer que el peso del objeto ha cambiado durante la verificación, esperamos que sean idénticos los pesos obtenidos con las tres balanzas. Si una indica un peso distinto, sospechamos que está desajustada.
En la figura 4. 5 se muestran las diferencias entre las formas interna y externa de validación construida. En la figura 4.Sa se ve que la validación interna se re~liza comprobando la correspondencia
Concepto X Com . .:epto Y Concepto Z
l l l Valor en la Vator en la Valor en la medida x ..,,....¿ Relacionadas"':l..,.. medida y medida z
"-- ¿R0/ac11J11adas? ,__/"
U) Validu.::ion externa
FIGURA 4.5. Formas de validación construida.
de las calificaciones en varias medidas diferentes del misrrw concepto. Cuanto más estrechamente se correspondan, con mayor convicción sostendremos la validez de cualquiera de las medidas. En la figura 4.Sb vemos que para efectuar la validación externa hay que determinar si nuestra medida de una variable indica que ésta está relacionada con otras varíables como cabe esperar de nuestra teoría. Si no aparecen las relaciones previstas, tendremos razones para sospechar que el indicador que hemos escogido no proporcioná medidas válidas del concepto. (En el capítulo 18 nos ocuparemos de las estadísticas que pueden utilizarse para determinar el verdadero grado de relación entre diversas medidas.)
La misma precaución que ha de tenerse al emplear los procedimientos de validación externa se ha de tener con los de validación interna. No siempre podemos estar seguros de que sean válidas nuestras distintas medidas del concepto principal. Por eso, debemos ser cautelosos y no juzgar la validez o invalidez de una medida con una sola verificación. Podemos adquirir sensiblemente mayor confianza en los resultados de una validación interna si seguimos esta sencilla regla: I.as medidas alternativas del concepto deben basarse en el mayor número posible de tipos diferentes de operacionalización.
En el ejemplo del alumbrado público nuestras medidas provienen de cuatro tipos de operacionalización distintos: clasificación oral por los ciudadanos, mediciones físicas, ,?piniones de los observadores y selección de fotografías por los ciudadanos. Cada uno de éstos representa un modo diferente de operacionalización. Cuanto mayor sea el nún1ero de modos diferentes que utilicemos y más independientes sean entre sí, rnayor confianza podremos tener en nuestra validación. ¿Por qué? La razón es la siguiente: la
principal causa de invalidez es el error de medición sistemático y aleatorio; las medidas diferentes están sujetas a diferentes tipos de error de medición, y cuantos más indicadores tengamos para una variahle y más difieran entre sí, más improbahle será que incida en todos ellos el mismo error de medición. Si esto es así, tendremos una mayor oportunidad de reconocer el error de mediciÓn como causa de diferencias de calificación en cualquiera de nuestras medidas y, al mismo tiempo, de obtener una medida exacta de nuestra variable si utilizamos indicadores múltiples7 .
Por ejemplo, los factores que pueden invalidar nuestra medida física de la calidad del alumbrado público (tales como un fotómetro defectuoso) probablemente tendrán bien pm:a relación con los factores que podrían introducir errores sistemáticos en la medida basada en las eva-1 uaciones de los ciudadanos (tales como la tendencia de éstos a sostener, movídos por un sentimiento de orgullo comunitario, que los servicios públicos de su barrio son tan buenos como los de las demás zonas). Si empleamos solamente un modo de medición, toda fuente de errores puede influir en las calificaciones atribuidas en cada medida, lo que nos dará un indicador que nunca será válido, impidiéndonos hacer comparaciones correctas entre las medidas. Si, por ejemplo, confiamos sólo en la medida física del alumbrado pero tomamos lecturas de diferentes maneras (digamos en la acera, en la curva de la calle y en la calzada), cualquier defecto del instrumento de medida (en este caso,
7 Figura una excelente exposición de la lógica de las operacionalizaciones múltiples en David C. Leege y Wayne L. Francis, Pofítical Research (Nueva Y<Jrlc: Basic Books, 1974), cap 5, y John L. Sullivan y Stanley F eldman, lvlultiple f ndicators (Beverly Hills, Calif: Sage. 1979)
el fotómetro) afectará a todas las medidas y no podremos utilizar ninguna para comprobar las demás.
De esta lógica se desprende lo valioso que es contar con indicadores múltiples para nuestras variables. La disponibilidad de medidas múltiples no sólo nos da una oportunidad de verificar la validez de nuestros indicadores, sino que además, y en primer lugar, mejora nuestras posibilidades de obtener una medida válida de las variables. La multiplicidad de medidas puede hacer que mejore verdaderamente la validez de la medición, pues nos permite combinar los resultados de diversos procedimientos de medida diferentes para obtener una calificación compuesta que será un reflejo válido del valor real de nuestra variable con más probabilidad que cualquiera de las medidas tomadas por separado. Es más probable que esa calificación compuesta sea una medida válida porque también es muy posible que los errores que invalidan cada una de las medidas qq.eden eliminados cuando se combinen los resultados de varios procedimientos de medición.
Esto es muy parecido a lo que sucede cuando se pesa un objeto con numerosas balanzas diferentes: corno éstas no son perfectas, cada una de ellas puede arrojar un peso ligeramente distinto, por exceso o por defecto; pero si pesamos el objeto con un número suficiente de balanzas, las leyes de la probabilidad nos dicen que, en muchos casos, esos pequeños errores se anularán unos a otros, dándonos un peso medio correcto. Análogamente, si operacionalizamos nuestros conceptos de varias maneras diferentes de' modo que al error de medición asociado a cada operaciona1ización sea independiente del atribuible a todas las demás, será muy probable que obtengam.os una n1edida exacta de nuestro concepto al combinar las diversas calificaciones. (En las secciones del capítulo 9
De lo abstracto a lo concreto
dedicadas a la construcción de escalas e índices se describen posibles métodos de combinar las calificaciones para obtener una medida compuesta).
Un tercer método de validación es la llamada , validación discriminante. Cuando preguntamos si una medida demuestra poseer validez discriminante, esencialmente lo que preguntamos es si al utilizarla como indicador de un concepto determinado podemos distinguir éste de otros conceptos. Por ejemplo, si deseamos medir el concepto confianza en los dirigentes públicos mediante una serie de preguntas formuladas en una encuesta, y hacemos también una serie de preguntas en el cuestionario destinadas a medir la confianza en Ja gente (en general), comparando las calificaciones de las dos medidas podremos preguntarnos si nuestra primera serie de preguntas refleja en realidad otro modo de medir la confianza en la gente. Si las calificaciones son muy semejantes, decimos que la medida de la confianza política no tiene validez discriminante porque no nos permite distinguir el concepto de confianza en los dirigentes políticos del concepto de confianza en la gente.
Un enfoque final de la validación radica en el concepto de validez manifiesta. Algunas medidas están basadas en una observación tan directa del comportainiento en cuestión que no parece haber motivo alguno para poner en duda su validez: puede decirse que son válidas "ª simple vista», Por ejemplo, supongamos que hemos de medir el cumplimiento de una ley estatal por la que los establecimientos comerciales deben tener expuesta su licencia de funcionamiento en la puerta principal. Puede parecer que la intervención de observadores instruidos para anotar la presencia o ausencia de tales licencias ha de proporcionar una medida evidentemente válida de ese
./JS-
Análisis político empírico
cumplimiento. Pero aunque debemos preguntarnos siempre si las medidas que hemos escogido parecen válidas a primera vista, generalmente es un error confiar tan sólo en la validez manifiesta si hemos de obtener resultados exactos en nuestra investigación, y deberemos esforzarnos por confirmar la validez de las medidas mediante procedimientos reconocidos como los ya indicados.
En la tabla 4.1 se resumen estos cuatro tipos de validación. Si hemos de extraer conclusiones exactas de nuestra investigación, tendremos que contar con medidas válidas; pero para que éstas lo sean, deberán ser también fiables.
Fiabilidad
Cuando nos preguntamos por la validez de una medida, lo que preguntarnos es hasta qué punto se corresponden los valores que presenta con los verdaderos valores de la variable objeto de medición. Y
TABLA 4.1. Tipos de validación
Validación pragmática
Se cotejan los resulta· dos obtenidos mediante el índicador con los obtenidos mediante otro indicador que, según se sabe, es una medida válida del concepto, o se comprueba la validez predictiva del indicador utilizándolo para predecir sucesos que reflejen el concepto objeto de medición.
Validación construida
Validación interna (convergente); se infiere la validez del índícador de su relación con otros Indicadores del mismo concepto utilizando indicadores múltiples.
Valídación externa: se
infiere la validez del indicador de su relación con otros indicadores de otros conceptos con los que teóricamente debe estar relacionado el con~ cepto objeto de medición.
cuando nos interrogamos sobre la fiabilidad de una medida, nos estamos preguntando lo estables que son sus valores. ¿Podemos obtener el mismo valor para un caso dado cuando aplicamos la medida varias veces, o de cada aplicación resulta la asignación de un valor diferente a cada caso? Si no obtenemos esencialmente el mismo valor para un caso dado tras aplicaciones sucesivas de una medida, es que ésta no es fiable co1no indicador del concepto. Las reglas están hechas de materias no elásticas para asegurar la fiabilidad. Si fuesen de materia elástica, podrían muy bien inaicar longitudes diferentes para un mis1no objeto aunque la verdadera longitud de éste no hubiera cambiado, simplemente porque la regla experimentaría estiramientos y contracciones.
Una medida que no sea fiable no puede ser válida, pues por lo menos algunas de las diferencias en las calificaciones asignadas a los casos se deben a errores de medición y no a las diferencias reales que
Validación discrirninante
Se infiere la validez del indicador del grado en que nu está relacionado con índicadores de otros conceptos teóricamente distintos del concepto objeto de medición
Validación manifiesta
Se supone la validez por el carácter manifiesto del indicador (¿Se puede persuadir a personas entendidas de que es válido un indicador del concepto?)
existen entre los casos. Recordemos nuestro ejemplo del estudio del alumbrado público: ¿qué pasaría si el fotómetro que utilizamos fuese tan sensible que además de registrar la luz del alumbrado captara la luz de la luna? En ese caso, los valores asignados a cada calle en la variable calidad del alumbrado público dependerán tanto dei brillo del alumbrado como de factores tan aleatorios como la plenitud de la luna y la densidad de la capa d~ nubes. En la medida en que estos factores aleatorios influyan en nuestros resultados, la medición no será un reflejo válido de las diferencias reales de calidad del alumbrado público. En tal caso, la falta de fiabilidad origina la invalidez.
Una medida puede ser fiable y, al mismo tiempo, no ser válida. Volvamos al ejemplo en el que se trataba de averiguar hasta qué punto estaban conforrnes los ciudadanos de diferentes naciones con las líneas de actuación de sus respectivos gobiernos. Decíamos que las preguntas formuladas en una encuesta pueden proporcionar medidas que no sean válidas porque los ciudadanos de países autoritarios tal vez tengan miedo de decir la verdad sobre sus opiniones. Cmno este factor provoca un error sistemático más que un error aleatorio, las preguntas pueden producir resultados muy estables. Es muy probable que la gente, por mucho que se le pregunte, dé siempre la misma respuesta; pero esto no hace que la medida sea válida.
Así pues, una medida puede ser fiable y no ser válida, pero no puede ser válida si no es fiable. Mientras que la validez está condicionada tanto por el error sistemático como por el aleatorio, la fiabilidad sólo está sujeta al error aleatorio. Esto significa que si una medida ha sido convincentemente validada en estudios anteriores, podemos utilizarla sin preocuparnos de su fiabilidad: ha de ser fiable si es
válida. Pero la demostración de fiabilidad no garantiza su validez.
¿Cómo precavernos contra la falta de fiabilidad? ¿Cómo determinar si es o no fiable µna medida determinada? Para prevenir la falta de fiabilidad, hemos de tener presentes las diversas causas de error aleatorio de medición indicadas en este capítulo, y hacer lo posible por controlarlas. Y para ello, se [la de analizar el verdadero proceso de medición y verifi-car de antemano Ruestros instrumentos de medida a fin de descubrir las causas de error aleatorio que anteriormente no se hubieran advertido.
En las ciencias sociales, muchas veces es difícil determinar si es fiable la medida que hemos adoptado. La razón es que el verdadero valor de las variables que nos interesan puede cambiar profundamente con el tiempo y las circunstancias: la gente cambia de opinión con arreglo a su experiencia, las naciones modifican la forma de distribuir sus recursos <:mtre los servicios sociales y el capítulo de defensa según los riesgos militares que perciben, y así sucesivamente. Cuando los valores reales cambian de éstas y otras maneras, es dificil distinguir los efectos del error aleatorio de medición de las auténticas fluctuaciones en los conceptos que se miden. Esto quiere decir que la fiabilidad se debe verificar en el lapso más corto posible.
"'Esencialmente, son tres los grandes métodos de evaluar la fiabilidad de las medidas en las ciencias sociales. El prirnero es el método de verificación reiterada. Eh éste se aplica la misma medida al mismo conjunto de casos una y otra vez a lo largo del tiempo. Con esta técnica se plantea una dificultad cuando se trata de entrevistar a la gente (a diferencia del caso en que se rniden objetos inanimados o se observa a la gente sin que ésta lo advierta). Si repetimos las preguntas en
/K-
un breve intervalo de tiempo, los entrevistados pueden recordar su primera respuesta y, por un deseo de ser consecuentes, repetir la misma en vez de contestar como verdaderamente sienten. Si esto sucede, no podemos obtener una impresión exacta de la fiabilidad de las preguntas como indicador del concepto. Con el fin de evitar este efecto de la verificación, podríamos esperar durante bastante tiempo para hacer las preguntas por segunda vez; pero entonces nos encontraríamos con otro problema: que los verdaderos valores de la variable pueden haber cambiado con el transcurso del tiempo y tal vez no seamos capaces de dintinguir las diferencias de calificación debidas a la falta de fiabilidad en la medida de los cambios reales producidos en la variable.
En vista de esta dificultad, se ha elaborado un segundo tipo de verificación de la fiabilidad: el llamado método de las formas alternativas de medición. En éste, se aplican diferentes formas de la medida al mismo grupo de casos, o se aplica la misma medida a diferentes grupos al mismo tiempo. De este modo no puede haber efecto de verificación porque ningún caso se medirá más de una vez, y como no transcurre el tiempo entre las aplicaciones de la medida, los cambios reales en las variables estudiadas no pueden influir en los resultados. Sin embargo, el éxito de esta estrategia depende de que las formas alternativas de la medida sean perfectamente comparables entre sí como medida del concepto, o de que los dos grupos sean virtualmente equivalentes con respecto a la distribución de la variable que se mide. En el supuesto de que se cumplan estas condiciones, cuanto mayor sea el nü1nero de calificaciones semejantes en las dos medidas o en los dos grupos, mayor confianza tendremos en nuestra medida. Pero sí no podemos obtener medidas o gru-
pos comparables, no podremos utilizar el método con propiedad.
El último procedimiento básico de verificar la fiabilidad de una medida es el llamado método de submuestreo. Consiste en tomar una muestra de casos y dividirla en varias submuestras de manera que cada una de ellas sea muy semejante a las demás en su composición. Luego se aplica la misma medida a todas las submuestras y se utiliza la similitud o diferencia de las respuestas de una submuestra a otra como indicador de la fiabilidad de la medida. Como usamos la misma medida, no hemos di;: preocuparnos por la comparabilidad como en el método de las formas alternativas; y como podemos confiar en la teoría del muestreo para asegurarnos la equivalencia de las submuestras, no tenemos que inquietarnos por que los grupos escogidos para la medición no sean lo bastante similares. Ningún caso se mide dos veces, lo que nos permite descartar la posibilidad de que el efecto de verificación malogre la exactitud de nuestro test de fiabilidad. Las medidas se aplican de manera simultánea, por lo que los cambios reales en la variable no pueden, con este método, crear los problemas que se derivan del método de verificación reiterada. Con todo, la aplicación del método de submuestreo depende de que podamos tomar una muestra lo suficientemente amplia como para dividirla y, a su vez, obtener submuestras lo bastante amplias como para dar sentido a nuestros ensayos estadísticos. Esto no siempre es posible y puede suponer un obstáculo para aplicar el método de submuestreo en la verificación de la fiabilidad.
Existen varios procedimientos estadísticos para interpretar los resultados de cada uno de estos tests d<~ fiabilidadª
" Se exponen algunos en George W. Bohrnstedt, "Reliabílity and Validíty Assessments ín Attitude
Estos métodos tienen numerosas variaciones. Según el tiempo y los recursos de que se disponga para realizar la investigación, en cada proyecto convendrá utilizar una u otra de ellas, atendiendo también a la índole del estudio. Por ejemplo, si hemos de medir el alumbrado público mediante observadores adiestrados que lo evalúen en diversas manzanas, bien podremos aplicar el método de verificación reiterada sin preocuparnos del efecto de verificación. El alumbrado público no va a cambiar por el solo hecho de que alguien lo mida, y podemos hacer que distintos observadores, actuando de manera independiente, evalúen el alumbrado de una calle en una rnisma noche. No podríamos confiar tanto en este método si nuestra medida de la calidad del alumbrado público se basara en las respuestas de los ciudadanos a las preguntas formuladas en una encuesta.
Con independencia del test de fiabHidad que escojamos, es importante que establezcamos la fiabilidad de nuestras medidas antes de iniciar verdaderamente la investigación. Esto supone la verificación previa de la medida mediante el acopio de algunos datos exclusivamente destinados a evaluar los instrumentos que hayamos de utilizar en el estudio final. De no hacerlo así, probablemente no adve:rtiremos que las medidas de las variables principales no son fiables (ni, por lo tanto, válidas) hasta después de haber terminado el estudio. Quiere esto decir que no podremos dar ningún Úédito a los resultados de la investigación y que, en todo o en parte, habremos malgastado nuestras energías. La verificación previa de la validez y Ja fiabilidad de las medidas debe forrnar parte de todo proyecto de investí-
Measurernent . ., en Gene F Summers, ed. Attitude IVleasurement \Skokie, IIL: Rand iV!cNally, 1970), pp. 80~99.
De lo abstracto a lo concreto
gación cuando las medidas utilizadas no hayan sido convincentemente validadas en otra ocasión, o cuando sólo hayan sido validadas en situaciones muy diferentes de aquéllas en las que van a utilizarse.
Conclusión
Hemos presentado hasta ahora todos los elementos básicos del proceso de investigación. En la figura 4.6 se representan las relaciones entre ellos. La operacionalización de nuestros conceptos mediante el desarrollo de indicadores mensurables nos prepara para entrar en el terreno práctico y hacer observaciones en las que basar nuestras conclusiones. Pero para poder hacer estas observaciones necesitamos un «plan de ataque», un esquema con el que, al hacerlo, podamos obtener el mayor número posible de conclusiones dignas de crédito. Este plan o proyecto de investigación es el objeto del capítulo S.
Sugerencias para otras lecturas
La mayoría de las explicaciones de medición en ciencias sociales figura en las publicaciones que informan de los resultados de la investigación o desarrollan técnicas de medición perfeccionadas. Son e!)casas las introducciones generales al tema. Sin embargo, podemos indicar algunas fuentes de utilidad además de las obras citadas en las notas de este capítulo. Figura una provechosa exposición de los fundamentos lógicos de la medición en Fred N. Kerlinger, Foundations of Behaviorai Research (Nueva York: Holt, Rinehart and vVinston, 1964), y en Abraham Kaplan. The Conduct of Inquiry (San Francisco: Chandler Publishing Co., 1964). Se aclaran algunos de los problemas que se plantean en la medición
Análisis político empkico
Teoría (supuestos abstractos en ~
un• e~mdurn lóglcol \
Formulación de conceptos y proposiciones que los relacionan
1 observadas entre variables
1 Inducción
Análisis de datos (determinación de relaciones observadas entre medidas)
Proposiciones (predicciones abstractas de relaciones entre conceptos)
Deducción
Hipótesis (predicciones concretas de relaciones entre variables)
Operacionalización
1 Instrumentación
Hipótesis de trabajo (predicciones de relaciones entre indicadores)
Plan de investigación (organización de observaciones)
Observaciones
~------ (fuediciones de sucesos empíricos)
FIGURA 4.6. Modelo del proceso de investigación.
en John M. Johnson, Doing Field Research (Nueva York: Free Press, 1975), y una de las mejores introducciones a las estrategias de medición es la de W. Philips Shively, The Craft of Political Research, 2.ª ed. (Englewood Cliffs, N. J.: Prentice-Hall, 1980). Expone algunos enfoques más avanzados de la medición H. M. Blalock, Jr., ed., Measurement in the Social Sciences (Chicago: Aldine, 1974), y H. lVI. Blalock, Jr., Conceptualization and Measurement in the Social Sciences
(Beverly Hills, Calif.: Sage, 1982). Figura un breve panorama de los métodos de verificación de la validez y fiabilidad en Edward G. Carmines y Richard A. Zeller, Reliability and Validity Assessment (Beverly Hills, CaliL: Sage, 1979).
Ejercicios de investigación
1. En una de las publicaciones de ciencia polític 99 J.meradas en el capítulo 3,
localizar un artículo que informe sobre los resultados de una investigación empírica. Hallar dos conceptos principales de dicho artículo, como mínirno, y exponer por escrito cómo ha sido operacionalizado cada uno de ellos. Si en el artículo sólo se hace una operacionalización de cada concepto, describir al menos otras dos de cada uno. Si se hace m.ás de una operacionalización, describir al rnenos una operacionalización optativa de cada concepto. En lo posible, las operacionalizaciones se basarán en indicadores cuya forma sea diferente a la utilizada en el artículo.
2. Seleccionar otro artículo especializado que informe sobre los resultados de una investigación empírica. Descubrir al menos dos de los conceptos principales empleados y exponer cómo fueron operacionalizados. Establecer una línea de razonamiento por la que quepa esperar que el indicador escogido para cada variable cambie cuando lo hagan los valores de la misma. En otras palabras, establecer una teoría de la rpedición que justifique el empleo de ese indicador.
3. Sirviéndose de las variables del artí-
De lo abstracto a lo concreto
culo seleccionado para el ejercicio 2, idear por lo menos dos teorías de medición distintas que muestren cómo se pueden producir cambios en cada indicador ernpleado en el artículo a consecuencia de los cambios de alguna variable diferente de la utilizada para representarlos. Dicho de otro modo, detectar por lo menos dos posibles causas de invalidez para cada indicador.
4. Utilizando uno de los artículos escogidos en cualquiera de los ejercicios anteriores, hallar dos medidas clave que se hayan empleado en él. Indicar cuál de los tres grandes métodos de verificación de fiabilidad de las medidas es adecuado utilizar para comprobar la fiabilidad de éstas, y justificar su elección. Exponer cómo se establecerían las observaciones necesarias para efectuar la verificación de cada medida. Por ejemplo, «Al principió y al final de cada una de las entrevistas, incluiría una versión de la pregunta en que se basa la medida, y compararía las respuestas que diera cada entrevistado a ambas preguntas».
Del mismo modo que a ningün montañero avezado se le ocurriría escalar el Monte Everest sin haberlo planeado cuidadosamente (preparando el equipo apropiado, estudiando la ruta más idónea y
previendo lo que habría de hacer si algo saliera mal), el experto en ciencia social no debería emprender un gran proyecto de investigación sin haber planeado minuciosamente sus distintas etapas. Este ;jplan de ataque» se denomina diseño de investigación. «El diseño de investigación es un esquema que orienta el proceso de recogida, análisis e interpretación de los datos. Es un modelo lógico de prneba que permite hacer inferencias causales váli~ das,,'. Sin un diseño adecuado y apropiado de investigación, las mejores medí., das serían baldías, ya que no podría determinarse su significado. Para realizar con éxito un estudio de ciencia social es esencial que, además de dominar las técm
1 David Nachmias, Public Policy Evilfuation (Nueva York: St, Martio 's Press, 1979), p 21
nicas ya expuestas~ se sepa elaborar un diseño de investigación coherente.
Antes de acometer un estudio serio, se debe redactar un díseño de investigación que no sólo indique con exactitud lo que se intenta hacer en el proceso investigador, sino también por qué se va a dar cada uno de los pasos en el mismo y por qué se va a dar de una determinada manera y no de otra.
Finalidad de la investigación y diseño de Investigación
Hasta el momento, hemos hablado de la investigación en ciencia política como si estuviera plenamente destinada a verifi~ car hipótesis mediante el proceso sintetizada en la figura 4. 6. Pero aunque por lo general se reconoce que los estudios de verificación de hipótesis son el elemento medular de Ja labor de ciencia social, la investigación puede tener objetivos muy variados, y es precisamente el objetivo que se persigue lo que determina el dise·
G(
100 An;jfisis político empifico
ño de investigación más adecuado para el proyecto de que se trate2
• Algunos proyectos de investigación son exploratorios: su única finalidad es la de familiarizarnos con los fenómenos que deseamos investigar, con el fin de formular preguntas más precisas y 1 tal vez, desarrollar ciertas hipótesis. Esos estudios pueden ser esendales cuando se trata de investigar nuevos fenómenos u otros fenómenos que todavía no han sido estudiados. Hay proyectos que requieren una investigación descriptiva: su objetivo es propotcionar una representación cabal de algún fenómeno para poder formular mejor preguntas e hipótesis de investigación .. Quizá necesitemos, por ejemplo, conocer la frecuencia1 distribución geográfica y secuen~ cia de sucesos de un determinado fenó~ meno, o saber con qué otros fenómenos tiende a estar asociado antes de que podamos empezar a teorizar sobre lo que lo ha ocasionado. Por último, el objeto de la investigación puede ser la contrastación de hipótesis causales. Si podemos utilizar los resultados de un estudio para sostener que una cosa es causa de otrat podemos empezar a elaborar explicaciones del se~ gundo suceso. Por eso, puede llamarse investigación explicativa a la destinada a contrastar hipótesis. Dicha investigación es apropiada cuando conocemos lo bastante un fenómeno para empezar a buscar explicaciones de por qllé es como es,
Lo que quiere decir esta somera tipología de los fines de la investigación es que_ ..... cada tipo de investigación .requiere condiciones distintas en su diseño. Para la in-
2 Unu amplia exposidón de los fines de tos pmyectos de invesdgoción en ciencia soclai y de sus implicaciones en el diseño de investiga:dón es la contenida en Ciaíre Selltiz1 Lawrem::e S. Wrightsmm1 y Stuart W. Cook, Research Methads in Social Relations, 3 .. ed .. (Nueva York: Holt, Rinehart and Winston, 1976), pp 89-112
vestigación exploratoria1 más que precisión hace falta flexibilidad, pues la finalidad es descubrir posibles explicaciones más bien que verificar explicaciones hipo~ téticas. Los diseños de inv~stigación exploratoria sólo han de proporcionar una oportunidad de observar el fenómeno en cuestión. En cambio, la investigación descriptiva requiere la medición exacta de los fenómenos. En los estudios descrípti· vos, el diseño de investigación debe apor-tar observaciones imparciales y fiables para que aquéllos produzcan una imagen exacta de tos sucesos de interés, Los diseños de investigación explicativa no sólo deben proporcionar observaciones impar~ ciales y fiables, sino también una base sobre la que pueda inferirse la influencia causal que una o más variables ejercen en otras. El diseño de investigación proporciona una base de inferencias causales cuando permite descartar todas aquellas explicaciones plausibles de los resultados observados que representan opciones distintas de la hipótesis causal objeto de contrastación~
Sea cual fuere la finalidad concreta de un estudio, su diseño de investigación debe reunir los siguientes elementos básicos:
L Una explicación de la finalidad de la investigación"
2 U na explicación de la hipótesis que se vaya a contrastar (en su caso).
3. Una especificación de las variables que hayan de emplearse.
4. Una explicación de cómo se va a ope~ racionalizar y medir cada variable"
S. U na explicación detallada de cómo van a organizarse y realizarSe las observaciones~
6 Una exposición general de cómo se van a analizar los datos obtenic~os.
Los capítulos 2 y 4 contienen los ele-
mentas fundamentales que son necesarios para preparar las secciones l a 4 de un diseño de investigación~ y los capítulos 1 S-19 presentan una introducción al análisis de datos. El presente capítulo se dedica a la organización de las observaciones. Es éste el aspecto del diseño de investigación que proporciona una base para descartar las hipótesis rivales alternativas y el que la mayoría de los especialistas tiene presente cuando alude al diseño de investigación,
Cómo abordar las hipótesis rivales alternativas mediante el diseño de investigación
Si examinamos un proyecto de investiw gación hipotético, podremos demostrar que la utilidad de los resultados de una investigación está condicionada por la manera en que hayamos estructurado u organizado nuestras observaciones. Supongamos que el departamento de justicia de su Estado ha puesto en práctica un nuevo programa destinado a reducir la delincuencia juvenil y que, con arreglo a él, los infractores juveniles o infractores potenciales que se ofrecen como volunta~ rios personalmente o a través de sus padres realizan visitas de un día a )as prisio-.nes, donde se hacen una idea de los horro~ res·de la vida carcelaria. El programa está basado en el supuesto de que eso les disuadirá de cometer delitos que podrían conducirlos a prisión. Digamos que, tras unos meses de aplicación del programa, el gobierno de ese Estado desea saber si está produciendo el efecto deseado y le contrata, como experto en ciencia política~
para que evalúe sus resultados, ¿Cómo procederá usted?
Como el programa, llamado Oparación Miedo, tiene por objeto reducir la delincuencia juvenil! será la delincuencia su
Aplica.ción del plan 101
variable dependiente. Podría operacionalizarla como .ser detenida por un delito penal, y luego, un año después de su visita a las prisiones, consultar el fichero de antecedentes penales para ver si figuran en él los jóvenes que se hayan sometido a la Operación Miedo. Si han sido detenidos durante ese tiempo, Jos clasificará como delincuentes, y si no han sido detenidos, como no delincuente-s3 _
En este ejemplo, su diseño de investigación entraña una sola observación de todos los casos de interésc Esta observación se hace cuando comprueba los ante. cedentes penales de los que han participado en la Operación Miedo. Supongamos que averigua que el 70 por ciento de los participantes en el programa no han sido detenidos durante el año siguiente" ¿Puede deducir de ello que la efectividad del programa para evitar la delincuencia se cifra en un 70 por ciento?
Para poder afirmarlo siquiera con una cierta seguridad tendrá que descartar otras explicaciones de por qué el 70 por dento de esos jóvenes no han sido detenidos. Según su hipótesis, la Operación Miedo es causante del comportamiento no delictivo. Veamos algunas posibles hipótesis rivales alternativas que pudieran explicar sus hallazgos,
3 En esta operacionalización de la delincuencia, se trata ésta como una variable nomina! dícotómica En la práctica. probablemente tendrá que una operndonalización que proporcione más mación y sea más sensible a las diferencias entre individuos. Por ejemplo1 elaborará un ,.jndice de delincuencia .. que combine el numero de detendo~ nes practicadas en un año con alguna medida de la gravedad de los delitos por los que hayan sido detenidos Jos sujetos, para disponer de un indicador del grado de delincuencia La simple operaeionalíza. dón aqul propuesta es, sin embargo, adecuada para ilustrar los principios deJ diseño de investigación y sirve, en el ejemplo dado, para evitar compfü:aciones innecesarias
¡ IJ2 Aniilisfa politico empirico
L ~ n 30 por e iento como máximo de los Jóvenes habrían sido detenidos aunque no hubieran participado en la
Operación Miedo 2 Los antecedentes familiares de los
presentados como voluntarios para la Operación Miedo son diferentes de los que no se presentaron, y son esos antecedentest y no el programa estatal, los que han evitado que delincan
aquéllos que no han participado, y sostener que cualquier diferencia entre ambos índices cabe atribuirla al programa, por~ que se puede supaner que los participantes habrían actuado esencialmente del mismo modo que los no participantes sí no se hubiera re!'llizado la Operación Miedo
3 Los jóvenes han cometido delitos) pero no han sido detenidos,
4. La Operación Miedo produce efectos temporales, y cuando éstos desaparecen, los jóvenes reinciden en su com~ portamiento delictivo - (El programa no evita la delincuencia, sino que la
pospone). S Los jóvenes participantes en el progra
ma han sido detenidos más a menudo de lo que lo hubieran sido de no haberse 1.mmetido a la Operación Miedo, porque la participación les asigna el calificativo de delincuentes potencia~ ies y los somete a una mayor vigilancia policial. (El programa ocasiona detenciones más frecuentes, con independencia del efecto que produzca en el comportamiento)
La hipótesis alternativa 1 afirma que el programa no ha tenido ningUn impacto. Con una sola observación no se puede demostrar si esto es verdad o si no lo es. Nunca puede saber cómo habrían obrado los participantes en el programa si no hubieran tomado parte en la Operación Miedo, pero puede induír en su diseño de investigación la comprobación de los antecedentes penales de un grupo de jóvenes que, sin haberse sometido a la Operación Miedo, tengan el mayor número po~ sibte de rasgos semejantes a los de quienes participaron en él. Luego, puede com~ parar el índice de delincuencia de los que han participado en el programa con el de
La observación del grupo de control (los que no participaron en el programa) nos permite establecer un vínculo causa) entre el programa y el comportamlento
delictivo La hipótesis alternativa 2 viene a afir
mar que toda:· relación aparente entre la participación en el programa y el compor~ tamiento delictivo es una re]ación espu· ria. Dicha hipótesis mantiene que los antecedentes familiares son causa de la participación en el programa y de la no delincuencia subsiguiente, Este razonamiento sugiere que hay un proceso de selección en el que aquéllos que cuentan con el apoyo de la familia, que les ayuda a evitar el comportamiento delictivo, son Jos que con más probabilidad han tomado parte en el programa, y que esto crea una relación aparente entre la Operación Miedo y la no delincuencia,
Una sola observación no le permitirá excluir esa posibilidad, pero. como en la hioótesls alternativa 1~ podrá determinar si .existe una relación causal sí dispone de un grupo de control integrado por jóvenes cuyos antecedentes familiares sean se-.. mejantes a los de quienes han participado en el programa: observará para ello si participantes y no participantes suelen tener antecedentes familiares distintos, y
si aquéUos con antecedentes familiares semejantes suelen tener el mísmo índice de delincuencia, ai margen de su participación en la Operación Miedo.
Para descartar la hipótesis alternativa 2, como en el caso de la hipótesis 1 r tendrá que realizar una segunda observación (consultar el fichero de antecedentes
penales para saber si algunos jóvenes que no hayan participado en el programa figuran en el mismo), Pero, además, al abor~ dar la hipótesis 2 habrá de hacer una tercera observación~, en la que obtenga informes sobre los antecedentes familiares de los sujetos, Posiblemente, podrá obtener algunos indicadores objetivos de esta variable (por ejemplo, la presencia del padre y la madre, el grado de educación y la ocupación de los padres y los ingresos ~amiliares) consultando los registros püblicos, pero también puede suceder que haya de entrevistar a Jos miembros de la familia o a los propios jóvenes Estas entrevistas serán necesarias si ope~ racionaHza los antecedentes familiares incluyendo las actitudes y el carácter de las interacciones personales. Y así, no solamente aumentará el volumen de los datos que obtenga, sino que además adoptará otro método de recogida de datos: la entrevista personal.
La hipótesis alternativa 3 hace alln más necesarío este método adicional de reco~ gida de datos. Plantea la posibilidad de que la Operación Miedo haya hecho a los participantes más cautelosos e induso, tal vez1 delincuente:; más avisados, en vez de reducir el nllmero de sus delitos, Pone en tela de juicio la idoneidad de la operacionalización de la variable dependiente Mientras el registro Gficial de detenciones sea su única medida de Ja delincuencia1
no podrá estar seguro de que la operacioff naJización es adecuada.
Una forma de abordar la hipótesis 3 consiste en operacionaJizar la delincuencia de manera que incluya informes de los actos delictivos de los propios jóvenes, y efectuar entrevistas antes y después de su participación en el programa. Tendrá que entrevistar tanto a los participantes como a jóvenes no participantes, e incluir información sobre los antecedentes familiares de cada grupo, para estar seguro de que
Aplicación del pian 103
sus resultados no pueden ser explícados por hipótesis tales como la 1 y la 2 expresadas en términos de este nuevo indicador de la delincuencia, Con ello, no sólo habrá añadido otro punto de observación (la entrevista previa al programa), sino otro modo de operacionaJfaación de la variable dependiente.
La hipótesis alternativa 4 añade una dimensión temporal al estudio. Si ha de descartarla, tendrá que entrevistar tanto a los participantes en el programa como al grupo de cootI'ol y comprobar sus antecedentes penales, no solamente un año des~ pués de ia visita a la prisión, sino también dos y taJ vez tres años más tarde. Es obvia la razón por la que se han de hacer observaciones subsiguientes de Jos participantes en el programa1 ya que éstos, según la hipótesis 4, acabarían por delinquir. Además, habrá de observar al grupo de control para-cerciorarse de que Jos cambios en los índices de delincuencia de Jos parti~ cipantes en el programa que se produzcan en los años siguientes no obedecen a otros factores tales como la madurez1 las modificaciones de la situación familíar o un empeoramiento de las condiciones económicas, Sólo si los participant~s en el pro~ grama tienen un índice subsiguiente de delincuencia similar al de los no participantes (o peor que él) en e/ mismo momento, podrá concluir que el programa ha sido ineficaz (o que ha tenido un efecto negativo)_
A diferencia de las otras, la hipótesis alternativa 5 sostiene que Ja Operación Miedo ha sido más efectiva de lo que los resultados dan a entender. Plantea !a po~ sibilidad de que, al utilizar las detenciones como medida de la delincuencia, haya introducido una variable índependíente suplementaria (tratamiento selectivo por parte de la~ autoridades) cuyos efe.otos encubran la verdadera influencia de la Operación Miedo en el comportamiento delictivo
63
104 Análisis político empirico
Una manera de afrontar esta posibilidad es incluir también otra operacionali .. zación de la variable dependiente. Si> además de Jas detenciones, toma en consi .. deracíón las condenas de los participantes y Jos no participantes, tendrá algunos indicios de si las acusaciones fonnuladas c·ontra los participantes en t?.l programa son menos consistentes que las vertidas contra los jóvenes que no hayan tomado parte en la Operación Miedo, y de ello probablemente podrá deducir sí la policía es más propensa a detener a los que han participado en ella voluntariamente. La diferencia entre detenciones y condenas de los participantes y detenciones y condenas de los no participantes proporcionará un indicador de la atención selectiva de la policía. Sí los participantes son detenidos y finalmente no son acusados ni condenados con una frecuencia sensiblemente mayor que los no participantes, tendrá motívos para creer que la hipótesis
5 es correcta" Este breve examen de algunas de las
posibles hipótesis rivales que pueden poner en duda el valor de sus resultados ha aportado una base para establecer un diseño de investigación mucho más elaborado que el que indicamos en primer lugaL Para poder descartar estas cinco interpre* taciones optativas de los hallazgos que haya deparado su investigación (y tendrá que hacerlo si su estudio ha de tener algún valor), no habrá de contentarse con una sola operacionalización de la varíable dependiente y una so)a observación, sino que deberá establecer un diseño de investigación que comprenda múltiples modos de operacionalización 1 mtiltiples métodos de recogida de datos y varias observaciones. El nuevo diseño pcdría suponer las siguientes etapas principales:
1. Seleccionar una muestra de jóvenes que hayan sido designados para parti-
cipar en la Operación Miedo Y una muestra de jóvenes con las mismas características susceptibles de incidir en ia delincuencia (como, por ejemplo, sexo, edad) raza, educación propia y
de sus padres, ingresos:, modo de vida y iugar de residencia), pero que no vayan a partici_par en el programa,
2 Entrevistar a los designados para participar en el programa antes de que se sometan a la Operación Miedo y, al mismo tiempo, entrevistar al grupo de control para obtener informes de los propios interesados sobre la actividad delictiva e información sobre los antecedentes familiares,
3. Entrevistar a los miembros de todas las fomiHas para obtener información sobre los antecedentes familiares.
4, Un año después de la visita a la prisión, entrevistar a los partidpantes y a los no participantes para obtener informes de los propios interesados sobre la actividad delictiva y averiguar si han cambiado ]as circunstancias familiares.
S. Al realizar la etapa 4, consultar los registros de detenciones y condenas de los participantes en el programa y de los no participantes
6 Dos años después de la partidpación en Ja Operación Miedo, repetir las eta
pas 4 y S. 7. Volver a repetir las etapas 4 y S tres
años después de la Operación Miedo.
Al analizar los datos, habrá de compa;ar los índices de detenciones. los índices de condenas y las diferencias entre ambos índices de los participantes en el programa y del grupo de control, sín olvidarse de eliminar aquellos integrantes de éste último que hayan tomado parte en la Operación Miedo después de ou selección inicial para el estudio. Empleando procedimientos estadísticos apropiados en el
análisis de los datos obtenidos mediante estas observaciones, podrá extraer conclusiones altamente defendibles sobre el valor de la Operación Miedo como factor disuasorio de la delincuencia juveniL Así. habiendo descartado las principales hipótesis rivales, el departamento de justicia del Estado en cuestión podrá prestar gran confianza a sus condusiones1 lo que no haría si éstas estuvieran basadas en el primer diseño de investigación.
No hemos querido decir con este ejercicio que los diseños de investigación complicados sean preferibles a los sencillos, En ocasiones, es muy preferible recurrir a estos últimos. Lo importante es la idonreidad del diseño, no su complejídaq. Un diseño de investigación será adecuado si proporciona una base lógica para las infe· rencias que desea hacer el investigador-
El comentario de este estudio hipotético constituye un ejemplo de cómo se elaboran diseños de investigaciqn adecuados. Al planear un proyecto de investigación, seguirá, paso a paso, el mismo tipo de razonamiento que hemos esbozado,, El diseño de investigación es un proceso de formulación de hipótesis rivales alternativas y de razonamiento mediante el tipo de observaciones que son necesarias para verificar dichas hipótesis a fin de poder descartarlas como explicaciones de los posibles hallazgos.
Se llega a establecer las hipótesis rivales alternativas del mismo modo que las hipótesis de trabajo.. Son resultado del análisis lógico de nuestras teorías sobre el fenómeno que se ha de explicar y de un conocimiento detallado de los hechos que lo rodean. La identificación de hipótesis adversas cruciales es principalmente una actividad creadora. No hay reglas fijas y concretas que pennitan determinar todas las hipótesis rivales que pueden desvirtuar el valor de la investigación., El proceso de diseñar un proyecto de investiga-
Aplicación del plan 105
ción será diferente para cada estudio No basta con seleccionar un diseño de inves~ tigación apropiado basándose en un conjunto limítado de opciones como sí se tratara de escoger un par de zapatos entre los que haya del número adecuado en una zapatería,_ Lo que sí hay son varios tipos generales de disefioS de investígación, cada uno de los cuales corresponde al tipo de problemas que se han de abordar. La sección siguiente contiene una panorámica de los principales tipos de diseño de investigación y una introducción a la lógica del diseño. Con estos fundamentos y con un sólido conocimiento teórico y empírico del tema que ha merecido su interés1 estará en condiciones de elaborar diseños de investigación para sus propk estudios.
Diseños de investigación experimentales
La finalidad de un buen diseño de investigación es permitirnos determinar los efectos de una variable sobre otra con Ja mayor seguridad posible, Para lograrlo, los diseños de investiga~ión proporcionan un elemento de control sobre las condiciones en que las variables actúan entre si. Este control es la clave del diseño de inVestigación, Si varios animales de una granja contraen una enferm~dad después de haber añadido un nuevo tipo de alimento a su pienso? el granjero no podrá saber con seguridad si el nuevo a1imento es la causa de la enfermedad, porque los anímales pueden haber estado expuestos a nuevas y diversas sustancias {como, por ejemPlo, insecticidas en el suministro de agua) al mismo tiempo. Por otro lado, si una proporción inusitadamente alta de animales de experimentación contrae una enfermedad en un laboratorio de investigaciones médicas después de añadir una
pi(
10S Análisis politico empírico
-nuev-a sustancia a su alimentación, es más probable que el investigador esté seguro de que esa sustanda es la causa de la enfermedad, pues ''en este caso se puede controlar el entorno de los animales de experimentación y asegurarse de que no están expuestos a ninguna otra sustancia durante las observaciones. Las condiciones de trabajo del investigador permiten un elemento de control que no permite la granja.
Los diseños de ínvestigacíón pueden clasificarse con arreglo al grado de control que permiten. En lo que más interesa a Jos expertos en ciencia política, la distinción básica es !a que se hace entre diseños experi.-:-1enta/e.c; y cuasi experimentales,
.Ei. experimento es el modelo clásico de p•ueba científica. Se basa en el supuesto de que los cambios del valor de una variable ocasionan cambios en el valor de otra variable (por ejemplo, los cambios de temperatura dan Jugar a los de la viscosidad del aceite), Con el experimento, podemos verificar este supuesto exponiendo los sujetos que manifiestan la variable dependiente a la variable independiente en condiciones que nos permitan estar re1atívamente seguros de que cualquier cambio observado en la variable dependiente obedece a los cambios de la variable independiente.
El diseño eil:perimental básico comprende un grupo experimental compuesto de los sujetos que se expondrán a la variable independiente, o estímulo, y un grupo de control de los sujetos que son como el grupo experimental en todos los aspectos pertinentes pero no se expondrán al estímulo. El valor de la variable dependiente de cada grupo se mide antes de la introducción del estímulo en lo que se llama verificación anterior (pre test) y se vuelve a medir después de haber expuesto el grupo experimental al estímulo en ln que se llama verificación pos-
terior (posttest). El impacto del estímulo (variable independiente) se infiere de la comparadón de los valores de la verificadón anterior y Ja posterior en cada grupo, Cuanto mayor sea la diferencia de valores entre la verificación anterior y Ja posterior de cada grupo, mayor será el efecto atribuido a la variable independiente. La tabla S. l muestra la lógica del diseño de investigación experimental. El valor de este diseño de in veStigación consiste en que nos permite lograr dos condiciones 'iG'ue facilitan las inferencias causales váií~ das: Ja compaii1ción y la manipulación,
La afirmación de que una cosa ha causado otra se basa en el concepto de cambio. Para poder sostener que han actuado fuerzas causales, primeramente tenemos que demostrar que se ha producido algún cambio, y Ja idea de cambio supone comparaciones. Tenemos que comparar los valores de la variable dependiente, antes de que los sujetos se hayan expuesto a la variable independiente o causalt con los valores de la variable dependiente después de dicha exposición, y, si es posibl~, debemos comparar, después de la exposición~ los valores de la variable dependiente con algún indicador de cuáles serian esos valores si la exposición no se hubiera producido. El diseño experimental, con su procedimiento de verificación anterior y posterior y sus grupos de experimenta~ ción y de control, proporciona una oportu-nidad para ambos de comparación"
Para estar seguros que una variable tiene una influencia causal sobre otra, n~cesitamos saber qué sujetos han sido expuestos a la variable independiente y cuáles no, con el fin de hacer las comparaciones apropiadas" El experimento clásico nos permite saberlo, puesto que es el investigador quien introduce la variable independiente. El científico actúa sobre el entorno de Jos sujetos para que su exposición a la influencia causal no quede
TABLA S, 1 E/ diseño experimenta! clásica
Experimental
Control
Fase 1
Verificación anterior
Verificación anterior
Fase 2
Estímulo
al azar. Además) actúa sobre él para que todas las demás causas posibles de cambio de la variable dependiente sean eliminadas del experimento cuando los sujet~s se expongan a la variable independiente
En otros diversos diseños de investiga~ ción se recurre a Ja lógica del experm1e11w clásico, pero se añaden que son de especial interés para los exper~ ' tos en ciencia sociaL Estos necesitan diseños mucho más elaborados, lo que obedece, en gran parte, a dos hechos: U en los objetos de su investigación influye a menudo el propio acto de estudiarlos (por ejemplo, el comportamiento de los individuos puede cambiar si saben que se les está observando), y 2) los objetos de su investigación no son estáticost sino que cambian continuamente (por ejemplo, los valores de los individuos pueden modifi· carse a medida que surgen nuevas situaciones). La manera de abordar estos hechos queda ilustrada en dos diseños experimentales desarrollados por R. L. Solomon4
•
El primer diseño aborda un aspecto del problema de la reactividad llamado efec. to de verificación. Cuando los sujetos
~ Richard L Solomon, "Extension of ControJ Group Desígn", Psycbologk<ll Bu!letin, 46 {enero 1949), pp 137-50.
Fase
Verificación posterior
Verificación posterior
Aplicación del plan 1117
Efecto (de la variable experimental)
(verif posterfors -verlf_ anteriorE) (verif posteriorc -vedf anteriorc) donde E se refiere at grupo experimental y
experimentales se someten a la verificación previat siempre puede ocurrir que su calificación en la verificación posterior obedezca a Ja vez a su reacción aJ estímulo y a una reacción a la propia verificación anterior. Toda diferencia entre las calificaciones de las verificaciones anterior y posterior que se deba únicamente a las reacciones a la verificación anterior se denomina efecto de verificación, Para que podamos obtener una imagen exacta del impacto del estímulo sobre el comportamiento, habremos de eHminar ese efecto de verificación de las calificaciones. El diseño de investigación con dos grupos de control, ilustrado en la tabla 5.2, nos permite hacerlo.
El diseño es idéntico al experimento clásico, pero se le aiíade un tercer grupo (Control 2), que se somete al estímulo y a la verificación posterior, mas no a Ja ante~ rior. Mientras que los cambios ent1 e las calificaciones de la verificación anterior y la posterior observados en el grupo experimental pueden deberse tanto a la verificación anterior como al estímulo, los observados en Control 1 sólo pueden deberse a la verificación anterior, y los de Control 2, solamente al estímulo. Si es dado suponer que, en un principio, todos los grupos han tenido esencialmente el mismo valor en la variable dependiente y
6S
108 Análísis político empírico
TABLA 5 .. 2 El diseño experimental Solomon con dos ¡J,rupos de control
Grupo
Experimental
Control 1
Control 2
Fase 1
Verificación anterior
Verificación anterior
Fase 2
Estímulo
Estímulo
que han reaccionado al estímulo de la misma manera, el efecto de verificación vendrá representado por la diferencia de las calificaciones de la verificación posterior entre el grupo experimental y el Control 2. En ese caso, el efecto producido solamente por la variable independiente (estímulo) puede evaluarse restando este efecto de verificación del efecto total del experimento, que se calcula mediante la misma fórmula utilizada para evaluar los resultados del diseño experimental clásico. En la fórmula de efecto de la tabla 5.2 se resume esta lógica algebraícamente.
Y así, el diseño con dos grupos de control nos permite estimar y -cabe esperar- excluir el efecto de verificación como explicación alternativa de los cambios observados en los valores de los sujetos,
..
Fase 3
Verificación posterior
Verificación posterior
Verificación posterior
Fórmula del efecto
Efecto = [(veriC posteriorE - verif anteriord - (verif posteriorc 1 - verif anteriorc 1>l - (verif posteriorE - veriL rosteriorc2)
Sin embargo, hay otras posibles causas de cambio en las. calificaciones de los grupos en la variable dependiente (VD) entre la verificación anteri6r y la verificación posterioL Una de eJlas es la influencia de factores externos que no están bajo el control del experimentador Otra es la de los cambios naturales que se producen en los sujetos de manera independiente del experimento (como, por ejemplo, el envejecimiento en los experimentos protOngados, o la fatiga mental). El impacto de esos factores ajenos se puede apreciar (y, por lo tanto, excluir como explicación rival de los resultados del experimento) utilizando el diseño Solomon con tres grupos de control, representado en la tabla 5.3.
En este diseño se añade un tercer gru-
TABl·A 5 . .3 El diseño experimental Solomon con tres grupos de control
Grupo
Experimental
Control 1
Control 2
Control 3
Fase 1
Verificación anterior
Verificación anterior
Fase 2
Estímulo
Estímulo
Fase 3
Verificación posterior
Verificación posterior
Verificación posterior
Verificación posterior
Fórmula del efecto
Efecto [(verif posteriorE verif anteriorE) (verif posteriorc 1 - verif anteriorc 1)) - ((verif posteriorE - verif posteriorc2) + (verif posterior E verif posteriorc3 )]
po de control, que no se somete a la verificación anterior ni al estímulo, Cualquier diferencia observada entre los valores de las verificaciones anterior y posterior de este grupo puede obedecer únicamente: a la influencia de factores ajenos Si podemos substraer este cambio del efecto del experimento, podremos eliminar de nuestros resultados los efectos de esos factores ajenos y los cambios de los consultados, y es de esperar que podamos descartar la hipótesis alternativa de que son esas influencias y no la variable independiente lo que ha ocasionado el cambio de calificación en el grupo experimental entre la fase 1 y la fase 2
La dificultad es que el Control 3 no ha sido sometido a la verificación previ~: ¿cómo determinar en qué medida han cambiaáo esas calificaciones de Jos sujetos de la fase 1 a la fase 2? Si todos nuestros grupos son esencialmente iguales, podemos suponer que sus calificaciones en la verificación previa han sido muy semejantes, y asignar así, simplemente, al Control 3 en su verificación previa una calificación igual al promedio de las calificaciones atribuidas al grupo experimental y al primer grupo de controL Seguidamente podemos substraer esa calificación de la asignada al Control 3 en la verificación posterior, para obtener una medida del cambio ocasionado por los factores ajenos y los cambios naturales de los sujetosº Una vez eliminado este cambio, podemos ver con más claridad los efectos de la variable independiente en la variable dependiente.
Asignación de casos a los grupos
Cada uno de los diseños experimentales que acabamos de describir tiene por objeto proporcionar una base lógica sólida con la que extraer conclusiones sobre los
Aplicación del plan 109
efectos que produce una variable en otra, Para conseguirlo, es fundamental que cada diseño dependa del supuesto de que todos los grupos incluidos en el estudio son esencialmente iguales con respecto a aquellos factores que pudieran influir en su respuesta al experimento., Si no podemos suponer que los grupos son esencialmente iguales, no tendremos ninguna base lógica para inferir que las diferencias observadas en sus valores se deben a las diferencias en el modo en que han sido tratados en el experimento (por ejemplo, si se han sometido o no a Ja verificación previa), ni podremos establecer argumentos coherentes sobre la influencia causal de nuestra variable independiente ..
¿Cómo podemos asegurarnos de que los integrantes de los distintos grupos son esencialmente iguales? Hay tres procedimientos para asignar integrantes a los grupos., El primero es el de equiparación de precisión. Después de determinar las características que podrían influir en la respuesta de los sujetos a la variable independiente, se selecciona un conjunto de sujetos para el experimento, Por cada sujeto seleccionado, se asigna al grupo de control otro sujetO que retina exactamente la misma combinación de características oportunas, obteniéndose así dos grupos que son idénticos en cuanto a las características susc~ptibles de influir en su respuesta al experimento. Si lo hemos hecho perfectamente, los valotes que les atribuyamos en Ja verificación previa serán sumamente similares y el grupo de semejanza que obtengamos realmente al someterlos a esa verificación nos servirá para estimar hasta qué punto hemos acertado en nuestro intento de equiparación
Este procedimiento plantea varios problemas, En primer término, si necesitamos controlar numerosas características, probablemente será muy difícil encontrar sujetos que las retinan todas por igual
6¡;
110 Análisis politfco empirico
como ha de ser para equipararlos con precisión. Bien podríamos, por ejemplo, encontrar a individuos iguales por su sexo, edad y raza, pero sería más difícil que además de poseer esas características co~ munes tuvieran también Ja misma ocupación, el mismo grado de estudios e igual duración de residencia en la comunidad. Además, si hemos de aplícar un diseño de investigación que requiera más de dos grupos, seguramente será tarea harto difí~ cil localizar a tres o cuatro sujetos con características idénticas. Es muy proba':: ble que la equíparación, para asignar sujetos a los grupos experimentales, sea ínvíable, a no ser que contemos con un m.imero sumamente elevado de sujetos potenciales o se trate de un experimento muy sencillo.
Un segundo método es el control de distribución de frecuencia. En él, no se equipara cada sujeto con otro con respecto a todas las características, sino que se asignan los sujetos a los grupos de tal manera que estos tiltimos tengan, en promedio, las mismas características y la misma distribución de cada una de ellas .. Es posible que no haya dos sujetos con la misma combinación de sexo,_ edad, raza y ocupación, pero en cada grupo habrá el mismo nümero de sujetos masculinos y femeninos, el mismo promedio de edad, y así sucesivamente. Además, será muy si~ milar la distribución de esas caracteristiw cas entre los integrantes de los distintos grupos.
El control de distribución de frecuencia se puede aplicar más a menudo que el equiparamiento de precisión, pero adole-ce de dos importantes defectos. En primer lugar, solamente permite controlar una variable a Ja vez. Por ejemplo, con la asignación por distribución de frecuencia se pueden obtener dos grupos con igual número de sujetos de más de 40 años e igual número de negros, pero nada garan-
tiza que todos los sujetos de más de 40 años no sean negros en un grupo Y bla'ncos en otro. Si esto se produjera, ambos grupos no serían verdaderamente semejantes. En segundo lugar, el método no ofrece control alguno sobre Jos factores que influyen en las reacciones de los sujetos pero que no han sido detectados por el investigador,, Sí nuestra teoría del fenómeno estudiado es incompleta (y casi siempre lo es)~ bien puede ocurrir que no hayamos controlado fa distribución de frecuencia de alguna variable importante Si los grupos de control y experimental difieren sistemáticamente en esa variable incontrolada, lo más probable es que nuestros resultados estén falseados,
El tercer método para asignar sujetos a los grupos es más flexible que la equiparación de precisión, y con él se evitan los dos problemas vinculados al control de distribución de frecuencia. Es la selección aleatoria: en ésta, se asigna a un grupo un sujeto seleccionado de una lísta de todos los sujetos elegibles mediante algún proceso aleatorio, como, por ejem .. p!o, el uso de una tabla de números aleatorios" La verdadera selección aleatoria no se consígue, sin más, por procedimien~ tos de azar (como el consistente en tomar a tas 30 primeras personas que se prestan al experimento como grupo de verificación y a las 30 siguientes como grupo de control}.
La selección aleatoria tiene la gran ventaja de que permite sentir una gran
_ seguridad de que todos los grupos son sumamente similares en todos los aspectos, no simplemente en lo que atañe a las variables que consideramos oportunas .para el experimentot pues con la asignación aleatoria las diferencias entre los sujetos dertamente desaparecen cuando .se escoge un gran núrnero de sujetos" Y así, la selección aleatoria nos permite descartar toda hipótesis optativa adversa en donde
se sostenga que alguna diferencia sistemática en los grupos ha producido los resultados observados, y es /a clave del éxito en /os expecimentos de laboratorio. En el capítulo 6 expondremos en detalle los procedimientos para la selección aJeatoría de casos.
Experimentos sobre el terreno y diseños no experimentales
Los expertos en ciencia política, por la naturaleza de su especialidad, raramente trabajan en Jaboratorios. Más bien, observan los acontecimientos en su entorno natural, donde pueden ejercer un menor, control sobre los factores capaces de influir en los resultados del estudio. En los casos en que el investigador puede actuar sobre la variable independiente y controlar la exposición de los sujetos pero no puede controlar otros aspectos de la situa~ ción, realiza con frecuencia experimen .. tos sobre el terreno. En estos estudios emplea un diseño experimental en el que los sujetos se asignan sistemáticamente a Jos grupos de verificación y de control. Los diversos experimentos del «impuesto negativo sobre la renta» efectuados en los Estados Unidos son un ejemplo de esos experimentos sobre el terreno5
. Estos estudios se aplicaron para evaiuar los efec..tos que producía el pago asistencial automático en forma de impuesto negativo sobre la renta en el modo de vida y el rendimiento laboral de los sujetos. L-Os investig:;idores podían comprobar qué
5 Figuran los detaUes de algunos de estos experi~ mentas en A. Pechmany P. Michael Timpane,eds*. Work lncenlivesand lncome Guarantees (Vl/ashing~ ton, D.C.: Brookings Institution, 1975), y John L Pnimer y Joseph A. Per:hman, eds., Welfare in Rural Arcas (Washington, D.C.: Brookings Instituw tion, 1978)
Aplicación del plan 111
sujetos percibían los pagos del impuesto negativo sobre ia renta, pero no podían controlar otros aspectos importantes de la situación de los sujetos. Por ejempio1 no podían garantizar la continuidad de su buen estado de salud, su estado d~il o la oferta de empleo en la economía local Este dispositivo hacía más difícil deslindar Jos efectos de las prestaciones asistenciales de otras posibles causas de cambio en el comportamiento de los sujetos, pero tenía la clara ventaja de indicar de manera realista los resultados que daría en Ja práctica el impuesto negativo sobre la renta. Un experírnento de laboratorio --en el supuesto de que hubiera sido practicable-- no habría sido tan satisfactorio, pues no podemos estar seguros de que los resultados obtenidos en un entorno tan artificial representen con fidelidaq lo que ocurre en e1 mundo exterior. Es ésta una ventaja general de los experimentos sobre el terreno con respecto a los estudios realizados en laboratorio.
En los experimentos sobre eJ terreno) los investigadores aplican la selección cuidadosa de los sujetos y la asignación aleatoria de éstos a los grupos de verificación y de control para controlar de alguna manera las características de fondo que pueden influir en Jos resultados. Además, vigilan estrechamente las circunstancias de los sujetos a lo largo del experimento para excluir las hipótesis alternativas que atribuyen los resultados observados a los hechos externos que ocurren durante el experimento, (Por ejemplo, en el que se ha comentado se prescindió de todos Jos sujetos que habían quedado incapacitados para desempeñar un empleo para que, en lo relativo al impuesto negativo sobre la renta, no pudiera interpretarse el desempleo como uria respuesta a los pagos asis~ tendales)
En muchos casos, los expertos en ciencia política ni siquiera pueden actuar so~
Gt
112 An8/isis politico empírico
bre la variable independiente. ¡Imagínese la dificultad de convencer a algunas naciones de que hagan revoluciones, y a otras de que las demoren, para realizar un experimento sobre el terreno de los efectos de la revolución en el desarrollo político! Cuanto más importante sea el asunto que se investiga, menos probable será que podamos controlarlo. En tales circunstancias, el investigador debe aproximarse a un diseño de investigación como el que describiremos en la sección si;:-, guiente, o recurrir a un diseño no experi:· mental,
En los estudios no experimentales, los científicos no pueden controlar la asignación de los sujetos a grupos experimentales ni la variable independiente, y tampoco pueden obtener calificaciones de Ja variable dependiente en una verificación previa.. A menudo, se ven obligados a emplear lo que se denomina diseño a posteriori, en el que se hace una sola observación después de haberse producido el hecho supuestamente causal. En ocasiones, puede añadirse un «grupo de control>) de sujetos similares no expuestos a la variable indP.pendiente (VI) y atribuirse a ésta las diferencias en las calificaciones de los dos grupos. Sin embargo, esos diseños no proporcionan base alguna para hacer inferencias coherentes sobre el efecto de la VI, ya que no permiten descartar ni siquiera la más sencilla de las hipótesis alternativas. Ni podemos, por ejemplo, estar seguros de que el valor de la VD que observamos después de la exposición a la VI sea diferente del valor que tenía la VD antes de dicha exposición. Los diseños no experimentales solamente son apropiados par.a la investigación descriptiva o exploratoria, no para los estudios explicativos.
Diseños cuasi experimentales
La mayoría de los diseños de investigación empleados por los expertos en ciencia política pueden clasificarse como cua .. si experimentales. En estos estudios, los investigadores no pueden controlar la exposición a la variable independiente ni las condiciones bajo las cuales se produce ésta, pero intentan simular un diseño experimental ya sea reuniendo datos suplementarios, ya sea mediante técnicas de análisis de datos .. Si se elaboran debidamente, los diseños cuasi experimentales permiten proceder como si se hubiesen respetado todas las características de control de un verdadero experimento, y aportan una base lógica coherente para efectuar inferencias causales.
Probablemente, el tipo más común de diseño cuasi experimental en ciencia política es el experimento ex post facto. En él, el investigador realiza una s01a observación y recoge datos sobre las variables independiente y dependiente así como cualesquiera otras que, a su juicio, deba controlar,, Por ejemplo, si queremos investigar los efectos de la educación universitaria en el comportamiento de voto, podemos efectuar una encuesta entre sujetos seleccionados aleatoriamente, y luego, analizar nuestros datos de manera que determinemos si votan de modo diferente quienes siendo semejantes en otros aspectos (raza, sexo, región de residencia,
_ etc"), poseen distintos grados de formación. Para ello, existen refinadas técnicas estadísticas, pero, en el nivel más sencillo, podemos clasificar a nuestros consultados en tablas de contingencia para poder examinar la relación existente entre la educación y el voto en diferentes categorías de otras variables, considerando, por ejemplo, sólo a las mujeres que han asistido y que no han asistido a la universidad, o
Linicamente a los hombres que están en esos dos casos
Este sistema nos permite actuar como si hubiésemos iniciado hace años un experimento en el que hubiéramos asignado cierto número de personas a los grupos experimentales y expuesto algunas a la educación universitaria (variable independiente), y estuviéramos ahora comprobando el impacto que ello ha producido en su comportamiento de voto, Los integrantes de nuestra muestra que poseen una educación inferior a la universitaria pero son semejantes en otros aspectos a los componentes de aquéJla que tienen educación universitaria, constituyen un «grupo de control"" Como no hemos realizado una prueba previa, no podemos estar seguros de que sea la educación universitaria la causa de las posibles diferencias observadas en el voto, pero podemos utilizar los datos suplementarios que hemos obtenido en la encuesta para descartar algunas hipótesis rivales plausibles, y podemos también confiar en la selección aleatoria de la muestra para eliminar los efectos de las variables que no podemos controlar en el análisis de datos.
Hay situaciones en las que no es posible aplicar el muestreo aleatorio ni seleccionar grupos de control comparables .. Sucederá esto cuando nuestras unidades de análisis sean escasas en nümero o únicas en numerosos aspectos de interés. Ejemplo de eJlo es la situación en que un gobierno municipal desea saber qué efecto ha producido una reorganización administrativa en los costos de los servicios municipalesº Para responder 2. esta pregunta, el experto en ciencia política habrá de utiJizar tal vez otro diseño de investigación común, denominado diseño de serie te1nporal.
En los diseños de serie temporal, el investigador hace varias observaciones
Aplicación del plan 113
antes y después de introducir algún fenómeno causal, y compara los valores que en esos dos momentos tiene la variable dependiente. En nuestro ejemplo, los expertos en ciencia política podrían consultar el registro municipal para comparar el coste per cápita de los servicios municipales antes y después de la reorganización administrativa. (Habrían de utilizar el coste per cápita y controlar la inflación para excluir la posibilidad de que el aumento de la población urbana o el alza de los precios hayan influido en el coste de los servicios pLiblicos independientemente del impacto de Ja reorganización) .. Las figuras 5.1, 5.2 y 5 .. 3 ilustran algunos posibles resultados de este estudio.
En cierto sentido, en los diseños de serie temporal se usa como grupo de control el mismo sujeto o conjunto de sujetos, pero en un mor.iento anterior .. Si hay una clara tendencia en los valores de la variable dependiente antes de la introducción de la variable independiente, suponemos que la tendencia continuaría si no fuera por la variable independiente, y como indicador del efecto de la VI utilizamos la diferencia entre los valores de la VD y los valores que tendría si la tendencia continuase
Esta lógica queda ilustrada en la figura 5. L Si los datos fueran los que representa dicha figura, las autoridades municipales se enterarían con sumo agrado de que la reorganización no sólo habría reducido el coste de los servicios, sino que también habría invertido la tendencia hacia unos costos en constante crecimiento, El efecto de la reorganización en un año dado puede medirse por la diferencia entre el valor previsto para ese año en la línea de tendencia original y el valor observadoº En la figura 5.1, el efecto de la reorganización sobre los costos de los servicios en 1985 es de 125$. Sí los datos fueran como en la figura 5.2, los valores previstos y
114
/
REORGANIZACiON
§ S250
" 225 ¡¡ ~ 200
:g 175 !
150
i 125
1l. b
8 1980 1982 1983 1984 1985 1987
Arla
FIGURA 5_L Tendencia hipotética de los costos de los servicios públicos, donde se ve que la reorganización ha invertido Ja tendencia originar
observados serán !os mismos y se estimará que la reorganización no ha tenido efecto sobre Jos costos, En el caso representado en Ja figura 5.3, Ja reorganización ha reducido iniciaJmente ros costost pero no ha producido efecto en la tendencia.
REORGANIZACION
Mientras que los resultados indicados en la figura 5 .1 muestran que la reorganización ha producido efectos acumulativos que totalizan 400$ en cuatro años, la figura 5.3 muestra solamente un efecto total de 25$
1980 1981 1982 1983 1984 1985 1986 '!987
Afio
FIGURA 5,2. Tendencia hipotética de /m; cmtos de Jos servicios públicos, donde se ve que la reorganización no ha producido ningún efecto.
~ REORGANIZAC[ON
¡¡ S250
~ 225
~ 200 ~ o 175 :!! 5
~ ~ ~
8
Año
FIGURA 5,3,, Tendencia hipotética de los costos de los servicios públicos, donde se ve que /a reorflanización ha. modificado el nivel de los costos, pero no ha inter111mpido la tendencia.
En ciertos casos, la tendencia que estaM
mos tratando no es Ían clara y constante conto en éste, Pot ejemplo, supongamos que la policía municipal, alarmada por el aumento de las detenciones debidas a la prostitución, adopta medidas enérgícas contra ella y más tarde desea saber qué resultados han dado. La figura 5.4 muestra el tipa de datas que podrían obtenerse a lo largo de diez años. Los valores de la variable dependiente (detenciones por prostitución) aumentan y disminuyen de un año a otro a lo largo del período. La tarea del investigador consiste en determinar si la tendencia general posterior a la adopción de las medidas es notablemente distinta de la tendencia general anterior a ella. Una manera de hacerlo es comparar el promedio anual de detenciones por prostitución anterior a la aplicación de las medidas con el promedio anual de detenciones registrado en los años si~ guientes {ambos promedios se cifran en nueve detenciones en el ejemplo). Si su~ ponemos que la tendencia original conti-
nuaría de no haberse adoptado las medidas enérgicas, podemos utilizar la posible diferencia existente entre los dos promedios como indicador del impacto de esas medidas en el nivel de detenciones por prostitución. Otro procedimiento consiste en comparar las líneas de tendencia (representadas por una línea de puntos en la figura 5A) que atraviesan los diversos valores de la VD anteriores y posteriores a la aplicación de las medidas, para determinar si difiere la tendencia general.
Este ejemplo ilustra una de las ventajas importantes de los diseños de serie tem~ poraL Si observamos los índices de detenciones solamente en 1984 y 1986, como en un estudio típico con verificaciones anterior y posterior, podemos deducir que las medidas represivas policiales han reducido las detenciones por prostitución, Pero los datos de la serie temporal nos permiten comprobar el descenso de detenciones registrada entre 1984 y 1986 como una fluctuación nonnal en torno a una tendenda general (representada por
c;·q
MEDlDAS RE.PREStVAS
Año
FIGURA 5.4, Tendencia hipotética de las detenciones por prostitución, donde se ve un efecto ilusorio de las medidas represivas,
la línea de puntos) en la que no ha influido la intervención de la policía.
A pesar de esta eficacia~ los diseños de serie temporal adolecen de un defecto: en muchos casos, no disponemos de un grupo de control y, por consiguiente, no podemos estar seguros de cuáles son los efectos de la VI, pues no sabemos con certeza cuál sería el valor de Ja VD sin la VI; tan sólo nos cabe suponer que se mantendría la tendencia original. Y esto puede ser un error por numerosas razones, Una de las rnás importantes es lo que Donald Campbell y J!;'lián Stanley denominan regresión hacia la 'media6
, fenómeno que viene a poner en tela de juicio la validez de las conclusiones extraídas de diversos clise~ ños de investigación,
La regresión hacia la media es, básica~ mente, un proceso por el que los sujetos
" Dooald T CampbeH y Julián Stanley, Experimenta/ and Quasi~ex.perimenta./ Desi~tJS for Re· search (Chicngo: Rand McNaUy, 1966). (Edición en castellano; Diseños experimenta}es y cuasi tnt:peri, mentales e11 la investigación social, Buenos Aires, Amorrortu, 1982.)
que tienen valores extremos en una variable dependiente en un momento dado tienden naturalmente a adquirir un valor más cercano aJ promedio en esa variable en mediciones subsiguientes, con inde~ pendencia de que se hayan expuesto a alguna variable independiente formulada en una hipótesis. Si esa regresión hacia la media tiene lugar en el momento de un estudio, el investigador puede tomar equivocadamente la regresión natural por un efecto de la VI. Y esto puede constituir un problema especial en aquellos casos en que los sujetos se exponen a la variable independiente precisamente porque tíenen valores extraordinarios en la variable dependiente
'En nuestro último ejernplo, la policía emprendía una acción represiva porque se venia registrando un número excepd,onalmente elevado de detenciones por prostitución. En la ciudad esto era una desviación de la normalíd~d que podría haberse corregido por sí misma aunque la policía no hubiera intervenido, Para excluir Ja regresión como explicación alter-
Aplicación del plan 117
MEDIDAS REPRESIVAS
12
11
10
·~~ ..... "\""·"~:;-,70;- ....... .,..,,. \
1980
\ \ f \ f
V
1982 1984 19B6 19BB 1990
Año
Jndke de detenciones de !a dudod de veriftcadcin <con medidas represivus)
Indice medio de lns cuntrn ciudndes dn control
T eodendn de In dudad de verificndón
........ ºººº Tendcnda de In. ciudud de control
FIGURA 5,5. Tendencia hipotética de las detenciones por prostitución en una ciudad de verificación y un grupo de ciudades de control
nativa se puede emplear un diseño de serie temporal controlada.
En los diseños de serie tempoiral controlada, se recogen datos sobre un caso o conjunto de casos que guarden la mayor semejanza posible con el caso o grupo de verificación en todos los aspee~ tos oportunos, pero que no se expongan a la VI, Y se utiliza ese caso o grupo como control para evaluar los efectos de la VI En nuestro ejemplo, podemos seleccionar una o más ciudades muy semejantes a la que aplica las medidas represivas y que no hayan modificado sus normas respecto a Ja prostitución, y observar su índice de detenciones en los mismos años, La figura 5,5 presenta algunos posibles resultados. Comparando la ciudad de verificación (rnedidas represivas) con un grupo de ciu-
dades similares, se puede aprecíar que la tendencia de las detenciones por prostitución anteriores a 1985 permanece inalterada en la ciudad de verificación1 mientras que el índice medio de detenciones aumenta espectacularmente en las ciudades de control. Esto parece indícar que con las medidas represivas no se ha logrado modificar la tendencia en la dudad de verificación, pero se ha evitado que siga el mismo camino que hace aumentar el índice de detenciones en otras ciudades similares, En este caso, utilizamos la dife~ renda entre los índices de la ciudad de verificación registrados después de la aplicación de las medidas represivas y los registrados en las ciudades de control en el mismo año corno medida del efecto de la VI dando por supuesto que la ciudad de
?-0
118 AnfJlísis polífíco empírico
verificación seguiría Ja tendencia de las demás si no fuera por la acción policial En 1988, por ejemplo, el efecto de las medidas represivas se estima en dos detenciones por cada L 000 habitantes
Si adoptásemos un diseño de investigación más consistente. en este ejemplo
1 no
llegaríamos a la conclusión aparentemente incorrecta de que un programa que ha constituido un factor eficaz de disuasión no ha producido efecto alguno
Elección del diseño de investigación
Son varios los diseños experimentales y cuasi experimentaJes que no hemos comentado7
., El número de variaciones de estos diseños básicos sólo está limitado por el ingenio humano, y ei diseño de investigación para un estudio determina~ do reflejará su particular finalidad. Más que elegir un diseño de investigación, lo que hacemos es crear un diseño que se ajuste al estudio concreto que hemos de realizar~ aunque) pÜr lo común, nos basemos en uno de los tipos de diseño fundamentales. Las tres consideraciones principales que orientan al investigador a la hora de elaborar su diseño de investigación son la necesidad de validez, Jos recursos disponibles y la ética profesional.
El objetivo del diseño de investigación en los estudios explicativos es el de per. mitirnos realizar inferencias váHdas sobre las relactones causales entre variables
1 Algunos de ellos se exponen en David C, Leege y Wayne L, Fn:mcis; Political Re:search {Nueva York: Bnsic Books, 1974}, cap, 3; en Delbert C Miller, Handbook o{ Research Design and Social Measurement, 4," ed (Whitc Plains, Nueva York: L<mgm.rm1 1983), cap::;, 1-9. y en James A Caporaso y Leslie L Roos, Jr-, eds. Quasi0 EKperirnental Approm:,hes {Evanstoo, IL: Northwestern University Press, J 973.}
partiendo de los cambios observados en nuestras medidas de esas variables_, En cons~cuencia1 la validez de nuestros resultados debiera ser una meta esencial a1 idear el disefio de investigación,
Hay dos tipos prímarios de validez aso. dados a la investigación empírica; interna y externa. La validez interna corresponde al grado en que el diseño proporciona una base lógica coherente para ínferir si la variable independiente es o no causa de un cambio determinado en la variable dependiente. Preguntarnos por la validez interna equivale a preguntarnos: ¿hay algo en el diseño de investiga. ción que nos lleve a atribuir una influencia causal a la VI cuando no tiene esa influencia, o a dejar de reconocer cuatqllier influencia causal que tenga la VI? Por ejempJ01 si existe un fuerte efecto de verificación asociado al empleo de una determinada medida, todo diseño de investigación que no aporte el medio d~ controlar ese efecto de verificación carecerá de validez interna, pues podrá llevamos a la fals2 interpretación de tomar los cambios debidos a dicho efecto como prueba del impacto causal de la variable independiente. La validez externa se refiere a la posibilidad de generalizar nuestros resultados: ¿cabe esperar razonabJemente que haHemos las mismas in~ fluencias causales en otras situaciones? ¿Nos dice este estudiO alguna cosa sobre la parte de realidad no incluida en él? Por ejemplo, un experimento sobre el terreno
.,.. destinado a averiguar Jos efectos qu~ produce en los hábitos de conducir del públi·· co la sobretasa de un dólar por galón en el precio de la gasolina, tendrá escasa validez externa sí se realiza en una comunidad cuyo promedio de ingresos anuales por familia sea superior a los l 00 .. 000 dólares, pues no ca.be esperar que los ciudadanos con ingresos medios y bajos se comporten de la misma manera,,
Factores opuestos a la validez
Entre los factores principales que se oponen a ta validez interna y externa figuran los sigulentes6:
Factores que se oponen a la validez interna
L H ístoria; hechos ajenos a la VI que pueden alterar los valores de la verificación posterior y que se producen entre Ja verificación anterior y la posterior, Por ejemplo, la declaración de un dirigente político a la que se dé gran publicidad puede modificar las actitudes de los sujetos independientemente del tratamiento experimental prolongado a que se estén sometiendo.
2., Madurez.· cambios naturales en Jos sujetos, que modifiquen los valores de la VD a lo largo del tiempo, con independencia de la VI (por ejemplo, fatiga humana, crecimiento de la población en unidades de análisis geográficamente definidas, envejecimiento de los medios físicos).
3. l nestabilidad: cambios aleatorios en los valores registTados, debidos a medidas no fiables, selección inadecuada de los sujetos u otras causas.,
4. Verificación;· el efecto de verificación descrito en este capítulo.
5 .. Instrumentación: diferencias en los dispositivos de medición empleados que producen diferencias en los valores con imlependencia de los efectos de la VI (como, por ejemplo. sesgos introducidos por los entrevistadores, una máquina indebidamente calibrada, o la desigual precisión entre !os codificadores).
8 Donald T Campbell, «Reforms ns Experi~ ments,., American Psychologist. 24 (abril 1969), PP
407-29
Aplicación del plan 119
6. Efectos de regresión.: cambios debidos a la regresión hacia la media, comen~ tados en este capítulo
7. Selección;· diferencias en los valores, originadas por la djstinta manera en que se han formado los grupos experimental y de control (por ejemplo, cuando ios componentes de un grupo experimental están legalmente obligados a someterse a la VI y los integrantes de uno de los grupos de control se someten a ella voluntariamente)~
8. Mortalidad experimenta/. tasas diferentes de pérdida de sujetos entre el grupo experimental y los de control. (Por ejemplo, aquellos casos que hacen que el grupo de control responda como un todo a la VI cuando el grupo experimental puede abandonar el experimento antes del test posterior).
9, Interacción entre la selección y la madurez," sesgos en el proceso de selección que originan diferentes tasas de madurez en los grupos de verificación y de control. (Por ejemplo, en el estudio Operación Miedo, los sujetos sometidos a verificación podrían ser de más edad porque se hubieran prestado voluntariamente a par-, tícipar en el programa solamente después de una serie de detenciones en su juventud, con lo que habrían superado más rápidamente la delincuencia juvenil que el grupo de control de menor edad).
Factores que se oponen a la validez externa
1" Efectos interactivos de la verifica.V
ción." los valores de la verificación posterior de los sujetos sometidos a la verificación anterior pueden dejar de ser representativos de la población no sometida al test previo por Ja manera en que este último ha predispuesto a los sujetos con respecto a la VI.
120 Análisis político empírico
2. Interacción de la selección y el tratamiento experimentaL' los procesos de selección parciales pueden producir un grupo experimental que reaccione ante Ja VI de una manera impropia de la mayoría de la población ..
3. Efectos reactivos de los dispositivos experimentales:· las condiciones del entorno experimental pueden no ser representativas de las del mundo real.
4. Interferencia del tratamiento múlti
ple: la aplicación simultánea de más de un tratamiento puede producir cambibs que sean diferentes de los que tendrían lugar si se aplicara un solo tratamiento,
S. Respuesta improcedente de las medidas: todas las medidas captan múltiples aspectos del entorno, algunos de los cuales pueden incluir componentes que den 1a impresión de cambio cuando éste no existef o que oculten los verdaderos cambios.
6. Posibilidad de réplica improcedente de los tratamientos: cuando las variables independientes son eventos complejos (como en el caso de la visita a la prisión en el ejemplo de la Operación Miedo y la educación universitaria), los investigadores pueden no advertir qué aspecto de aquéllas ocasiona el cambio en los sujetos, y dejar de incluir el aspecto oportuno de la VI en todas las exposiciones experimentales a ésta.
El diseño de investigación más idóneo es aquél con el que se evita el mayor número posible de estos obstáculos a la validez. Sin ernbargot aun el más perfecto de los diseños carecerá de utilidad si no contamos con los recursos necesarios para realizarlo: La disponibilidad de tiempo, dinero, personal especializado, servicios e instalaciones y las fuentes de datos necesarias condicionará siempre la elección de un diseño de investigación, Si los investigadores no están seguros de poder contro-
lar los principales obstáculos que se oponen a la validez y que, dadas las limitaciones de los recursos existentes, impedirían la correcta realización del estudio en cuestión, harán bien en abandonar el proyecto hasta que dispongan de los recursos adecuados. Es preferible no hacer la investigación a realizar una investiga~ ción defectuosa que pudiera llevar a conclusiones inexactas.
Una última consideración en el diseño de investigación, que ha de prevalecer sobre todas las demás, es la de si su realización supondría el quebrantamiento de la ética profesional: ¿perjudicará a alguien en algún sentido? En caso afirmativo, ¿en qué medida? ¿Proporcionará a la sociedad beneficios superiores a los costos? Estas son preguntas que el profesional debe responder de acuerdo con sus valores y con las normas imperantes en la profesión. El capítulo 11, que trata de las técnicas de observación directa empleadas en !a recogida de datos, presenta algunos ejemplos de los tipos de cuestiones éticas que muy probablemente han de afrontar los expertos en ciencia política al plantear un estudio, y el apéndice B reco· ge las normas de ética de la investigación recomendadas y refrendadas por las principales asociaciones profesionales de ciencia política y sociología. La única orientación general que podemos dar para hacer esta eleccíón es la de reiterar nuestra opinión de que la ciencia no es un fin en sí misma~ sino un instrumento que ha de estar al servicio de la humanidad.
Sugerencias para ulteriores lecturas
Son \;arias las obras de carácter general sobre Jos métodos de ciencia social que tratan de manera eficaz del diseño de investigación. Una de ellas es la de Fred
N. Kerlinger, Foundations of Behavioral Research (Nueva York: Holt, Rinehart y Winston, 1964), caps. 15-21, y otra, la de Kenneth D. Bailey, Methods of Socia/ Research (Nueva York: Free Press, 1978), cap. 9. Se trata este tema de manera más detallada y especializada en Wi!liam G. Cochran y Gertrude M. Cox, Experimental Desi¡jns, 2. ª ed. (Nueva York: Wiley, 1957). Una obra de utilización generalizada es la de Thomas D. Cook y Donald T. Campbell, QuasiExperimentation (Chicago: Rand McNally, 1979),
Un libro dedicado a explicar a los expertos en ciencia social la manera de elaborar bases lógicas coherentes sobre las que extraer conclusiones en su labor de investigación es el de Hubert M. Blalock, Jr., Causal Jnferences in Nonexperímen~ tal Research (Chapel Hill: Universíty of North Carolina Press, 1964) Se estudia la naturaleza y los usos de los diseños cu2si experimentales en la ciencia soda) en los artículos recopilados en James k Caporaso y Leslie L. Roos, J r., eds , Quasi-experimental Approaches (Evanston, IIL: Northwestem Universíty Press, 1973), y la relación entre los diseños experimentales y los cuasi experimentales, en Henry Adand, «Are Randomized Experiments the Cadíllacs ofDesign?», Polic¿y Analysis, 5 {primavera de 1979), pp. 223-41. Se trata con mayor profundidad de la inferencia causal y el diseño de investigación en H. M. Blalock, Jr., ed., Causal Models in Panel and Experimental Designs (Nueva York: Aldine, 1985). Figuran otros buenos ejemplos de diseños de investigación en ciencia social en Ed~ ward R Tufte, ed., The Quantitative Analysis of Social Problems (Reading, Mass: Addison-Wesley, 1970). Presenta una neta aplicación del diseño de serie temporal controlada Franklin E. Zimring, «Firearrns and Federal Law: The Gun
Control Act of 1968•·, ]ournal of L.e¡jal Studies, 4 (enero de 1975), pp. 133-98.
Ejercicios de investigación
L Con referencia al ejemplo de la Operación Miedo utilizado al comienzo del capítulo, formular otras dos explicaciones alternativas plausibles de por qué fueron tan escasos los que, habiendo participado en el programa, fueron detenidos después. Explicar en detalle las modificaciones del diseño de investigación original descrito en el ejemplo que habrá que hacer para evaluar la exactitud de esas explicaciones hipotéticas.
2. Está usted estudiando la relación entre la desigualdad en la distribución de la riqueza y la violencia política interna en las naciones del mundo. Ha operadonalizado la desigualdad como la diferencia en la proporción de la renta nacional que recibe el 20 por ciento de máximos perceptores y la proporción que recibe el 20 por ciento de mínimos perceptores. Ha operacionalizado la violencia polítíca como el nümero de incidentes violentos con motivación política comunicados anualmente por la prensa nadonal de cada nación. Su hipótesis de trabajo es la siguiente: Cuanto mayor es la desigualdad en la distribución de la renta, mayor es el número de incidentes de violencia políti~ ca.
Establezca al menos tres hipótesis sobre la relación entre las desigualdades de la riqueza y la violencia nacional que representen otras tantas hipótesis rivales de esa hipótesis de trabajo. Por cada opción que proponga~ indique cada una de las variables que tendrá que controlar para poder excluirla como explicación válida de los hechos observados.
3. Desea evaluar los efectos que pro· duce una película sobre Jas relaciones in-
7-2.