Analisis cuantitativo

10
27/4/2016 Analisis cuantitativo http://www2.uiah.fi/projects/metodi/280.htm 1/10 Análisis cuantitativo 1. Analizar variables individuales 2. Analizar las relaciones entre variables Una vez recibidos los datos y antes de someterlos al análisis, suele ser útil llevar a cabo algunas operaciones preliminares. Esto puede incluir: apartar los datos que son obviamente erróneos o irrelevantes. Esto ha de ser hecho con precaución: no debiéramos borrar datos que son solamente "anómalos" y no armonizan con nuestras hipótesis. Pueden también demostrar que la hipótesis es defectuosa. normalizar o reducir nuestros datos significa que eliminamos la influencia de algún factor bien conocido pero sin interés. Por ejemplo, podemos eliminar el efecto de la inflación dividiendo todos los precios por el índice de precios de la fecha de la compra. En el análisis propiamente dicho de los datos, el propósito es extraer una invariante o estructura que nos interese a partir de los datos. Esto no significa que introduzcamos los datos en un ordenador y esperemos que el ordenador nos muestre qué estructuras pueden encontrarse en ellos. Los ordenadores no son lo bastante listos para eso. En lugar de ello, es habitual que ya en un momento tan temprano como el inicio del proyecto, el investigador tenga un modelo matemático que aplicará a los datos. Este modelo también proporciona las hipótesis eventuales para el proyecto de investigación, o al menos actúa como una hipótesis de trabajo inicialmente no exacta que se puntualizará durante el análisis. Los datos empíricos pueden entonces analizarse del modo siguiente: primero, el investigador dispone los datos de acuerdo con el modelo y después considera en qué grado el marco es adecuado a los datos o si ha de buscarse un modelo que se adapte mejor. En otras palabras, el investigador suele primero decidir qué tipo de patrón es el que está buscando en los datos. Esto determinará los métodos para un análisis matemático. Así, la primera cuestión a la hora de elegir el método de análisis es: ¿Queremos usar las variables medidas para clasificar casos o individuos? ¿O deseamos analizar variables inconexas, o bien las relaciones entre diversas variables ? Otra decisión importante se refiere al propósito final de su proyecto. ¿Usted desea describir cómo es el actual (o anterior) estado de su objeto, o usted desea descubrir cómo el objeto debe ser: qué grado de las cualidades medidas sería óptimo? Este último tipo de análisis se discute bajo del título Agregar una dimensión normativa a un análisis descriptivo . Analizar variables individuales A continuación hay una lista de algunos métodos habituales para el análisis estadístico de una sola variable. Los métodos han sido dispuestos de acuerdo con la escala de medición de la variable. Escala nominal Escala ordinal Escala de intervalo Escala de proporción Métodos de presentación de los datos Tabulación ; Presentación gráfica La moda

description

tecnicas para el analisis cuantitativo de datos

Transcript of Analisis cuantitativo

Page 1: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 1/10

Análisis cuantitativo1. Analizar variables individuales2. Analizar las relaciones entre variables

Una vez recibidos los datos y antes de someterlos al análisis, suele ser útil llevar a cabo algunasoperaciones preliminares. Esto puede incluir:

apartar los datos que son obviamente erróneos o irrelevantes. Esto ha de ser hecho conprecaución: no debiéramos borrar datos que son solamente "anómalos" y no armonizan connuestras hipótesis. Pueden también demostrar que la hipótesis es defectuosa.normalizar o reducir nuestros datos significa que eliminamos la influencia de algún factorbien conocido pero sin interés. Por ejemplo, podemos eliminar el efecto de la inflacióndividiendo todos los precios por el índice de precios de la fecha de la compra.

En el análisis propiamente dicho de los datos, el propósito es extraer una invariante o estructura quenos interese a partir de los datos. Esto no significa que introduzcamos los datos en un ordenador yesperemos que el ordenador nos muestre qué estructuras pueden encontrarse en ellos. Los ordenadoresno son lo bastante listos para eso.

En lugar de ello, es habitual que ya en un momento tan temprano como el inicio del proyecto, elinvestigador tenga un modelo matemático que aplicará a los datos. Este modelo también proporcionalas hipótesis eventuales para el proyecto de investigación, o al menos actúa como una hipótesis detrabajo inicialmente no exacta que se puntualizará durante el análisis.

Los datos empíricos pueden entonces analizarse del modo siguiente: primero, el investigador disponelos datos de acuerdo con el modelo y después considera en qué grado el marco es adecuado a los datoso si ha de buscarse un modelo que se adapte mejor.

En otras palabras, el investigador suele primero decidir qué tipo de patrón es el que está buscando enlos datos. Esto determinará los métodos para un análisis matemático. Así, la primera cuestión a la horade elegir el método de análisis es: ¿Queremos usar las variables medidas para clasificar casos oindividuos? ¿O deseamos analizar variables inconexas, o bien las relaciones entre diversas variables?

Otra decisión importante se refiere al propósito final de su proyecto. ¿Usted desea describir cómo esel actual (o anterior) estado de su objeto, o usted desea descubrir cómo el objeto debe ser: qué gradode las cualidades medidas sería óptimo? Este último tipo de análisis se discute bajo del título Agregaruna dimensión normativa a un análisis descriptivo.

Analizar variables individuales

A continuación hay una lista de algunos métodos habituales para el análisis estadístico de una solavariable. Los métodos han sido dispuestos de acuerdo con la escala de medición de la variable.

­ Escalanominal

Escalaordinal

Escala deintervalo

Escala deproporción

Métodos de presentación de losdatos ­ Tabulación ; Presentación gráfica ­

­ La moda ­

Page 2: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 2/10

Medias: ­ ­ La mediana ­­ ­ ­ Media aritmética ­

Medidas de dispersión:­ ­ Desviación de cuartil ­­ ­ El rango ­­ ­ ­ Desviación estándar ­

Presentación gráfica de una variable

Un modo simple de presentar una distribución de valores esmostrar cada valor como un punto en una escala. Si hay un grannúmero de valores, puede ser mejor clasificarlos primero yentonces presentar la frecuencia de cada clase como unhistograma (Fig. de la derecha).

Si nuestros estudios tienenque ver con personas,ocurrirá con bastantefrecuencia que nuestrasmediciones estarándistribuidas de acuerdo con cierta curva, la llamada curva deGauss (a la izquierda) que es, por consiguiente, llamada ladistribución normal. Una de sus propiedades es que el 68% detodas las mediciones diferirá de la media (en la figura: M) en nomás que la desviación estándar, y el 95% en no más que el doblede la desviación estándar.

A veces querremos poner el énfasis no en la distribución absoluta,sino en la proporcional o de porcentaje. Un diagrama apropiado paraesto es el gráfico de sectores, también llamado "de tarta" o "dequeso" (a la derecha):

Medias

Una media es una estadística que caracteriza el valor típico denuestros datos y elimina la dispersión aleatoria de valores. Para cadauna de las distintas escalas de medición hay un tipo adecuado de media,

la modala medianala media aritmética.

Moda es el valor más común en nuestro conjunto de datos.

Mediana es el valor en el medio de la selección, si todos los valores están dispuestos del menor almayor.

Media (aritmética) es la suma de todos los valores dividido por su número, o

De entre las medias que se han presentado más arriba, el investigador puede elegir habitualmente

Page 3: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 3/10

aquella que muestra mejor el valor típico de la variable. La media aritmética es el más popular, peropuede ofrecer un cuadro equivocado por ejemplo en datos que incluyen un valor que difieren en granmedida de los otros (véase la imagen de abajo).

Lo mismo ocurre si la distribuciónestá desviada, como en la imagen dela derecha. En el ejemplo, serelacionan los minutos que losdistintos sujetos tardan en llevar acabo una tarea. Los más rápidosnecesitaron 5 minutos, pero elresultado más común (=la moda) fuede siete minutos. El valor en elmedio, es decir, la mediana, se hamostrado en "M" rojo en la imagen.La mediana tenía aquí el valor 11.

¿Qué pasa con la media? Como alsujeto más lento le llevó el acabar 34minutos, la media se eleva a 11.98 minutos, lo que no da un cuadro exacto del resultado medio en estecaso. Esto muestra que los datos están desviados; el tipo de media debe elegirse con cuidado. Unapresentación gráfica muchas veces sería más ilustrativa que calcular una sola estadística.

La distribución mostrada en esta figura está escorada positivamente, porque las mediciones que handado valores mayores que la mediana (11) se extienden en un amplio rango (de 11 a 34), mientras quelas mediciones que han dado valores por debajo de la mediana se concentran pocos valores (5...11).

Se puede también, si es necesario, acudir a una estadística para describir la cantidad de desviación.

Al elegir la media más apropiada, debemos tener en cuenta la escala que fue usada en la recolecciónde los datos. Si la escala era nominal, la única media posible es la moda. Si la escala fue ordinal,podemos usar la mediana o la moda.

Finalmente, si la media fue calculada a partir de una muestra, debemos examinar su representatividadestadística, o qué probable es que la misma media sea cierta en la población de la que la muestra seextrajo. Una comprobación apropiada para esto es la prueba t.

Indicar la dispersión de los datos

Una vez que hemos calculado el valor medio, puede ser a veces interesante describir a qué distanciaen torno a la media están diseminados los valores singulares. Para este fin, podemos elegir entrediversas estadísticas. La elección depende del tipo de media que hayamos usado:

En conexión con la moda la dispersión de valores raramente es interesante.En lugar de ello, si hemos calculado una mediana, muchas veces querremos señalar ladiseminación de valores en torno a ella. Una forma adecuada para esto es la desviación decuartiles. Un "cuartil más alto" es aquel valor que es sobrepasado por el 25% del conjunto detodas las mediciones; del mismo, modo el 25% de todos los valores son más bajos que el"cuartil bajo". La desviación media de los cuartiles (marcadas con Q verde en la diagrama) apartir de la mediana es llamada desviación de cuartiles y es calculada con facilidad dividiendopor la mitad la diferencia de los cuartiles.Una estadística alternativa y muy simple es el rango: la diferencia entre el mayor y el menorvalor.En conexión con la media aritmética muchas veces querremos calcular la desviación estándar.

Page 4: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 4/10

Si los valores se miden a partir de una población, la formula será,

Sin embargo, si la desviación estándar sólo se refiere a una muestra, la formula es,

En ambas fórmulas, n es el número de los valores, y los valores de cada variable sustituirán a x unotras otro. Raramente un investigador se molestará en realizar por sí mismo el cálculo, porque elalgoritmo necesario para esto existe incluso en calculadoras de bolsillo.

A la raíz cuadrada de la desviación estándar se llama varianza, y también ésta es usada confrecuencia para describir y analizar la dispersión.

Si la estadística de dispersión se ha calculado a partir de una muestra, su representatividad estadísticadebe también calcularse al final. La prueba t es adecuada para esto.

Analizar las relaciones entre variables

Si dos variables evolucionan modo tal que en alguna medida se siguen entre ellas, podemos decir queexiste una asociación o covarianza estadística entre ellas. Por ejemplo, la altura y peso de la genteestán estadísticamente asociadas: aunque el peso de nadie esté causado por su altura ni la altura por elpeso es, no obstante, habitual que las personas altas pesen más que las personas bajas. Por otro ladolos datos habitualmente incluyen también excepciones, lo que significa que una asociación estadísticaes inherentemente estocástica.

La ciencia de la estadística ofrece numerosos métodos para revelar y presentar las asociaciones entredos y hasta más variables. Los medios más simples son los medios de presentación gráfica ytabulación. La intensidad de la asociación entre variables puede también describirse como unaestadística especial, como el coeficiente de contingencia y una correlación para lo que hay variosmétodos de análisis disponibles.

Si, al analizar los datos, se descubre alguna asociación entre las variables, el investigador quisiera amenudo saber la razón de esta asociación en el mundo empírico, es decir él quisiera explicar estaasociación. Los tipos usuales de explicacion se enumeran en la página Descripción y Explicación.Común a todos es que dan la causa del fenómeno se está estudiando que. Cuando las medidas se hanhecho de una serie de estos fenómenos, es usual que una serie de medidas, llamada variableindependiente, se hace así de la causa presumida, y una otra serie de medidas, la variabledependiente, del efecto presumido en el fenómeno.

Nota que no hay métodos en el análisis estadístico para la tarea de descubrir la explicación causal parauna asociación estadística. Una fuerte correlación entre, digamos, A y B, puede deberse a cuatrorazones alternativas:

A es la causa de B.B es la causa de A.Tanto A como B son causadas por C.A y B no tienen nada que ver con uno al otro. Su asociación en los datos analizados está unacoincidencia.

Page 5: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 5/10

El investigador debe encontrar así la causalidad o la otra explicación para la asociación de lasvariables en alguna otra parte que en las medidas. En muchos casos, la teoría original del investigadorpuede proporcionar una explicación; si no, el investigador debe usar su sentido común para clarificarla causa.

A continuación mencionamos algunos métodos usuales de análisis estadístico que pueden usarse alestudiar la interdependencia entre una o más variables. Los métodos han sido dispuestos siguiendo aqué escala de medición corresponden la mayor parte de las variables.

Meta de análisis Escalanominal

Escalaordinal

Escala deintervalo

Escala deproporción

Presentar datos y su estructura a grandesrasgos Tabulación ; Gráficos

Medir la fuerza de la asociación entre dosvariables

Coeficiente de contingencia­ Correlación ordinal­ ­ Correlación r de Pearson

Encontrar qué variables entre varios sonasociadas:

Calcular contingencias o correlaciones para todos lospares de variables ; análisis factorial

Transcribir una asociación estadística enuna función matemática: ­ ­ Análisis de regresión

Tabulación

La tabulación es una forma habitual de presentar las asociaciones entre dos o más variables. Una tablatiene la ventaja de que en ella puede disponerse bien una cantidad extensa de datos y se conservan lascifras exactas. Una desventaja es que una tabla grande no es ilustrativa: raras veces revela algo másque las más obvias regularidades o interdependencias entre datos. Algunas abreviaturasconvencionales usadas en tablas se presentan bajo el encabezado Clasificar.

Presentación gráfica

Los productos, como objetos de estudio, son presentados con frecuencia como imágenes, que son unaforma de presentación gráfica. (Ejemplos de presentaciones gráficas.)

Si el investigador desea resaltar algunos rasgos comuneso patrones generales que ha encontrado en un grupo deobjetos, puede combinar varios objetos en un gráfico,como en la figura de la izquierda. En el diagrama, StureBalgård muestra cómo los edificios viejos en Härnösandsiguen proporciones uniformes de anchura y altura (lalínea roja) con sólo algunas excepciones. Al inventarmétodos ilustrativos de presentación de los hallazgos delestudio de productos, la más seria restricción es laimaginación del investigador.

Con frecuencia, no obstante, la apariencia del objeto en síno es importante y sólo interesan los valores numéricos desus mediciones. Si se considera así, lo primero que

debiéramos plantearnos al elegir el tipo de gráficos es cuál es la estructura que queremos mostrar delos datos. Por supuesto tenemos que no "mentir con ayuda de la estadística", pero siempre esadmisible elegir un estilo de presentación realce los patrones importantes al eliminar o dejar ensegundo plano las relaciones y estructuras que no nos interesan.

Page 6: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 6/10

Si nuestros datos consisten en solamente unas pocas mediciones, esposible mostrarlos todos como un diagrama de dispersión.Podemos exhibir los valores de dos variables sobre los ejes deabscisas y ordenadas, y adicionalmente unas cuantas variables másutilizando los colores o formas de los puntos. En el diagrama de laderecha, la variable z tiene dos valores que se indicanrespectivamente por un cuadrado y un signo +.

Si la variación es demasiado pequeña para que aparezcaclaramente, podemos darle énfasis eliminando partes de una oambas escalas, véanse los ejemplos. Simplemente eliminamos laparte que no nos interesa, sea por la parte superior o por la inferior.La parte descartada debe estar vacía de valores medidosempíricamente. Para asegurarnos que el lector se da cuenta de la operación, es mejor mostrarlo nosólo en las escalas, sino también en la cuadrícula de fondo del diagrama.

Por otro lado, si el rango de variación de nuestrosdatos es muy amplio, podemos plantearnos usar unaescala logarítmica en uno o ambos ejes (véase eldiagrama de la izquierda). La escala logarítmica esapropiada solamente en una escala de proporción.

Si tenemos cientos de mediciones, es probable que noqueramos mostrarlas todas en forma de diagrama dedispersión. Una posibilidad en este caso es clasificarlos casos y presentarlos como un histograma.

El histograma puede adaptarse para presentar hasta cuatro o cinco variables. Podemos hacer estovariando las anchuras de las columnas, sus colores, sus tramados y por una representacióntridimensional (fig. de la izquierda.). Todas estas variaciones se crean fácilmente con un programa dehoja de cálculo como Excel, pero no deben ser usadas sólo como adorno. Los patrones que rellenan o marcan las columnas del histograma pueden ser elegidos de forma quesimbolicen una de las variables. Por ejemplo, las columnas que describen el número de automóvilespueden estar formadas por una pila de automóviles unos sobre otros. Esto es correcto, con tal de queno variemos el tamaño de los símbolos usados en un histograma. De otro modo, la interpretación sele haría difícil al lector (¿se vincula el número de automóviles a la longitud, el área o el volumen delos símbolos de los automóviles?)

El investigador suele estar interesado en las relaciones de dos o más variables antes que en las parejasde mediciones tomadas separadamente. La forma normal de presentar dos o más variablesinterdependientes es la curva. Esto implica una variable continua (es decir, en que el número deposibles valores es infinito).

No debemos producir una curva a partir de mediciones que no son valores de la misma variable. Porejemplo, los atributos de un objeto son variables diferentes. Ejemplos de ello son las evaluacionespersonales que los investigadores suelen reunir con la ayuda de escalas semánticas diferenciales deltipo de la mostrada abajo:

Estime las características de su dormitorio. Tache un recuadro en cada línea.Claro _ _ _ _ _ _ _ Oscuro

Ruidoso _ _ _ _ _ _ _ TranquiloLimpio _ _ _ _ _ _ _ SucioGrande _ _ _ _ _ _ _ Pequeño

Page 7: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 7/10

Carecería ahora de sentido el presentar las distintas evaluaciones deldormitorio como un solo "perfil" como en el diagrama de laizquierda (aunque encontremos con frecuencia este tipo depresentaciones ilógicas en informes de investigación.) Si queremos a toda costa poner el acento en que las variables han deir juntas (por ejemplo porque todas son evaluaciones del mismoobjeto), un método apropiado podría ser, por ejemplo, un grupo dehistogramas (como el de la derecha).

Todos los diagramas mostradosarriba pueden combinarse con

mapas y otras presentaciones topológicas. Por ejemplo, la variaciónen las diferentes áreas del país suele mostrarse como un cartogramaque distinga los diferentes distritos con distintos colores o tramas.Otra forma es el cartopictograma en que pequeños diagramas de sectores ("de tarta" o "queso") o decolumnas han sido colocados en el mapa. Las conexiones entre distintas áreas suele ser con frecuenciamostradas con filas cuyo grosor indica el número de conexiones. (Ejemplo.)

Una obra útil y concisa en español sobre el uso de diagramas para análisis estadístico es: AntonioAlaminos, Gráficos, Madrid, Centro de Investigaciones Sociológicas, 1993 (Col. Cuadernosmetodológicos, nº 7)

Contingencia y correlación

La covarianza estadística entre dos variables suele ser analizada haciendo una tabla o una presentacióngráfica, pero también hay disponibles estadísticas especiales para indicar su intensidad. Los mediosdisponibles para el análisis de los vínculos entre las variables dependen de con qué tipo de escala sehan medido las variables. Vea la tabla que se presentó anterior.

Cociente de contingencia puede aplicarse a todo tipo de variables incluyendo aquellas que sehan medido solo con una escala de clasificación. Una estadística alternativa es Chi cuadrado.Correlación ordinal es adecuada cuando al menos una de las variables se han medido con unaescala ordinal. La otra puede ser u ordinal o aritmética.Para variables sobre escalas aritméticas, el método usual es la correlación estándar, mejordicho la correlación del momento­producto o correlación de Pearson.

Las formulas para calcular las estadísticas de contingencia no se muestran aquí porque llevar a cabolos cálculos manualmente sería poco práctico y los investigadores habitualmente los hacen con unordenador.

La correlación del momento­producto suele abreviarse con la letra r. Si el coeficiente de correlaciónes bajo, por ejemplo algo entre ­0.3 y +0.3, las dos variables no tienen mucho que ver entre sí (másexactamente, no tienen casi ninguna covariación lineal). Si es alto, en otras palabras, si su valor seaproxima ya sea a +1 o a ­1, esto significa que la relación entre las dos variables se aproxima a laecuación y = ax + b. El signo del coeficiente de correlación no es importante; el signo siempre esidéntico al signo del coeficiente a en la ecuación de arriba.

Debajo, se puede ver tres diagramas de dispersión que demuestren tres conjuntos diferentes de datosde dos variables. Cada conjunto consiste en ocho pares de valores. Las correlaciones entre las dosvariables se han calculado y se demuestran bajo cada diagrama. Se puede ver que no hay correlaciónentre las variables en el conjunto en la izquierda, y los otros dos conjuntos demuestran lascorrelaciones de 0,5 y 1,0.

Page 8: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 8/10

A pesar del hecho que el análisis de correlación es capaz de manejar solamente dos variables, puedeutilizarlo para el análisis inicial de un gran número de variables, cuando no tenemos una idea clara delas relaciones mutuas entre ellas. Es fácil para un ordenador calcular una matriz de correlación entretodos los pares potenciales de variables. Podemos entonces elegir esos pares que presentan lascorrelaciones más fuertes, y continuar examinandolos con otras herramientas de análisis másrefinadas.

Un aspecto débil del análisis de correlación es que no puede detectar otras relaciones lineales entre lasvariables. Por ejemplo, una relación que obedece a la ecuación y = ax2 pasaría inadvertida. Sinembargo, algunos de los nuevos programas de análisis son capaces de detectar incluso esta y algunasotras asociaciones habituales de variables. Además, se puede intentar:

sustituir los valores de una variable con sus valores cuadrados, su raíz cuadrada o con algunaotra modificación, y hacer de nuevo la matriz de correlación. La computadora toma el cuidadodel cálculo.hacer un diagrama de dispersión de las dos variables que usted piensa quizás tenga una relación,y mirar si el patrón resultante sigue una forma de cualquier función matemática apropiada.

Una vez que usted haya encontrado un par de variables con una correlación o contingencia fuerteusted puede continuar, por ejemplo, con las operaciones siguientes:

Considere, en base de su teoría, cuál variable del par es independiente (es decir la razón) y cuáles el dependiente (la consecuencia), y si la relación puede implicar todavía más variables.Descubra el patrón exacto de la relación. Los métodos posibles para esto incluyen los análisisde serie temporal y de regresión.

Si la correlación se calcula a partir de una muestra, debemos recordar probar su representatividadestadística con la prueba t.

Análisis de regresión

El investigador suele tener razones teóricas o prácticas para creer que determinada variable escausalmente dependiente de una o más variables distintas. Si hay bastantes datos empíricos sobreestas variables, el análisis de regresión clasico o "multivariate" es un método apropiado para desvelarel patrón exacto de esta asociación.

El análisis de la regresión encuentra la ecuación linear que se desvía lo menos posible de lasobservaciones empíricas. Por ejemplo, en el diagrama a la derecha, los puntos simbolizan lasobservaciones donde se han medido dos variables, y la línea representa la ecuación y = 8x + 45,obtenido con análisis de la regresión de modo que la suma de las diferencias cuadradas de los valoresmedidos de y llegue a ser mínima.

El esquema contiene sólo cuatro observaciones. Es demasiado poco para producir una ecuaciónplausible porque las observaciones podrían ser el resultado de coincidencia sólo, sin ningunadependencia verdadera entre las variables. Si usted quiere hallazgos plausibles o "estadísticamentesignificativos" se necesitaría mucho más, quizás 40 observaciones multiplicados por el número de lasvariables independientes.

Page 9: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 9/10

El algoritmo de análisis de regresión construye una ecuación,que tiene el siguiente patrón con una o más variablesindependientes. Además, da los parámetros a1 , a2 etc. y bvalores tales que la ecuación corresponde a los valoresempíricos con tanta precisión como es posible.

y = a1x1 + a2x2 + a3x3 + ... + b

En la ecuación, y = la variable dependiente x1 , x2 etc. = variables independientes a1 , a2 etc. = parámetros b = constante.

Una desventaja del algoritmo del análisis de regresión es que puede discernir relaciones sólo linealesentre las variables. Así no puede manejar tales formatos usuales de ecuación como y = ax2 + bx + c.Esta dificultad, sin embargo, puede ser evitado por reemplazar temporalmente la variable no linealcon una transformación conveniente de ello, tal como su cuadrado, raíz cuadrada, el inverso, ologaritmo.

Si tenemos amplios datos con muchas variables, al principio del análisis no estaremos tal vez segurosde qué variables están mutuamente conectadas y cuales debieran así ser incluidas en la ecuación.Podríamos primero estudiar esto con una matriz de correlación, o podemos dejar al programa deanálisis de regresión elegir las variables "correctas" (x1 , x2 etc.) para la ecuación. "Correctas" sonaquellas variables que mejoran la exactitud del ajuste entre la ecuación y los valores empíricos.

Cuando una de las variables independientes es tiempo, y especialmente cuando tenemos una serie detiempo de medidas en intervalos iguales, el análisis de regresión es una herramienta conveniente pararevelar una tendencia o un desarrollo a largo plazo en una serie de tiempo, considera estudio histórico.Esta tendencia se puede a menudo utilizar para pronosticar el desarrollo futuro de la variabledependiente.

En el análisis clásico de la regresión la ecuación deseada contiene solamente una variabledependiente. En el caso que más que uno variable dependiente se parecen ser implicadas, unaherramienta conveniente para su análisis es la correlación canónica, no discutida aquí.

Finalmente, la herramienta correcta para calcular la representatividad estadística de la ecuaciónobtenida por la análisis de regresión está la prueba t.

Análisis factorial

Todas las preguntas en un cuestionario se pueden considerar como variables, los valores de las cualesson encontrados estudiando las respuestas que cada pregunta recibe. Generalmente la mayor parte delas preguntas conciernen más o menos el mismo tema, y es por lo tanto normal que algunas de estasvariables resultan tener una alta correlación mutua. El investigador ahora pudo desear descubrir si hay"variables de fondo" o los factores latentes que combinan algunas variables originales. Si se podríaencontrar estas variables del fondo, los datos contenidos en los cuestionarios serían comprimidosgrandemente y llegarían a ser más fáciles de comprender. El análisis factorial es el método normal deencontrar estas variables latentes.

Por ejemplo, en un estudio acerca de la ropa de gente finlandesa joven, Sinikka Ruohonen (2001, p.97) examinó con un cuestionario las actividades del ocio de los respondedores, y descubrió que habíauna alta correlación entre pasar tiempo en conciertos, en galerías de arte, en teatros y en bibliotecas y

Page 10: Analisis cuantitativo

27/4/2016 Analisis cuantitativo

http://www2.uiah.fi/projects/metodi/280.htm 10/10

también en lectura de libros. Todos éstos tenían una correlación negativa con mirar la televisión o lascompeticiónes deportivas. Ruohonen dio el nombre de "factor cultural" a esto factor. Él se asocióademás con educación alta de madre y padre, y con independencia de las opiniones de otros alcomprar ropas.

Otro factor que Ruohonen encontró y nombró "estético­social", incluyó objetivos de seleccionarropas: destacar sus buenos o belleza, retratar confianza en sí mismo y personalidad, llamar atención,demostrar camaradería, valores comunes e ideologías. Este factor correlacionó también, en pocogrado, con interés en la ecología, con se hacer la ropa por una misma, y no llevar pieles.

Un tercer factor, "gastar" contuvo varios indicadores de gastar dinero comprando la ropa, loscosméticos y las joyas, tan bien como el aprecio del estilo, de la calidad y de la moda.

Con la ayuda de un análisis factorial, las variables de combinación o factores latentes tras los atributosmedidos pueden detectarse y especificarse, y el análisis también dice lo estrechamente que estosfactores están vinculados con las variables originalmente verificadas.­­ A veces se sitúa también unacondición suplementaria sobre los factores, concretamente que no deben tener correlación algunaentre ellos y estén por lo tanto en "ángulo recto" uno con respecto a otro (= "rotación ortogonal" de losfactores durante el análisis). Esta opción, no obstante, suele disminuir la correlación con las variablesoriginales.

Un inconveniente del método del análisis factorial es que su uso formalmente correcto perodesconsiderado puede producir fácilmente los factores elegantes y matemáticamente exactos que sinembargo no tienen ningún significado empírico sensato. En el estudio citado arriba, Ruohonen evitóeste callejón sin salida con el medio de entrevistar algunos respondedores desde una u otra extremidadde un factor, los cuales eran capaces clarificar sus actitudes y estilos de vida y dar el motivo para susopiniones que difieren del promedio.

Es posible continuar el análisis factorial agrupando los respondedores (u otros casos empíricos) engrupos en base de sus valores en los factores que se encontraron en el análisis. Esta operación sufre dela misma inconveniencia que arriba: es difícil dar una explicación empírica a estos grupos artificialesy encontrar cualquier rastro de su existencia verdadera en empiria. Además, la dispersión de casos a lolargo de cada factor sigue casi siempre la distribución normal de Gauss, que significa que la mayoríade casos están cerca del punto medio y el investigador no puede encontrar ninguna división distinta engrupos. Esta trampa del investigador se discute también en la página Clasificación.

3.ago.2007. Enviar los comentarios al autor:

Versión en español: con aumentos por Pentti Routio Ubicación original: http://www2.uiah.fi/projects/metodi/