Cómo Redactar El Análisis de Los Resultados

32
CÓMO REDACTAR EL ANÁLISIS DE LOS RESULTADOS ANÁLISIS DE LOS RESULTADOS Lic. José Pérez Leal El análisis de resultados es lo más difícil de redactar, aunque los resultados obtenidos sean validos y muy interesantes, si el análisis de resultados está redactado de manera deficiente, esto afectará seriamente el trabajo. Usualmente cuando se llega a esta parte del trabajo, el investigador suele estar un poco cansado por eso es importante tomar esta parte del trabajo con tranquilidad. El análisis de resultados es sencillamente entrelazar los datos y resultados que se encontraron en la investigación con los datos o información de la base teórica y los antecedentes. Por otra parte, al consultar libros sobre metodología de la investigación, pocos de ellos se clarifican a nivel de los proyectos de investigación. Sin embargo, según mi experiencia conviene precisar la forma como se llevará a cabo el análisis o procesamiento e interpretación de los datos, recomiendo hacer un pequeño diseño esquemático, teniendo en cuenta para ello las respuestas a las siguientes preguntas: - ¿Cuál es la postura epistemológica que subyace al método seleccionado por el investigador para estudiar la realidad precisada en el problema?, - ¿Cuál será la forma de análisis de los datos de acuerdo con el método seleccionado? En este sentido, la respuesta a estas preguntas presuponen explicar y describir la forma como serán procesados los datos, describiendo en la argumentación el énfasis por un análisis cuantitativo o cualitativo de éstos y detallando el nivel de medición al que se pretende llegar a acceder siguiendo las escalas nominales, ordinales, de intervalo y de razón. Como se puede apreciar, la primera interrogante obedece esencialmente al lenguaje de la cualificación, mientras que las escalas ordinal y de intervalo implican un mayor desarrollo cuantitativo en los procesos de medición; la escala de razón corresponde a las ciencias físicas. Si bien esta actividad no parece tan importante como la formulación del problema, los objetivos o la metodología del estudio, conviene saber que la gran mayoría de los proyectos comienzan a definir sus posibilidades de financiación cuando su resumen muestra con claridad y suficiencia de qué trata la investigación y cómo se llevará a cabo.

Transcript of Cómo Redactar El Análisis de Los Resultados

CMO REDACTAR EL ANLISIS DE LOS RESULTADOSANLISIS DE LOS RESULTADOS

Lic. Jos Prez Leal

El anlisis de resultados es lo ms difcil de redactar, aunque los resultados obtenidos sean validos y muy interesantes, si el anlisis de resultados est redactado de manera deficiente, esto afectar seriamente el trabajo. Usualmente cuando se llega a esta parte del trabajo, el investigador suele estar un poco cansado por eso es importante tomar esta parte del trabajo con tranquilidad. El anlisis de resultados es sencillamente entrelazar los datos y resultados que se encontraron en la investigacin con los datos o informacin de la base terica y los antecedentes.

Por otra parte, al consultar libros sobre metodologa de la investigacin, pocos de ellos se clarifican a nivel de los proyectos de investigacin. Sin embargo, segn mi experiencia conviene precisar la forma como se llevar a cabo el anlisis o procesamiento e interpretacin de los datos, recomiendo hacer un pequeo diseo esquemtico, teniendo en cuenta para ello las respuestas a las siguientes preguntas:

-Cul es la postura epistemolgica que subyace al mtodo seleccionado por el investigador para estudiar la realidad precisada en el problema?,-Cul ser la forma de anlisis de los datos de acuerdo con el mtodo seleccionado?

En este sentido, la respuesta a estas preguntas presuponen explicar y describir la forma como sern procesados los datos, describiendo en la argumentacin el nfasis por un anlisis cuantitativo o cualitativo de stos y detallando el nivel de medicin al que se pretende llegar a acceder siguiendo las escalas nominales, ordinales, de intervalo y de razn.

Como se puede apreciar, la primera interrogante obedece esencialmente al lenguaje de la cualificacin, mientras que las escalas ordinal y de intervalo implican un mayor desarrollo cuantitativo en los procesos de medicin; la escala de razn corresponde a las ciencias fsicas. Si bien esta actividad no parece tan importante como la formulacin del problema, los objetivos o la metodologa del estudio, conviene saber que la gran mayora de los proyectos comienzan a definir sus posibilidades de financiacin cuando su resumen muestra con claridad y suficiencia de qu trata la investigacin y cmo se llevar a cabo.

As, el anlisis de resultados consistir en explicar los resultados obtenidos y comparar estos con datos obtenidos por otros investigadores, es una evaluacin crtica de los resultados desde la perspectiva del autor tomando en cuenta los trabajos de otros investigadores y el propio.

Cabe sealar que el anlisis de resultados se propone interpretar y analizar los resultados de la investigacin de donde saldrn los elementos para plantear las conclusiones, teniendo cuidado de no caer en repeticiones de los resultados. Es una relacin entre hechos y explicaciones, sin sintetizar todo lo que se ha dicho. Este espacio en el trabajo est destinado de un cierto modo a respaldar la hiptesis general o de discutirla, y explicar y comparar los resultados obtenidos con la teora para as hallar las conclusiones. Por supuesto, antes de discutirlos ya se ha hecho la descripcin y por lo tanto se pueden ir mencionando un poco esos resultados a medida que se van discutiendo, pero no repetirlos en detalle.

Por lo tanto, cuando se repiten los resultados en lugar de compararlos y discutirlos genera dbiles comparaciones, as como la ausencia de lgica en el anlisis de resultados empricos o se hace excesivamente terica.

En este mismo orden de ideas, los resultados deben compararse con estudios que sean objetivamente comparables, con estudios que compartan la hiptesis, o que la contradicen. Pues sobre ellos es que se construye el anlisis se parecen los resultados? Por qu se considera que difieren los resultados? Vale la pena comparar los resultados con estudios que apoyan y comparten ideas importantes del trabajo que se estn realizando.

Todas estas comparaciones y anlisis deben sealar la fuente citando los autores empleando las normas de la Asociacin Americana de Psiclogos o Normas APA. Lo ideal es hacer una discusin puntual, no prolongar innecesaria del anlisis de resultados de manera redundante, esto distrae al lector y perturba lo importante de l anlisis de resultados. El hecho de que sea larga y exuberante no implica que sea una buena discusin.

De all que el anlisis de resultados sea apropiado para hacer cuestionamientos sobre el tema estudiado y proponer nuevas corrientes y perspectivas para futuras investigaciones. No tiene necesidad de ser muy larga pero si lo suficientemente claro ya que estas lneas orientaran a futuros investigadores del mismo campo. De este modo es conveniente seguir una lnea organizada para el abordaje del anlisis de resultados:

1.Comenzar con las relaciones y generalizaciones que los resultados indican.2.Sealar las faltas de correlacin y delimitar los aspectos no resueltos. No ocultar o alterar los datos que no cuadren.3.Mostrar la relacin que existe o que no existe entre los resultados con trabajos anteriormente publicados.4.Exponer las consecuencias tericas de la investigacin y las posibles aplicaciones prcticas de la misma.5.Dar alguna recomendacin o sugerencia en caso de considerarlo necesario.6.Formular las conclusiones de la forma ms clara posible.7.Resumir las pruebas que respaldan cada conclusin.

Finalmente, en el anlisis de resultados los tiempos verbales que se utilizan son el presente y el pasado. Se redacta en presente los conocimientos ya preestablecidos y en pasado los resultados obtenidos por el autor durante el trabajo de investigacin. Existen trabajos en los que el anlisis de resultados se realiza junto con las conclusiones como un solo punto (discusin y conclusiones).

BIBLIOGRAFA Y FUENTES DOCUMENTALESAbello, R. (2009) La investigacin en Ciencias sociales: sugerencias prcticas sobre el proceso. Barranquilla-Colombia. (Artculo en lnea) disponible en:http://www.gratispdf.com/?url=http%3A%2F%2Fciruelo.uninorte.edu.co%2Fpdf%2Finvest_desarrollo%2F17-1%2F10%252520LA%252520INVESTIGACION%252520EN%252520CIENCIAS%252520SOCIALES.pdf&t=LA+INVESTIGACI%C3%93N+EN+CIENCIAS+SOCIALES%3A+SugerenciaS+pr%C3%A1cticaS+Sobre+... (Consulta: 2010, noviembre 02)Arias, F. (1999) el proyecto de investigacin; Gua para su elaboracin (3ra. Edicin) Caracas-Venezuela, Editorial EsptemeBalestrini, M. (1997). Cmo se elabora el proyecto de investigacin para los estudios formulativos o exploratorios, descriptivos, diagnsticos, evaluativos, formulacin de hiptesis causales, experimentales y los proyectos factibles. Caracas: BL Consultores Asociados, Servicio Editorial.Rena.edu.ve (2006) Discusin de los Resultados. (Documento en lnea) disponible en:http://www.rena.edu.ve/cuartaEtapa/metodologia/Tema17.html(Consulta: 2010, noviembre 02)

CAPITULO IV ANALISIS DE DATOS

PLAN DEL CAPITULO IVObjetivo: En el presente captulo se expone un panorama conceptual sobre el anlisis de datos. Se describen de manera no exhaustiva algunos elementos estadsticos tiles tanto para la organizacin y presentacin de los datos como para el anlisis de los resultados de investigacin.

4.1 Procedimientos de Anlisis de DatosUna vez concluidas las etapas de coleccin y procesamiento de datos se inicia con una de las ms importantes fases de una investigacin: el anlisis de datos. En esta etapa se determina como analizar los datos y que herramientas de anlisis estadstico son adecuadas para ste propsito. El tipo de anlisis de los datos depende al menos de los siguientes factores.a) El nivel de medicin de las variables (los niveles de medicin fueron explicados en la seccin 2.4 del captulo II).b) El tipo de hiptesis formulada (ver seccin 2.2, captulo II).c) El diseo de investigacin utilizado indica el tipo de anlisis requerido para la comprobacin de hiptesis.El anlisis de datos es el precedente para la actividad de interpretacin. La interpretacin se realiza en trminos de los resultados de la investigacin. Esta actividad consiste en establecer inferencias sobre las relaciones entre las variables estudiadas para extraer conclusiones y recomendaciones (Kerlinger, 1982). La interpretacin se realiza en dos etapas:a) Interpretacin de las relaciones entre las variables y los datos que las sustentan con fundamento en algn nivel de significancia estadstica.b) Establecer un significado ms amplio de la investigacin, es decir, determinar el grado de generalizacin de los resultados de la investigacin.Las dos anteriores etapas se sustentan en el grado de validez y confiabilidad de la investigacin. Ello implica la capacidad de generalizacin de los resultados obtenidos.Analizar significa establecer categoras, ordenar, manipular y resumir los datos, (Kerlinger, 1982, p. 96). En esta etapa del proceso de investigacin se procede a racionalizar los datos colectados a fin de explicar e interpretar las posibles relaciones que expresan las variables estudiadas.El diseo de tablas estadsticas permite aplicar tcnicas de anlisis complejas facilitando este proceso. El anlisis debe expresarse de manera clara y simple utilizando lgica tanto inductiva como deductiva.Los resultados de una investigacin basados en datos muestrales requieren de una aproximacin al verdadero valor de la poblacin (Zorrilla, 1994). Para lograr lo anterior se requiere de una serie de tcnicas estadsticas. Estas tcnicas se derivan tanto de la estadstica paramtrica como de la estadstica no paramtrica. La primera tiene como supuestos que la poblacin estudiada posee una distribucin normal y que los datos obtenidos se midieron en una escala de intervalo y de razn. La segunda no establece supuestos acerca de la distribucin de la poblacin sin embargo requiere que las variables estudiadas se midan a nivel nominal u ordinal (ver Weiers, 1993).Las tablas diseadas para el anlisis de datos se incluyen en el reporte final y pueden ser tiles para analizar una o ms variables. En virtud de ste ltimo criterio el anlisis de datos puede ser univariado, bivariado o trivariado dependiendo de la cantidad de variables que se analizan.4.1.1 Anlisis Univariado.Consiste en el anlisis de cada una de las variables estudiadas por separado, es decir, el anlisis esta basado en una sola variable. Las tcnicas ms frecuentes de anlisis univariado son la distribucin de frecuencias para una tabla univariada y el anlisis de las medidas de tendencia central de la variable. Se utiliza nicamente en aquellas variables que se midieron a nivel de intervalo o de razn (ver Therese L. Baker, 1997). La distribucin de frecuencias de la variable requiere de ver como estn distribuidas las categoras de la variable, pudiendo presentarse en funcin del nmero de casos o en trminos porcentuales.4.1.2 Anlisis Bivariado.El anlisis bivariado disea tablas con tabulaciones cruzadas, es decir, las categoras de una variable se cruzan con las categoras de una segunda variable. Se les conoce como tablas de contingencia. Los requisitos que debe cubrir son:1 El ttulo debe reflejar la informacin que contiene la tabla.2 Incluir un subttulo para cada columna y subcolumna que se integre a la tabla.3 Indicar el 100 % cuando la tabla se exprese en trminos porcentuales.4 Indicar al final de cada columna el nmero total de casos o categoras que comprende.4.1.3 Anlisis TrivariadoEl anlisis trivariado incluye una tercer variable que se utiliza como variable control. Esto permite analizar la asociacin entre las dos variables, controlando el efecto de una tercer variable mediante la observacin de las dos primeras sobre cada condicin que presenta la tercera.Por ejemplo si se analiza el ingreso econmico de los ejecutivos de la micro, pequea y mediana empresa regional con estudios de licenciatura y los ingresos de aquellos ejecutivos con estudios de posgrado (maestra), es posible incluir en el anlisis la variable dicotmica sexo.4.2 Elementos EstadsticosEl anlisis e interpretacin de datos requiere de un profundo conocimiento de la estadstica, es decir, para que una investigacin pueda arrojar luz sobre el PON, el investigador tendr que someter los datos a la prueba estadstica y para ello necesita tener conocimiento de los supuestos que involucra la metodologa estadstica que habr de utilizar.La herramienta utilizada para el anlisis de datos es la estadstica. Esta disciplina proporciona innumerables beneficios a la investigacin cientfica y tecnolgica. La estadstica descriptiva se entiende como el conjunto de mtodos para procesar informacin en trminos cuantitativos de tal forma que se les de un significado. La estadstica inferencial estudia la confiabilidad de las inferencias de que los fenmenos observados en la muestra son extensivos a la poblacin de donde se obtuvo la muestra, es decir, facilita el establecimiento de inferencias de la muestra analizada hacia la poblacin de origen.4.2.1 Elementos de Estadstica DescriptivaComo ya fue explicado la estadstica descriptiva permite organizar y presentar un conjunto de datos de manera que describan en forma precisa las variables analizadas haciendo rpida su lectura e interpretacin.Entre los sistemas para ordenar los datos se encuentran principalmente dos: a) la distribucin de frecuencias y b) la representacin grfica. Estos sistemas de organizacin y descripcin de los datos permiten realizar un anlisis de datos univariado, bivariado o trivariado, dependiendo de los objetivos y de la naturaleza de la investigacin que se realiza.Distribucin de Frecuencias. Comunmente llamada tabla de frecuencias, se utiliza para hacer la presentacin de datos provenientes de las observaciones realizadas en el estudio, estableciendo un orden mediante la divisin en clases y registro de la cantidad de observaciones correspondientes a cada clase. Lo anterior facilita la realizacin de un mejor anlisis e interpretacin de las caractersticas que describen y que no son evidentes en el conjunto de datos brutos o sin procesar. Una distribucin de frecuencias constituye una tabla en el mbito de investigacin.La distribucin de frecuencias puede ser simple o agrupada. La distribucin de frecuencias simple es una tabla que se construye con base en los siguientes datos: clase o variable (valores numricos) en orden descendente o ascendente, tabulaciones o marcas de recuento y frecuencia. Por ejemplo, si se construye una distribucin de frecuencias sobre los resultados finales que arroj la evaluacin de un curso de planeacin estratgica para estudiantes de administracin correspondientes al semestre agosto-diciembre de 1998, se tienen los siguientes datos brutos: 86, 80, 84, 84, 74, 88, 87, 84, 74, 77, 77, 82, 68, 78, 67, 74, 66, 86, 65, 88,69 se procede a organizarlos en forma ascendente o descendente y se tiene en orden descendente: 88, 88, 87, 86, 86, 84, 84, 84, 82, 80, 78, 77, 77, 74, 74, 74, 69, 698, 67, 66, 65 posteriormente se registran en una tabla de distribucin de frecuencias simple (ver Tabla 4.1). Cuando se pretende ... determinar el nmero de observaciones que son mayores o menores que determinada cantidad, (Webster, 1998, p. 27) se utiliza la distribucin de frecuencias agrupadas tambin conocida como distribucin de frecuencias acumuladas. La distribucin de frecuencias agrupadas es una tabla que contiene las columnas siguientes: intervalo de clase, puntos medios, tabulacin frecuencias y frecuencias agrupadas. Los pasos para disearla son:

Tabla 4.1 Distribucin de Frecuencias de los Resultados Finales obtenidos de la Evaluacin de Planeacin Estratgica correspondientes al semestre agosto-diciembre de 1998.

1 Se localizan el computo mas alto y el mas bajo de la serie de datos.2 Se encuentra la diferencia entre esos dos cmputos.3 La diferencia obtenida se divide entre nmeros nones tratando de encontrar un cociente cercano a 15 pero no mayor. Lo anterior indica cuantas clases va a tener la distribucin de frecuencias agrupadas y cul va a ser la magnitud del intervalo de clase.4 Se determina el primer intervalo de clase y posteriormente se van disminuyendo los lmites del intervalo de clase de acuerdo al valor de la magnitud establecida previamente.El ejemplo planteado en la distribucin de frecuencias simples se utilizar tanto para efectos de ejemplificacin de la distribucin de frecuencias agrupadas como para el diseo de grficas tipo polgono de frecuencias, histograma y ojiva. En la Figura 4.2 se presenta un ejemplo de una distribucin de frecuencias agrupada.

Tabla 4.2 Distribucin de Frecuencias Acumuladas de los Resultados Finales obtenidos de la Evaluacin de Planeacin Estratgica correspondientes al semestre agosto-diciembre de 1998.

Los computos mayor y menor son las puntuaciones 88 y 65, la diferencia es 88-65=23 y el nmero de intervalos de clase es 23/3= 7.68.b) Representacin Grfica. A partir de la distribucin de frecuencias se procede a presentar los datos por medio de grficas. La informacin puede describirse por medio de grficos a fin de facilitar la lectura e interpretacin de las variables medidas. Los actuales sistemas computacionales como Excel, Lotus Smart Suite, Minitab, SAS-PC, Stath Graph, entre otros permiten obtener representaciones grficas de diversos conjuntos de datos. Las grficas pueden ser tipo histograma, polgono de frecuencias, grfica de series de tiempo, etc,b1) El Histograma. El histograma ... es una grfica de barras que permite describir el comportamiento de un conjunto de datos en cuanto a su tendencia central, forma y dispersin, (Gutirrez, 1998, p.79). De acuerdo con Glass y Stanley (1994) un histograma no debe ser demasiado plano o esculpado. El ancho es de dos tercios de su altura. Los pasos para elaborar un histograma son (ver Figura 4.1):1 Se trazan los ejes horizontal y vertical.2 Se registran marcas equidistantes sobre ambos ejes.3 Se marcan los puntos medios de cada intervalo de clase sobre el eje horizontal.b2) El Polgono de Frecuencias. Un mtodo ampliamente utilizado para mostrar informacin numrica de forma grfica es el polgono de frecuencia o grfica de lnea. La construccin es similar a la del histograma pero la diferencia radica en que para indicar la frecuencia solo se utiliza un punto sobre el punto medio de cada intervalo. Los pasos para construirlo son (ver Figura 4.2):

Figura 4.1 Nmero de Empresas de la Industria Grfica de Estados Unidos por Segmento. (EPA, 1997).

Figura 4.2 Resultados de la Aplicacin de una Prueba Matemticas con 100 tems al Grupo de 2. de Ingeniera en Sistemas.

1 Se trazan los ejes horizontal y vertical.2 Se registran marcas equidistantes sobre el eje horizontal y se anotan debajo de cada una de ellas los puntos medios de los intervalos de clase en un orden de menor a mayor.3 Se registran marcas equidistantes sobre el eje vertical y se anotan a la izquierda de cada una de ellas las frecuencias en orden ascendentes. A partir de ellas se disea la cuadrcula del espacio enmarcado, trazando las abscisas y ordenadas.4 Se representa con puntos las frecuencias de cada intervalo de clase. Se toma en cuenta el punto medio de cada intervalo de clase como base y las frecuencias como altura.5 Se unen con lnea gruesa los puntos as determinados. 6 Se registra el ttulo expresando en resumen el asunto o cuestin sobre la que informa la grfica.b3) Grfica de Series de Tiempo. Es una grfica de lnea en la que la lnea horizontal representa el tiempo. Es utilizada para representar tendencias como puede ser el tipo de cambio peso-dlar, el ndice de precios al consumidor, etc. (ver Figura 4.3).los anteriores elementos de estadstica descriptiva son utilizados en investigacin para disear tablas y figuras que presenten de manera resumida y organizada n conjunto de datos obtenidos mediante la observacin y medicin de las variables estudiadas.

Figura 4.3 Tendencias de Crecimiento de la Industria Grfica de Estados Unidos para el periodo 1990- 2000, (EPA, 1997).

c) Medidas de Tendencia Central. Las medidas de tendencia central son tiles para encontrar indicadores representativos de un colectivo de datos. Los tres mtodos que permiten obtener el punto medio de una serie de datos son la media, la mediana y la moda.c1) Media Aritmtica. Medida de tendencia central que se define como el promedio o media de un conjunto de observaciones o puntuaciones. En aquellas situaciones en que la poblacin de estudio es pequea suele utilizarse la media poblacional mediante la expresin:

(Ec. 4.1)donde: = media poblacionalXi = Sumatoria de las puntuacionesN = Nmero de casosEn cambio si la poblacin de estudio es muy numerosa se procede a obtener la media muestral definida matemticamente por la expresin:

(Ec. 4.2)donde:X = media muestralXi = Sumatoria de las puntuacionesN = Nmero de casosAl obtener la media alcanzada por la compaa XYZ que comercializa computadoras personales. Las ventas diarias realizadas por la compaa durante una semana indican las siguientes cantidades: 4, 12, 7, 9, 11, 7, 8, el clculo de la media es:

el anterior resultado sugiere que el promedio semanal de ventas de la compaa XYZ es de 8.29 computadoras personales.c2) La Moda. En una serie de puntuaciones se denomina moda a la observacin que se presenta con mayor frecuencia. As en el ejemplo anterior de lacompaa XYZ la moda es la puntuacin 7. Para obtener la moda a partir de una distribucin de frecuencias agrupadas se utiliza la expresin:

(Ec. 4.3)donde:Mo = ModaLmo = Lmite inferior del intervalo de clase modalDa = Diferencia entre la frecuencia de la clase modal y la de la clase que la precede.Db = Diferencia entre la frecuencia de la clase modal y la de la clase que l la sigue.i = Intervalo de clase.La moda para una distribucin de frecuencias agrupadas se obtiene a partir de los datos de la Tabla 4.2:

la moda tiene un valor de 86.10.c3) La Mediana. Tambin conocida como media posicional en virtud de que se localiza en el centro de un conjunto de observaciones presentadas en una serie ordenada de datos. Lo anterior sugiere que el 50 % de los casos se encuentra por encima de la mediana y el resto por debajo de ella. La posicin central de la mediana se obtiene mediante la expresin matemtica.

(Ec. 4.4)donde:PMd = Posicin de la MedianaN = Nmero de casos.el procedimiento para obtener la mediana a partir de una distribucin de frecuencias simple o agrupada requiere de aplicar la expresin:

(Ec. 4.5)donde:Md = MedianaN = Nmero de casos.FA = Frecuencia agrupada.FS = Frecuencia del intervalo adyacente superior.

Al aplicar la ecuacin 4.5 a los datos de la Tabla 4.2 se obtiene un valor de 83 para la mediana:

De las tres medidas de tendencia central la media es mas exacta que la mediana por ser una estadstica obtenida a travs de una medicin ordinal o de razn mientras que la mediana se obtiene a un nivel de medicin nominal.La principal caracterstica de la media consiste en tomar en cuenta al 100 % de las puntuaciones de una distribucin de frecuencias. No obstante cuando se analizan medidas extremas esta medida pudiera ser afectada por desviaciones que se posicionan por debajo o por arriba de ella. Ni la mediana ni la moda tienen este problema (Webster, 1998; Hopkins, Hopkins y Glass 1997; Kazmier, 1998).a) Medidas de Dispersin.Las medidas de dispersin son ndices que se utilizan para describir una distribucin de frecuencias a partir de la variacin de los valores obtenidos. Los ndices ms utilizados son el rango, la varianza y la desviacin estndar.d1) El Rango. Indice conocido como recorrido. Se le define como la diferencia existente entre la puntuacin mayor y la menor en una serie de datos. Tiene como desventaja que solo toma en cuenta para su clculo las puntuaciones extremas, es decir la mayor y la menor omitiendo el resto de los datos u observaciones. Debido a lo anterior no es una medida confiable dado que se obtiene prcticamente por inspeccin.d2) La Varianza. La varianza es una medida de variabilidad que toma en cuenta el 100 % de las puntuaciones de manera individual. Webster (1998) la define como la media aritmtica de las desviaciones respecto a la media aritmtica elevada al cuadrado, (p. 83). La definicin matemtica de la varianza se expresa por medio de la ecuacin 4.6:

(Ec. 4.6)donde:2= Varianza. = Suma deX2= Desviacin de las puntuaciones de la media (X-X)N = Nmero de casos.

d3) La Desviacin Estndar. Dada la dificultad inherente de interpretar el significado de una varianza en virtud de que expresa valores elevados al cuadrado, para efectos de investigacin es ms adecuado utilizar la desviacin estndar o desviacin tpica, definida como la raz cuadrada de la varianza. La desviacin estndar se expresa mediante la ecuacin 4.7:

(Ec. 4.7)donde: X2= Suma de los cuadrados de cada puntuacin(X)2= Suma de las puntuaciones elevadas al cuadradoN = Nmero de casos. = Desviacin Estndar

La desviacin estndar es una medida obtenida mediante una escala de intervalo o de razn basada en la magnitud de las puntuaciones individuales de la distribucin (DAry, Jacobs y Razavieh, 1982). Es de mucha utilidad en ... en conjuncin con la...distribucin normal, (Kazmier, 1998).e) Correlacin.La correlacin es un mtodo estadstico que permite determinar la presencia o ausencia de asociacin entre dos variables sometidas a investigacin. Por ejemplo se puede medir el grado de asociacin entre el rendimiento acadmico y el nivel socioeconmico de una muestra de unidades de observacin. La correlacin se describe por medio de ndices estadsticos denominados coeficientes de correlacin que pueden sugerir si el cambio de una variable se asocia con el cambio de la otra variable.Los ndices mas utilizados para medir la asociacin entre dos variables es el coeficiente de correlacin producto-momento que se aplica a escalas de medicin de intervalo o de razn y el coeficiente de correlacin de rangos que se utiliza en escalas de medicin ordinal.Al analizar la correlacin de una serie de datos el resultado que arroja un coeficiente de correlacin flucta entre 1.00 y + 1.00. Una puntuacin de 1.00 sugiere una correlacin negativa perfecta. Una puntuacin de 0.00 sugiere ausencia de asociacin entre las variables y una puntuacin de + 1.00 sugiere una correlacin positiva perfecta. Una correlacin positiva perfecta indica que si una variable aumenta la otra tambin aumenta, por ejemplo cabe esperar que si el tipo de cambio peso-dlar aumenta el volumen de exportaciones del sector manufacturero del pas tambin aumenta.En el caso de una correlacin negativa perfecta ocurre el aumento de una variable y el decremento o disminucin de la otra variable. Por ejemplo ante el aumento del tipo de cambio peso-dlar cabe esperar una disminucin o decremento en el volumen de importaciones del pas. Una adecuada tcnica para leer e interpretar los valores de correlacin son las grficas de dispersin. La Tabla 4.3 muestra algunos valores de coeficientes de correlacin con su respectiva descripcin y grfica de dispersin.Determinar la existencia de asociacin entre las variables no indica existencia de causalidad. Esto es, un coeficiente de correlacin nicamente sugiere el grado de relacin entre las variables y no una situacin causal.e1) Correlacin Producto-Momento. La correlacin producto-momento es conocida como r de Pearson en virtud de que el estadstico Karl Pearson desarrollo este procedimiento. Se define como la media de los productos

de las puntuaciones Z y se expresa matemticamente mediante la ecuacin:donde:rxy = coeficiente de correlacin producto-momento.ZxZy = Sumatoria de los productos de puntuacin Z.n = Nmero de casos o puntuaciones pareadas.en situaciones en las que el conjunto de observaciones es muy numeroso se omite la aplicacin de la ecuacin 4.8 y es sustituida por la expresin:

(Ec. 4.9)

donde:rxy = coeficiente de correlacin producto-momento.n = Nmero de casos. Xi = Sumatoria de las puntuaciones de la variable X.Yi = Sumatoria de las puntuaciones de la variable Y.XY = Sumatoria de los productos de las puntuaciones apareadas XiYi.Xi2= Sumatoria de los cuadrados de las puntuaciones de la variable X.Yi2= Sumatoria de los cuadrados de las puntuaciones de la variable Y.

Tabla 4.3 Ejemplo de Grficas de Dispersin.Grfica de DispersinCoeficiente de correlacinInterpretacin

+ 1.00Correlacin positiva perfecta.

- 1.00Correlacin negativa perfecta.

+ 0.60Correlacin positiva moderada

0.00Ausencia de correlacin

Para ejemplificar el coeficiente de correlacin producto-momento se desarrollar el anlisis de correlacin al volumen de exportaciones del Sector de Servicios de Impresin (SSI) de Mxico en el periodo comprendido entre 1991 y 1995 en relacin con el tipo de cambio peso-dlar. El volumen de exportaciones se expresa en millones de dlares. La Tabla 4.4 muestra los datos del ejemplo. Al aplicar la ecuacin 4.9 se obtiene:

Tabla 4.4 Volumen de Exportaciones en relacin con el Tipo de Cambio peso- dlar del Sector de Servicios de Impresin Mexicano.

Fuente: Avila, H. L. (1999). Determinacin de la Productividad Total del Sector de Servicios de Impresin de Cd. Cuauhtmoc, Chih. Tesis para obtener el grado de M. C. en Comercio Exterior, Instituto Tecnolgico de Cd. Jurez, Jurez, Chih.

al calcular el coeficiente de determinacin (ver seccin 5.3) se obtiene un valor de:

el anlisis de correlacin arroj un coeficiente de correlacin de 0.28 para la asociacin del valor total de exportaciones con el tipo de cambio peso-dlar, esto indica una dbil correlacin inversa entre ambas variables, con un coeficiente de determinacin de 0.06. Lo anterior sugiere la conclusin lgica de que mientras el volumen de exportaciones se incrementa, el tipo de cambio peso-dlar decrece, sin que lo anterior indique una relacin causstica, dado que para tal efecto sera necesario un anlisis marginal con soporte en algn modelo econmico. El anlisis de correlacin simple es susceptible de someterse a prueba de hiptesis estadstica mediante la distribucin t con gl = n 2 (gl = grados de libertad). Para lo anterior se procede a:a) Establecer la hiptesis nula expresada en trminos estadsticos (ver seccin 2.2 del captulo II). La hiptesis es:

b) Determinar el nivel de significancia estadstica al que se someter a contrastacin la hiptesis nula y que pudiera ser en nivel de:

c) Calcular la prueba de signifitica mediante el

(Ec. 4.10)d) estadstico t expresado en la ecuacin:donde:t = prueba t para prueba de hiptesis de correlacin simpler = coeficiente de correlacinr2= coeficiente de determinacinn = nmero de casosal aplicar la ecuacin 4.10 al anlisis de correlacin anterior se obtiene un valor t calculado de:

el valor t calculado de 0.90 se compara con el valor t crtico a una significacin de = 0.05 consultado en el apndice A, procediendo previamente a obtener los grados de libertad para la distribucin t con la ecuacin:gl = n - 2(Ec. 4.11)

en el problema son cinco casos por lo que gl = 5 2 = 3. Con tres grados de libertad el valor t crtico es de 3.182. La regla de decisin es que si el valor t calculado es mayor que el valor t crtico entonces se rechaza la hiptesis de nulidad. En este caso se acepta la hiptesis de nulidad en virtud de que el valor to = - 0.90 < tc = 3.182 y se concluye que si existe asociacin entre las variables volumen de exportaciones y tipo de cambio peso-dlar.e2) Coeficiente de Correlacin por Rangos. El coeficiente de correlacin por rangos conocido como coeficiente de Spearman (rho) se obtiene por medio de la expresin:

(Ec. 4.10)donde: = Coeficiente de correlacin por rangos.D2= Sumatoria de los cuadrados de las diferencias entre los rangos.N = Nmero de casos.

e3) Coeficiente de Determinacin. El coeficiente de determinacin (rXY2) se define como el cuadrado del coeficiente de correlacin y se utiliza para medir la variacin de la variable dependiente (Y) explicada por la variacin de la variable independiente (X). Es ms adecuado aplicarlo en modelos de regresin lineal para medir el poder explicativo de modelos de regresin lineal.5.2.2 Elementos de Estadstica Inferenciala) Anlisis de Varianza. El anlisis de varianza (ANOVA) es una tcnica estadstica diseada para comparar la varianza de dos poblaciones a partir del anlisis de las varianzas de las muestras respectivas. Webster (1998) aplica el concepto de ANOVA al contexto de un experimento y la define como ... el procedimiento [que] se puede aplicar a la determinacin de si un tratamiento en particular aplicado a una poblacin tendr efecto significativo sobre su media, (p. 595). Aplicar el ANOVA requiere cumplir con dos criterios especficos:a1) Las poblaciones de estudio deber ser normales y tener varianzas iguales.a2) Seleccionar las muestras independientemente.La varianza total de todos los tratamientos (observaciones) se puede dividir en dos fuentes:a) Variacin Intermuestral. Factor que representa la variacin entre los diversos tratamientos administrados durante el desarrollo de un experimento.b) Variacin Intramuestral o debida al Error. Factor que representa la variacin dentro de un mismo tratamiento administrado durante la realizacin de un experimento.En este contexto se entiende que la variacin total es igual a la variacin intermuestral + la variacin intramuestral o debida al error. Para obtener la comprobacin de una hiptesis de nulidad mediante el ANOVA se tienen que calcular los siguientes factores:a) La suma total de cuadrados expresada por la ecuacin:

(Ec. 4.11)donde: xt2= Suma total de cuadrados x2=Suma de los cuadrados de las puntuaciones( x)2 =Suma de las puntuaciones elevadas al cuadradoN = Nmero de casos.b) La suma de los cuadrados entre grupos (varianza intermuestral) se expresa por la ecuacin:

(Ec. 4.12)donde:xi2= Suma de los cuadrados entre los grupos(X1)2= Suma de las puntuaciones elevadas al cuadrado del tratamiento1n = Nmero de casos

c) La suma de cuadrados dentro de grupos (varianza intramuestral) se expresa por la ecuacin:

(Ec. 4.13)

donde:Xd2= Suma de cuadrados dentro de gruposX12= Suma de los cuadrados de las puntuaciones del grupo 1(X1)2= Suma de las puntuaciones elevadas al cuadrado del tratamiento1Lo anterior refleja que se cuenta con tres varianzas y solo es posible realizar la comparacin de la varianza intermuestral con la varianza intramuestral mediante el anlisis del comportamiento de las mismas con respecta a la distribucin F que supone la independencia de las varianzas. La distribucin F se expresa por la ecuacin:

(Ec. 4.14)donde:F = Distribucin F.

d) Los grados de libertad para la varianza del error se obtienen mediante la ecuacin:gl =c-1(Ec. 4.15)donde:gl = grados de libertadc = columnas

e) Los grados de libertad para la varianza intramuestral se obtienen por medio de la ecuacin:gl =n-c(Ec. 4.16)donde:gl = grados de libertadc = columnasn = nmero de casos

Para ejemplificar el ANOVA se tomarn los datos siguientes: Con el propsito de determinar que las medias de las puntuaciones obtenidas por tres grupos de menonitas provenientes de los campos menonitas del municipio de Riva Palacio, Chih., en un experimento de lectura veloz en indioma espaol utilizando un vocabulario tcnico-cientfico. El rendimiento de cada uno de los grupos se muestra en la Tabla 4.5.

Tabla 4.5 Resultados de un experimento de lectura veloz con una muestra demenonitas del Municipio de Riva Palacio, Chih.

Para obtener la razn F se recomienda elaborar la siguiente tabla a fin de facilitar el anlisis de resultados:

Tabla 4.6 Formato para Obtener la Razn F.

La razn F crtica para 2 y 15 grados de libertad a un nivel = 0.05 se obtiene consultando el apndice B. Para el presente caso tiene un valor de F = 3.68. La interpretacin requiere de aplicar la regla de decisin: Si la razn F calculada es mayor que la razn F crtica entonces se rechaza la hiptesis nula, en caso contrario se acepta.Para el problema anterior la razn F calculada es de 0.44 valor que esta muy por debajo de la razn F crtica con valor de 3.68 para = 0.05 por consiguiente es posible aceptar la hiptesis de nulidad concluyendo que no existe evidencia de que las tres medias de calificaciones obtenidas por los grupos en lectura veloz sean diferentes.b) Anlisis Multifactorial de Varianza. El anlisis multifactorial de varianza (ANCOVA) tambin denominado anlisis de covarianza permite la comparacin de ms de dos variables entre si con el propsito de comprobar tanto el efecto de las variables como el efecto de interaccin entre ellas.El ANCOVA es utilizado para analizar los resultados de investigaciones de tipo experimental que aplican un diseo factorial (ver seccin 3.4 del captulo III). En este tipo de diseos se analizan los efectos combinados de dos o ms variables independientes. Para realizar un ANCOVA se necesita obtener:b1) La suma total de cuadrados mediante la ecuacin 4.11.b2) La suma de cuadrados entre grupos mediante la ecuacin 4.12.b3) La suma de cuadrados dentro de grupos mediante la ecuacin 4.13.b4) La suma de cuadrados entre columnas que se define por la ecuacin:

(Ec. 4.17)donde:Xec2= suma de cuadrados entre columnasnc1= nmero de casos en la columna 1.N = nmero total de casosb5) La suma de cuadrados entre hileras que se expresa matemticamente mediante la ecuacin:

(Ec. 4.18)donde:Xec2= suma de cuadrados entre columnasnr1 = nmero de casos en la hilera 1.N = nmero total de casosb6) La suma de la interaccin de los cuadrados ... es la parte de la desviacin entre las medias de los grupos y la media total que no se debe ni a las diferencias de las hileras ni a las diferencias de las columnas, (DAry, Jacobs y Razavieh, 1982, p. 164). Se define matemticamente mediante la expresin:

(Ec. 4.19)donde:Xint2= suma de cuadrados entre hilerasXi2= suma de cuadrados entre gruposXec2= suma de cuadrados entre columnasXer2= suma de cuadrados entre hilerasb7) Determinar el nmero de grados de libertad asociados a cada puntuacin de variacin:1 Suma de cuadrados entre columnas utilizando la ecuacin 4.152 Suma de cuadrados entre hileras mediante la ecuacin:gl = r-1(Ec. 4.20)donde:gl = grados de libertadr = hileras

3 Suma de la interaccin de los cuadrados por medio de la expresin:gl =(c-1)(r-1)(Ec. 4.21)donde:gl = grados de libertadc = columnasr = hileras

4 Suma de cuadrados entre grupos mediante la ecuacin:gl =G-1(Ec. 4.22)donde:gl = grados de libertadG = grupos5 Suma total de cuadrados definido por la expresin:gl =N-1(Ec. 4.23)donde:gl = grados de libertadN = columnas

b8) Obtencin de la razn F mediante la ecuacin 4.14.Para ejemplificar el ANCOVA se aplicar el procedimiento al siguiente caso: Se desea investigar como influye un programa de incentivacin econmica en la productividad de la mano de obra de una compaa de servicios de impresin, formando cuatro grupos de trabajadores aleatoriamente. Los integrantes de dos de los grupos son menores de 24 aos y los integrantes del resto del grupo mayores de 24 aos. Los datos obtenidos se muestran en la Tabla 4.7.Tabla 4.7 Valores de la Productividad de la Mano de Obra de la Empresa de Servicios de Impresin.

los clculos son:

para obtener la razn F se sugiere disear la siguiente tabla con el propsito de facilitar

el anlisis:Tabla 4.8 Formato para Obtener la Razn F.

Para la varianza entre columnas la razn Fo = 5.69 > Fc = 4.49 por consiguiente no se acepta la hiptesis de nulidad. La razn F calculada (Fo) es significativa a nivel = 0.05. Para la varianza entre hileras la razn Fo = 15.13 > Fc = 4.49 por lo que no se acepta la hiptesis nula. La razn F es altamente significativa a nivel = 0.05. Para la varianza de la interaccin la razn Fo = 15.03 > Fc = 4.49 por lo que no se acepta la hiptesis de nulidad. La razn F es altamente significativa a nivel = 0.05. Los anteriores resultados permiten concluir que existe evidencia estadstica para establecer como conclusin que la incentivacin econmica tiene influencia significativa en el aumento de la productividad de los empleados de la compaa de servicios de impresin. Este efecto se presenta tanto en trabajadores menores de 24 aos como en los mayores de 24 aos.c) La Distribucin Xi2. La Xi2 (chi cuadrada) es una prueba de estadstica no paramtrica que se utiliza para la contrastacin de hiptesis. De acuerdo con Webster (1998) las pruebas no paramtricas son procedimientos estadsticos que se pueden utilizar para contrastar hiptesis cuando no es posible fijar ningn supuesto sobre parmetros o distribuciones poblacionales, (p. 836). Las aplicaciones de la prueba Xi2 son dos: c1) las pruebas de bondad del ajuste y c2) las pruebas de independencia.c1) Xi2 de bondad del ajuste. Esta prueba se utiliza para apreciar si las distribuciones observadas se ajustan a las esperadas. La prueba es adecuada para realizar pruebas de variancia sin que interese el tipo de distribucin que tiene (Glass y Stanley, 1994; Kazmier, 1998).Lo anterior significa que esta prueba permite determinar si los datos empricos de alguna distribucin especfica corresponde a una distribucin terica como la binomial, la poisson o la normal. Se emplea en el muestreo con el propsito de precisar si los valores obtenidos de una muestra corresponden a las frecuencias poblacionales (ver Hopkins, Hopkins y Glass, 1997; Kazmier, 1998).Para Webster (1998) presenta una definicin muy completa de las pruebas de bondad del ajuste. ... estas pruebas miden el grado en que los datos muestrales observados cumplen una distribucin hipottica determinada. Si el grado de cumplimiento es razonable, se puede deducir que la distribucin hipottica existe, (p. 838).La hiptesis de nulidad en la prueba de bondad del ajuste se expresa:Ho: fo = fe. (No hay diferencia entre las frecuencias observadas y las esperadas)H1: fofe. (Existe diferencia entre las frecuencias observadas y las esperadas.Para someter a prueba estas hiptesis se utiliza la expresin matemtica:

(Ec. 4.24)donde:Xi2= prueba chi cuadradak = nmero de categoras o clasesfo = frecuencias observadasfe = frecuencias esperadas

Para ejemplificar la Xi2 de bondad del ajuste se utilizarn los siguientes datos: El Sr. David Neufeld es gerente de ventas de la fbrica de queso menonita tipo chester ubicada en la Colonia Manitoba en la regin noroeste del Estado de Chihuahua. En particular el Sr. Neufeld tiene que desplazar la produccin de queso en el mercado nacional. Recientemente se da cuenta de la existencia de una fuerte competencia de otras marcas de queso provenientes de otras entidades del pas y del extranjero. Le resulta cada vez ms difcil comercializar la produccin de queso y decide someter a comprobacin la hiptesis de nulidad a un nivel = 0.05:Ho: fo = fe. La demanda real es uniforme a la esperadaH1: fofe. La demanda real no es uniforme a la esperada.el Sr. Neufeld toma como muestra el volumen de ventas mensual en toneladas de queso correspondientes a un periodo de 12 meses. Las frecuencias son:

Tabla 4.9 Frecuencias Esperadas y Observadas de las Ventas de Queso

El valor de Xi2es:

Con el propsito de analizar e interpretar el valor encontrado de Xi2se necesita obtener los grados de libertad. Para ello se utiliza la expresin matemtica:gl = n - 1donde:gl = grados de libertadn = nmero de casos

para el anterior problema los gl = 11. Posteriormente se obtiene el valor de Xi2 crtica(consultar apndice C) aplicando la regla de decisin: Se rechaza la hiptesis nula s Xi2 calculada > Xi2 crtica, no se rechace en caso contrario. Para el caso anterior se puede concluir que Xi2 calculada = 42.57 > Xi2 crtica =19.675 a nivel = 0.05 por consiguiente no se acepta la hiptesis de nulidad que expresa que la demanda de queso menonita tipo chester en el mercado nacional es uniforme. Las diferencias entre la demanda observada y la esperada son significativas por lo que es posible refutar la hiptesis de nulidad.c2) Xi2de Independencia. Es una excelente herramienta estadstica para comprobar la independencia de variables categricas. Analiza dos factores con el propsito de determinar la existencia o no de relacin entre ellos. Para lo anterior utiliza tablas de tabulaciones cruzadas o de contingencia (ver seccin 4.3 del captulo IV).As por ejemplo si se analizar el rendimiento de alumnos con resultados por arriba o por debajo del promedio en la prueba coeficiente intelectual se estaran comparando dos factores: rendimiento y coeficiente intelectual. La Xi2 de independencia aplica la ecuacin 4.23 para analizar la diferencia entre las frecuencias observadas y las esperadas.Para ilustrar esta prueba se utilizar un ejemplo segn el cual a una muestra aleatoria de 90 estudiantes recin egresados y prximos a egresar de educacin media superior se les pregunta si prefieren estudiar una carrera profesional en la Universidad Autnoma de Chihuahua (UACH), en el Instituto Tecnolgico de Cd. Cuauhtmoc (ITCC) o si tienen preferencia por alguna Institucin de Educacin Superior Particular. Los resultados se muestran en la Tabla 4.9.

Tabla 4.10 Frecuencias Observadas para la Preferencia por Educacin Superior.

como puede observarse la Tabla 4.9 contiene 6 casillas integradas por tres columnas y dos hileras. Para realizar la comparacin se plantea la hiptesis:Ho: fo = fe. No existe preferencia por alguna institucin especficaH1: fofe. Existe preferencia por alguna institucin especfica.para someter a comprobacin la hiptesis de nulidad se elige un nivel de = 0.05 procedindose a obtener las frecuencias esperadas en funcin de las frecuencias observadas por medio de operaciones aritmticas. Se multiplica el valor de cada casilla por el total de la columna dividido por el total de casos.As por ejemplo la frecuencia esperada de los estudiantes que prefieren la UACH es 20 (36/90) = 8. Se realiza la misma operacin para obtener el resto de frecuencias esperadas. La Tabla 4.10 presenta las frecuencias esperadas.

Tabla 4.11 Frecuencias Esperadas para la Preferencia por Educacin Superior.

el valor de Xi2es:Finalmente se compara el valor de Xi2observada con el valor de Xi2crtica. Para lo cual se requiere obtener los grados de libertad mediante la expresin:gl = (r-1) (c-1)(Ec. 4.25)donde:gl = grados de libertadr = nmero de renglones en la tablac = nmero de columnas en la tablapor consiguiente los grados de libertad son gl = (2 1) (3 1) = 2 que a un nivel = 0.05 el valor de Xi2crtica es de 5.99. Como Xi2=87.20 > Xi2crtica = 5.99 es posible afirmar con cierto grado de confianza que existen diferencias significativas acerca de la relacin de la variable estudiantes recin egresados y prximos a egresar de educacin media superior y la variable preferencia por alguna institucin de educacin superior. La hiptesis de nulidad no se acepta a nivel = 0.05.RESUMEN DEL CAPITULOLa etapa de anlisis de datos es una de las ms importantes en el proceso de investigacin en virtud de que se procede a racionalizar los datos colectados con el propsito de explicar las posibles relaciones que expresan las variables estudiadas. El anlisis puede ser univariado, bivariado o trivariado. El anlisis e interpretacin requiere del conocimiento de la estadstica.La estadstica proporciona innumerables beneficios a la investigacin cientfica y tecnolgica. Esta disciplina aporta elementos estadsticos descriptivos e inferenciales. Los primeros representan un conjunto de procedimientos que permiten procesar y presentar la informacin de manera organizada y resumida. Los segundos facilitan el establecimiento de inferencias de la muestra estudiada hacia la poblacin de origen a travs de una serie de pruebas de hiptesis aplicando estadstica paramtrica y no paramtrica.