ANALISIS DE DATOS CUANTITATIVOS diapos.pdf

63
DOCENTE: Dra. Maria Cecilia Zavaleta López INTEGRANTES: Alva Lazo, Simone Anticona Ibañez, Rolan Blas Ortega, Yescenia Correa Lozada, Ana Finochetti Romero, Julio Florian Alvarez, Marli Gutierrez Cruzado, Deivy UNIVERSIDAD NACIONAL DE TRUJILLO FACULTAD DE CIENCIAS ECONÓMICAS ESCUELA DE ECONOMÍA “ANÁLISIS DE LOS DATOS CUANTITATIVOS”

Transcript of ANALISIS DE DATOS CUANTITATIVOS diapos.pdf

  • DOCENTE: Dra. Maria Cecilia Zavaleta Lpez INTEGRANTES: Alva Lazo, Simone Anticona Ibaez, Rolan Blas Ortega, Yescenia Correa Lozada, Ana Finochetti Romero, Julio Florian Alvarez, Marli Gutierrez Cruzado, Deivy

    UNIVERSIDAD NACIONAL DE TRUJILLOFACULTAD DE CIENCIAS ECONMICAS

    ESCUELA DE ECONOMA

    ANLISIS DE LOS DATOS CUANTITATIVOS

  • Qu procedimiento se sigue para analizar cuantitativamente los datos?

    Una vez que los datos se han codificado, transferido a una matriz, guardado en un archivo y limpiado de errores, el investigador procede a analizarlos.

    En la actualidad, el anlisis cuantitativo de los datos se lleva a cabo por computadora u ordenador.

  • Pasos para el procedimiento para analizar los datos:1 Seleccionar un programa estadstico 2 Ejecutar el programa: SPSS, Minitab, Stats, SAS u otro equivalente. 3 Explorar los datos: 4 Evaluar la confiabilidad y validez logradas por el o los instrumentos de medicin. 5 Analizar mediante pruebas estadsticas las hiptesis planteadas 6 Realizar anlisis adicionales. 7 Preparar los resultados para presentarlos (tablas, grficas, cuadros, etctera).

  • PASO 1: SELECCIONAR UN PROGRAMA DE ANLISIS Existen diversos programas para analizar datos. Los programas ms importantes: - SPSS: Statistical Package for the Social Sciences - MINITAB: Es un paquete que goza de popularidad por su

    relativamente bajo costo. Incluye un considerable nmero de pruebas estadsticas, y cuenta con un tutorial para aprender a utilizarlo y practicar; adems, es muy sencillo de manejar.

    - SAS: Statistica Analysys Sistem- Sistema de Anlisis Estadstico - Stacts: paquete estadstico

  • PASO 2: EJECUTAR EL PROGRAMA

    En el caso de SPSS y Minitab, ambos paquetes son fciles de usar, pues lo nico que hay que hacer es solicitar los anlisis requeridos seleccionando las opciones apropiadas.

  • PASO 3: EXPLORAR LOS DATOSEn esta etapa, inmediata a la ejecucin del programa, se inicia el anlisis. Cabe sealar que si hemos llevado a cabo la investigacin reflexionando paso a paso, esta etapa es relativamente sencilla, porque:

    formulamos la pregunta de investigacin que pretendemos contestar, visualizamos un alcance (exploratorio, descriptivo, correlacional y/o

    explicativo), establecimos nuestras hiptesis (o estamos conscientes de que no las

    tenemos), definimos las variables, elaboramos un instrumento (conocemos qu tems miden qu variables y

    qu nivel de medicin tiene cada variable: nominal, ordinal, de intervalos o razn) y recolectamos los datos.

  • Apunte 2 El nivel de medicin de las variables. La manera como se hayan formulado las hiptesis. El inters del investigador.

  • Estadstica descriptiva para cada variable La primera tarea es describir los datos, los valores o las

    puntuaciones obtenidas para cada variable. Esto se logra al describir la distribucin de las puntuaciones o

    frecuencias de cada variable.

  • Qu es una distribucin de frecuencias? Una distribucin de frecuencias es un conjunto de

    puntuaciones ordenadas en sus respectivas categoras y generalmente se presenta como una tabla.

  • Qu otros elementos contiene una distribucin de frecuencias? Las distribuciones de frecuencias pueden completarse

    agregando los porcentajes de casos en cada categora, los porcentajes vlidos y los porcentajes acumulados.

  • De qu otra manera pueden presentarse las distribuciones de frecuencias? Las distribuciones de frecuencias, especialmente cuando

    utilizamos los porcentajes, pueden presentarse en forma de histogramas o grficas de otro tipo.

  • Las distribuciones de frecuencias tambin se pueden graficar como polgonos de frecuencias Los polgonos de frecuencias relacionan las puntuaciones con

    sus respectivas frecuencias. Es ms bien propio de un nivel de medicin por intervalos o

    razn. Los polgonos se construyen sobre los puntos medios de los

    intervalos. Los polgonos de frecuencias representan curvas tiles para

    describir los datos. Nos indican hacia dnde se concentran los casos en la escala de la variable; ms adelante se hablar de ello.

  • Cules son las medidas de tendencia central? Las medidas de tendencia central son puntos en una

    distribucin obtenida, los valores medios o centrales de sta, y nos ayudan a ubicarla dentro de la escala de medicin. Las principales medidas de tendencia central son tres: moda,

    mediana y media. El nivel de medicin de la variable determina cul es la medida

    de tendencia central apropiada para interpretar.

  • La moda es la categora o puntuacin que ocurre con mayor frecuencia. Se utiliza con cualquier nivel de medicin. La mediana es el valor que divide la distribucin por la mitad.

    Esto es, la mitad de los casos caen por debajo de la mediana y la otra mitad se ubica por encima de sta. La media es la medida de tendencia central ms utilizada y

    puede definirse como el promedio aritmtico de una distribucin.

  • Cules son las medidas de la variabilidad? Las medidas de la variabilidad indican la dispersin de los

    datos en la escala de medicin y responden a la pregunta: dnde estn diseminadas las puntuaciones o los valores obtenidos? Las medidas de tendencia central son valores en una

    distribucin y las medidas de la variabilidad son intervalos que designan distancias o un nmero de unidades en la escala de medicin. Las medidas de la variabilidad ms utilizadas son rango,

    desviacin estndar y varianza.

  • La varianza

    Desviacin estndar elevada al cuadrado y se s imbol iza s2. Es un concepto estadstico muy importante, ya que muchas de las pruebas cuantitativas se fundamentan en l.

  • La Asimetra

    Es una estadstica necesaria para conocer cunto se parece nuestra distribucin a una distribucin terica llamada curva normal.

    Si es cero (asimetra = 0), la curva o distribucin es simtrica.

    Cuando es positiva, quiere decir que hay ms valores agrupados hacia la izquierda de la curva.

    Cuando es negativa, significa que los valores tienden a agruparse hacia la derecha de la curva.

  • La Curtosis

    La curtosis es un indicador de lo plana o picuda que es una curva.

    Cuando es cero (curtosis = 0), significa que puede tratarse de una curva normal.

    Si es positiva, quiere decir que la curva, la distribucin o el polgono es ms picuda(o) o elevada(o).

    Si la curtosis es negativa, indica que es ms plana la curva.

  • Puntuaciones z

    Transformaciones que se pueden hacer a los valores o las puntuaciones obtenidas, con el propsito de analizar su distancia respecto a la medida, en unidades de desviacin estndar.

    Nos indica la direccin y el grado en que un valor individual obtenido se aleja de la media, en una escala de unidades de desviacin estndar.

  • Razones y Tasas

    Una razn e a relacin entre 2 categoras.

    Una tasa es la relacin entre el nmero de casos, frecuencias, o evento de una ca tego r a y e l nmero to ta l de observaciones, multiplicada por un mltiplo de 10, generalmente 100 a 1000.

  • Paso 4: evaluar la confiabilidad o fiabilidad y validez lograda por el

    instrumento de medicin.

  • La confiabilidad se calcula y evala para todo el instrumento de medicin utilizado, o bien, si se administraron varios instrumentos, se determina para cada uno de ellos.

  • Medida de estabilidad (confiabilidad por test-retest)

    Un mismo instrumento de medicin se aplica dos o ms veces a un mismo grupo de personas, despus de cierto periodo.

    Si la correlacin entre los resultados de las diferentes aplicaciones es altamente positiva, el instrumento se considera confiable.

  • Mtodo de formas alternativas o paralelas.

    No se administra el mismo instrumento de med i c i n , s i n o do s o m s v e r s i one s equivalentes.

    Las versiones son similares en contenido, instrucciones, duracin y otras caractersticas, y se administran a un mismo grupo de personas simultneamente o dentro de un periodo relativamente corto.

    El instrumento es confiable si la correlacin entre los resultados de ambas administraciones es positiva de manera significativa.

  • Mtodo de mitades partidas (split-halves)

    Necesita slo una aplicacin de la medicin.

    El conjunto total de tems o reactivos se divide en dos mitades equivalentes y se comparan las puntuaciones o los resultados de ambas.

    Si el instrumento es confiable, las puntuaciones de las dos mitades deben estar muy correlacionadas.

  • Medidas de coherencia o consistencia interna

    stos son coeficientes que estiman la confiabilidad: a) El alfa de Cronbach (desarrollado por J. L.

    Cronbach) b) Los coeficientes KR-20 y KR-21 de Kuder y

    Richardson (1937).

    El mtodo de clculo en ambos casos requiere una sola administracin del instrumento de medicin.

  • La validez

    La validez del contenido se obtiene al asegurarse que las dimensiones medidas por el instrumento sean representativas del universo o dominio de dimensiones de la(s) variable(s) de inters.

  • Hasta aqu llegamos?

    Cuando el estudio tiene una finalidad puramente exploratoria o descriptiva, debemos interrogarnos: podemos establecer relaciones entre variables? En

    caso de una respuesta positiva, es factible seguir; pero si dudamos o el alcance se limit a explorar y describir, el trabajo de anlisis concluye y

    debemos comenzar a preparar el reporte de la investigacin. De lo contrario es necesario continuar con la estadstica inferencial.

  • 5) Analizar mediante pruebas estadsticas las hiptesis planteadas (anlisis estadstico inferencial)

    Recoleccin de datos en la muestra

    Clculo de estadgrafos

    Inferencia de los parmetros mediante tcnicas estadsticas

    apropiadas

    Poblacin o universo

  • Para qu es til la estadstica inferencial?

    a) Probar hiptesis poblacionales b) Estimar parmetro

  • En qu consiste la prueba de hiptesis?

    Esta determina si la hiptesis poblacional es congruente con los datos obtenidos en la muestra.

    Una hiptesis se retiene como un valor aceptable del parmetro, si es consistente con los datos. Si no lo es, se rechaza (pero los datos no se descartan

  • Qu es una distribucin muestral?

    Una distribucin muestral es un conjunto de valores sobre una estadstica calculada de todas las muestras posibles de determinado tamao de una poblacin.

  • Ejemplo de Distribucin Muestral:Una empresa elctrica fabrica focos que tienen una duracin que se distribuye aproximadamente en forma normal, con media de 800 horas y desviacin estndar de 40 horas. Encuentre la probabilidad de que una muestra aleatoria de 16 focos tenga una vida promedio de menos de 775 horas.

    800

    0.0062

    775

  • Interpretacin:

    Este valor se busca en la tabla de z:

    P ( 775 ) = P ( z -2.5 ) = 0.0062

    La interpretacin sera que la probabilidad de que la media de la muestra de 16 focos sea menor a 775 horas es de 0.0062.

  • Qu es el nivel de significancia?

    Es un nivel de la probabilidad de equivocarse y que fi ja de manera a priori el investigador. Obtiene una estadstica en una muestra (por ejemplo, la

    media) y analiza qu porcentaje tiene de confianza en que dicha estadstica se acerque al valor de la distribucin muestral (que es el valor de la poblacin o el parmetro).

  • Con qu porcentaje de confianza el investigador generaliza, para suponer que tal cercana es real y no por un error de muestreo? Existen dos niveles convenidos en ciencias sociales:

    a) El nivel de significancia de 0.05, el cual implica que el investigador tiene 95% de seguridad para generalizar sin equivocarse y slo 5% en contra. En trminos de probabilidad, 0.95 y 0.05, respectivamente; ambos suman la unidad.

    b) El nivel de significancia de 0.01, el cual implica que el investigador tiene 99% en su favor y 1% en contra (0.99 y 0.01 = 1.00) para generalizar sin temor.

  • DISTRIBUCION NORMAL:

  • Cmo se relacionan la distribucin muestral y el nivel de significancia?

    Tomamos el nivel de significancia como un rea bajo la distribucin muestral, y depende de si elegimos un nivel de 0.05 o de 0.01. Es decir, que nuestro valor estimado en la muestra no se

    encuentre en el rea de riesgo y estemos lejos del valor de la distribucin muestral, que insistimos es muy cercano al de la poblacin. As, el nivel de significancia representa reas de riesgo o

    confianza en la distribucin muestral.

  • Se pueden cometer errores al probar hiptesis y realizar estadstica inferencial?

    Aceptar una hiptesis verdadera (decisin correcta) Rechazar una hiptesis falsa (decisin correcta) Aceptar una hiptesis falsa (conocido como error del Tipo II o

    error beta) Rechazar una hiptesis verdadera (conocido como error del

    Tipo I o error alfa)

  • Prueba de hiptesis:Hay dos tipos de anlisis estadsticos que pueden realizarse para probar hiptesis, cada tipo posee sus caractersticas y presuposiciones que lo sustentan:

    Los anlisis paramtricos Los anlisis no paramtricos

  • Tamao del efecto

    El hallazgo de efectos estadsticamente significativos (cuando se rechaza la Hiptesis Nula) pueden ser irrelevantes cuando son de baja magnitud, lo que puede ocurrir cuando las muestras son bastante grandes.

  • Qu es la prueba de diferencia de proporciones?

    En algunos diseos de investigacin, el plan muestral requiere seleccionar dos muestras independientes, calcular las proporciones mustrales y usar la diferencia de las dos proporciones para estimar o probar una diferencia entre las mismas.

  • Qu es el anlisis de varianza unidireccional o de un factor?

    La tcnica del Anlisis de la Varianza (ANOVA o AVAR) es una de las tcnicas ms utilizadas en los anlisis de los datos de los diseos experimentales. Se utiliza cuando queremos contrastar ms de dos medias, por lo que puede verse como una extensin de la prueba t para diferencias de dos medias. El ANOVA es un mtodo muy flexible que permite construir modelos estadsticos para el anlisis de los datos experimentales cuyo valor ha sido constatado en muy diversas circunstancias.

    (Valor observado) = (efectos atribuibles) + (efectos no atribuibles o residuales)

  • Estadstica Multivariada:

    Unvector aleatorioes un vector formado por una o ms var iab les a leator ia s esca la res . La estadstica multivariante se ocupa de los vectores aleatorios que tienen aplicaciones en muchas ciencias y tcnicas. Podemos destacar entre ellas la econometra y la taxonoma.

  • En losmtodos estadsticos multivariantesse pueden sintetizar dos objetivos claros:

    Proporcionar mtodos cuya finalidad es el estudio conjunto de datos multivariantes que el anlisis estadstico uni y bidimensional es incapaz de conseguir. Ayudar al analista o investigador a tomar decisiones ptimas en

    el contexto en el que se encuentre teniendo en cuenta la informacin disponible por el conjunto de datos analizado.

  • Anlisis no Paramtricos:

    Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de probabilidad para los datos, por ello se conocen tambin como de distribucin libre (distribution free). En la mayor parte de ellas los resultados estadsticos se derivan nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es de fcil comprensin.

  • Cules son las presuposiciones de la estadstica no paramtrica?

    La distribucin poblacional de la variable dependiente es normal. El nivel de medicin de la variable dependiente es por

    intervalos o razn. Cuando dos o ms poblaciones son estudiadas, stas tienen una

    variable homognea.

  • Cules son los mtodos o las pruebas estadsticas no paramtricas mas usadas?

    Prueba t. Prueba de contraste de la diferencia de proporciones. Anlisis de la varianza unidireccional. (ANOVA) Anlisis de la variable factorial. (ANOVA) Anlisis de covarianza. (ANOVA) Coeficiente de Correlacin de Pearson y la regresin lineal.

  • Qu es la chi cuadrada o 2?

    Es una prueba estadstica para evaluar hiptesis acerca de la relacin entre dos variables categricas.

    Se simboliza: 2.

    Hiptesis a probar: Correlacionales

  • Qu son los coeficientes de correlacin e independencia para tabulaciones cruzadas?

  • Qu otra aplicacin tienen las tablas de contingencia?

    Las tablas de contingencia, adems de servir para el clculo de chi cuadrada y otros coeficientes, son tiles para describir conjuntamente dos o ms variables. Esto se efecta al convertir las frecuencias observadas en frecuencias relativas o porcentajes. En una tabulacin cruzada puede haber tres tipos de porcentajes respecto de cada celda.

    Porcentaje en relacin con el total de frecuencias observadas (N o n de muestra).

    Porcentaje en relacin con el total marginal de la columna.

    Porcentaje en relacin con el total marginal del rengln.

  • Otros coeficientes de correlacin

    Los coeficientes rho de Spearman, simbolizado

    como rs, y tau de Kendall, simbolizados como t, son medidas de correlacin

    para variables en un nivel de medicin ordinal

    (ambas), de tal modo que los individuos u objetos de

    la muestra pueden ordenarse por rangos

    (jerarquas).

  • Otros coeficientes de correlacin

  • Una vista general a los procedimientos o pruebas estadsticas

  • Paso 6: realizar anlisis adicionales

    Este paso implica simplemente que una vez realizados nuestros anlisis, es posible que decidamos efectuar otros

    anlisis o pruebas extra para confirmar tendencias y evaluar los datos desde diferentes ngulos. Por ejemplo, podemos en una tabla de contingencia calcular primero chi cuadrada y luego phi, lambda, T de Cramer (C) y el coeficiente de contingencia. O despus de un ANOVA, efectuar los contrastes posteriores que consideremos apropiados. Resulta este paso un momento clave para

    verificar que no se nos haya olvidado un anlisis pertinente. En esta etapa regularmente se eligen los

    anlisis multivariados.

  • Paso 7: preparar los resultados para presentarlos

    Se recomienda, una vez que se obtengan los resultados de los anlisis estadsticos (tablas, grficas, cuadros, etc.), las siguientes actividades; sobre todo para quienes se inician en la investigacin: 1. Revisar cada resultado [anlisis general anlisis especfico valores

    resultantes (incluida la significancia) tablas, diagramas, cuadros y grficas]. 2. Organizar los resultados (primero los descriptivos, por variable del estudio; luego

    los resultados relativos a la confiabilidad y la validez; posteriormente los inferenciales, que se pueden ordenar por hiptesis o de acuerdo con su desarrollo).

    3. Cotejar diferentes resultados: su congruencia y en caso de inconsistencia lgica volverlos a revisar. Asimismo, se debe evitar la combinacin de tablas, diagramas o grficas que repitan datos. Por lo comn, columnas o fi las idnticas de datos no deben aparecer en dos o ms tablas. Cuando ste es el caso, debemos elegir la tabla o elemnto que ilustre o refleje mejor los resultados y sea la opcin que presente mayor claridad. Una buena pregunta en este momento del proceso es: qu valores, tablas, diagramas, cuadros o grficas son necesarias?, cules explican mejor los resultados.

  • Se recomienda, una vez que se obtengan los resultados de los anlisis estadsticos (tablas, grficas, cuadros, etc.), las siguientes actividades; sobre todo para quienes se inician en la investigacin: 4. Priorizar la informacin ms valiosa (que es en gran parte resultado de la actividad

    anterior), sobre todo si se van a producir reportes ejecutivos y otros ms extensos. 5. Copiar y/o formatear las tablas en el programa con el cual se elaborar el reporte de la

    investigacin (procesador de textos o uno para presentaciones, como Word o Power Point). Algunos programas como SPSS y Minitab permiten que se transfieran los resultados (tablas, por ejemplo) directamente a otro programa (copiar y pegar). Por ello, resulta conveniente usar una versin del programa de anlisis que est en el mismo idioma que se emplear para escribir el reporte o elaborar la presentacin. Aunque, de no ser as, el texto de las tablas y grfi cas puede modificarse, nicamente es ms tardado.

    6. Comentar o describir brevemente la esencia de los anlisis, valores, tablas, diagramas, grficas.

    7. Volver a revisar los resultados. 8. Y, finalmente, elaborar el reporte de

    investigacin.

  • CONCLUSIONES El anlisis cuantitativo de los datos se efecta mediante la

    matriz de datos, la cual est guardada como archivo. El tipo de anlisis o pruebas estadsticas depende del nivel de

    medicin de las variables, las hiptesis y el inters del investigador.

    Los principales anlisis estadsticos que pueden hacerse son: estadstica descriptiva para cada variable (distribucin de frecuencias, medidas de tendencia central y medidas de la variabilidad), la transformacin a puntuaciones z, razones y tasas, clculos de estadstica inferencial, pruebas paramtricas, pruebas no paramtricas y anlisis multivariados.