Estadística Con Spss 2015 Repaso

50
ASIGNATURA: ESTADÍSTICA II Mg. Econ. Jean Paul Moreno

Transcript of Estadística Con Spss 2015 Repaso

UNIVERSIDAD DANIEL ALCIDES CARRIN

ASIGNATURA: ESTADSTICA II

Mg. Econ. Jean Paul MorenoALGUNOS SMBOLOS EN ESTADSTICAAlfaSigma minsculaBethaPhiGammaEpsilonThetaDelta LambdaRho muSigma Mayscula piQU ES ESTADSTICAAplicacin de la estadstica

SUB DIVISIONES DE LA ESTADSTICAESTADSTICA DESCRIPTIVAESTADSTICA INFERENCIALTRMINOS EN ESTADSTICADATOSCONSTANTEPARMETROPoblacin Estadgrafos o estadsticos

Muestra

NVARIABLEMEDICINESCALA DE MEDICINNOMINALORDINALINTERVALARRAZN O PROPORCINVariable: Es una propiedad, es una cualidad, es una caracterstica, es un atributo, que se asigna dos o ms valores, que tiende a variar, susceptible a una medicin. Una variable que no vara no es variable, es constante, ejemplos de variable: inteligencia, personalidad, motivacin de logro, hbitos acadmicos, frustracin, afectividad, desarrollo psicomotriz, aprendizaje, aptitud verbal, agresividad, liderazgo, condicin socio econmica, marginacin, trabajo juvenil, lugar de residencia, movilidad social, preferencias polticas, creencias religiosas, sexo, talla, edad, velocidad en la carrera, resistencia, velocidad, fuerza, estrategias cognitivas, mtodos didcticos, estrategias de aprendizaje, procesos de evaluacin, nivel de escolaridad, desercin, actitud hacia los estudiantes, creatividad, nivel profesional, estilos de liderazgo, inteligencia emocional, currculo, infraestructura fsica, equipamiento, laboratorios, tipo de gestin institucional, etc. Ejemplos de escala nominal, Sistema psiquitrico: esquizofrnica, paranoica, neurtica.Marcas de zapatilla: power, adidas, nike, zing, tayer.Los nmeros de los policas, tipos de casa, creencia religiosa, color de los ojos, marca de las bicicletas, sexo, tipos de gaseosas, marca de carros, das de la semana, nacionalidad, Ejemplos de escala ordinal: Estatus econmico, sistema de grados en el servicio militar, participantes en una maratn de acuerdo a la llegada, criterios de calificacin en el nivel inicial, grados de estudio en el nivel primario, la escala de Likert, las categoras en el docente universitario, niveles en el docente peruano.Ejemplos de escala intervalar: La escala vigesimal, la escala centesimal, puntajes de algunos test estandarizados, las escalas de Celsius y Fahrenheiit.Ejemplos de escala de razn o proporcin: La masa, talla de las personas, nmero de hijos, nmero de bicicletas, nmero de carros, nmero de palomas, escala de onzas y libras, REDONDEOPORCENTAJE

TABLA DE FRECUENCIA criteriosAprobadosDesaprobadosTotalAsignaturani%ni%Metodologa157552520Gestin de proyectos189021020Gerencia201000020Mtodos estadsticos178531520Total701080Tabla N 01Resumen de estudiantes aprobados y desaprobadosFuente: actas promocionalesGrfica N 01Estudiantes aprobados y desaprobadosInterpretacin: la barra ms alta corresponde a la asignatura de gerencia, considerando los estudiantes aprobados, seguidamente le sigue la barra de la asignatura de gestin de proyectos, mtodos estadsticos y metodologa; por otro lado en cuanto a los desaprobados se observa que la barra ms alta resulta en la asignatura de metodologa, luego mtodos estadsticos y finalmente gestin de proyectos . Ejemplo sobre el estado civil de los estudiantes de educacin fsica

solterocasadosolterosolterocasadodivorciadosolterocasadodivorciadosolterocasadosolterosolterocasadoseparadosolterosolterocasadosolterosolteroAnalizar - estadsticos descriptivos- frecuencias de la ventana de la izquierda pasa a la derecha grficos - grficos en barras continuar y aceptar. (aparece la tabla de frecuencia y la grfica)MEDIDAS DE CENTRALIZACINMediana Media Aritmtica o promedio

Moda

MEDIA O PROMEDIO:Es el valor promedio de un conjunto de datos, es decir es la suma de los valores observados de la variable dividido por el total de observaciones.

MEDIANALa mediana, es el valor que divide a una distribucin de datos en dos partes iguales. Cada parte equivale el 50%.

MODAEs el valor de mayor frecuencia en una distribucin de datos. Cuando una distribucin de datos posee una moda se denomina unimodal, dos modas bimodal, tres modas tri modal, cuatro ms modas, multimodal

MEDIDAS DE DISPERSINDesviacin media (D.M)Rango

Varianza S2x

Desviacin Tpica SxCoeficiente de Variacin (C.V.)

RANGO O RECORRIDOEs la diferencia entre los valores mximo y mnimo con respecto a la variable.VARIANZAEs el estadgrafo de dispersin ms importante y expresa el grado de dispersin de las observaciones respecto a la media aritmtica. El valor de la varianza no puede ser negativa y cero slo es cuando todas las observaciones son las mismas.DESVIACIN TPICA O ESTNDAREs una medida de dispersin ms confiable, sirve para determinar la normalidad de una distribucin de los datos alrededor de la media aritmtica, dentro de los valores extremos mximo y mnimo.Por otro lado la desviacin tpica mide la variacin entre los puntajes. Si los puntajes estn muy juntas el valor de la desviacin tpica es pequea; pero si estn separadas entonces el valor de la desviacin tpica es mayor.COEFICIENTE DE VARIACINExpresa de manera relativa la dispersin, midiendo el peso de la desviacin estndar comparado con la media. Si el coeficiente de variacin es menor al 10% , entonces la distribucin tiene poca dispersin y se confa en la media como medida de centralidad y tratarla como representativa de los datos que resumeSea un conjunto de atletas cuyos pesos son los siguientes5456575557585657535259575658575659575857Determinar los siguientes estadsticos: media, mediana, moda, varianza, desviacin tpica, valor mximo, valor mnimo.

Analizar estadsticos descriptivos frecuencias estadsticos continuar - aceptar

Determine:xMeMoSSC.V.

6. Realizar grfica de tallo y hojas con los siguientes datos:23183179445124191725271944612218141729312217154055161719203220455327161922201830203321TCNICASINSTRUMENTOS1. Observacin directaDiario de campoFichas de observacinFotografasFilmacionesCroquisPlanos2. La observacin indirectaDiario de campoFichas de observacinFotografasFilmacionesCroquisPlanos3. Entrevista:Estructuradas (cuantitativa)No estructuradasFormato de entrevistaDiario de campoGrabaciones magnetofnicasFilmaciones4. EncuestaCuestionarioDiario de campo5. FichajeLas fichas: tipos de fichas6. Evaluacin educativaPrueba objetiva7. Anlisis documental: libros; revistas, tesis, peridicos, documentos, actas, boletines, pelculas, fotografas, internet, Libreta de apuntes, fichas, cuadros sinpticos, Fotografas, filmaciones, fotocopias, croquis, planos, disquete, diapositiva, CD, casete.TCNICASINSTRUMENTOS8. Grupos focalesFormato de guaGrabaciones magnetofnicasc) Registro de apuntesd) Gua de discusinANECDOTARIO Y FICHA ANECDTICALa ficha es, simplemente, una cartulina en la que se van anotando acontecimientos, incidentes significativos y relevantes con relacin a la persona. Lo ms importante del registro de una ancdota es separar el hecho de la opinin o interpretacin del mismo.El anecdotario no es ms que un archivo o fichero de ancdotas sobre un mismo sujeto o bien sobre una conducta particular del sujeto, que est siendo objeto de observacin.

Estudiante: Asignatura:Fecha: Hora:Descripcin del hecho:Comentario:

Observador: ANVERSO REVERSOLISTA DE CONTROLEst definida por la enumeracin de una serie de conductas cuya presencia o ausencia en un grupo de personas se desea constatar. El observador slo debe marcar con una cruz (X) si el hecho se da o no se da durante un perodo de observacin definido. No hay comentario alguno sobre la conducta, ni apreciacin del grado en que se da no se da.Ejemplo:Conducta del estudiante antes y durante la realizacin de sus trabajos.Estudiante:Materia o tarea:Fecha de este registro

SiNoDudosoReceptividad:Se hace cargoActitud de aperturaAtencin selectivaRealizacinEstabilidad emocionalCoherenciaInters en la tareaBuenas relaciones con el grupoCUESTIONARIOes una lista o repertorio de preguntas, formuladas por escrito, a las que el sujeto puede responder. Las preguntas pueden ser cerradas o abiertas. La administracin o aplicacin de los cuestionarios puede ser muy variada: en grupos pequeos o grandes y de forma presencial o bien por correo o por algn otro sistema que no exija realizarlo en presencia de los aplicadores. Ejemplo de instrumento de actitudes hacia el trabajoNItemsNunca

1Casi nunca2A veces

3Casi siempre4Siempre

51Debido a mi trabajo me siento emocionalmente agotado.2Al final de la jornada me siento agotado.3Me siento desgastado por el trabajo.4Me siento frustrado por mi trabajo.5He realizado muchas cosas que merecen la pena en este trabajo.6En el trabajo siento que estoy al lmite de mis posibilidades.Las opciones de respuesta o categoras mediante la escala de Likert son las siguientes:Muy de acuerdoDe acuerdoNi de acuerdo, ni en desacuerdoEn desacuerdoMuy en desacuerdoTotalmente de acuerdoDe acuerdoNeutralEn desacuerdoTotalmente en desacuerdoSiempreLa mayora de las veces sAlgunas veces s, algunas veces noLa mayora de las veces noNuncaCompletamente verdaderoVerdaderoNi falso, ni verdaderoFalsoCompletamente falsoDefinitivamente s Probablemente sIndecisoProbablemente noDefinitivamente noNo en lo absolutoUn pocoNeutralBastanteMuchoLa calificacin vara de 1 a 5 si el tem es positivo y de 5 a 1 si es negativoMUESTRA PROBABILSTICONO PROBABILISTICOTIPOS DE MUESTREO Azar o aleatoriaEstratificacinSistemticoConglomeracinIntencional o criterialParticipantes voluntariosMuestra de expertosMuestra por cuotas

Muestra intencional o criterialLa representatividad se da en base a una opinin o intencin particular de quien selecciona la muestra. Ejemplo si se desea realizar un estudio de las caractersticas de los nios de los pueblos jvenes, entonces la muestra seleccionada puede ser en base a la eleccin de un pueblo joven que es representativob) Muestra por participantes voluntariosSon aquellos individuos que voluntariamente acceden a participar en un estudio, respondiendo activamente a una invitacin.c) Muestra de expertosEs la participacin mediante opiniones de individuos expertos con respecto a un tema. Ejemplo , el perfil del contador pblico, entonces se recurre a una muestra considerable de contadores quienes opinan sobre el perfil correspondiente.d) Muestra por cuotasConsiste en un muestreo de que la muestra incluye un nmero mnimo de cada subgrupo especfico dentro de la poblacin. Distrito Porcentaje casa habitacinOlivos 20 120Surco 15 420San Borja 20 320

-10+1yxCorrelacin positiva perfecta yxCorrelacin negativa perfecta COEFICIENTE DE CORRELACINCORRELACIN

FORMULAS DE CORRELACIN:PRODUCTO - MOMENTO

FRMULA COMPUTACIONAL-10+1COEFICIENTE DE CORRELACININTERPRETACIN + 1,00Correlacin perfecta (+) (-) De + 0,90 a + 0,99Correlacin muy alta (+) (-)De + 0,70 a + 0,89Correlacin alta (+) (-)De + 0,40 a + 0,69Correlacin moderada (+) (-)De + 0,20 a + 0,39Correlacin baja (+) (-)De + 0,01 a + 0,19Correlacin muy baja (+) (-) 0Correlacin nula INTERPRETACIN DE LOS COEFICIENTES DE CORRELACIN-10+1Ejemplo: Sean las puntuaciones de los estudiantes de Educacin Fsica en las asignaturas de actividad fsica y vida saludable, determinar el coeficiente de correlacin de PearsonEstud.abcdefghiAct.fisX131110131415141213Vida saludableY1198111212121012Analizar correlaciones bivariadas Pearson - aceptar-10+1CONFIABILIDADSinnimo de confiabilidad son : estabilidad, fiabilidad, consistencia, reproductividad, predictibilidad . En consecuencia se define a la confiabilidad como la capacidad que posee un instrumento para obtener y entregar informacin idntica o similar sobre determinadas manifestaciones conductuales de un mismo individuo, indagadas en una o ms ocasiones.Es decir es el grado de estabilidad de la clasificacin de los individuos, realizada mediante algn procedimiento evaluativo que sea representativo del dominio conductual estudiado.ESCALAS DE VALORACIN DE LOS COEFICIENTES DE CONFIABILIDADConfiabilidad nulaDe 0,53 a menosConfiabilidad bajaDe 0,54 a 0,59ConfiabilidadDe 0,60 a 0,65Muy confiableDe 0,66 a 0,71ExcelenteDe 0,72 a 1,00Autor: Luis Damin en su libro evaluacin de capacidadesMtodos para determinar la confiabilidadConfiabilidad por test retestConsiste en administrarla misma prueba en una segunda ocasin al mismo grupo de personas. Luego se correlacionan los resultados obtenidos en las dos aplicaciones del test y el coeficiente as obtenido se denomina coeficiente de estabilidadPRUEBA APRUEBA A1ra aplicacin2da aplicacinPuntuacionesPuntuacionesr = coef. de estabilidadTiempob) Confiabilidad de la forma equivalente o alternativas o paralelaConsiste en administrarla a los sujetos dos instrumentos , de tal manera que se debe asegurar que ambas versiones realmente sean equivalentes: siendo muy importante que se debe abordar el mismo tipo de contenido, expresar los tems en la misma forma, con el mismo nivel de dificultad y presentar idntica extensin.PRUEBA APRUEBA B1ra aplicacin2da aplicacinPuntuacionesPuntuacionesr = coef. de estabilidadTiempoc) Confiabilidad por mitadesConsiste en aplicar una forma del test a un grupo de personas en una sola sesin y luego dividir la prueba en dos mitades comparable. Para ello se considera los temes pares y los temes impares como formas equivalentes, posteriormente de determina el coeficiente de correlacin con respecto a una mitad y este valor de reemplaza en la frmula de Spearman Brown.

Confiabilidad por Alfa de CronbachConsiste en aplicar el instrumento a un grupo de personas en una sola sesin luego se determina la varianza total, as mismo de halla la sumatoria de las varianzas iniciales y el total de los tems. Y de esta manera se obtiene el valor del coeficiente de fiabilidad.

Correlacin de rangos ordenados (coeficiente de Spearman)Destaca su utilidad cuando el nmero de pares de puntuaciones (n) que se desea asociar es pequeo (menor que 30). Por otro lado si hay pocos empates, el coeficiente de Spearman resulta el ms apropiado.

: sumatoria del cuadrado de la diferencia n: elementos de la muestra rs: coeficiente de correlacinSi el nmero de dichos pares es muy grande y cuando en las puntuaciones , es muy probable que se presenten muchos empates, entonces lo ms adecuado sera utilizar el coeficiente de correlacin de Pearson, es decir:

Ejemplo: Un conjunto de atletas participaron en las carreras de 100 metros planos y de 1000 metros planos, siendo el orden de llegada de la siguiente manera:. Atletasabcdefghij100 metros123456789101000 metros91087654123Analizar correlaciones bivariadas Spearman - aceptarCoeficiente (T)Tau de KendallEs adecuado como una medida de correlacin con la misma clase de datos, en tal sentido proporcionar una medida del grado de asociacin entre los dos conjuntos de rangos. El coeficiente T tambin es parcialrmente adecuado para evaluar el acuerdo entre jueces mltiples.

Donde:n = nmero de casos o sujetosP = suma de rangos ms altosQ = suma de rangos ms bajosA una muestra de estudio se aplic dos instrumentos, con respecto a inteligencia emocional y desempeo laboral en los docentes de educacin fsica.SujetosABCDEFGHIInt.emocional848078767064625047Desempeo laboral606471615857545552Analizar correlaciones bivariadas variables pasa de izquierda a derecha Tau de Kendall - aceptarDonde:fo = la frecuencia obtenida en cualquier casillafe = la frecuencia esperada en cualquier casilla = chi cuadrada o ji cuadrada

C: Coeficiente de contingenciax2: chi cuadrada o ji - cuadradan: total de datos

Coeficiente de contingencia (C)Es un coeficiente de correlacin para datos nominales colocados en una tabla de contingencia con un diseo mayor que 2 x 2. Con ste se trata de determinar el grado de asociacin, al comparar varios grupos o categoras.Para ello se determina el valor de la ji cuadrada o Chi cuadrada, luego se reemplaza en la frmula del coeficiente de contingencia:Ejemplo:Se considera una pequea muestra de docentes que participan en un programa de capacitacin, para quienes registramos los valores de las variables sexo y estado civilSexoEs.civilSexoEs.civilSexoEs.civilSexoEs.civilfemeninosolterofemeninoSolterofemeninosolterofemeninosolterofemeninosolteromasculinosolteromasculinocasadomasculinocasadomasculinosolteromasculinosolterofemeninocasadofemeninocasadoFemeninocasadofemeninocasadomasculinosolteromasculinosolteromasculinosolterofemeninosolterofemeninocasadomasculinosolteromasculinosolterofemeninosolterofemeninocasadomasculinosolteroDeterminar el coeficiente de contingencia entre sexo y estado civilSexoEstado civilTotalSolteroCasadoFemenino

Masculino7

96

213

11Total16824

Analizar estadsticos descriptivos tabla de contingencia pasa de ventana izquierda a derecha estadsticos coef, contingencia continuar - aceptarPASOS PARA LA CONTRASTACIN DE HIPTESISPasos para la contrastacin de hiptesis

Formulacin de hiptesis operacionalHo:Ha:2. Nivel de significancia3. Estadstico de prueba4 .Regin de aceptacin y rechazo5. Recoleccin de datos y clculos6. Decisin estadstica7. Conclusin estadsticaEjemplo:Copier Sales of Per vende copiadoras a empresas de todos tamaos en el Per. El Gerente decide reunir informacin sobre la relacin entre el nmero de llamadas de ventas y el nmero de copiadoras vendidas, de tal manera selecciona una muestra 10 representantes de ventas.Representantes de ventasLlamadas de ventasCopiadoras vendidasA2030B4060C2040D3060E1030F1040G2040H2050I2030G3070Regresin

Se refiere al procedimiento de obtener una ecuacin con fines de estimacin o prediccin. El trmino regresin lineal proviene de que existe una relacin proporcional directa (en lnea recta) entre las variables X y Y, de manera que conforme aumenta X tambin lo hace Y, o viceversa. Tal relacin se dice que es positiva. Por lo contrario, si a medida que se incrementa X, disminuye Y, la relacin se considera negativa.La ecuacin se denomina ecuacin de regresin y la lnea recta se denomina lnea de regresin

1. RECTA DE REGRESIN DE y SOBRE x

MNIMOS CUADRADOS

2. RECTA DE REGRESIN DE x SOBRE y

MNIMOS CUADRADOS

3. Mtodo computacinal para determinar los valores de a y b en una ecuacin de regresin.Prueba de la t de Student para un solo grupo

X : media aritmticaS : desviacin tpican : tamao de la muestrao : media poblacionalEn general: resulta til para probar una hiptesis de que la media de una poblacin, , es igual a un valor objetivo.Existe slo una variable. El nivel de medicin es de intervalo / razn.Hay una sola variable y una poblacin.El tamao de la muestra, n, es 121 o menos casos (aunque esta prueba se puede emplear para muestras mayores, se requiere cuando n es pequea).Hay un valor objetivo de la variable al cual podemos comparar la media de la muestra.

Prueba de la t de Student para datos apareados

d : media muestral de la diferenciaSd : desviacin tpica de la diferencian : tamao de la muestrad : promedio poblacional de la diferenciaEn general: se aplica para comprobar la hiptesis de que las puntuaciones de una variable de intervalo/ razn difieren dos puntos en el tiempo en el caso de los mismos individuos. Hay una poblacin con una muestra representativa de ella. Existen dos variables de intervalo/razn con el mismo diseo en sus puntuaciones, o una nica variable medida dos veces en los mismos individuos pertenecientes a la muestra. Hay un valor objetivo de la variable con el cual podemos comparar la media de la diferencia entre los dos conjuntos de puntuaciones (normalmente este valor objetivo ser cero para una prueba de no diferencias entre las dos puntuaciones)al cual podemos comparar la media de la muestra.

Vista variables tipo numrico analizar comparar medias prueba t para muestras relacionadas pasar de ventana izquierda a derecha - aceptarPrueba de la t de Student para dos muestras independientes con varianzas desconocidas y diferentes

Dos muestras son independientes si los valores muestrales seleccionados de una poblacin no estn relacionados, apareados o asociados de alguna manera con los valores muestrales seleccionados de la otra poblacin. Las desviaciones tpicas poblacionales se desconocen y no se hace una suposicin sobre la igualdad de dichas desviaciones tpicas poblacionales.Las dos muestras son aleatorias simples.Ambas muestras son independientes.Cualquiera o ambas de estas condiciones se satisfacen: los dos tamaos muestrales son grandes (con n1 >30 y n2 > 30) o ambas muestras provienen de poblaciones que tienen distribuciones normales en cada uno de los grupos. gl = el ms pequeo de n1 1 y n2 1.Prueba de la t de Student para dos muestras independientes con varianzas desconocidas y con suposicin de igualdad

El nmero de grados de libertad est dado por gl = n1+ n2 21.Se desconocen las dos desviaciones estndar poblacionales, pero se supone que son iguales.2. Las dos muestras son independientes.3. Ambas muestras son aleatorias simples4. Cualquiera o ambas de estas condiciones se satisfacen: los dos tamaos muestrales son grandes (con n1 >30 y n2> 30) o ambas muestras provienen de poblaciones que tienen distribuciones normales en cada uno de los grupos.

Aplicacin de la t de Student para dos muestras independientes G.E O1 X O2 -------------------------G.C O3 - O4

M1 -------------- O1

M2 --------------- O2

diseo de un estudio comparativo, con datos cuantitativosANALISIS DE VARIANZA (ANOVA)Es uno de los test estadstico ms ampliamente utilizados para probar la igualdad de ms de dos medias o promedios de la poblacin. Es decir : hiptesis: cuando se trata de comparar varias medias cabe la posibilidad de realizar comparaciones dos a dos utilizando por ejemplo el estadstico t de Student. Este procedimiento no es correcto.La frmula es:

Ho : 1 = 2 = 3 = 4 = 5 = k Ha: 1 2 3 4 5 k

Entre los usos ms frecuentes de las pruebas ANOVA se encuentran:El modelo de efectos fijos asume que los datos provienen de poblaciones normales las cuales podran diferir nicamente en sus medias.El modelo de efectos aleatorios asume que los datos describen una jerarqua de diferentes poblaciones cuyas diferencias quedan restringidas por la jerarqua.El modelo de efectos mixtos describen situaciones que ste puede tomar.Por otro lado los supuestos son los siguientes:La variable dependiente debe medirse al menos a nivel de intervalo.Independencia de las observaciones.La distribucin de los residuales debe ser normal.Homocedasticidad: homogeneidad de varianzas.