Nazira Calleja. Estadística Propósito del análisis estadístico Poner orden en el caos para: ...

42
Características de las distribuciones estadísticas Nazira Calleja

Transcript of Nazira Calleja. Estadística Propósito del análisis estadístico Poner orden en el caos para: ...

Tratamiento de los datos

Caractersticas de las distribuciones estadsticasNazira Calleja1EstadsticaPropsito del anlisis estadsticoPoner orden en el caos para:Comunicar de manera clara y concisa un conjunto de datos.Obtener bases para la toma de decisiones.2Distribucin de datosEstado civilPorcentajeSoltero16.7Casado68.8Divorciado10.4Viudo4.2Total100.0Resumen de la frecuencia de los valores individuales de una variable.Ejemplo:Enumera cada valor o grupo de valores de una variable y el nmero y/o porcentaje de las personas que tienen ese valor.Estado civilFrecuenciaSoltero8Casado33Divorciado5Viudo2Total48Tabla 1. Distribucin de frecuenciasdel estado civil de los participantesTabla 2. Distribucin porcentualdel estado civil de los participantes3Grficas

Grfica de barrasHistogramaFig. 1. Distribucin porcentual de la escolaridad del padre.Fig. 2. Edad en aos de los participantes.4Grficas

Polgono de frecuenciasFig. 3. Puntajes obtenidos por los participantes en el subtest de Informacin general del WISC.5Grficas

Diagrama de cajas y bigotes

6Medidas descriptivasTendencia centralIndican valores con respecto a los que los datos parecen agruparseModoMedianaMediaDispersinIndican la mayor o menor concentracin de los datos con respecto a las medidas de tendencia centralRangoRango semiintercuartilarDesviacin estndarVarianzaPosicinDividen un conjunto ordenado de datos en grupos con la misma cantidad de individuosCuartilesDecilesPercentilesFormaComparan la forma que tiene la representacin grfica con la distribucin normal.Asimetra o sesgoCurtosis o apuntamiento7Poblacin y muestraPOBLACINMUESTRAEl universo de todoslos casosUn subconjunto de una poblacinParmetrosEstadsticosLetras griegas(, , )Letras latinas( , s, r).

8EstudiantePuntajeClaudia15Vicky20Carlos23Silvia23Alejandro34Memo15Lupita25Karina15Andrea16Ejemplo: EstudiantePuntaje1152203234235346157258159169PuntajeCasos(Frecuencias)151151151161201231231251341PuntajeFrecuencias153161201232251341Distribucin de frecuencias10Porcentajes y porcentajes acumuladosPuntajef%% acum15111.111.115111.122.215111.133.316111.144.420111.155.523111.166.623111.177.725111.188.834111.1100.0Puntajef%% acum15333.333.316111.144.420111.155.523222.277.725111.188.834111.1100.011Medidas de tendencia centralEstimacin del "centro" de una distribucin de valores.

ModoMedianaMedia

SPSS: Analizar Estadsticos descriptivos Frecuencias - Estadsticos12Modo o modaValor que ocurre con ms frecuencia en el conjunto de puntajes.

MoEn algunas distribuciones hay ms de un valor modal. Cuando hay dos valores con igual frecuencia,la distribucin se denomina bimodal.Es el dato que ms se repite.13Puntajef153161201232251341Modo o moda: Valor que ocurre con ms frecuencia en el conjunto de puntajes.ModoCmputo: Enlistar todos los puntajes en orden numrico y contar el nmero de casos en cada puntaje.Mo = 1514MedianaPuntaje que se encuentra exactamente en el centro del conjunto de valores.

10 12 14 16 18 20 22Mdn = 16

Md Me MdnEs el dato que ocupa la posicin central en un conjunto ordenado de datos.15Mediana

MedianaCmputo: Enlistar todos los puntajes en orden numrico (de menor a mayor) y localizar el puntaje que divide a la distribucin en dos partes iguales(50% arriba y 50% abajo).

Puntajef% acum15111.115122.215133.316144.420155.523166.623177.725188.8341100.04450%Mdn = 2016

Posicin de la

Si el nmero de datos (n) es impar, la mediana es el dato que ocupa la posicin central.

Puntaje1011121418Si el nmero de datos (n) es par, la mediana es el promedio de los dos datos centrales.Puntaje101112141823

17EstudiantePuntaje115220323423534615725815916Suma186Media o promedio

Cmputo: sumar los puntajes y dividirles entre el nmero de casos.Ejemplo: Puntajes obtenidos por 9 estudiantes en un examen:Media = 186 / 9 = 20.6618Media

Media = 186 / 9 = 20.66Puntajexff (x)153451611620120232462512534134Total9186Xi (del i simo caso) = Xi1..Xin19Medidas de dispersinDispersinVariabilidad de los valores alrededor de la tendencia central.

RangoRango intercuartilarVarianzaDesviacin estndar

SPSS: Analizar Estadsticos descriptivos Frecuencias - Estadsticos20Medidas de dispersinPuntaje151515162023232534Rango. Distancia entre los dos puntajes extremos.

Cmputo: Valor ms alto menos valor ms bajo + 1.

Ejemplo:Valor ms alto: 34Valor ms bajo: 15Rango: 34 15 + 1= 20VentajasDesventajasFcil de computarFcil de entenderPuede usarse con datos de rango y cuantitativosEs inestable (los puntajes extremos pueden exagerar el rango)Su cmputo involucra slo dos puntajes, no la distribucin completa21Desviacin estndar:Medida de dispersin ms exacta y detallada.Muestra la relacin que un grupo de valores tiene con la media.Es la distancia promedio de los puntajes con respecto a la media. Ayuda a crear una representacin ms exacta de la distribucinDesviacin estndar pequeaDesviacin estndar grandeGrupo de datos donde los puntajes estn muy cerca del valor de la media; existe poca variacin; corresponde a un rango pequeoGrupo de datos con ms variacin; gran diferencia entre los puntajes; corresponde a un rango grande22Clculo

S = desviacin estndar = suma deX = puntaje individualM = media de todos los puntajesn = tamao de la muestra (nmero de puntajes)[n-1 porque se calcula para una muestra,no para la poblacin] Ejemplo:En una distribucin con una media de 80 y una desviacin estndar de 10, la dispersin ser mucho mayor que si la desviacin es de 2.23XMX-M

(X-M)21520.66-5.6633.041520.66-5.6633.041520.66-5.6633.041620.66-4.6621.722020.66-0.660.442320.662.345.482320.662.345.482520.664.3418.843420.6613.34177.950351.39351.39 / 9 1 = 84.1 Varianza 84.1 = 9.17 Desviacin estndarNtese que los valores que se encuentran abajo de la media tienen discrepancias negativas y los que estn arriba de la media las tienen positivas.24Medidas de posicinCuartilesDecilesCentilesSPSS: Analizar Estadsticos descriptivos Frecuencias - Estadsticos25Medidas de posicin

CuartilesDividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos.De la misma manera en que la mediana divide a la distribucin en dos partes iguales (50% debajo de ese puntaje y 50% arriba), los cuartiles la dividen en cuatro partes iguales (del 25% cada una).Son tres y se denotan: Q1, Q2 y Q3La Mdn y el Q2 coinciden en el mismo valor.26Medidas de posicinDeciles

Dividen a la distribucin en diez partes iguales (del 10% cada una).Son 9 y e le denotan D1, D2,..., D9. El decil 5 coincide con la Mdn en el mismo valor.27Centiles o percentiles

Dividen a la distribucin en cien partes iguales (del 1% cada una). Se utilizan en pruebas estandarizadas.Son 99 y se les denota P1, P2,...,P99.El percentil 50 coincide con la Mdn, con el Q2 y con el decil 5 en el mismo valor.

28Medidas de posicinPuntajems bajoQ1MdnQ2Q3Puntajems alto25%50%75%P25D5P50P75SPSS: Analizar Estadsticos descriptivos Frecuencias - EstadsticosQ = Cuartiles (3)D = Deciles (9)P = Percentiles o Centiles (99)29Medidas de dispersinPuntaje%% acum1511.111.11511.122.21511.133.31611.144.42011.155.52311.166.62311.177.72511.188.83411.1100.0Rango intercualtilar, RIQ. Distancia entre puntajesdel Q1 y Q3.

Cmputo: Valor del Q3 menos valor del Q1

Ejemplo:Q3: 23Q1 : 15Rango intercuartilar: 23 15 = 8Q1Q325%75%30GrficasDiagrama de cajas y bigotes (boxplot)Ejemplo:

Casox110421123134 41465155616871708195924610302113381241213678xf%% ac10417.7 7.711217.715.4134 17.723.114617.730.815517.738.516817.746.217017.753.819517.761.524617.769.230217.776.933817.784.641217.792.367817.7100.0Q1Q3Mdn50%25%75%31Grficas

Diagrama de cajas y bigotes (boxplot)Rango intercuartilar(50% de la distribucin)Lmite superior: Q3 X 1.5Lmite inferior: Q1 X 1.5 Atpicos extremos: < Q1 X 3Atpicos extremos: >Q3 X 3Atpicos medios: >Q3 X 1.5 y