Unidad 3 Estadistica descriptiva

49
Unidad III.- Estadística descriptiva descriptiva Ricardo Ruiz de Adana Pérez

Transcript of Unidad 3 Estadistica descriptiva

Page 1: Unidad 3 Estadistica descriptiva

Unidad III.- Estadística descriptivadescriptiva

Ricardo Ruiz de Adana Pérez

Page 2: Unidad 3 Estadistica descriptiva

Conceptos de estadística

• N Población .- Conjunto de individuos u objetos sobre los cuales se desea conocer el comportamiento de las características de interés. Se utiliza la letra N para designar el numero de elementos de la población.elementos de la población.

• n Muestra .- Subconjunto o parte de la población sobre los que realizamos realmente las mediciones con la idea de obtener conclusiones que se generalizan a la población. Se utiliza la letra n para designar el numero de elementos de la muestra (p. ej., n = 56).

Page 3: Unidad 3 Estadistica descriptiva

Conceptos de estadística• Variable .- Característica que deseamos

conocer de un población.• Datos .- Valores de las variables que

medimos.medimos.• Muestreo .- Técnicas estadísticas que

permiten proporcionar una muestra representativa de la población y conocer el numero de elementos que tenemos que estudiar.

Page 4: Unidad 3 Estadistica descriptiva

Conceptos de estadística• Parámetro .- Medida que resume los datos obtenidos

sobre el conjunto de la población. Ejem: Media (µ), Desviación típica (σ)

• Estadístico .- Medida que resume los datos obtenidos sobre los elementos de una muestra. obtenidos sobre los elementos de una muestra. Ejem: Media (X), Desviación típica (S)

• Estimador .- Cuando un estadístico se utiliza para aproximarnos al valor de un parámetro, se le llama Estimador.

Page 5: Unidad 3 Estadistica descriptiva

Población Conjunto de individuos u objetos sobre el que se desea conocer

una/s característica/s

InferenciaMuestreo

MuestraSubconjunto de individuos u objetos realmente estudiados

InferenciaMuestreo

Page 6: Unidad 3 Estadistica descriptiva

Tipo de variables• Cualitativas.

– Miden una característica o “cualidad” que no se pueden representar numéricamente. (sexo, estado civil, profesión, nivel de estudios).

– Si solo tiene dos posibles valores se denominan – Si solo tiene dos posibles valores se denominan dicotómicas.

Page 7: Unidad 3 Estadistica descriptiva

Tipo de variables cualitativas

• Nominal: Los datos se ajustan a categorías que no tienen relación de orden entre sí (el sexo, la profesión el estado civil, presencia o no de una patología).

• Ordinal: Existe una jerarquía, una relación de orden entre las categorías (nivel de estudios, grado de satisfacción: mucho, normal, poco).

Page 8: Unidad 3 Estadistica descriptiva

Tipo de variables• Cuantitativas.

– Son aquellas cuyos valores pueden ser expresados numéricamente y esta numeración no es una simple codificación, sino que existe una correspondencia entre el valor de la variable y la correspondencia entre el valor de la variable y la representación numérica de la misma.

Page 9: Unidad 3 Estadistica descriptiva

Tipo de variables cuantitativas• Discretas: entre dos valores consecutivos no

podemos encontrar ningún otro valor (nº finito de valores: números naturales/enteros). Ej.: nª de hijos.

• Continuas: entre dos valores consecutivos • Continuas: entre dos valores consecutivos hay un número infinito de valores (números reales). Ej.: peso, talla.

Page 10: Unidad 3 Estadistica descriptiva

�Una variable cuantitativa debiera ser recogida como norma como cuantitativa, ya que aporta más información. Posteriormente pueden hacerse las categorizaciones o recodificaciones deseadas recodificaciones deseadas

Page 11: Unidad 3 Estadistica descriptiva

Descripción variables cualitativas

a)Frecuencia absoluta (fa) (Fa): número de veces que se ha observado el valor de cada categoría de la variable.

b)Frecuencia relativa (fr) (Fr): es la frecuencia b)Frecuencia relativa (fr) (Fr): es la frecuencia absoluta dividida por el número de casos estudiados (n) (N). Es sinónimo de probabilidad, y se expresa como proporción (x 100) o tanto por uno.

fr = fa / n Porcentaje = fr x 100

Page 12: Unidad 3 Estadistica descriptiva

• EJEMPLO .- En un servicio de traumatología con objeto de realizar una correcta planificación, interesa saber la localización de la patología en una muestra de 186 pacientes atendidos durante los últimos seis meses n=186

• La variable de interés es la zona afectada, es una variable cualitativa dividida en 5 modalidades (rodilla, cadera, tobillo, cráneo, otras).cadera, tobillo, cráneo, otras).ZONA AFECTADA fa fr %RODILLA 30 0.161 16.1CADERA 28 0.151 15.1TOBILLO 41 0.220 22.0CRÁNEO 34 0.183 18.3OTRAS 53 0.285 28.5TOTAL Σfa=186 Σfr=1

Page 13: Unidad 3 Estadistica descriptiva

Medidas descriptivas variables cuantitativas

� TENDENCIA CENTRAL

-MEDIA -MEDIANA -MODA

� DISPERSIÓN

-RANGO O AMPLITUD -VARIANZA -DESVIACIÓN ESTÁNDAR -COEFICIENTE DE VARIACIÓN -PERCENTILES

� FORMA

-COEFICIENTE DE ASIMETRÍA -COEFICIENTE DE KURTOSIS

Page 14: Unidad 3 Estadistica descriptiva

Media aritmética• Aquel valor que es “promedio” de todos los valores

de la variable, representa el centro de gravedad de la distribución.

• La media aritmética de los datos es la suma de los valores de una variable dividido por el número total valores de una variable dividido por el número total de datos. X=Σxi/n

• Debe distinguirse entre la media obtenida en una muestra (X) o (M) y la autentica media poblacional (µ).

• Ejem.:La media aritmética de los datos siguientes: 2, 4, 6, 8, 9. es:X=Σxi/n =(2+4+6+8+9)/5 =29/5 = 5.8

Page 15: Unidad 3 Estadistica descriptiva

Media aritmética

• Es una buena medida de tendencia central porque fluctúa menos entre varias muestras de la misma población que la mediana o la moda.moda.

• Sus inconvenientes: – Resulta poco representativa cuando existen

valores extremos. En estos casos se recomienda usar la MEDIANA que aporta información mas fiable.

– No se debería utilizar en variables cualitativas nominales ni ordinales.

Page 16: Unidad 3 Estadistica descriptiva

Mediana

• La mediana de un conjunto de n datos ordenados es el valor central.

• La mediana divide a un conjunto de datos ordenados en dos partes iguales datos ordenados en dos partes iguales en cuanto al numero de datos.

Page 17: Unidad 3 Estadistica descriptiva

• EJEMPLO.- Calcular la mediana de los conjuntos de datos siguientes : – 2, 4, 6, 8, 9, 10, 11, 12, 13, 14, 20.

• El conjunto de datos anterior tiene un número impar de datos y el número total de datos es 11 por lo tanto la mediana es el valor central es decir el sexto Md=10.

– 3, 6, 8, 12, 17, 28, 32, 34. • El conjunto de datos anterior consta de 8 datos es par

por lo tanto la mediana es la media aritmética de los dos valores centrales Md=(12+17)/2=14.5.

Page 18: Unidad 3 Estadistica descriptiva

Moda• Es aquel valor de la variable que mas

frecuentemente se repite en la serie estadística.

• Según la moda, las distribuciones de las variables se pueden clasificar en las variables se pueden clasificar en unimodales y multimodales (bimodales, trimodales, etc).

• En el caso particular de las variables continuas se habla de intervalo modal.

Page 19: Unidad 3 Estadistica descriptiva

Medidas de dispersión

• Aportan información de la variabilidad de los valores de la variable.

Page 20: Unidad 3 Estadistica descriptiva

Rango, amplitud o recorrido

• Es la diferencia entre el valor máximo y el valor mínimo de los datos observados.– Rango=Máximo-Mínimo – Rango=Máximo-Mínimo

• Nos informa sobre la amplitud del recorrido observado de la variable.

Page 21: Unidad 3 Estadistica descriptiva

Rango o amplitud o recorrido

• EJEMPLO.- La medida de la presión arterial sistólica en mm de mercurio, sobre un grupo de pacientes arroja los siguientes resultados:

• 120,135, 160, 100, 155, 115, 165, 125, 130.• Calcular el Rango.• Máximo=165; Mínimo=100; Rango=165-

100=65.• Esto nos indica que en un intervalo de 65 mm

de mercurio están todos los valores medidos.

Page 22: Unidad 3 Estadistica descriptiva

Desviación media

• Es la media aritmética de las diferencias en valores absolutos de todos los datos respecto a la media todos los datos respecto a la media aritmética . – DM=Σ(xi-X)/n

Page 23: Unidad 3 Estadistica descriptiva

Desviación media

• EJEMPLO.- Las tallas en cm de un grupo de personas se detallan a continuación: 180, 165, 160, 175.

• Calcular la desviación media.– X=(180+165+160+175)/4 =170.– X=(180+165+160+175)/4 =170.– Dm= Σ (Xi-X)/n =[ (180-170)+(165-170)+(160-170)+(175-

170)]/4– Dm= (10+5+10+5)/4 =7.5.

• Se utilizan valores absolutos, ya que si no fuera así, las diferencias se contrarrestarían y seria cero

Page 24: Unidad 3 Estadistica descriptiva

Varianza• Otra manera de eliminar la anulación del

resultado en la formula Σ(xi-X)/n es elevando (xi-X) al cuadrado. Σ(xi-X)2/n.

• En caso de que nos refiramos a la varianza poblacional la representaremos por: poblacional la representaremos por: σ2= Σ(xi- µ)2/N

• La varianza muestral la representaremos por: S2= Σ(xi-X)2/n-1

Page 25: Unidad 3 Estadistica descriptiva

Varianza

• La varianza representa unidades cuadráticas, por tanto NO es adecuada cuando se quiere expresar la dispersión cuando se quiere expresar la dispersión en unidades originales

Page 26: Unidad 3 Estadistica descriptiva

Desviación típica o estándar

• La desviación estándar es la raíz cuadrada de la varianza.

2óó =

2SS =

Page 27: Unidad 3 Estadistica descriptiva

Desviación típica o estándar

• El objetivo de la desviación estándar es volver a unidades originales.

• Son las medidas de dispersión más informativas, pues se basan en todas las observaciones, teniendo pues se basan en todas las observaciones, teniendo en cuenta el valor de cada una.

• Están muy influidas por valores extremos. En estos casos, aportan mejor información los percentiles.

• Se utilizan ampliamente a causa de las propiedades de la curva normal de Gaus, y por la importancia de la varianza en la estadística inferencial

Page 28: Unidad 3 Estadistica descriptiva

Propiedades de la curva normalen la distribución de una variable

en una población

• Una variable con distribución normal:

• µ ± 1σ incluye el 68% de las observaciones.

• µ ± 2σ incluye el 95 % de los datos (exactamente es 1,96 en vez de 2, como se verá en temas posteriores).

µ ± 3σ incluye prácticamente el 100%.

Page 29: Unidad 3 Estadistica descriptiva

Propiedades de la curva normalen la distribución de una variable

en una muestra• También en una muestra que se distribuya

normalmente se cumplen las siguientes propiedades:normalmente se cumplen las siguientes propiedades:

– X ± 1 S incluye el 68% de las observaciones.– X ± 2 S incluye el 95 % de los datos (exactamente es 1,96

en vez de 2, como se verá en temas posteriores).– X ± 3 S incluye prácticamente el 100%.

Page 30: Unidad 3 Estadistica descriptiva

Ejemplo

• En una población con media de 40 años y desviación estándar de 10 años, aunque no sepamos su distribución, podemos afirmar que:

• -Entre 30 y 50 años (40±1 x 10) se encuentra • -Entre 30 y 50 años (40±1 x 10) se encuentra aproximadamente el 68% de la población,

• -Entre 20 y 60 (40±2 x 10) años se encuentra aproximadamente el 95% de la población, y

• -Entre 10 y 70 (40±3 x 10) años se encuentra prácticamente toda la población.

Page 31: Unidad 3 Estadistica descriptiva

Resumen• Para las variables cuantitativas, la

información obtenida de una muestra se resume mediante:– Tamaño de la muestra.– La media aritmética.– La media aritmética.– La desviación típica.

• Para las variables cualitativas, la información obtenida de una muestra se resume mediante:– Tamaño de la muestra.– Frecuencia relativa.

Page 32: Unidad 3 Estadistica descriptiva

Percentiles: medida de posición • El percentil es el valor que deja por debajo de sí un

determinado porcentaje de las observaciones, estando estas ordenadas de menor a mayor, es decir, el percentil 20 corresponde al valor que deja por debajo al 20% de los datos.

• A los percentiles 10, 20, 30, 40, 50, 60, 70, 80, 90 se les • A los percentiles 10, 20, 30, 40, 50, 60, 70, 80, 90 se les llama DECILES.

• A los percentiles 25, 50, 75 se les llama CUARTILES.• La mediana es el percentil 50• A la distancia entre los cuartiles 25 y 75 se le llama

INTERVALO INTERQUARTÍLICO.

Page 33: Unidad 3 Estadistica descriptiva

Resumen

• Los valores muy alejados de la media tienen mucho peso en los cálculos tanto de la media como de la desviación estándar. A estos valores "extraños" se les suele llamar valores valores "extraños" se les suele llamar valores extremos "Outliers“.

• Una de las formas que hay para definir cuando un valor es un extremo, es considerarlo cuando está alejado más de 3 S de la media, es decir, por fuera del intervalo X± 3 S

Page 34: Unidad 3 Estadistica descriptiva

Resumen

• Cuando la distribución contiene valoresextremos se recomienda utilizar, para resumirlos datos de la misma, la mediana y elintervalo interquartílico.intervalo interquartílico.

Page 35: Unidad 3 Estadistica descriptiva

Representaciones gráficas

• Diagrama de barras• Histograma• Sectores circulares (tarta)• Polígono de frecuencias• Polígono de frecuencias• Diagrama de dispersión• Diagrama de cajas

Page 36: Unidad 3 Estadistica descriptiva

Diagrama de barras• En el eje de las x se colocan

los valores de las variables y en el eje de las y las frecuencias absolutas o relativas.

• Adecuado para variables 1500

2000

2500

• Adecuado para variables cualitativas.

• Cuando se utiliza el diagrama de barras para comparar dos variables cualitativas de dos poblaciones diferentes, se debe utilizar las frecuencias relativas.

0

500

1000

grupo A Grupo B Grupo C Grupo D

Distribución de sujetos de estudio por grupos

Page 37: Unidad 3 Estadistica descriptiva

Histograma

• Es un diagrama de barras en el que las barras están unidas

• Es la representación gráfica más utilizada• En el eje de las x se colocan los valores de las variables

y en el de las y las frecuencias absolutas o relativas• Es el más adecuado para variables cuantitativas y • Es el más adecuado para variables cuantitativas y

cualitativas ordinales.

Page 38: Unidad 3 Estadistica descriptiva

Histograma

• Números de metástasis en los sujetos incluidos en el estudio

200

número de metástasiss

4.03.02.01.00.0

100

0

Desv. típ. = 1.08

Media = 1.5

N = 393.00

Page 39: Unidad 3 Estadistica descriptiva

Sectores circulares (tarta)

• Se trata de un círculo en el que a cada clase o categoría de la variable se le asigna un sector proporcional a su frecuencia absoluta o relativa. frecuencia absoluta o relativa.

• No resulta adecuada cuando las variables tiene muchas categorías ( Ideal para 3 – 5 categorías)

Page 40: Unidad 3 Estadistica descriptiva

Sectores circulares (tarta)

hombre

mujermujer

Distribución de sexos en un estudio

Page 41: Unidad 3 Estadistica descriptiva

Polígono de frecuencias

• Se realiza a partir del histograma, buscando el punto medio (marca de clase) de la parte superior de los intervalos de clase. clase.

Page 42: Unidad 3 Estadistica descriptiva

Polígono de frecuencias

200

100

número de metástasiss

43210Omitido

Fre

cuen

cia

100

0

Page 43: Unidad 3 Estadistica descriptiva

Diagrama de dispersión

• Nos permite comprobar gráficamente si existe correlación entre dos variables cuantitativas. Se confrontan en el eje horizontal una variable (x) y en el vertical horizontal una variable (x) y en el vertical la otra (y).

Page 44: Unidad 3 Estadistica descriptiva

Diagrama de dispersión

Diagrama de dispersión entre la talla y el peso de una muestra de individuos

Page 45: Unidad 3 Estadistica descriptiva

Diagrama de caja y bigotes

• Supone un resumen de cinco parámetros importantes de las variables cuantitativas: la mediana (valor central de la serie), el primer y el tercer cuartil (los cuartiles delimitan los borde de la caja), los valores mínimo máximo no de la caja), los valores mínimo máximo no atípicos (delimitan los bigotes)

• Valores atípicos: Q1-1,5*RIC o Q3+1,5*RIC (amplitud recorrido intercuartilico)

• Valores extremos: Q1-3*RIC o Q3+3RIC

Page 46: Unidad 3 Estadistica descriptiva

Diagrama de caja

Descripción de la edad en los sujetos de estudio

Page 47: Unidad 3 Estadistica descriptiva

Medidas de forma

• Coeficiente de asimetría

• Coeficiente de curtosis• Coeficiente de curtosis

Page 48: Unidad 3 Estadistica descriptiva

Medidas de forma

• Coeficiente de asimetría.- Nos informa si las colas de la curva asociadas a los datos son mas alargadas hacia alguno de los lados

• Si V= 0 curva simétrica• Si V= 0 curva simétrica• Si V< 0 curva asimetría hacia la izquierda• Si V> 0 curva asimetría a la derecha

Page 49: Unidad 3 Estadistica descriptiva

Medidas de forma

• Coeficiente de curtosis.- Nos informa del grado de apuntamiento de la curva

• Si Ѓ = 0 curva mesocurtica• Si Ѓ < 0 planicurtica (aplanada)• Si Ѓ < 0 planicurtica (aplanada)• Si Ѓ > 0 leptocurtica (estilizada)