introducccion a la estadistica

12
CLASE 2 INTRODUCCION A LA ESTADISTICA

description

presentacion

Transcript of introducccion a la estadistica

Page 1: introducccion a la estadistica

CLASE 2

INTRODUCCION A LA ESTADISTICA

Page 2: introducccion a la estadistica

Medidas descriptivas

Page 3: introducccion a la estadistica

Medidas de Centralización o Tendencia Central

• Nos dan un centro de la distribución de frecuencias, es un valor que se puede tomar como representativo de todos los datos. Hay diferentes modos para definir el "centro" de las observaciones en un conjunto de datos. Por orden de importancia, son:

• MEDIA : (media aritmética o simplemente media). es el promedio aritmético de las observaciones, es decir, el cociente entre la suma de todos los datos y el numero de ellos. Si xi es el valor de la variable y ni su frecuencia, tenemos que:

Page 4: introducccion a la estadistica

• MEDIANA (Me):es el valor que separa por la mitad las observaciones ordenadas de menor a mayor, de tal forma que el 50% de estas son menores que la mediana y el otro 50% son mayores. Si el número de datos es impar la mediana será el valor central, si es par tomaremos como mediana la media aritmética de los dos valores centrales.

Page 5: introducccion a la estadistica

• MODA (M0): es el valor de la variable que más veces se repite, es decir, aquella cuya frecuencia absoluta es mayor. No tiene porque ser única.

Page 6: introducccion a la estadistica

Medidas de Dispersión

• Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor representativo, las medidas de dispersión nos dicen hasta que punto estas medidas de tendencia central son representativas como síntesis de la información. Las medidas de dispersión cuantifican la separación, la dispersión, la variabilidad de los valores de la distribución respecto al valor central. Distinguimos entre medidas de dispersión absolutas, que no son comparables entre diferentes muestras y las relativas que nos permitirán comparar varias muestras.

Page 7: introducccion a la estadistica

MEDIDAS DE DISPERSIÓN ABSOLUTAS

• VARIANZA ( s2 ): es el promedio del cuadrado de las distancias entre cada observación y la media aritmética del conjunto de observaciones.

Page 8: introducccion a la estadistica

• DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas unidades que la variable pero al cuadrado, para evitar este problema podemos usar como medida de dispersión la desviación típica que se define como la raíz cuadrada positiva de la varianza

Page 9: introducccion a la estadistica

MEDIDAS DE DISPERSIÓN RELATIVAS

• COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere comparar el grado de dispersión de dos distribuciones que no vienen dadas en las mismas unidades o que las medias no son iguales se utiliza el coeficiente de variación de Pearson que se define como el cociente entre la desviación típica y el valor absoluto de la media aritmética

Page 10: introducccion a la estadistica

Medidas de Forma • Diremos que una distribución es simétrica cuando su

mediana, su moda y su media aritmética coinciden.• Diremos que una distribución es asimétrica a la

derecha si las frecuencias (absolutas o relativas) descienden más lentamente por la derecha que por la izquierda.

• Si las frecuencias descienden más lentamente por la izquierda que por la derecha diremos que la distribución es asimétrica a la izquierda.

• Existen varias medidas de la asimetría de una distribución de frecuencias. Una de ellas es el Coeficiente de Asimetría de Pearson:

Page 11: introducccion a la estadistica

ASIMETRÍA

• Su valor es cero cuando la distribución es simétrica, positivo cuando existe asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

Page 12: introducccion a la estadistica

MEDIDA DE APUNTAMIENTO O CURTOSIS

• Miden la mayor o menor cantidad de datos que se agrupan en torno a la moda. Se definen 3 tipos de distribuciones según su grado de curtosis:

• Distribución mesocúrtica: presenta un grado de concentración medio alrededor de los valores centrales de la variable (el mismo que presenta una distribución normal). Distribución leptocúrtica: presenta un elevado grado de concentración alrededor de los valores centrales de la variable. Distribución platicúrtica: presenta un reducido grado de concentración alrededor de los valores centrales de la variable.