ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión...

14
ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA CATALINO

Transcript of ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión...

Page 1: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA CATALINO

Page 2: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas estadísticas descriptivas

• Para sistematizar los datos de los eventos que ocurren y se registran de formas caóticas, se requiere la sistematización de los procesos estadísticos en la dirección de proporcionar orden, resumen y indicación. Este última se ofrece mediante un valor o indicador característicos del contenido de la variable.

• Expresión puntual de las características de la variable cuantitativa en término del valor más frecuente, las posiciones de los fractiles o cuantiles, el valor de representación, la dispersión o variabilidad, la potencia de desviaciones, la deformación de la distribución con respecto al centro, la concentración con respecto al centro, estandarización de un valor de la variable con respecto a su media y desviación estándar, la concentración de un grupo pequeño con respecto a un grupo grande, la asociación o concordancia o dependencia entre los elementos entre las frecuencias dos o mas de dos variables, entre otras.

• Nos referimos a la moda, la mediana, los cuartiles, los quintiles, los percentiles, la media, los desvíos, la desviación media, la varianza, la desviación estándar, el coeficiente de variación, Los momentos, el coeficiente de asimetría, el coeficiente de curtosis, la puntuación estándar, el coeficiente Gini, el valor calculado Chi cuadrado, el coeficiente de contingencia.

Page 3: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Primer resumen de medidas estadísticas descriptivas relacionadas con la distribución de frecuencias

Fórmulas de medidas estadísticas

No. Medida Modelo y componentes

1 Recorrido o Rango

( R) o Amplitud

total

R= (Xmax – Xmin) +1, para variable discreta R= Xmax – Xmin :

para variable continua: R = recorrido o rango, Xmax = valor mayor

que toma la variable, Xmin = valor mínimo que toma la variable.

2 Número de clases

(Nc)

Criterio: 5 ≤ Nc ≤15, Fórmula de Sturges: Nc = 1 +(3.22 log n) y Raíz

cuadrada de (n o N), n = número de elementos en la muestra, log n =

logaritmo del la cantidad de muestra o de población para N.

3 Intervalo o Ancho

de la clase ( i )i = R / Nc : R = Recorrido, Nc = número de clases, i = es el número

de valores en las clases en las que se dividió el recorrido

4 Punto Medio (Xi) Xi = (Li + Ls) / 2 : Li = límite inferior de la clase, Ls = límite superior

de clase, Xi= valor representativo de cada una de las clases

5 Frecuencia relativa

(fiR)

fiR = fi / Σfi , fiR = es el valor que expresa lo que representa la parte

del todo.

fi = frecuencia absoluta, Σfi = suma de las frecuencias absoluta

6 Moda

(Mo)

Mo = Li + [Δf1 / (Δf1 + Δf2)] * i , Δf1 = fmo - fi-1mo y Δf2 = fmo - fi+1mo i

= número de valores en la anchura del intervalo de clases,

Page 4: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Primer resumen de medidas estadísticas descriptivas relacionadas con la distribución de frecuencias

Descripción de medidas estadísticas

No. Medida Descripción o definición

1 Recorrido o Rango ( R) o

Amplitud total

Es el valor que define el nivel de extensión de los valores que

toma la variable cuantitativa

2 Número de clases (Nc) Las partes en la que se divide el recorrido

3 Intervalo o Ancho de la

clase ( i )

Tamaño de las clases en las que se divide el recorrido

4 Punto Medio (Xi) Expresión puntual del intervalo de clase de la variable

5 Frecuencia relativa (fiR) Número que expresa las veces que la parte esta contenido en el

todo.

6 Moda (Mo) Representa el valor o la categoría más frecuente o que ocurre

un mayor número de veces.

Page 5: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Segundo resumen de las medidas estadísticas descriptivas y posición

Fórmulas de medidas estadísticas de valores simples y con la distribución de frecuencias

No. Medida Modelo y componentes

7 Mediana

(Md)

Md = Li + { [(n/2) – fi-1A] / fmd }*i, k = 1

Li = límite inferior de la clase mediana k, n/2 = posición de la mediana k, fi-1A= frecuencia

acumulada anterior a la de la clase en la que está la mediana k, fmd = frecuencia absoluta en la clase

mediana k, i = numero de valores en la anchura del intervalo

8 Cuartil

(Ck)

Ck = Li + { [(nk/4) – fi-1A] / fCk }*i , k = 1,2,3,

Li = límite inferior de la clase cuartil k, nk/4 = posición del cuartil k, fi-1A= frecuencia acumulada

anterior a la de la clase en las que está el cuartil k, fCk = frecuencia absoluta del cuartil k, i =

elementos en la anchura del intervalo

9 Quintil

(Qk)

Qk = Li + { [(nk/5) – fi-1A] / fQk }*i, k =1,2,3,4

Li = límite inferior de la clase quintil k, nk/5 = posición del quintil k, fi-1A= frecuencia acumulada

anterior a la de la clase en las que está el quintil k, fQk = frecuencia absoluta del quintil k, i =

elementos en la anchura del intervalo

10 Decil

(Dk)

Dk = Li + { [(nk/10) – fi-1A] /fDk }*i , k = 1,2,3,…,9

Li = límite inferior de la clase decil k, nk/10 = posición del decil k, fi-1A= frecuencia acumulada

anterior a la de la clase en las que está el decil k, fDk = frecuencia absoluta del decil k, i =

elementos en la anchura del intervalo

11 Percentil

(Pk)

Pk = Li + { [(nk/100) – fi-1A] /fPk }*i , k =1,2,3,…, 99

Li = límite inferior de la clase percentil k, nk/100 = posición del percentil k, fi-1A= frecuencia

acumulada anterior a la de la clase en las que está el percentil k, fPk = frecuencia absoluta del

percentil k, i = elementos en la anchura del intervalo

Page 6: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Segundo resumen de las medidas estadísticas descriptivas y posición

Fórmulas de medidas estadísticas de valores simples y con la distribución de frecuencias

No. Medida Modelo y componentes

7 Mediana

(Md)

Medida estadística de posición que se ubica en el centro de la distribución organizada de los

valores, dividiendo el grupo en dos partes iguales, de modo que la cantidad de valores inferiores a

la mediana son iguales a los superiores.

8 Cuartil

(Ck)

Son tres medidas de posición, que resultan de la división del grupo de valores organizados en

cuatro partes iguales, dejando valores inferiores del 25% para el primer cuartil, del 50% inferiores

para el segundo cuartil y del 75% de valores inferiores y el 25% de valores superiores para el

tercer cuartil.

9 Quintil

(Qk)

Son 4 medidas de posición, que resultan de la división del grupo de valores organizados en cinco

partes iguales, dejando valores inferiores del 20% para el primer quintil, del 40% inferiores para el

segundo quintil , del 60 % de valores inferiores para el tercer quintil y el 80% de valores inferiores

y el 20% superiores para el cuarto quintil

10 Decil

(Dk)

Son 9 medidas de posición, que resultan de la división del grupo de valores organizados en diez

partes iguales, dejando valores inferiores del 20% para el primer cuartil, del 50% inferiores para el

segundo cuartil y del 75% de valores inferiores y el 25% de valores superiores para el tercer

cuartil

11 Percentil

(Pk)

Son 99 medidas de posición, que resultan de la división del grupo de valores organizados en cien

partes iguales, dejando valores inferiores del 25% para el primer cuartil, del 50% inferiores para el

segundo cuartil y del 75% de valores inferiores y el 25% de valores superiores para el tercer

cuartil

Page 7: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas estadística de representación

No. Medida y descripción Modelo y componentes

12 Media Aritmética ( o )

Para hallar el valor representativo

del conjunto que toma la variable

cuando se distribuye en forma

aritmética

1.1 = Σxi / n, 1.2 = Σxi / N

2.1 = Σxifi / n 2.2 = Σxifi / N

n = número de elementos en la muestra, xi = valor que

toma la variable, fi = frecuencia con la que ocurre el valor

de la variable, N = número de elementos en la población

13 Media Geométrica (Mg)

Para hallar el valor representativo

del conjunto que toma la variable

cuando se distribuye en forma

geométrica

1.1 Mg = nxi, para valores simples. 1.2 Mg =Antilog

(Σlog xi / n),

1.3 Mg = n (xifi), en distribución de frecuencias. n =

número de elementos en la muestra, = producto de los

valores, log xi = logaritmo en base 10

14 Media Armónica: (Mh)

Para hallar el valor representativo

del conjunto que toma la variable

cuando se distribuye en forma

armónica

1.1 Mh = n / Σ(1/xi), para valores simples. 1.2 Mh = n /

Σ(fi / xi), en distribución de frecuencias; n = número de

elementos en la muestra, xi = valor de la variable, fi=

frecuencia

Page 8: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas de variabilidad o de dispersión

No. Medida Modelo y componentes

15 Desvíos

(d, D)

1.1 d = (xi- ), 1.2 (xi - ), xi = valor de la variable, = media aritmética

muestral; d = desvíos muestral , D = desvíos poblacional

16 Desviación

media (dm, Dm)

1.1 dm = Σ │xi - │ 1.2 Dm = Σ │(x - │ 2.1 dm = Σ │xi - │fi,

2.2 Dm = Σ │x - │fi ; xi = valor de la variable, = valor de la media

muestral, = media poblacional, fi = frecuencia absoluta; dm = desviación

media muestral , Dm = desviación media de la poblacional

17 Varianza

(s2, 2)

1.1 s2 = Σ (xi - )2 , 1.2 2 = Σ (x - )2

2.1 s2 = Σ (xi - )2fi, 2.2 2 = Σ (x - )2fi xi = valor de la variable, =

valor de la media muestral, = media poblacional, fi = frecuencia absoluta;

s2 = varianza muestral , 2 = varianza poblacional

18 Desviación

estándar (s, )

1.1 s = Σ (xi - )2 , 1.2 =Σ (x - )2 2.1 s = Σ (xi - )2fi,

2.2 =Σ (x - )2fi xi = valor de la variable, = valor de la media

muestral, = media poblacional, fi = frecuencia absoluta; s = desviación

muestral , = desviación poblacional

19 Coeficiente de

variación

(cv, CV)

1.1 cv = (s / )*100 , 1.2 CV = ( / )*100,

s = desviación estándar muestral, = valor de la media muestral

= media de la población; cv = coeficiente de variación muestral , CV =

coeficiente de variación poblacional

Page 9: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas de variabilidad o de dispersión

No. Medida Descripción de la medida

15 Desvíos

(d, D)

Son diferencias de cada valor que toma la variable cuantitativa con

respecto al valor medio u otro valor

16 Desviación media

(dm, Dm)

Son diferencias, en valor absoluto, de cada valor que toma la

variable cuantitativa con respecto al valor medio u otro valor.

17 Varianza

(s2, 2)

Valor promedio cuadrático que expresa el nivel de dispersión,

considerando cada uno de los valores que toma la variable con

respecto al valor medio u otro valor .

18 Desviación

estándar (s, )

Valor promedio lineal que expresa el nivel de dispersión,

considerando cada uno de los valores que toma la variable con

respecto al valor medio u otro valor .

19 Coeficiente de

variación

(cv, CV)

Valor que resulta de la relación entre la desviación estándar y la

muestra para establecer la parte que representa la desviacion

estándar con respecto a la media.

Page 10: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas de formas de la distribución

No. Medida y descripciones Modelo y componentes

20 Momentos ( Mr ):

Son potencias de desvíos con

respecto a la media u otro valor de la

variable . Apoyan la determinación

del coeficiente de asimetria y el

coeficiente de curtosis

1.0 Mr = Σ (xi - )rfi , r = 1,2,3,4;

1.1 M1 = Σ (xi - )1fi = 0

1.2 M2 = Σ (xi - )2fi = a la varianza,

1.3 M3 = Σ (xi - )3fi ,

1.4 M4 = Σ (xi - )4fi

r = potencia de los desvíos, xi = valor de la variable,

= media poblacional, fi = frecuencia absoluta

21 Coeficiente de asimetría ( Cas ):

Mide el nivel de deformación de la

distribución de los valores que toma

la variable cuantitativa

1.1 Cas = M3 /3,

Momento 3,

3= desviación estándar al cubo

22 Coeficiente de curtosis ( CK ) :

Mide el nivel de concentración y

frecuencia de los valores que

presenta la distribución de la variable

1.1 CK = M4 / (M2)2,

M2 = Momento 2, Momento 4

Page 11: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas de coeficientes estadísticos

No. Medida Modelo y componentes

23 Puntuación

estándar

(Pe, P.E)

1.1 Pe = (xi- )/s y 1.2 P.E = (xi - ) / ,

xi = valor de la variable, = valor de la media muestral, = media

poblacional

24 Coeficiente Gini

( Ig )

Ig = Σ(i=1,i=N-1) (Pi – Qi) / Σ(i=1,i=N-1) Pi ,

Ig = 1- ( Σ(i=1,i=N-1) Qi / Σ(i=1,i=N-1)Pi)

Pi = porcentaje acumulado de la población

Qi = porcentaje acumulado del ingreso

25 Coeficiente de

confiabilidad

(alpla)

Alpha = (k/k-1) (1- Σ(i=1, i=k) si2/st

2),

si2 = varianza de los ítems, st

2 = varianza total, k = número de ítems

Alpha estandarizado = kp/1+p(k-1), k = número de ítems, p = promedio

de las correlaciones lineales entre cada uno de los ítems (se tienen [k(k-

1)/2] pares de correlaciones

26 Coeficiente Chi

cuadrado

2 = Σ (fo-fe)2/fe,

fo = frecuencia observada, fe = frecuencia esperada

27 Coeficiente de

contingencia

C = (2/ 2+n),

2 = valor chi cuadrada, n = número elementos de la muestra

{\displaystyle C={\sqrt {\frac {\chi ^{2}}{\chi ^{2}+N}}}}

Page 12: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Medidas de coeficientes estadísticos

No. Medida Descripciones

22 Puntuación

estándar

(Pe, P.E)

Es un coeficiente que estandariza el valor de la variable con respecto al

valor medio, considerando la desviación estándar. Media y desviación

estándar son constante. P.E toma valores de 0 cuando corresponde a la

media.

23 Coeficiente Gini

( Ig )

Proporciona un valor de la forma en que los valores de una variable se

concentran en pocas unidades. El valor máximo Gini es el 1 y el mínimo

es 0. Mientras más próximo a 0 menor concentrado están los recursos.

24 Coeficiente de

confiabilidad

( α = alpha de

Cronbach)

Medida que produce un valor para establecer el nivel consistencia

interna de una conjunto variables de medición ordinal o numérica las

que se presentan con una misma escala. Mientras mas se aproxima a 1.

los ítems son más consistentes. En otro orden, mientras pasen del 60% o

menos serán menos consistentes.

25 Coeficiente Chi

cuadrado

Produce un coeficiente que expresa cuanto están asociadas , dependen

o se relacionan las categorías de una o las categorías contingentes en

dos variables .

26 Coeficiente de

contingencia

Una medida de la intensidad entre las categorías de dos variables. El

valor puede estar entre 0 y 1.

Page 13: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Práctica conceptual de las medidas estadísticas (1-10)

No. Expresión o afirmación F V

1 Cuando la media carece de representatividad es recomendable utilizar la mediana u otros

fractiles, porque no les afectan la dispersión

2 Cuatro importante medidas de variabilidad son la varianza, la desviación estándar, la

moda y el coeficiente de variación

3 El coeficiente de simetría proporciona un valor que define el nivel de concentración o

apuntalamiento de la distribución de la variable cuantitativa

4 El coeficiente de variación es una medida de dispersión relativa que define la cantidad

de desviación estándar con respecto a la media

5 La dispersión de un conjunto de valores de una variable cualitativa nos permite conocer

el nivel de confiabilidad de las medidas de tendencia central, de la media aritmética

6 La frecuencia relativa o la proporción expresa mediante un número las veces que se

encuentra la parte considerada en el todo

7 La media aritmética es la media de tendencia central que mejor describe los siguientes

valores { 1,8,15,17,23,512}

8 La media aritmética produce un valor que divide el grupo en dos partes iguales

9 La mediana del siguiente conjunto de valores {2,5,7,1,3} es 7 y de {4,6,6,8,7,5} es 6

10 La medida de dispersión que permite una más efectiva comparabilidad con media

aritmética es la varianza

Page 14: ESTADISTICA DESCRIPTIVA, PROF. FRANCISCO HERRERA … · Medidas de variabilidad o de dispersión No. Medida Modelo y componentes 15 Desvíos (d, D) 1.1 d = (x i - ), 1.2 (x i - ),

Práctica conceptual de las medidas estadísticas (11-20)

No. Expresión o afirmación F V

11 La puntuación estándar de una media igual a 90 cuando desviación estándar es 15 con respecto a un valor de

75. Significa que este valor se coloca a 1 desviación estándar por encima de la media

12 Las varianzas de los siguientes conjuntos de valores A= {0,0,0,0,0,0} es 0 y la B = {1,1,1,1,1} es 12

13 Los momentos 4 y 2 se utilizan para calcular el coeficiente de asimetría, el cual produce un valor el nivel de

sesgo o deformación de la distribución con respecto al valor medio

14 Si el percentil 60, P60 = 70 en la puntuación de 80 alumnos en un examen en base 100 de matemática 1, con

mínimo de aprobación de 70. El valor de P60 = 70, significa que el 60% de los estudiantes aprobó la

matemática I.

15 Si la media aritmética del número de autos vendidos por mes, en un negocio es 12 y la varianza es 4, el

coeficiente de variación es 16.67%

16 La principal debilidad de la media aritmética se produce cuando los valores de la variable se extremizan o

alejan.

17 La desviación estándar del peso de la población de aficionados inscritos en un gimnasio de 65 libras,

significa que del conjunto de valores de pesos de los aficionados, la diferencia cuadrática de cada uno de los

valores que toma la variable peso con respecto a la media aritmética es 65 libras.

18 Si la media aritmética de los valores 9,7,5,3,1, referido a los minutos en que tiene efecto un analgésico que

es 5 minutos. Significa que 5 divide el grupo de prueba, en dos partes iguales, es decir dos antes y dos

después de él. Como son 5 valores de medición, deja 2 superiores antes y 2 inferiores después.

19 Un valor del coeficiente de asimetría de Cas = -1, significa que los valores más frecuentes, de los que toma

la variable cuantitativa son mayores que la media aritmética

20 El coeficiente de variación del número de autos vendidos por mes durante un año por un negocio de CV =

16.67%, significa que el valor de la desviación estándar con respecto a la media es de 16.67%