MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos...

53
MEDIDAS DE DISPERSIÓN: MEDIDAS DE DISPERSIÓN:

Transcript of MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos...

Page 1: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

MEDIDAS DE MEDIDAS DE DISPERSIÓN:DISPERSIÓN:

Page 2: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan distintas medidas de dispersión o de variación, las más empleadas son la desviación media absoluta, la varianza y la desviación estándar.

Desviación media absoluta o promedio de desviaciones. ( D.M.A)

Page 3: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Definición : Dado un conjunto de observacionesTales como X1, X2………Xn, la desviación media se define como el promedio aritmético de las respectivasDesviaciones absolutas con respecto a la media. nD.M.A. = ∑ Xi - X i=1 n1.- Hallar la desviación media de los siguientes datos: 9, 4,7,5,3.

Page 4: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Varianza: la varianza se denota por la letra

S2 ( s al cuadrado) y se define como el

cuadrado medio de las desviaciones con respecto a su media aritmética.

n 2

2 = ∑ ( Xi – X) s i=1 n

2.- encuentre la varianza delProblema anterior.

Page 5: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Desviación estándar: Dado un conjunto de observaciones x1, x2…. Xn,

la desviación estandar denotada por “s” se define como la raíz cuadrada de la varianza, esto es :

s = s2 n 2 = ∑ ( Xi – X) i=1 n obtenga la d. estándar del

ejercicio anterior.

Page 6: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Medidas de variación para datos agrupados:

1.- Si en una tabla de frecuencias x1, x2,… xk corresponden a los puntos medios de las clases y f1, f2,… fk, son las frecuencias respectivas, entonces la D.M.A. se define como:

Page 7: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

kD.M .A. = ∑ Xi – X F i i=1 n

2.- Varianza y desviación standar:Si en una tabla de frecuencias los puntos medios de las clases son x1,x2….., xk y las frecuencias

Page 8: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

F1, f2…..fk, entonces la varianza se define

como: k k

2= n ∑ Xi2Fi – ( ∑ XiFi )2

i =1 i=1 n2Y la desviación estándar : 2 =

Page 9: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

54 56 58 60 65 70

55 57 59 62 66 71

55 57 60 63 67 75

55 58 60 64 69 77

56 58 60 65 70 80

Page 10: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Clase

Lim.reales

Marca clase xi

Frec. fi

Xi-media

Xifi Xi2 xi2fi

1 52.5-57.5

55 8 -7.67

440 3025 24200

2 57.5-62.5

60 9 -2.66 540 3600 32400

3 62.5-67.5

65 6 2.34 390 4225 25350

4 67.5-72.5

70 4 7.34 280 4900 19600

5 72.5-77.5

75 2 12.34 150 5625 11250

6 77.5-82.5

80 1 17.34 80 6400 6400

media =62.66

30 1880 119200

Page 11: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

La tabla muestra la distribución de la carga máxima en toneladas, que La tabla muestra la distribución de la carga máxima en toneladas, que soportan ciertos cables producidos por una compañía . Determinar la soportan ciertos cables producidos por una compañía . Determinar la D.M.A. , la varianza y desviación estándar de datos agrupados. D.M.A. , la varianza y desviación estándar de datos agrupados.

Maximo de carga

N° CABLES

Marca clase xi

Xi-media

Xifi Xi2 xi2fi

9.3-9.7 2 9.5 -3.3666

19 90.25 180.25

9.8-10.2

5 10 -2.8666

50 100 500

10.3-10.7

12 10.5

-2.366

126 110.25

1323

10.8-11.2

17 11 -1.366

187 121 2057

11.3-11.7

14 11.5

-0.866

161 132.25

1851.5

11.8-12.2

6 12 -0.366

72 144 864

12.3-12.7

3 12.5

0.134 37.5 156.25

468.75

12.8-13.2

1 13 0.634 13 169 169

Page 12: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

DISTRIBUCIÓN NORMALDISTRIBUCIÓN NORMAL

Características: 1.- distribución simétrica de las observaciones

alrededor de un valor central (µ).

2.- Forma simétrica de campana cóncava, descendente para “x” hasta un menor de la µ y convexa ascendente para “x”mayor que la desviación estándar de la µ.

Page 13: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

3.- El valor de la media, la moda, y la mediana coinciden

4.- La distribución esta caracterizada por dos constantes la µ media y la desviación estándar, una curva normal se representa por la expresión N ( µ, Desv.standar).

5.- El área bajo la curva y sobre el eje “x” es igual a la unidad.

6.- Si a ambos lados de µ se levantan perpendiculares a una distancia de , 2 desv. Stad., 3 desv. Stand.

Page 14: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Las áreas bajo la curva y las perpendiculares representanLos porcentajes del área total de la curva conforme a las Expresiones siguientes:

Área entre µ ± desv. Stad. = 0.6826 = 68.26%P(µ - Desv. Stad.≤ x ≤ µ+ Desv. Stad.) = 0.6826

Area entre µ ± 2 desv. Stad. = 95.45 95.45%P ( µ - 2 Desv. Stand. ≤ x ≤ µ + 2 desv.stand.) 0.9545

Área entre µ ± 3 desv.stad. = 0.9973

Page 15: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

-3 -2 -1 µ 1 2 3 68.26 %

Page 16: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

La distribución normal estandar es aquella cuya media µ = 0 y desviación estandar = 1,cualquierVariable distribuida normalmente puede transformarse En una normal estandar mediante la siguiente Expresión.

Z = x - µ desviación standar

Page 17: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Dada una distribución normal con µ = 50 y unaDesviación estandar = 10, encuentre la probabilidad de queX tome un valor entre 45 y 62.Solución : P( 45≤ X≤ 62) = ?

Page 18: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Hallar el área bajo la curva normal en cada uno de los Siguientes casos y representarlos gráficamente :

a)Entre desv.stand. = 0 y desv. Stand. = 1.2 P(0 ≤ desv.stan. ≤ 1.2)

b) Entre desv. Stan. = - 0.68 y desv.stan. = 0 P ( - 0.68 ≤ desv.stan. ≤ 0 )c)Entre desv. Stan. = - 0.46 y desv. Stan.= 2.21 Área pedida = ( área entre d.s. = - 0.46 y d.s.= 0) + ( área entre d.s. = 0 y d.s. = 2.21)

Page 19: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

d) Entre d.s.= 0.81 y d.s.= 1.94

Área pedida = ( área entre d.s. = 0 y d.s. = 1.94) – ( área entre d.s. = 0 y d.s = 0.81)

e) A la izquiera de d.s. = - 0.6

Área pedida = ( área a la izquierda de d.s.= 0) –( área entre d.s.= - 0.6 y d.s. = 0

Page 20: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

F) A la derecha de d.s.= - 1.28

Área pedida = ( área entre d.s.= - 1.28 y d.s.= 0) +(área a la derecha de d.s.= 0)

Page 21: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

2.-En un examen final de matemáticas la media es de 72 y la desviación estandar 15 , determinar las referencias tipificadas de los estudiantes que obtuvieron Puntuaciones de: a) 60 , b) 93, c) 72.

3.- Con referencia al problema anterior , hallar las puntuaciones correspondientes a las referencias tipificadas de a) -1 , b) 1.6

Page 22: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

4.- Dos estudiantes fueron informados de que habían recibido referencias tipificadas de 0.8 y -0.4,respectivamente en un examen de ingles, si sus Puntuaciones fueron 88 y 64 respectivamente, hallar laMedia y la desviación estandar de las puntuaciones delExamen.

Page 23: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

5.- La media de los pesos de 500 estudiantes de un colegio es de 151 libras y la des. Stand. Es de 15 lb. suponiendo que los pesos se distribuyen normal- mente. Hallar cuántos estudiantes pesan, a) entre 119.5 y155.5 lb.

P( 119.5 ≤ X ≤ 155.5 ) =

P ( 119.5 – 151 ≤ X -151 ≤ 155.5 – 151 ) = 15 15 15

Page 24: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

= P ( -2.10 ≤ D.S ≤ 0.3) =

Proporción de estudiantes pedida = ( área entred.S = -2.1 y d.s = 0) + (área entre d.s.= 0 y d.s. =0.3)

= 0.4821 + 0.1179 = 0.6

Entonces el número de estudiantes es de (500) (0.6)

= 300

Page 25: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

b) Más de 185.5 lb

P ( x ≥ 185.5 ) =

P( x - 151 ≥ 185.5 – 151) = P ( d.s. ≥ 2.30)

15 15

Proporción estudiada pedida = ( área de la derechaDe d.s. = 2.3

= (área de la derecha de d.s. = 0) – (área entre d.s.=0 y

Page 26: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

d.s. = 2.3)

= 0.5 – 0.4893 = 0.0107

El número de estudiantes que pesan mas de 185.5 lb. es = (500) ( 0.0107) = 5.35

c) Menos de 127.5 lb

d) 128.5 lb. O menos

Page 27: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

6.- la población de millas recorridas por camioneros presenta una media de 8500, con una d.s. de 1950. si se toma una muestra de 100 conductores, cuál es la probabilidad de la media sea : a)Mayor que 8900b)Menor que 8000c)Entre 8200 y 8700d)Entre 8100y 8400 pp-157

Page 28: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Datos bivariados:Datos bivariados:

La regresión y la correlación son las dos herramientas Estadísticas mas poderosas y versátiles que se pueden Utilizar para solucionar problemas.

Por ejemplo: si x es estatura y Y su peso para cada Persona pueden registrarse su estatura y su pesoCorrespondiente.

Se denomina variable independiente o variable de entradaA x y variable dependiente o variable de salida a Y.

Page 29: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

La variable independiente x se mide o controla paraPredecir la variable dependiente.

Cuando ambos analisis, de correlación y regresiónSean aplicables al mismo problema se escribiran losDatos graficamente en un diagrama de dispersión.

Este diagrama es una grafica en un sistema de ejesDe toos los pares ordenados que forman datos Bivariados. La variable independiente x se grafica Sobre el eje horizontal, y la dependiente y aparece En el eje vertical.

Page 30: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Las siguientes medidas fueron registradas durante un cursoDe educación física e indican el número de sentadillas yLagartijas realizadas por 10 estudiantes seleccionadosAleatoriamente.

(27,30), (22,26), (15,25), (35,42), (30,38), (52,40), (35,32), (55,54), (40,50), (40,43).

X = sentadillas, y = lagartijas

Page 31: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Diagramas de dispersiónDiagramas de dispersión

Page 32: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE:

La correlación simple estudia la variaciónSimultanea de dos variables.

La correlación entre dos variables es positiva, cuando el aumento de una de ellas va acompañado de un aumento en la otra. Si el aumento de una variable coincide con una disminución en la otra,Se dice que están correlacionadas negativamente.

Page 33: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Si no hay relación entre las dos variables, Se dice que son independientes y que no Están correlacionadas.

Ejemplos : temperatura y longitud de una Barra de hierro, estatura y peso de una Persona, edad y presión sanguínea, precoci-Dad y rendimiento.etc….

Page 34: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

METODO DE MINIMOS CUADRADOS( utilizando Coeficiente De correlación), la recta de mejor ajuste.

El propósito del análisis de la regresión es determinar Una recta de que se ajuste a los datos muéstrales.

Utilizando este método se producirá una recta quePasa por el centro del diagrama de dispersión Aproximándose a los puntos.

Page 35: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Coeficiente de Coeficiente de correlación:correlación:es un valor que indica el es un valor que indica el grado de asociación entre grado de asociación entre dos variablesdos variablesValores posibles:

a)Si el c.c. = 0 las variables son independientes no hay correlación.b) Si el C.C. = +1 Hay correlación positiva y perfecta

c) Si el C.C. = -1 Hay correlación negativa y perfectad) 0< C.de C. < 1 Y -1< C.de C.< 0

Page 36: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Sugiere cierto grado de asociación. Si la muestra fueTomada al azar de una población.

Page 37: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.
Page 38: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Formulas:Formulas:

r = ∑ ( X – X) ( Y – Y) = ∑ X Y (X²) (Y²) (X²) (Y²)

r = coeficiente de correlación ( X – X) = x, desviación de la variable x ( Y – Y) = y, desviación de la variable y X Y = producto de dos desviaciones n = n° de observaciones

Page 39: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

x² = x² - (x)² n

y² = y² - (y)² n

xy = xy - (x) (y) n

Page 40: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Ejemplo:Ejemplo:

En un muestreo de personas de diferentes edadesSe tomaron datos de la edad “x “ en años y el Promedio de la presión sanguínea “y” en mm de Mercurio , los valores se ilustran en la siguiente tabla.

Page 41: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

DATOS EDAD X

PRESIÓN Y

PRODUCTO (XY)

CUADRADOS X² Y²

1 19 122

2 25 125

3 30 126

4 42 129

5 46 130

6 52 135

7 57 138

8 62 142

9 70 145

10 73 146

X = Y= XY= X²= Y²=

Page 42: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

XY = ( 65119) - (476) (1338) 10= 65119 – 63688.8= 1430.2

X²= 25792 – ( 476)² 10 = 3134.4

Page 43: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Y² = 179700 - (1338)2 10 = 179700 – 179024.4 = 675.6

r = 1430.2 = 0.9828 ( 3134.4) (675.6) indica que existeUna relación positiva entre la edad y presión

Page 44: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Ecuación de predicción: ^ Y = y + b ( x – x)

Y = valor teórico ordenado de la línea de regresión.y = promedio de la variable dependienteb = pendiente de la línea de regresión de la muestra o coeficiente de regresión.

Page 45: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

X = promedio de la variable independiente

X = cualquier valor de la variable independiente.

El coeficiente de regresión (b) indica el incremento promedio de Y al aumentar X en una unidad.

Page 46: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

b = xy x² Y = y n

x = x n

Page 47: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

x² = x² - (x)² n

xy = xy - (x) (y) n

Page 48: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

b = 1430.2 = 0.45629 3134.4

Y = 133.8 = 133.8 10

X = 476 = 47.6 10

Page 49: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

^Y = 133.8 + 0.4563 ( X – 47.6) = 133.8 – 21.72 + 0.4563 X = 112.08 + 0.4563 X

¿ si dos personas tienen 45 y 56 años cual será su presión aproximadamente?

Page 50: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Ejercicio : 2

Se recolectaron los datos mensuales por Gastos de publicidad y número de pasajerosPor 15 meses mas recientes los datos apare-en en la table. Desarrolle los cálculos nece-Sarios para obtener el modelo de regresión

Page 51: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.

Mes Publicidad

pasajeros xy x² y²

1 10 15

2 12 17

3 8 13

4 17 23

5 10 16

6 15 21

7 10 14

8 14 20

9 19 24

10 10 17

11 11 16

12 13 18

13 16 23

14 10 15

15 12 16

Pp 333

Page 52: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.
Page 53: MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan.