MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos...

Post on 22-Jan-2016

222 views 0 download

Transcript of MEDIDAS DE DISPERSIÓN:. Se le llama dispersión o variación al grado en que los datos numéricos...

MEDIDAS DE MEDIDAS DE DISPERSIÓN:DISPERSIÓN:

Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan distintas medidas de dispersión o de variación, las más empleadas son la desviación media absoluta, la varianza y la desviación estándar.

Desviación media absoluta o promedio de desviaciones. ( D.M.A)

Definición : Dado un conjunto de observacionesTales como X1, X2………Xn, la desviación media se define como el promedio aritmético de las respectivasDesviaciones absolutas con respecto a la media. nD.M.A. = ∑ Xi - X i=1 n1.- Hallar la desviación media de los siguientes datos: 9, 4,7,5,3.

Varianza: la varianza se denota por la letra

S2 ( s al cuadrado) y se define como el

cuadrado medio de las desviaciones con respecto a su media aritmética.

n 2

2 = ∑ ( Xi – X) s i=1 n

2.- encuentre la varianza delProblema anterior.

Desviación estándar: Dado un conjunto de observaciones x1, x2…. Xn,

la desviación estandar denotada por “s” se define como la raíz cuadrada de la varianza, esto es :

s = s2 n 2 = ∑ ( Xi – X) i=1 n obtenga la d. estándar del

ejercicio anterior.

Medidas de variación para datos agrupados:

1.- Si en una tabla de frecuencias x1, x2,… xk corresponden a los puntos medios de las clases y f1, f2,… fk, son las frecuencias respectivas, entonces la D.M.A. se define como:

kD.M .A. = ∑ Xi – X F i i=1 n

2.- Varianza y desviación standar:Si en una tabla de frecuencias los puntos medios de las clases son x1,x2….., xk y las frecuencias

F1, f2…..fk, entonces la varianza se define

como: k k

2= n ∑ Xi2Fi – ( ∑ XiFi )2

i =1 i=1 n2Y la desviación estándar : 2 =

54 56 58 60 65 70

55 57 59 62 66 71

55 57 60 63 67 75

55 58 60 64 69 77

56 58 60 65 70 80

Clase

Lim.reales

Marca clase xi

Frec. fi

Xi-media

Xifi Xi2 xi2fi

1 52.5-57.5

55 8 -7.67

440 3025 24200

2 57.5-62.5

60 9 -2.66 540 3600 32400

3 62.5-67.5

65 6 2.34 390 4225 25350

4 67.5-72.5

70 4 7.34 280 4900 19600

5 72.5-77.5

75 2 12.34 150 5625 11250

6 77.5-82.5

80 1 17.34 80 6400 6400

media =62.66

30 1880 119200

La tabla muestra la distribución de la carga máxima en toneladas, que La tabla muestra la distribución de la carga máxima en toneladas, que soportan ciertos cables producidos por una compañía . Determinar la soportan ciertos cables producidos por una compañía . Determinar la D.M.A. , la varianza y desviación estándar de datos agrupados. D.M.A. , la varianza y desviación estándar de datos agrupados.

Maximo de carga

N° CABLES

Marca clase xi

Xi-media

Xifi Xi2 xi2fi

9.3-9.7 2 9.5 -3.3666

19 90.25 180.25

9.8-10.2

5 10 -2.8666

50 100 500

10.3-10.7

12 10.5

-2.366

126 110.25

1323

10.8-11.2

17 11 -1.366

187 121 2057

11.3-11.7

14 11.5

-0.866

161 132.25

1851.5

11.8-12.2

6 12 -0.366

72 144 864

12.3-12.7

3 12.5

0.134 37.5 156.25

468.75

12.8-13.2

1 13 0.634 13 169 169

DISTRIBUCIÓN NORMALDISTRIBUCIÓN NORMAL

Características: 1.- distribución simétrica de las observaciones

alrededor de un valor central (µ).

2.- Forma simétrica de campana cóncava, descendente para “x” hasta un menor de la µ y convexa ascendente para “x”mayor que la desviación estándar de la µ.

3.- El valor de la media, la moda, y la mediana coinciden

4.- La distribución esta caracterizada por dos constantes la µ media y la desviación estándar, una curva normal se representa por la expresión N ( µ, Desv.standar).

5.- El área bajo la curva y sobre el eje “x” es igual a la unidad.

6.- Si a ambos lados de µ se levantan perpendiculares a una distancia de , 2 desv. Stad., 3 desv. Stand.

Las áreas bajo la curva y las perpendiculares representanLos porcentajes del área total de la curva conforme a las Expresiones siguientes:

Área entre µ ± desv. Stad. = 0.6826 = 68.26%P(µ - Desv. Stad.≤ x ≤ µ+ Desv. Stad.) = 0.6826

Area entre µ ± 2 desv. Stad. = 95.45 95.45%P ( µ - 2 Desv. Stand. ≤ x ≤ µ + 2 desv.stand.) 0.9545

Área entre µ ± 3 desv.stad. = 0.9973

-3 -2 -1 µ 1 2 3 68.26 %

La distribución normal estandar es aquella cuya media µ = 0 y desviación estandar = 1,cualquierVariable distribuida normalmente puede transformarse En una normal estandar mediante la siguiente Expresión.

Z = x - µ desviación standar

Dada una distribución normal con µ = 50 y unaDesviación estandar = 10, encuentre la probabilidad de queX tome un valor entre 45 y 62.Solución : P( 45≤ X≤ 62) = ?

Hallar el área bajo la curva normal en cada uno de los Siguientes casos y representarlos gráficamente :

a)Entre desv.stand. = 0 y desv. Stand. = 1.2 P(0 ≤ desv.stan. ≤ 1.2)

b) Entre desv. Stan. = - 0.68 y desv.stan. = 0 P ( - 0.68 ≤ desv.stan. ≤ 0 )c)Entre desv. Stan. = - 0.46 y desv. Stan.= 2.21 Área pedida = ( área entre d.s. = - 0.46 y d.s.= 0) + ( área entre d.s. = 0 y d.s. = 2.21)

d) Entre d.s.= 0.81 y d.s.= 1.94

Área pedida = ( área entre d.s. = 0 y d.s. = 1.94) – ( área entre d.s. = 0 y d.s = 0.81)

e) A la izquiera de d.s. = - 0.6

Área pedida = ( área a la izquierda de d.s.= 0) –( área entre d.s.= - 0.6 y d.s. = 0

F) A la derecha de d.s.= - 1.28

Área pedida = ( área entre d.s.= - 1.28 y d.s.= 0) +(área a la derecha de d.s.= 0)

2.-En un examen final de matemáticas la media es de 72 y la desviación estandar 15 , determinar las referencias tipificadas de los estudiantes que obtuvieron Puntuaciones de: a) 60 , b) 93, c) 72.

3.- Con referencia al problema anterior , hallar las puntuaciones correspondientes a las referencias tipificadas de a) -1 , b) 1.6

4.- Dos estudiantes fueron informados de que habían recibido referencias tipificadas de 0.8 y -0.4,respectivamente en un examen de ingles, si sus Puntuaciones fueron 88 y 64 respectivamente, hallar laMedia y la desviación estandar de las puntuaciones delExamen.

5.- La media de los pesos de 500 estudiantes de un colegio es de 151 libras y la des. Stand. Es de 15 lb. suponiendo que los pesos se distribuyen normal- mente. Hallar cuántos estudiantes pesan, a) entre 119.5 y155.5 lb.

P( 119.5 ≤ X ≤ 155.5 ) =

P ( 119.5 – 151 ≤ X -151 ≤ 155.5 – 151 ) = 15 15 15

= P ( -2.10 ≤ D.S ≤ 0.3) =

Proporción de estudiantes pedida = ( área entred.S = -2.1 y d.s = 0) + (área entre d.s.= 0 y d.s. =0.3)

= 0.4821 + 0.1179 = 0.6

Entonces el número de estudiantes es de (500) (0.6)

= 300

b) Más de 185.5 lb

P ( x ≥ 185.5 ) =

P( x - 151 ≥ 185.5 – 151) = P ( d.s. ≥ 2.30)

15 15

Proporción estudiada pedida = ( área de la derechaDe d.s. = 2.3

= (área de la derecha de d.s. = 0) – (área entre d.s.=0 y

d.s. = 2.3)

= 0.5 – 0.4893 = 0.0107

El número de estudiantes que pesan mas de 185.5 lb. es = (500) ( 0.0107) = 5.35

c) Menos de 127.5 lb

d) 128.5 lb. O menos

6.- la población de millas recorridas por camioneros presenta una media de 8500, con una d.s. de 1950. si se toma una muestra de 100 conductores, cuál es la probabilidad de la media sea : a)Mayor que 8900b)Menor que 8000c)Entre 8200 y 8700d)Entre 8100y 8400 pp-157

Datos bivariados:Datos bivariados:

La regresión y la correlación son las dos herramientas Estadísticas mas poderosas y versátiles que se pueden Utilizar para solucionar problemas.

Por ejemplo: si x es estatura y Y su peso para cada Persona pueden registrarse su estatura y su pesoCorrespondiente.

Se denomina variable independiente o variable de entradaA x y variable dependiente o variable de salida a Y.

La variable independiente x se mide o controla paraPredecir la variable dependiente.

Cuando ambos analisis, de correlación y regresiónSean aplicables al mismo problema se escribiran losDatos graficamente en un diagrama de dispersión.

Este diagrama es una grafica en un sistema de ejesDe toos los pares ordenados que forman datos Bivariados. La variable independiente x se grafica Sobre el eje horizontal, y la dependiente y aparece En el eje vertical.

Las siguientes medidas fueron registradas durante un cursoDe educación física e indican el número de sentadillas yLagartijas realizadas por 10 estudiantes seleccionadosAleatoriamente.

(27,30), (22,26), (15,25), (35,42), (30,38), (52,40), (35,32), (55,54), (40,50), (40,43).

X = sentadillas, y = lagartijas

Diagramas de dispersiónDiagramas de dispersión

CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE:

La correlación simple estudia la variaciónSimultanea de dos variables.

La correlación entre dos variables es positiva, cuando el aumento de una de ellas va acompañado de un aumento en la otra. Si el aumento de una variable coincide con una disminución en la otra,Se dice que están correlacionadas negativamente.

Si no hay relación entre las dos variables, Se dice que son independientes y que no Están correlacionadas.

Ejemplos : temperatura y longitud de una Barra de hierro, estatura y peso de una Persona, edad y presión sanguínea, precoci-Dad y rendimiento.etc….

METODO DE MINIMOS CUADRADOS( utilizando Coeficiente De correlación), la recta de mejor ajuste.

El propósito del análisis de la regresión es determinar Una recta de que se ajuste a los datos muéstrales.

Utilizando este método se producirá una recta quePasa por el centro del diagrama de dispersión Aproximándose a los puntos.

Coeficiente de Coeficiente de correlación:correlación:es un valor que indica el es un valor que indica el grado de asociación entre grado de asociación entre dos variablesdos variablesValores posibles:

a)Si el c.c. = 0 las variables son independientes no hay correlación.b) Si el C.C. = +1 Hay correlación positiva y perfecta

c) Si el C.C. = -1 Hay correlación negativa y perfectad) 0< C.de C. < 1 Y -1< C.de C.< 0

Sugiere cierto grado de asociación. Si la muestra fueTomada al azar de una población.

Formulas:Formulas:

r = ∑ ( X – X) ( Y – Y) = ∑ X Y (X²) (Y²) (X²) (Y²)

r = coeficiente de correlación ( X – X) = x, desviación de la variable x ( Y – Y) = y, desviación de la variable y X Y = producto de dos desviaciones n = n° de observaciones

x² = x² - (x)² n

y² = y² - (y)² n

xy = xy - (x) (y) n

Ejemplo:Ejemplo:

En un muestreo de personas de diferentes edadesSe tomaron datos de la edad “x “ en años y el Promedio de la presión sanguínea “y” en mm de Mercurio , los valores se ilustran en la siguiente tabla.

DATOS EDAD X

PRESIÓN Y

PRODUCTO (XY)

CUADRADOS X² Y²

1 19 122

2 25 125

3 30 126

4 42 129

5 46 130

6 52 135

7 57 138

8 62 142

9 70 145

10 73 146

X = Y= XY= X²= Y²=

XY = ( 65119) - (476) (1338) 10= 65119 – 63688.8= 1430.2

X²= 25792 – ( 476)² 10 = 3134.4

Y² = 179700 - (1338)2 10 = 179700 – 179024.4 = 675.6

r = 1430.2 = 0.9828 ( 3134.4) (675.6) indica que existeUna relación positiva entre la edad y presión

Ecuación de predicción: ^ Y = y + b ( x – x)

Y = valor teórico ordenado de la línea de regresión.y = promedio de la variable dependienteb = pendiente de la línea de regresión de la muestra o coeficiente de regresión.

X = promedio de la variable independiente

X = cualquier valor de la variable independiente.

El coeficiente de regresión (b) indica el incremento promedio de Y al aumentar X en una unidad.

b = xy x² Y = y n

x = x n

x² = x² - (x)² n

xy = xy - (x) (y) n

b = 1430.2 = 0.45629 3134.4

Y = 133.8 = 133.8 10

X = 476 = 47.6 10

^Y = 133.8 + 0.4563 ( X – 47.6) = 133.8 – 21.72 + 0.4563 X = 112.08 + 0.4563 X

¿ si dos personas tienen 45 y 56 años cual será su presión aproximadamente?

Ejercicio : 2

Se recolectaron los datos mensuales por Gastos de publicidad y número de pasajerosPor 15 meses mas recientes los datos apare-en en la table. Desarrolle los cálculos nece-Sarios para obtener el modelo de regresión

Mes Publicidad

pasajeros xy x² y²

1 10 15

2 12 17

3 8 13

4 17 23

5 10 16

6 15 21

7 10 14

8 14 20

9 19 24

10 10 17

11 11 16

12 13 18

13 16 23

14 10 15

15 12 16

Pp 333