desviaciones
-
Upload
jazmin-villarroel-bejarano -
Category
Documents
-
view
213 -
download
0
description
Transcript of desviaciones
MEDIDAS DE MEDIDAS DE DISPERSIÓN:DISPERSIÓN:
Se le llama dispersión o variación al grado en que los datos numéricos tiende a extenderse alrededor de un valor medio. Se utilizan distintas medidas de dispersión o de variación, las más empleadas son la desviación media absoluta, la varianza y la desviación estándar.
Desviación media absoluta o promedio de desviaciones. ( D.M.A)
Definición : Dado un conjunto de observacionesTales como X1, X2………Xn, la desviación media se define como el promedio aritmético de las respectivasDesviaciones absolutas con respecto a la media. nD.M.A. = ∑ Xi - X i=1 n1.- Hallar la desviación media de los siguientes datos: 9, 4,7,5,3.
Varianza: la varianza se denota por la letra
S2 ( s al cuadrado) y se define como el
cuadrado medio de las desviaciones con respecto a su media aritmética.
n 2
2 = ∑ ( Xi – X) s i=1 n
2.- encuentre la varianza delProblema anterior.
Desviación estándar: Dado un conjunto de observaciones x1, x2…. Xn,
la desviación estandar denotada por “s” se define como la raíz cuadrada de la varianza, esto es :
s = s2 n 2 = ∑ ( Xi – X) i=1 n obtenga la d. estándar del
ejercicio anterior.
Medidas de variación para datos agrupados:
1.- Si en una tabla de frecuencias x1, x2,… xk corresponden a los puntos medios de las clases y f1, f2,… fk, son las frecuencias respectivas, entonces la D.M.A. se define como:
kD.M .A. = ∑ Xi – X F i i=1 n
2.- Varianza y desviación standar:Si en una tabla de frecuencias los puntos medios de las clases son x1,x2….., xk y las frecuencias
F1, f2…..fk, entonces la varianza se define
como: k k
2= n ∑ Xi2Fi – ( ∑ XiFi )2
i =1 i=1 n2Y la desviación estándar : 2 =
54 56 58 60 65 70
55 57 59 62 66 71
55 57 60 63 67 75
55 58 60 64 69 77
56 58 60 65 70 80
Clase
Lim.reales
Marca clase xi
Frec. fi
Xi-media
Xifi Xi2 xi2fi
1 52.5-57.5
55 8 -7.67
440 3025 24200
2 57.5-62.5
60 9 -2.66 540 3600 32400
3 62.5-67.5
65 6 2.34 390 4225 25350
4 67.5-72.5
70 4 7.34 280 4900 19600
5 72.5-77.5
75 2 12.34 150 5625 11250
6 77.5-82.5
80 1 17.34 80 6400 6400
media =62.66
30 1880 119200
La tabla muestra la distribución de la carga máxima en toneladas, que La tabla muestra la distribución de la carga máxima en toneladas, que soportan ciertos cables producidos por una compañía . Determinar la soportan ciertos cables producidos por una compañía . Determinar la D.M.A. , la varianza y desviación estándar de datos agrupados. D.M.A. , la varianza y desviación estándar de datos agrupados.
Maximo de carga
N° CABLES
Marca clase xi
Xi-media
Xifi Xi2 xi2fi
9.3-9.7 2 9.5 -3.3666
19 90.25 180.25
9.8-10.2
5 10 -2.8666
50 100 500
10.3-10.7
12 10.5
-2.366
126 110.25
1323
10.8-11.2
17 11 -1.366
187 121 2057
11.3-11.7
14 11.5
-0.866
161 132.25
1851.5
11.8-12.2
6 12 -0.366
72 144 864
12.3-12.7
3 12.5
0.134 37.5 156.25
468.75
12.8-13.2
1 13 0.634 13 169 169
DISTRIBUCIÓN NORMALDISTRIBUCIÓN NORMAL
Características: 1.- distribución simétrica de las observaciones
alrededor de un valor central (µ).
2.- Forma simétrica de campana cóncava, descendente para “x” hasta un menor de la µ y convexa ascendente para “x”mayor que la desviación estándar de la µ.
3.- El valor de la media, la moda, y la mediana coinciden
4.- La distribución esta caracterizada por dos constantes la µ media y la desviación estándar, una curva normal se representa por la expresión N ( µ, Desv.standar).
5.- El área bajo la curva y sobre el eje “x” es igual a la unidad.
6.- Si a ambos lados de µ se levantan perpendiculares a una distancia de , 2 desv. Stad., 3 desv. Stand.
Las áreas bajo la curva y las perpendiculares representanLos porcentajes del área total de la curva conforme a las Expresiones siguientes:
Área entre µ ± desv. Stad. = 0.6826 = 68.26%P(µ - Desv. Stad.≤ x ≤ µ+ Desv. Stad.) = 0.6826
Area entre µ ± 2 desv. Stad. = 95.45 95.45%P ( µ - 2 Desv. Stand. ≤ x ≤ µ + 2 desv.stand.) 0.9545
Área entre µ ± 3 desv.stad. = 0.9973
-3 -2 -1 µ 1 2 3 68.26 %
La distribución normal estandar es aquella cuya media µ = 0 y desviación estandar = 1,cualquierVariable distribuida normalmente puede transformarse En una normal estandar mediante la siguiente Expresión.
Z = x - µ desviación standar
Dada una distribución normal con µ = 50 y unaDesviación estandar = 10, encuentre la probabilidad de queX tome un valor entre 45 y 62.Solución : P( 45≤ X≤ 62) = ?
Hallar el área bajo la curva normal en cada uno de los Siguientes casos y representarlos gráficamente :
a)Entre desv.stand. = 0 y desv. Stand. = 1.2 P(0 ≤ desv.stan. ≤ 1.2)
b) Entre desv. Stan. = - 0.68 y desv.stan. = 0 P ( - 0.68 ≤ desv.stan. ≤ 0 )c)Entre desv. Stan. = - 0.46 y desv. Stan.= 2.21 Área pedida = ( área entre d.s. = - 0.46 y d.s.= 0) + ( área entre d.s. = 0 y d.s. = 2.21)
d) Entre d.s.= 0.81 y d.s.= 1.94
Área pedida = ( área entre d.s. = 0 y d.s. = 1.94) – ( área entre d.s. = 0 y d.s = 0.81)
e) A la izquiera de d.s. = - 0.6
Área pedida = ( área a la izquierda de d.s.= 0) –( área entre d.s.= - 0.6 y d.s. = 0
F) A la derecha de d.s.= - 1.28
Área pedida = ( área entre d.s.= - 1.28 y d.s.= 0) +(área a la derecha de d.s.= 0)
2.-En un examen final de matemáticas la media es de 72 y la desviación estandar 15 , determinar las referencias tipificadas de los estudiantes que obtuvieron Puntuaciones de: a) 60 , b) 93, c) 72.
3.- Con referencia al problema anterior , hallar las puntuaciones correspondientes a las referencias tipificadas de a) -1 , b) 1.6
4.- Dos estudiantes fueron informados de que habían recibido referencias tipificadas de 0.8 y -0.4,respectivamente en un examen de ingles, si sus Puntuaciones fueron 88 y 64 respectivamente, hallar laMedia y la desviación estandar de las puntuaciones delExamen.
5.- La media de los pesos de 500 estudiantes de un colegio es de 151 libras y la des. Stand. Es de 15 lb. suponiendo que los pesos se distribuyen normal- mente. Hallar cuántos estudiantes pesan, a) entre 119.5 y155.5 lb.
P( 119.5 ≤ X ≤ 155.5 ) =
P ( 119.5 – 151 ≤ X -151 ≤ 155.5 – 151 ) = 15 15 15
= P ( -2.10 ≤ D.S ≤ 0.3) =
Proporción de estudiantes pedida = ( área entred.S = -2.1 y d.s = 0) + (área entre d.s.= 0 y d.s. =0.3)
= 0.4821 + 0.1179 = 0.6
Entonces el número de estudiantes es de (500) (0.6)
= 300
b) Más de 185.5 lb
P ( x ≥ 185.5 ) =
P( x - 151 ≥ 185.5 – 151) = P ( d.s. ≥ 2.30)
15 15
Proporción estudiada pedida = ( área de la derechaDe d.s. = 2.3
= (área de la derecha de d.s. = 0) – (área entre d.s.=0 y
d.s. = 2.3)
= 0.5 – 0.4893 = 0.0107
El número de estudiantes que pesan mas de 185.5 lb. es = (500) ( 0.0107) = 5.35
c) Menos de 127.5 lb
d) 128.5 lb. O menos
6.- la población de millas recorridas por camioneros presenta una media de 8500, con una d.s. de 1950. si se toma una muestra de 100 conductores, cuál es la probabilidad de la media sea : a)Mayor que 8900b)Menor que 8000c)Entre 8200 y 8700d)Entre 8100y 8400 pp-157
Datos bivariados:Datos bivariados:
La regresión y la correlación son las dos herramientas Estadísticas mas poderosas y versátiles que se pueden Utilizar para solucionar problemas.
Por ejemplo: si x es estatura y Y su peso para cada Persona pueden registrarse su estatura y su pesoCorrespondiente.
Se denomina variable independiente o variable de entradaA x y variable dependiente o variable de salida a Y.
La variable independiente x se mide o controla paraPredecir la variable dependiente.
Cuando ambos analisis, de correlación y regresiónSean aplicables al mismo problema se escribiran losDatos graficamente en un diagrama de dispersión.
Este diagrama es una grafica en un sistema de ejesDe toos los pares ordenados que forman datos Bivariados. La variable independiente x se grafica Sobre el eje horizontal, y la dependiente y aparece En el eje vertical.
Las siguientes medidas fueron registradas durante un cursoDe educación física e indican el número de sentadillas yLagartijas realizadas por 10 estudiantes seleccionadosAleatoriamente.
(27,30), (22,26), (15,25), (35,42), (30,38), (52,40), (35,32), (55,54), (40,50), (40,43).
X = sentadillas, y = lagartijas
Diagramas de dispersiónDiagramas de dispersión
CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE:
La correlación simple estudia la variaciónSimultanea de dos variables.
La correlación entre dos variables es positiva, cuando el aumento de una de ellas va acompañado de un aumento en la otra. Si el aumento de una variable coincide con una disminución en la otra,Se dice que están correlacionadas negativamente.
Si no hay relación entre las dos variables, Se dice que son independientes y que no Están correlacionadas.
Ejemplos : temperatura y longitud de una Barra de hierro, estatura y peso de una Persona, edad y presión sanguínea, precoci-Dad y rendimiento.etc….
METODO DE MINIMOS CUADRADOS( utilizando Coeficiente De correlación), la recta de mejor ajuste.
El propósito del análisis de la regresión es determinar Una recta de que se ajuste a los datos muéstrales.
Utilizando este método se producirá una recta quePasa por el centro del diagrama de dispersión Aproximándose a los puntos.
Coeficiente de Coeficiente de correlación:correlación:es un valor que indica el es un valor que indica el grado de asociación entre grado de asociación entre dos variablesdos variablesValores posibles:
a)Si el c.c. = 0 las variables son independientes no hay correlación.b) Si el C.C. = +1 Hay correlación positiva y perfecta
c) Si el C.C. = -1 Hay correlación negativa y perfectad) 0< C.de C. < 1 Y -1< C.de C.< 0
Sugiere cierto grado de asociación. Si la muestra fueTomada al azar de una población.
Formulas:Formulas:
r = ∑ ( X – X) ( Y – Y) = ∑ X Y (X²) (Y²) (X²) (Y²)
r = coeficiente de correlación ( X – X) = x, desviación de la variable x ( Y – Y) = y, desviación de la variable y X Y = producto de dos desviaciones n = n° de observaciones
x² = x² - (x)² n
y² = y² - (y)² n
xy = xy - (x) (y) n
Ejemplo:Ejemplo:
En un muestreo de personas de diferentes edadesSe tomaron datos de la edad “x “ en años y el Promedio de la presión sanguínea “y” en mm de Mercurio , los valores se ilustran en la siguiente tabla.
DATOS EDAD X
PRESIÓN Y
PRODUCTO (XY)
CUADRADOS X² Y²
1 19 122
2 25 125
3 30 126
4 42 129
5 46 130
6 52 135
7 57 138
8 62 142
9 70 145
10 73 146
X = Y= XY= X²= Y²=
XY = ( 65119) - (476) (1338) 10= 65119 – 63688.8= 1430.2
X²= 25792 – ( 476)² 10 = 3134.4
Y² = 179700 - (1338)2 10 = 179700 – 179024.4 = 675.6
r = 1430.2 = 0.9828 ( 3134.4) (675.6) indica que existeUna relación positiva entre la edad y presión
Ecuación de predicción: ^ Y = y + b ( x – x)
Y = valor teórico ordenado de la línea de regresión.y = promedio de la variable dependienteb = pendiente de la línea de regresión de la muestra o coeficiente de regresión.
X = promedio de la variable independiente
X = cualquier valor de la variable independiente.
El coeficiente de regresión (b) indica el incremento promedio de Y al aumentar X en una unidad.
b = xy x² Y = y n
x = x n
x² = x² - (x)² n
xy = xy - (x) (y) n
b = 1430.2 = 0.45629 3134.4
Y = 133.8 = 133.8 10
X = 476 = 47.6 10
^Y = 133.8 + 0.4563 ( X – 47.6) = 133.8 – 21.72 + 0.4563 X = 112.08 + 0.4563 X
¿ si dos personas tienen 45 y 56 años cual será su presión aproximadamente?
Ejercicio : 2
Se recolectaron los datos mensuales por Gastos de publicidad y número de pasajerosPor 15 meses mas recientes los datos apare-en en la table. Desarrolle los cálculos nece-Sarios para obtener el modelo de regresión
Mes Publicidad
pasajeros xy x² y²
1 10 15
2 12 17
3 8 13
4 17 23
5 10 16
6 15 21
7 10 14
8 14 20
9 19 24
10 10 17
11 11 16
12 13 18
13 16 23
14 10 15
15 12 16
Pp 333