Des Arrollo

28
COMPENDIO SEIS JENNIFER XIMENA SANCHEZ BARRIOS WALVIN JHOVANNY CAICEDO GARCIA LIC. JORGE OBANDO UNIVERSIDAD COOPERATIVA DE COLOMBIA VILLAVICENCIO – META

description

desarrollo

Transcript of Des Arrollo

Page 1: Des Arrollo

COMPENDIO SEIS

JENNIFER XIMENA SANCHEZ BARRIOSWALVIN JHOVANNY CAICEDO GARCIA

LIC. JORGE OBANDO

UNIVERSIDAD COOPERATIVA DE COLOMBIAVILLAVICENCIO – METACONTADURIA PÚBLICA

ESTADISTICA DESCRIPTIVAGRUPO 502

2015-1

Page 2: Des Arrollo

DESVIACION MEDIA PARA DATOS NO AGRUPADOS

EJEMPLO:

Los siguientes datos fueron tomados en el laboratorio de física:

X = Espacio recorrido

t = tiempo

X Espacio (cm.) 10 20 30 40

Tiempo (seg.) 0.3 0.4 0.45 0.5

Calculemos el tiempo promedio

X=

0 .3+0. 4+0 .45+0 . 54 = 0,413

Miremos como los datos representados en segundos se acercan o se alejan de

este valor promedio.

Dm=∑i=1

n

|Xi−X|

n =

|0 . 3−0. 413|+|0 . 4−0 . 413|+|0 . 45−0. 413|+|0 .5−0 .413|4 = 0.0625

0.063 es el error promedio que se comete al remplazar los segundos de cada

medida de cada uno de los datos por 0.413 segundos.

Esta distancia corta habla también de la homogeneidad de los datos y de la

confianza que se le debe tomar a esta media aritmética

Page 3: Des Arrollo

DESVIACION MEDIA PARA DATOS AGRUPADOS

Xi = Marca de clase del intervalo de referencia

X = Media Aritmética

f = frecuencia absoluta

n = número de datos

EJEMPLO:

La siguiente tabla representa los salarios (Medidos en miles de pesos diarios) de

50 trabajadores entre los que se cuentan, celadoras, aseadoras, secretarias de un

núcleo educativo. Determine la desviación media de estos datos.

Salarios F Xi f*Xi |Xi−X| |Xi−X|*f100 _ 200

200 _ 300

300 _ 400

400 _ 500

500 _ 600

600 _ 700

10

15

5

10

5

5

150

250

350

450

550

650

1500

3750

1750

4500

2750

3250

200

100

0

100

200

300

2000

1500

0

1000

1000

1500

Total 50 17500 7000

X=1750050 = $350.000

Dm=∑i=1

n

|Xi−X|∗f

n =

700050 = 140

Dm=∑i=1

n

|Xi−X|∗f

n

Page 4: Des Arrollo

VARIANZA PARA DATOS NO AGRUPADOS

EJEMPLO:

En una universidad de la región se nota que el promedio de los hombres en las

notas del primer periodo corresponde a 3.2 y la suma de los cuadrados de todas

las notas tiene un valor 900; y la media de las mujeres es de 3 con una suma de

cuadrados de 900; determine cuál de los dos grupos es mas variable en su

rendimiento sabiendo que son 30 hombres y 20 mujeres.

S2h =

∑i=1

n

Xi2

n - X2 =

90030

−(3 . 2)2 = 30 – 10.24 = 19,76

S2m =

∑i=1

n

Xi2

n - X2 =

90020

−(3 )2 = 45 – 9 = 36

Como la varianza es más pequeña en la de los hombres, podemos decir que el

grupo de las mujeres es mas variable en su rendimiento, entendiéndose por la

variabilidad en el hecho de que pueden existir estudiantes mujeres con notas más

bajas que altas.

S2=∑i=1

n

(Xi−X )2

n

Page 5: Des Arrollo

2. A la rectoría del colegio han llegado 15 cajas con libros de diferentes

editoriales para ser revisados y evaluados por los docentes. El

encargado de abrir las cajas es el rector del colegio. El deberá

seleccionar los libros por áreas para entregarlos a los respectivos

profesores. En el transporte de los libros desde la editorial hasta la

rectoría sufrieron algunos daños. Los siguientes datos representan las

cajas y la cantidad de libros que se han dañado por caja.

C1=1 C2=2 C3=0 C4=5 C5=2

C6=3 C7=1 C8= 4 C9=3 C10=1

C11=0 C12=3 C13=1 C14=0 C15=5

3 Cajas cada una con 0 libros dañados Total Libros =

0

4 cajas cada una con 1 libro dañado Total Libros =

4

2 Cajas cada una con 2 libros dañados Total Libros =

4

3 Cajas cada una con 3 libros dañados Total Libros =

9

1 Cajas cada una con 4 libros dañados Total Libros =

4

2 Cajas cada una con 5 libros dañados Total libros =

10

Total de cajas 15; total de libros dañados 31

Promedio de Libros dañados por Caja: = 3115 = 2.06

S2 = (0−2. 06 )2∗3+(1−2. 06 )2∗4+(2−2. 06 )2∗2+(3−2. 06 )2∗3+( 4−2. 06 )2+(5−2 .06 )2∗215

=2 .72

Page 6: Des Arrollo

Este valor pequeño de desviación indica que el promedio de libros

dañados por caja es confiable, se puede afirmar con seguridad dicho

valor.

VARIANZA PARA DATOS AGRUPADOS

EJEMPLO:

Se desea determinar la desviación Standard de la situación económica de 50

familias clasificadas en diferentes estratos y que pertenecen a la comunidad

educativa de un colegio. Los datos expuestos en la siguiente tabla representan los

salarios que devengan dichas familias medidos en miles de pesos.

Salarios f

100 _ 200 1

200 _ 300 14300 _ 400 25400 _ 500 7

500 _ 600 350

Para encontrar el valor de la varianza se elabora la siguiente tabla la que permitirá

calcular primero la media y con la formula llegar al resultado esperado.

Salarios f Xi f*Xi (Xi-X )2 (Xi-X )2*f100 _ 200 1 150 150 40000 40000

S2=∑i=1

n

(Xi−X )2∗f

n

Page 7: Des Arrollo

200 _ 300300 _ 400400 _ 500500 _ 600

142573

250350450550

3500875031501950

100000

1000090000

1400000

70000270000

17500 520.00

X=1750050

= $350.000 Salario promedio

S2 =

520 . 00050 =10.400

DESVIACION STANDART

Ejemplo de Aplicación

Consideremos la distribución de datos dado por los siguientes números los que

representan el comportamiento de las valoraciones alcanzadas por tres

estudiantes en las asignaturas de: Química, Física, español, trigonometría y

filosofía para efecto de graficación se ha hecho la siguiente semejanza.

D = 1; I = 2; A = 3; S = 4; E= 5.

Nombres Química Física Español Trigo Filosofía

Juan Carlos Sánchez

David Alejandro Morales

Laura Natalia Céspedes

I

A

S

A

S

A

A

S

I

D

I

A

A

A

S

Si reemplazamos la tabla de las valoraciones con su respectiva denominación

obtenemos la tabla.

Nombres Química Física Español Trigo Filosofía

S=√∑i=1

n

(Xi−X )2∗f

n

Page 8: Des Arrollo

Juan Carlos Sánchez

David Alejandro Morales

Laura Natalia Céspedes

2

3

4

3

4

3

3

4

2

1

2

3

3

3

4

Aunque a simple vista podemos determinar cuál es el estudiante con mejor

desempeño en las cinco asignaturas dejemos que el resultado de la desviación

Standard calculada en Excel sea quien determine el estudiante con mayor

variabilidad.

Juan Carlos es el que presenta mayor variabilidad de su promedio, indica que

tiene valoraciones bajas y eso perjudica su promedio. David y Laura tienen la

misma desviación Standard y aunque no tienen los mismos las mismas

valoraciones a los dos se les pueden clasificar en el mismo rango de rendimiento

académico.

COEFICIENTE DE VARIACION MEDIA:

Por ejemplo, para una colección de datos que representan la edad de 15

estudiantes.

10 8 7 6 9

5 7 8 10 6

7 8 9 10 9

Calculemos la edad promedio

Page 9: Des Arrollo

X =

5+6∗2+7∗3+8∗3+9∗3+10∗315 = 7,9 años

Ahora la desviación Standard

S =

(5−7 .9 )2+(12−7 . 9)2+(21−7 .9 )2+(27−7 .9 )2+(30−7 .9)2

15 = 1,6 años

Cv =

1. 6mts7 .9mts = 0,20

EJERCICIOS DE APLICACIÓN

1. El ICFES decidió establecer un nuevo currículo para las materias de ciencias y

matemáticas en las escuelas intermedias públicas del país. Para probarlo

selecciono 9 escuelas según la disponibilidad de los maestros de esas escuelas y

la recomendación de las secretarias de Educación. Luego de implantados los

cambios, decidieron demostrar que esas escuelas son representativas del total de

escuelas intermedias públicas del país. Utilizaron como criterio de

representatividad el ingreso promedio (en miles de pesos) de los padres de

estudiantes que asisten a esas escuelas. Los resultados se resumen en la

siguiente gráfica.

Los resultados indican que en las nueve escuelas cerca del 72.5% de los

estudiantes estaban bajo el nivel de pobreza, mientras que en la población de

escuelas ese porcentaje es del 79.75%. La desviación estándar poblacional es de

7.8 puntos porcentuales. Su conclusión es que como el 72.5% se encuentra a

Page 10: Des Arrollo

menos de una desviación estándar de la media poblacional de 79.75%, entonces

no hay diferencia significativa.

La conclusión del centro es errónea PORQUE Las escuelas de la muestra tienen

un nivel de pobreza promedio menor que los de la población

2. Los siguientes datos representan las edades de los pacientes admitidos al

hospital departamental de Villavicencio durante el mes de agosto de este año:

37 62 47 54 54 8 63 7

81 1 16 3 64 2 24 10

11 39 16 4 34 22 24 6

80 4 35 58 71 84 8 10.

Durante el mes de agosto de 2002, la edad media de los pacientes admitidos al

hospital de la comunidad era de 8 años. ¿Hay suficiente evidencia para concluir

que la edad media de los pacientes admitidos durante el mes de agosto de este

año es mayor que la edad mediana de los admitidos en el 2002?

I. se debe calcular la media y realizar una diferencia para establecer la evidencia

de la afirmación

II. Se debe calcular la varianza para establecer la veracidad de la afirmación

COMANDOS EN R RESULTADO

>Datos=c(37,62,47,54,54,8,63,7,81,1,16,3,64,2,

24,10,11,39,16,4,34,22,24,6,80,4,35,58,71,84,8,10)

>Rang=max(Datos)–min(Datos)

>Rang

83

>m=1+3.3*log10(32)

>m

5,95

Se redondea por exceso 6

>C =Rang/m

>C

Page 11: Des Arrollo

13,83

Se redondea por exceso a 14

>NRang = C * m

>NRang

84

NRang-Rang= 84 – 83 = 1

Xmin - 0.5 = 0.5

Xmax + 0.5 = 84.5

Con los resultados de la tabla ya se puede hacer:

Media. Variación

Media=∑i=1

n

( f∗Xi )

n

X =

105232

=32.8125 = 33

S2=∑i=1

n

(Xi−X )2∗f

n

S2=20947 . 5432 =654.61

La edad promedio de los pacientes en este año es de: 33 años.

La edad promedio de los pacientes en el 2002 es de: 8 años.

Mediactual-Media2002= 33-8= 25

3. Una compañía recoge información sobre los precios de libros de texto de

matemáticas. En el 2000, el precio promedio para todos los textos de matemáticas

Edades F xi f* xi (Xi-X )2 (Xi-X )2*f0.5 _ 14.5

14.5 _ 28.5

28.5 _ 42.5

42.5 _ 56.5

56.5 _ 70.5

70.5 _ 84.5

12

5

4

3

4

4

7.5

21.5

35.5

49.5

63.5

77.5

90

107.5

142

148.5

254

310

640.72

127.97

7.22

278.47

941.72

1996.97

7688.64

639.85

28.88

835.41

3766.88

7987.88

32 1052 20947.54

Page 12: Des Arrollo

era de $45.400, con una desviación típica de $100. Los precios de 32 libros de

matemáticas seleccionados al azar durante este año son:

50 40 41 48 48 42 49 50

48 45 56 41 57 42 45 46

45 66 45 45 55 66 42 50

46 46 55 48 45 58 47 35

El precio promedio de los libros para este año es mayor que el precio de los libros

en el año 2000 POR QUE, el coeficiente de variación es también mayor.

COMANDOS EN R RESULTADO

>Datos=c(50,40,41,48,48,42,49,50,48,45,56,

41,57,42,45,46,45,66,45,45,55,66,42,50,46,

46,55,48,45,58,47,35)

>Media=mean(Datos)

>49

MediaVariación

Coeficiente de

variación

Media=∑i=1

n

( f∗Xi )

n

X =

152432

=

48.1875= 49

S2=∑i=1

n

(Xi−X )2∗f

n

>X=c(35,40,41,42,45,46,47,48,49,50,55,56,57,58,66)> D2=sum(Media-X)^2> D2[1] 148.5352> Var=D2/n> Var[1] 4.641724

>

Cv=(sqrt(Var)/Media)*1

00

> Cv

[1] 4.471006

> Cvx=45.4/100

> Cvx

[1] 0.454

>

Page 13: Des Arrollo

El precio promedio actual de los libros: $48.187

El precio promedio de los libros en el año 2000: $45.400

4. Multiplicando por 4 cada uno de los valores de la variable, X: 3, 2, 0,

5, se obtiene la serie Y: 12, 8, 0, 20, Para comprobar que las series

tienen el mismo coeficiente de variación se debe

Calcular las medias de ambas series

Calcular la Varianza de ambas series

Medias Varianza

Desviación

estándar

coeficiente d

variación

×=3+2+0+54

= 2.5

×=12+8+0+204

=

10

S=√S2

CV=1.802.5

∗100

=72%

CV=7.2110

∗100=

72%

5. En una universidad de la capital, se ha Encontrado que los promedios en los 4

primeros semestres de las notas de Matemáticas corresponden a: 3.2, 3.4, 3.0,

3.8, si la cantidad de alumnos matriculados fue de 30, 35, 40, 22 respectivamente,

S2=

(3−2. 5)2+(2−2. 5)2+(0−2.5 )2+(5−2 .5 )2

4=3 .25

S2=(12−10 )2+(8−10 )2+(0−10 )2+(20−10 )2

4=52

S=√3 . 25=

1.80

S=√52 =

7.21

S2=∑i=1

n

(Xi−X )2

n

Page 14: Des Arrollo

y sabiendo que existe un 4 de Varianza, entonces el coeficiente de variación del

promedio total de las notas de los cuatro semestres corresponde a:

A. 60.6 % B. 70.6% C. 75.6% D. 65.6%

E. 55.6%

1semestre 2semestre 3 semestre 4semestre

Notas 3.2 3.4 3.0 3.8

matriculados 30 35 40 22

Media Variación

Desviación

estándar

Coeficiente de

variación

Notas=c (3.2, 3.4, 3.0, 3.8)

Matriculados=c(30,35,40,22)

nMatriculados=sum (Matriculados)

Media=sum

(Matriculados*Notas)/nMatriculados

Media

[1] 3.296063

S2=∑i=1

n

(Xi−X )2∗f

n

S2==4

S=√S2

S=√4

= 2

CV= 23,296963

∗100

=60%

Nota F

3,2 30

3,4 35

3,0 40

3,8 22

127

Page 15: Des Arrollo

6. En una distribución de datos correspondientes a salarios de 50 educadores de

un colegio, Se encontró que el salario promedio es de $600.000, con una varianza

de $625, se puede concluir que:

1. La varianza en el ejemplo representa una buena medida para establecer la

veracidad del dato promedio.

2. $600.000 de acuerdo a la desviación Standard no es una medida suficiente

representativa.

3. La media de $600.000 es suficientemente representativa ya que la desviación

estándar es pequeña.

4. La media no está acorde con la realidad lo dice el enorme tamaño de la

Varianza.

Media Varianza Desviación

estándar

Coeficiente de

variación

600 S2=∑i=1

n

(Xi−X )2∗f

n

S2=625

S=√S2

S=√625 = 25

Cv= SX

Cv=25600

Cv=4,16%

7. Mediante una curva normal y utilizando las desigualdades de TChebycheff se

diseño un modelo para cualificar el desempeño académico de los estudiantes de

la U.C.C en el programa de Sistemas.

D = deficiente

R = Regular

B=bueno

S=Sobresaliente

E=Excelente

O=Optimo

.

Page 16: Des Arrollo

Si en total existen 180 estudiantes con un promedio total de 3,4 y un coeficiente

de variación del 2.5%, entonces ¿cuántos estudiantes sobresalientes tiene la

facultad?

n Media

Coeficiente

de variación Porcentajes

Estudiantes

sobresaliente

s

180 3,4 2,5%

D = 2%

R = 10%

B=55%

S=25%

E=5%

O=3%

180 100%

X 25%

=45

A. 100

B. 96

C. 45

D. 99

E. 9

8. La Varianza de todo el grupo corresponde a:

A. 0.085

B. 0.025

C. 7.2

Page 17: Des Arrollo

D. 0.085

E. 0.0072

Coeficiente de variación Varianza

Desviación

estándar

CV=0,0853,4

∗100 =2,5%

S2=∑i=1

n

(Xi−X )2∗f

n

S2=0 ,0072

S=√S2

S=√0 ,0072 =

0,085

9. Una cantidad que se toma en cuenta para evaluar proyectos azarosos es la

desviación estándar. Ésta mide la dispersión de los resultados del proyecto

azaroso. Es decir, si hay dos proyectos: A y B. Y si la desviación estándar del

rendimiento del proyecto A es mayor que la del B. El proyecto A es más

arriesgado, el B es más Estable. Si ambos tienen valor esperado parecido el A

tiene posibilidades de rendir mucho más que el B pero, también el A tiene

posibilidad de generar mayores pérdidas que el B.

La Afirmación anterior es verdadera porque:

A. La desviación Standard mide la variabilidad de dos grupos A y B cualquiera.

C. La desviación Standard permite comparar a dos grupos y decidir la estabilidad

del uno con respecto al otro.

D. La desviación Standard mide el margen de error de un grupo con respecto a

otro.

E. La desviación Standard mide la distancia entre los datos y la media aritmética

F. La desviación Standard mide el margen de error cometido al usar la media en

una distribución

10. La resistencia de 100 baldosas de la fabrica “De las casas “se referencia en la

siguiente tabla.

Page 18: Des Arrollo

SI el

promedio de salario en la fábrica de “Las casas” es de

$541.000 y la desviación Standard es $1.791

Concluimos que:

A. Es mucho más dispersa la información correspondiente a la resistencia de las

baldosas.

B. Es mucho más dispersa la información correspondiente al salario de los

empleados.

C. Ambas informaciones presentan la misma dispersión y por tanto no se puede

tomar una decisión.

D. La Varianza en los salarios es diferente en la resistencia de las baldosas eso

hace que el análisis entre las dos informaciones sea indiferente

11. Se consulto en 30 almacenes de la capital el precio de monitores para

computador y se obtuvo los siguientes resultados en miles de pesos.

100 101 120 115 130 150 112 145 138 121

126 115 140 137 143 118 147 149 150 115

100 127 135 149 146 137 122 118 135 129

Kg./Cm2 F

100_ 200

200_ 300

300_ 400

400_ 500

500_ 600

600_ 700

700_ 800

4

10

21

33

18

9

5

100

xi f* xi (Xi-X )2 (Xi-X )2*f150

250

350

450

550

650

750

600

2500

7350

14850

9900

5850

3750

88804

39204

9604

4

10404

40804

91204

355216

392040

201684

132

187272

367236

456020

44.800 1.959.600

Page 19: Des Arrollo

Elabore una distribución de frecuencias, para datos agrupados, indicando los

valores de los límites reales. Y calcule: Cuartil 2, Coeficiente de variación,

Interpretación con respecto al Cv.

COMANDOS EN R RESULTADO

>Datos=c(100,100,101,112,115,115,115,

118,118,120,121,122,126,127,129,

130,135,135,137,137,138,140,143,

145,146,147,149,149,150,150)

>Rang=max(Datos)–min(Datos)

>Rang

50

>m=1+3.3 log10(30)

>m

5,851

Se redondea por exceso a 6

>C =Rang/m

>C

8,33

Se redondea por exceso a 9.

>NRang = C * m

>NRang=9*6

>NRang

54

NRang-Rang= 54 – 50= 4

Xmin - 2 = 98

Xmax + 2= 152

Page 20: Des Arrollo

Con los resultados de la tabla ya se puede hacer:

Cálculo de la media

variación

Desviación

estándar

Coeficiente de

variación segundo Cuartil

Media=∑i=1

n

( f∗Xi )

n

X =

387630

=

129.2= 130

S2=∑i=1

n

(Xi−X )2∗f

n

S2=6720 ,330 = 224,01

S=√S2

S=√224 ,01= 14.9669

CV=14,9669129,2

∗100

= 11%

2(30)4

= 15

sabemos que las operaciones se harán en el cuarto intervalo ya que en las

frecuencias acumuladas el valor de 15 queda perfectamente contenido en 16.

Por tanto:

Li = 125 Fa = 12 C=9

2n4 =15 fo=4

Q2 =

Li+( 2∗n4

−Fa

fo )∗c

Precios f F xi f* xi (Xi-X )2 (Xi-X )2*f98 _ 107

107 _ 116

116 _ 125

125 _ 134

134 _ 143

143 _ 152

3

4

5

4

7

7

3

7

12

16

23

30

102,5

111,5

120,5

129,5

138,5

147,5

307,5

446

602,5

518

969,5

1032,5

712,89

313,29

75,69

0,09

86,49

334,89

2138,67

1253,16

378,45

0,36

605,43

2344,23

30 3876 6720,3

Page 21: Des Arrollo

Q2 =

Li+( 2n4

−Fa

fo )∗C. = 125 +

(15−124 )

*9 = 131,75

Lo que indica que el 50 % de los precios de los monitores corresponden

a $131.450

SEGUNDO CUARTIL

COMANDOS EN R RESULTADO

>precios=c(100,100,101,112,115,115,

115,118,118,120,121,122,126,127,

129,130,135,135,137,137,138,140,

143,145,146,147,149,149,150,150)

>quantile(precios,prob=seq(0,1,length=5),type=6)

0% 25% 50% 75% 100%

100.00 117.25 129.50 143.50 150.00

13. En los siguientes enunciados uno es verdadero.

A. La media en una muestra de datos agrupados la divide en dos partes iguales.

B. Una distribución de datos permite calcular todas las medidas de tendencia

central

C. La moda es un dato que permite analizar un resultado esperado.

D. Una medida de dispersión esta libre del cálculo de la media

14. Cuando la media aritmética de un determinado número de datos es

$270.50 y la desviación típica es de $33.99, el coeficiente de variación

(CV) es igual a:

A. 6.2%

B. 795.82%

C. 2.6%

D. 5.4%

Page 22: Des Arrollo

E. 1.8%