Balotario de Estadistica

19
BALOTARIO DE BIOESTADISTICA 1. El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos: 0 0 1 1 1 1 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 5 6 Se pide: a) Construir una tabla de distribución de frecuencias absolutas. b) ¿Cuál es el número de familias que tiene como máximo dos hijos? c) ¿Cuántas familias tienen más de 1 hijo pero como máximo 3? d) ¿Qué porcentaje de familias tiene más de 3 hijos? Solución: a) Variable: Número de hijos (discreta) Dato estadístico: 0, 1, 2, 3, 4, 5, 6 b) 27 27 21 4 2 2 3 2 1 F ó f f f c) 36 6 42 36 15 21 2 4 4 3 F F ó f f d) , 16 , 0 2 , 0 2 , 0 12 , 0 7 6 5 h h h i x i f i F i h i H 0 1 2 3 4 5 6 2 4 21 15 6 1 1 2 6 27 42 48 49 50 0,04 0,08 0,42 0,30 0,12 0,08 0,02 0,04 0,12 0,54 0,84 0,96 0,98 1,00 n=50 00 , 1 i h

description

.

Transcript of Balotario de Estadistica

BALOTARIO DE BIOESTADISTICA

1. El gobierno desea averiguar si el número medio de hijos por familia ha descendido respecto de la década anterior. Para

ello ha encuestado a 50 familias respecto al número de hijos, y ha obtenido los siguientes datos:

0 0 1 1 1 1 2 2 2 2

2 2 2 2 2 2 2 2 2 2

2 2 2 2 2 2 2 3 3 3

3 3 3 3 3 3 3 3 3 3

3 3 4 4 4 4 4 4 5 6

Se pide:

a) Construir una tabla de distribución de frecuencias absolutas.

b) ¿Cuál es el número de familias que tiene como máximo dos hijos?

c) ¿Cuántas familias tienen más de 1 hijo pero como máximo 3?

d) ¿Qué porcentaje de familias tiene más de 3 hijos?

Solución:

a) Variable: Número de hijos (discreta)

Dato estadístico: 0, 1, 2, 3, 4, 5, 6

b) 27272142 2321 Fófff

c) 36642361521 2443 FFóff

d) ,16,02,02,012,0765 hhh

ix if iF ih iH

0 1 2 3 4 5 6

2 4 21 15 6 1 1

2 6 27 42 48 49 50

0,04 0,08 0,42 0,30 0,12 0,08 0,02

0,04 0,12 0,54 0,84 0,96 0,98 1,00

n=50 00,1ih

2. Los siguientes datos muestran los costos de producción de un determinado artículo

en 65 centros de producción:

487,7 457,2 473,3 475,0 487,2 450,0

511,4 513,0 486,7 452,6 496,7 489,2

448,9 474,7 517,2 488,5 436,8 465,6

514,7 512,6 524,3 462,4 525,6 478,7

513,0 445,7 489,4 484,2 467,2 476,7

477,8 453,4 466,7 505,7 466,8 495,2

503,2 492,3 508,7 439,6 499,7 461,2

438,7 471,7 469,5 482,3 478,3 510,8

483,5 481,2 487,4 457,8 471,2 500,7

468,3 455,6 477,9 493,2 459,3 499,2

471,7 479,2 512,7 483,4 462,0

Elabore una tabla de distribución de frecuencias.

Solución

Para elaborar una tabla de distribución de frecuencias agrupadas, se debe seguir los

siguientes pasos:

i) Cálculo de rengo o recorrido (R): Es la diferencia numérica que hay entre el

dato mayor y el dato menor:

MínMáx XXR

R= 525,6-436,8

R= 88,8

ii) Elección del número de intervalo de clase (NC): Es el número de intervalos en

el que se va a dividir la información.

a) (Regla de Sturges)

NC=1+3,3Logn

Donde n = total de datos de la muestra

Nc=1+3,3log(65)

NC = 1+3,3(1,812913357)

NC =1+5,982614077=6,982614077(se aproxima al entero)

Nc=7 (intervalos de clase)

i) Determinación del tamaño o amplitud de un intervalo de clase (C):

Cuando no se conoce los límites de un intervalo, la amplitud es igual al

cociente del rango entre el número de intervalos de clase:

NC

RC

7,127

8,88C

ii) Formación de los intervalos de clase(LI-LS): Formar los intervalos de

clase, significa hallar los limites inferior y superior de cada intervalo, y para

ello se parte del dato menor y se le suma la amplitud del intervalo de la

siguiente manera:

Limites nominales

LI-LS

Conteo

fj

Fi hi%

436,8-449,4

449,5-462,1

462,2-474,8

474,9-487,5

487,6-500,2

500,3-512,9

513,0-525,6

IIII

IIII IIII

IIII IIII II

IIII IIII IIII

IIII IIII

IIII III

IIII I

5

9

12

15

10

8

6

5

14

26

41

51

59

65

7,69

13,85

18,46

23,08

15,38

12,31

9,23

65jf

3. Supongamos que una empresa ha obtenido durante los primeros seis meses las

siguientes cifras de ventas:

Enero : S/. 240 640 Abril : 320 560

Febrero : 260 600 Mayo : 360 850

Marzo : 285 700 Junio : 385 800

Hallar el promedio aritmético.

Solución:

6

800385850360560320700285600260640240 X

X = S/. 309 025

4. Determinar el número promedio de trabajadores por empresa:

Solución

Luego: n

xf

X

n

i

ii 1

Número de trabajadores

xi

Número de empresas

fj

2 3 4 5 6

1 4 7 5 3

n=20

xi fi fjxj

2 3 4 5 6

1 4 7 5 3

2 12 28 25 18

n=20

5

1

85j

jj xf

425,420

85X Trabajadores por empresa

5. Determine la moda en las series:

1) 6 8 6 9 10 3 6 3

2) 12 15 16 18 23 26

3) 5 6 7 7 7 8 9 9 9 10

Solución

(1) 6 8 6 9 10 3 6 3

Luego M0=6, es una distribución unimodal

(2) 12 15 16 18 23 26

No moda, la distribución de este tipo se llama uniforme

(3) 5 6 7 7 7 8 9 9 9 10

Xi fi

3

6

8

9

10

2

3

1

1

1

xi fi

12

15

16

18

23

26

1

1

1

1

1

1

Luego:

M`0=7; M´´0=9 , es una distribución bimodal

6. Considerando la distribución de frecuencias de la siguiente tabla:

Sueldos (soles) Número de trabajadores

90-119

120-149

150-179

180-209

210-239

240-269

270-299

11

13

20

17

15

3

1

Total n=80

Calcular el valor modal, moda o sueldo más frecuente en los 80 trabajadores.

Solución

CLiM

21

10

Clase modelo (III Clase)

Li=150

1 =20-13=7

2 =20-17=3

C=30

xi fi

5

6

7

8

9

10

1

1

3

1

3

1

Mo =150+30 171/37

7S

7. Hallar la mediana de los valores: 4, 1, 4, 8, 5, 6, 9

Solución

Ordenando los datos en forma ascendente:

1 4 4 5 6 8 9

x1 x2 x3 x4 x5 x6 x7

Md=5

8. Si los sueldos de 8 trabajadores, ya ordenados son:

S/ 323, 425, 428, 432, 440, 445, 500,510 (n=8)

Entonces el valor de la mediana es:

SOLUCION

2

440432 Md

436/2

872SMd

9. Calcular el sueldo mediano correspondiente a los 80 trabajadores de la distribución de

frecuencias de la siguiente tabla:

Sueldos fj Fi

90-119

120-149

150-179

180-209

210-239

240-269

270-299

11

13

20

17

15

3

1

11

24

44

61

76

79

80

80

Solución

Cfm

mFn

LiMdi

1

2

i) Calcular la posición de la Md:

402

80

2

n (III clase) y se ubica en Fi

ii) Li= 150

Fi-1m=24

fm=17

C=30

iii) Remplazando los valores en la fórmula:

Md = 150+30

20

2440=s/. 178

10. Dada la siguiente distribución determinar los cuartiles Q1 y Q3

CLASES NOMINALES LI – LS

fj Fi

207,4-220,0

220,1-232,7

232,8-245,4

245,5-258,1

258,2-270,8

270,9-283,5

283,6-296,2

19

22

25

27

20

18

15

19

41

66

93

113

131

146

146

Solución

i) Determinación del Q1:

CfQ

QFn

LiQi

1

11

14

)(1

Posición del Q1: 5,364

146

4

n en fa (II clase)

7,1222

195,361,2201

Q

7,1222

59,171,2201

Q

20,23010,101,2201 Q

ii) Determinación del Q3:

CfQ

QFn

LiQi

3

31

34

)(3

Posición del Q3 : 5,1094

)146(3

4

3

n en fa (V clase)

7,1220

935,1092,2583

Q

68,2684775,102,2583 Q

11. Dada la siguiente distribución determinar los cuartiles D7

CLASES NOMINALES LI – LS

fj Fi

207,4-220,0

220,1-232,7

232,8-245,4

245,5-258,1

258,2-270,8

270,9-283,5

283,6-296,2

19

22

25

27

20

18

15

19

41

66

93

113

131

146

146

SOLUCION:

CfD

DFn

LiDi

7

71

7

10

7

Posición del D7: 2,10210

)146(7

10

7

n en fa (V clase)

04,2647,1220

932,1022,2587

D

12. La siguiente tabla muestra la distribución de salarios de 65 empleados de cierta

compañía (año 2012)

SALARIOS (En miles de soles)

NÚMERO DE EMPLEADOS

Fi

50-59 60-69 70-79 80-89 90-99

100-109 110-119

8 10 16 14 10 5 2

8 18 34 48 58 63 65

TOTAL 65

Calcular P99

Solución

CfP

PFkn

LiPi

99

991

99

100

Posición del P1: 35,64100

)65(99

100

99

n en fa (VII clase)

102

6335,6411099

P

102

35,111099

P

75,11675,611099 P

13. Un ama compara los precios de las chuletas de cerdo en carnicerías de diferentes

mercados de Ica. Observa los siguientes precios por kilogramo: (en nuevos soles, caso

hipotético)

5,6 6,5 4,8 7,3 6,3

Se pide encontrar la varianza.

Solución

1,65

5,30

5

3,63,78,45,66,5

X

5

)1,63,6()1,63,7()1,68,4()1,65,6()1,66,5( 222222 S

5

)2,0()2,1()3,1()4,0()5,0( 222222 S

72,05

58,3

5

04,044,169,116,025,02

S

14. Calcular la varianza de los sueldos de 80 trabajadores, de la tabla:

SOLUCION:

La varianza para datos agrupados: Se define por:

n

XXf

S

n

j

jj

2

12

)(

36,190380

80,1522682 S

Sueldos fi

90-119

120-149

150-179

180-209

210-239

240-269

270-299

11

13

20

17

15

3

1

n=80

Sueldos Xj fi fi Xj (xj- X ) (xj- X )2 fj(xj- X )2

90-119

120-149

150-179

180-209

210-239

240-269

270-299

104,5

134,5

164,5

194,5

224,5

254,5

284,5

11

13

20

17

15

3

1

1149,5

1748,5

3290,0

3306,5

3367,5

763,5

284,5

-69,4

-39,4

-9,4

20,6

50,6

80,6

110,6

4816,36

1552,36

88,36

424,36

2560,36

6496,36

12232,36

52979,96

20180,68

1767,20

7214,12

38405,4

19489,08

12232,36

n=80 13910,0 152268,80

15. Calcular la desviación típica de un trabajador que tuvo las siguientes tardanzas

durante los meses de Enero a Agosto: 10, 10, 8, 10, 10, 12, 10, 10

Solución

(i) Para datos no agrupados: Se definen por:

n

Xx

S

n

i

i

1

2)(

108

80X

118

8S

16. Sea el experimento aleatorio: “Lanzar dos dados simultáneamente’’. Describa el evento A:

’’La suma total en los dados no excede a 6’’

Solución:

Sea el experimento: ‘’Lanzar dos dados simultáneamente’’

Xi (xi- X ) (xi- X )2

10

10

8

10

10

12

10

10

0

0

-2

0

0

2

0

0

0

0

4

0

0

4

0

0

80 xi

8)( 2 Xxi

2do dado

1er dado 1 2 3 4 5 6

1

2

3

4

5

6

(1,1) (1,2) (1,3) (1,4) (1,5) (1,6)

(2,1) (2,2) (2,3) (2,4) (2,5) (2,6)

(3,1) (3,2) (3,3) (3,4) (3,5) (3,6)

(4,1) (4,2) (4,3) (4,4) (4,5) (4,6)

(5,1) (5,2) (5,3) (5,4) (5,5) (5,6)

(6,1) (6,2) (6,3) (6,4) (6,5) (6,6)

6,6,...,3,1,2,1,1,1 S

Luego:

6/, yxSyxA

1,5,2,4,1,4,3,3,2,3,1,3,4,2,3,2,2,2,1,2,5,1,4,1,3,1,2,1,1,1

17. Hallar la probabilidad de obtener cara en el lanzamiento de una moneda.

Solución:

i) Sea el experimento: ‘’Lanzar una moneda’’.

ii) Sea el espacio muestral:

S={𝑐, 𝑠}, n(S)=2

iii) Sea el evento:

A={𝑐}, n(A)=1

iv) Cálculo de la probabilidad

2

1

)(

)()(

Bn

AnAP

%505,0 AP

18. Hallar la probabilidad de obtener el número 2 en el lanzamiento de un dado.

Solución:

i) Sea el experimento: ‘’Lanzar un dado’’

ii) Sea el espacio muestral:

6,6,5,4,3,2,1 snS

iii) Sea el evento

A={Obtener el número 2}, 1An

iv) Cálculo de la probabilidad

6

1

Sn

AnAP

%1717,0 AP

19. Una urna contiene 30 bolas coloreadas distribuidas así: 8 bolas blancas, 12 bolas negras y 10

bolas rojas. Calcular la probabilidad de que al extraer una bola, sea:

A) Negra o blanca

B) Blanca o roja

C) No sea roja

Solución:

i) Sea el experimento: ‘’Extraer una bola al azar’’

ii) Espacio muestral:

30,,...,,,,...,,..., 10211221821 snrrrnnnbbbS

iii) Definición de eventos

B: Sacar bola blanca, 8Bn

:N Sacar bola negra, 12Nn

R: Sacar bola roja, 10Rn

iv) Cálculo de probabilidades de los eventos:

30

8)( BP

30

12NP

30

10RP

a) 3

2

30

20

30

8

30

12 BPNPBNP

b) 5

3

30

18

30

10

30

8 RPBPRBP

c) 3

2

30

20

30

1030

30

1011

RPRP

20. Se extraen cinco cartas de una baraja de 52 cartas. Hallar la probabilidad de extraer:

a) 4 ases

b) 4 ases y un rey

Solución:

i) Sea experimento: ‘’Extraer 5 cartas de una baraja de 52’’

ii) Sea el espacio muestral ..........S

5

52

r

n

!4712345

!474849505152

!47!5

5252

5xxxxx

xxxxxCSn

2598960Sn

iii) Sean los eventos:

M: Extraer 4 ases y una carta cualquiera

A: Extraer 4 ases, 14

4 CAn

B: Extraer una carta cualquiera; 4848

1 CBn

48481. xBnAnMn

N: Extraer 4 ases y un rey

C: Extraer 4 ases, 14

4 CCn

D: Extraer 1 rey, 44

1 CDn

441. DnCnNn

iv) Cálculo de la probabilidad

a) 14554

1

9605982

48MP

740649

1

9605982

4NP

21. La siguiente tabla presenta los puntajes de quince trabajadores, correspondiente a dos Test para

selección de personal en las áreas de Personalidad (X) y Aptitud (Y):

Calcular el coeficiente de correlación por el método de Pearson

SOLUCION:

Fórmula de Pearson

2222

.

YYnXXn

YXYXnr

TRABAJADORES X Y

A

B

C

D

E

F

G

H

I

J

K

L

M

N

Ñ

19

12

15

13

17

07

11

15

09

10

14

18

15

12

08

18

15

12

15

11

18

15

13

16

16

14

19

11

15

17

n=15 195X 225Y

Reemplazando:

22 )225)(3461(15)195()2717(15

)225)(195()2893(15

r

)1290)(2730(

480

)5062551915)(3802540755(

4387543395

r

2558,062,1876

480

3521700

480

r

Luego:

El valor de la correlación de esta distribución es -0,2558, que de acuerdo a la escala

de valores, la correlación es baja y negativa.

TRABAJADORES X Y X.Y X2 Y2

A

B

C

D

E

F

G

H

I

J

K

L

M

N

Ñ

19

12

15

13

17

07

11

15

09

10

14

18

15

12

08

18

15

12

15

11

18

15

13

16

16

14

19

11

15

17

342

180

180

195

187

126

165

195

144

160

196

342

165

180

136

361

144

225

169

289

49

121

225

81

100

196

324

225

144

64

324

225

144

225

121

324

225

169

256

256

196

361

121

225

289

n=15 195X 225Y 2893XY 27172X 34612Y