SEPARATA II PROBABILIDAD E INFERENCIA ESTADISTICA.doc

70
SEPARATA DE PROBABILIDADES Y ESTADÍSTICA INFERENCIAL Docente: M.Sc. Est. Carlos Daniel Gonzales Hidalgo. 1. PROBABILIDAD 1.1. INTRODUCCIÓN 1

Transcript of SEPARATA II PROBABILIDAD E INFERENCIA ESTADISTICA.doc

SEPARATA DE PROBABILIDADES Y ESTADÍSTICA INFERENCIAL

Docente:

M.Sc. Est. Carlos Daniel Gonzales Hidalgo.

1. PROBABILIDAD

1.1. INTRODUCCIÓN

La estadística representa un método para la toma de decisiones frente a la incertidumbre y como tal, se basa en la teoría de probabilidades, pues la probabilidad es la medida de la incertidumbre y de los riesgos asociados con ella. Por ello, el estudiante, antes que aprender procedimientos estadísticos para tomar decisiones, debe tener un concepto claro de la teoría de probabilidad.

Un tratamiento preciso de la teoría de probabilidad requiere de dos enfoques, uno inicial, basado en la teoría de conjuntos, y un segundo basado en las distribuciones de probabilidad.

1

El primer enfoque nos permite comprender con claridad el concepto de probabilidad, así como obtener un listado de axiomas y propiedades fundamentales de la teoría de probabilidad. Con el segundo enfoque, llegamos a representaciones matemáticas que facilitan el cálculo de probabilidades, mediante fórmulas que se ajustan regularmente a ciertos fenómenos o experimentos.

1.2. EXPERIMENTO

En estadística se considera experimento al proceso mediante el cuál se obtienen los datos, ya sea de naturaleza cualitativa o cuantitativa.

1.2.1. EXPERIMENTO DETERMINÍSTICO

Se llama así al fenómeno o experimento que siempre tiene que ocurrir. Es decir se presenta de una única manera y existen fórmulas matemáticas que describen el fenómeno y con las que se pueden determinar el resultado del experimento.

Ejemplos:

1. El experimento consiste en dejar en el aire un plumón, éste siempre tiene que caer, pues la ley de la gravedad hará que sea atraída al suelo.

2. Elevamos el precio de un bien, inmediatamente se reducirá la cantidad demandada.

1.2.2. EXPERIMENTO NO DETERMINISTICO O ALEATORIO

Se llama así al fenómeno o experimento en el que no se puede determinar con certeza su resultado, debido a que las causas que lo originan son no predecibles por ser aleatorias.

¿Por qué se dice que el experimento es no determinístico o aleatorio?

Por que:

a. Sus resultados son producto del azar.b. Se puede repetir, cada experimento muchas veces sin cambiar las condiciones.c. Sus resultados posibles se pueden enlistar en un conjunto.

Ejemplos:

1. Lanzar una moneda sobre una mesa es un experimento aleatorio; unas veces resulta cara otras veces sello. Si en este experimento “cargásemos” la moneda (revistiendo la cara con un metal pesado) de tal manera que al lanzarla a una mesa siempre resulte cara, el experimento deja de ser aleatorio y pasaría a ser determinístico.

2. Consideremos un partido entre dos equipos de Fútbol; desde el punto de vista de los resultados (goles). Siempre queda un margen de azar en la determinación del número de goles a favor o en contra.

3. Los juegos de lanzar dados, barajas, loterías, ruletas, carrera de caballos, etc. son típicamente aleatorios.

4. Observar la vida útil de un artículo.

1.3. ESPACIO MUESTRAL ()

Se denomina espacio muestral, al conjunto formado por todos los resultados posibles de un experimento aleatorio.

En notación matemática el espacio muestral se define como sigue:

= {x / x es resultado de un experimento aleatorio}

Ejemplos:

Describir el espacio muestral asociado a cada uno de los experimentos aleatorios:

1. Lanzar una moneda al piso y observar el resultado que ocurre en la cara superior de la moneda.

= {c, s} n () = 2

2

2. Lanzar dos monedas consecutivas al piso y observar el resultado que ocurre en la cara superior de las monedas.

= {(c, c), (c, s), (s, c), (s, s)} n () = 4

C = ( C, C )

C S = ( C, S )

C = ( S, C )

S S = ( S, S ) _________________________________________________ 2 * 2 = 4 3. Elegir el Presidente de una asociación, de un grupo de 5 candidatos (A, B, C, D, E).

= {A, B, C, D, E} n () = 5

4. Lanzar una moneda hasta obtener cara y contar el número de lanzamientos.

= {1, 2, 3,…}

5. Determinar la vida útil de un artículo.

= {w / w 0} 1.4. EVENTO O SUCESO

Se llama evento o suceso a todo subconjunto del espacio muestral. A los eventos se les denota con las primeras letras mayúsculas del alfabeto, así decimos:

A = Es un evento A

A se le considera evento seguro y a evento imposible.

Ejemplo:

Suponga que se lanza dos monedas consecutivas al piso y se observa el resultado que ocurre en la cara superior de las monedas. Enliste los siguientes eventos:

a). Se obtuvo exactamente una cara.b). Se obtuvo exactamente dos sellos.c). Se obtuvo por lo menos una cara.d). Se obtuvo mas de una cara.e). Se obtuvo a lo más dos caras.f). Se obtuvo menos de dos caras.

Solución. = {(c, c), (c, s), (s, c), (s, s)} n () = 4

a). A = {(c, s), (s, c)} n (A) = 2b). B = {(s, s)} n (B) = 1c). C = {(c, c), (c, s), (s, c)} n (C) =3d). D = {(c, c)} n (D) = 1e). E = {(c, c), (c, s), (s, c), (s, s)} n (E) = 4f). F = {(c, s), (s, c), (s, s)} n (F) = 3

3

1 2

1.5. ALGEBRA DE EVENTOS

Usando las leyes del álgebra de conjuntos se puede formar nuevos eventos, los cuales son subconjuntos del mismo espacio muestral de donde provienen los eventos dados. Así para los eventos dados. Así, para los eventos A, B Y C de se cumplen las siguientes leyes:

1.5.1. LEY DE IDEMPOTENCIA:

a) Unión: AA =Ab) Intersección: AA =A

1.5.2. LEY ASOCIATIVA:

a) Unión: A(BC) = (AB)C = (ABC) b) Intersección: A(BC) = (AB)C = (ABC)

1.5.3. LEY CONMUTATIVA:

a) Unión: AB = BAb) Intersección: AB =BA

1.5.4. LEY DISTRIBUTIVA:

a) Unión: A(BC) = (AB) (AC)b) Intersección: A(BC) =(AB) (AC)

1.5.5. LEYES DE MORGAN:

a) Unión: (AB)´ =A´ B´b) Intersección: (AB)´ = A´ B´

1.5.6. LEYES DEL COMPLEMENTO:

a) Unión: AA´ = b) Intersección: AA´ =

1.5.7. LEY DE IDENTIDAD:

a) Unión: A=A y A = b) Intersección: A = y A=A

1.6. TÉCNICAS DE CONTEO

1.6.1. PERMUTACIONES

Permutación es un arreglo lineal de todos los elementos de un conjunto o parte de los elementos del conjunto (subconjunto) tomados en un orden definido. El número total de permutaciones está en función al número de elementos tomados a la vez para cada permutación. Según esto podemos distinguir tres casos:a) Permutaciones simples.

a.1. nPn = n

a.2. nPr = n / (n-r)

b) Permutaciones con objetos repetidos.

nPn1, n2, n3,...nk = n / (n1 * n2 * … *nk)

c) Permutaciones circulares.

PCn = (n-1)

4

Ejemplos:

1. Se invita a 5 gerentes de grandes Empresas de Chiclayo, para dar a los alumnos de Marketing y Negocios Internacionales de la UCV, una conferencia sobre exportación. ¿De cuántas maneras distintas se pueden sentar los gerentes en una fila?

5P5 = 5 = 5*4*3*2*1 =120 2. De un grupo de 4 personas, se tiene que elegir a 3 personas que deben ocupar el cargo de presidente,

secretario, y vocal. ¿De cuántas maneras se pueden hacer los arreglos?

4P3 = 4 / (4-3) = 24

3. El número de formas diferentes de permutar 12 objetos iguales en todo, salvo el color, de los cuales 3 son negros, 4 son blancos y 5 son rojos es,

12P3, 4, 5 = 12 / (3 * 4 *5) =277204. ¿De cuántas maneras diferentes pueden sentarse 9 personas alrededor de una mesa elipsoidal?

PC9 = (9-1) =8

1.7. COMBINACIONES

Cuando hablamos de combinaciones, no debemos tener en cuenta el orden de los elementos; sólo nos interesa que se combine un elemento con otro.

nCr = n / r(n-r)Ejemplos:

1. ¿Cuántos cables de conexión se necesitan para que dos aulas cualesquiera, de doce aulas existentes en total en una Universidad, puedan comunicarse directamente?

12C2 = 12 / 2 (12-2) = 662. Una caja contiene 20 tornillos similares, de los cuales 10 son buenos, 8 tienen defectos del tipo A, 5 tienen

defectos del tipo B, y 3 los dos tipos de defectos.¿Cuántos elementos tiene el espacio muestral que resulta de escoger al azar 11 tornillos de manera que 2 tengan defectos Ay B, 3 defectos sólo A, 2 con defectos sólo B y 4 sin defectos?

10C4 * 5C3 * 3C2 * 2C2 = 63003. Dados los eventos A de 4 elementos, y B de 8 elementos.¿Cuántos eventos de 6 elementos pueden formarse si

cada uno debe contener:

a) Un solo elemento de A?b) Por lo menos un elemento de A?

Solución:

a) 4C1 * 8C5 = 224 formas.

b) 4C1 * 8C5+ 4C2 * 8C4+ 4C3 * 8C3+ 4C4 * 8C2 = 896 formas.

1.8. PROBABILIDAD DE OCURRENCIA DE OCURRENCIA DE UN EVENTO

1.8.1. DEFINICIÓN DE PROBABILIDAD CLÁSICA

Si A es un evento de , la probabilidad de que ocurra el evento A está dada por:P(A)= n(A) / n ()

5

Experimentoaleatorio

Espacio muestral

n()

Evento (A)n(A)

Ejemplo: Suponga que el experimento aleatorio consiste en lanzar un dado y observar el resultado que ocurre en la cara superior del dado. Calcular la probabilidad de que ocurra:

a) El número 6.b) Por lo menos el número 4.c) A lo más el número 2.d) Por lo menos el número 1.

Solución:

= {1, 2, 3, 4, 5, 6} n () = 6

a) A= {6} n (A) = 1

P(A)= n(A) / n () = 1/6

b) B= {4, 5, 6} n (B) = 3.

P(B)= n(B) / n () = 3/6

c) C = {1, 2} n (C) = 2.

P(C)= n(C) / n () =2/6

d) D = {1, 2, 3, 4, 5, 6} n (D) = 6

P(D)= n(D) / n () =6/6

1.8.1. DEFINICIÓN DE FRECUENCIA RELATIVA

La probabilidad de un evento (que suceda o que resulte) es la proporción de veces que el evento sucedería en una serie prolongada de eventos repetidos.

Ejemplo:

La tabla siguiente, muestra el estado civil de 30 Trabajadores de una Empresa. Año 2005.

ESTADO CIVIL niSOLTERO 20CASADO 10TOTAL 30

Si se selecciona un trabajador al azar, ¿cuál es la probabilidad de que sea soltero?

Solución:

P(Soltero)= 20 / 30

1.9. AXIOMAS DE PROBABILIDAD

A.1. 0 P(A) 1

A.2. P() =1

A.3. Si A y B son dos eventos en , tales que A y B son mutuamente excluyentes

6

P(A)= n(A) / n ()

(AB = )

P(AB) = P(A)+P(B)

Este axioma se puede extender para k eventos mutuamente excluyentes A1, A2,…, AK, es decir

P( A1A2 …AK) = P(A1)+P(A2)+…+P(AK)

1.10. TEOREMAS DE PROBABILIDAD

T.1. P( ) = 0

T.2. P(A´) = 1- P(A)

T.3. Si AB P(A) P(B)

T.4. Si A y B no son mutuamente excluyentes ( AB )

P(AB) = P(A)+P(B) -P (AB)

T.5. Si A, B y C no son mutuamente excluyentes

P(ABC) = P(A)+P(B)+P(C) -P (AB) - P (AC)- P (BC)+ P (ABC)

Ejemplos:1. La probabilidad de que la señora hablantina reciba por lo menos 8 llamadas telefónicas en un día es 0.2 y

la probabilidad de que reciba a lo más 5 llamadas telefónicas en un día es 0.3. Hallar la probabilidad de que la señora hablantina reciba 6 ó 7 llamadas en un día.Solución:

= {0,1 ,2 ,3 ,4 ,5, 6, 7, 8, 9,...}A= {8, 9,…} P(A) = 0.2B= {0, 1, 2, 3, 4, 5} P(B)=0.3C = {6, 7} P(C) = ?

ABC = P (ABC) = P()P(A) + P(B) + P(C) = 10.2 + 0.3 + P( C) = 1 P( C) = 0.5

2. Un escolar entra a una tienda de golosinas. La probabilidad de que compre caramelos es 0.7, la probabilidad de que compre galletas es 0.5 y la probabilidad de que compre ambos (caramelos y galletas) es 0.3. Hallar la probabilidad de compre caramelos, o galletas o ambos.

Solución:Sean los eventos:A = El niño compra caramelosB = El niño compra galletasAB = El niño compra caramelos y galletas

P(AB) = P(A)+P(B) -P (AB)

= 0.7 + 0.5 – 0.3 = 0.9

1.11. PROBABILIDAD CONDICIONAL

A menudo se quiere determinar la probabilidad de que ocurra un evento sabiendo que otro evento ha ocurrido. La probabilidad condicional (o condicionada) de que un evento B ocurra dado que otro evento a ha ocurrido se denota por P(B/A). Esta notación se lee “. La probabilidad de que B ocurra dado que A ha ocurrido” o simplemente la probabilidad de B dado A”

P(B/A) = P (AB) / P(A) , Si P(A) 0

Ejemplo:

7

Un club consiste de ciento cincuenta miembros. Del total, 3/5 son hombres y 2/3 son profesionales. Además, 1/3 de las mujeres son no profesionales.

a) Se elige al azar un socio del club:a.1) Calcular la probabilidad de que sea hombre y profesional.a.2) Calcular la probabilidad de que sea hombre, dado que es profesional.

b) Se eligen tres socios al azar:

b.1) Si las tres son mujeres, ¿cuál es la probabilidad de que sólo l de ellas sea profesional? b.2) Si resultan ser del mismo sexo, ¿cuál es la probabilidad de que sean mujeres?.

Solución:PROFESIONAL NO PROFESIONAL TOTAL

HOMBRE (H) 60 30 90MUJER (M) 40 20 60

TOTAL 100 50 150a)a.1) P(H P) = 60/150 = 0.4a.2) P(H/P) = P (HP) / P(P) = (60/150) / (100/150) = 0.6

b)b.1) A = Las tres son mujeres

B = Sólo una es profesional P(B/A) = ( 40C1 * 20C2)/ 60C3

b.2) A = Los tres son del mismo sexoB = Las tres son mujeres P(B/A) = ( 60C3 )/ (90C3 + 60C3) = 0.23

1.12. EVENTOS INDEPENDIENTES

Se dice que el evento B es independiente del evento A, si,

P(B/A) = P(B)

Se verifica que, si P(B/A) = P(B), entonces, P(A/B) = P(A) y recíprocamenteEn consecuencia, podemos afirmar que:

Los eventos A y B son independientes si, y sólo si,

P(B/A) = P(B) y P(A/B) = P(A).

Esto equivale a decir que A y B son independientes si sólo si

P(AB) = P (A) P(B)

Ejemplo:

Suponga que en un proceso de producción se utilizan las máquinas. 1 y 2, que trabajan en forma independiente para producir cierto bien. Si la probabilidad de que ambas máquinas fallen es 1/5 y de que falle sólo la 2 es 2/15. Calcular la probabilidad de que

a) Falle sólo la máquina 1.b) La producción continúe.

Solución: P(AB) =1/5 = 3/15, P(A´B) = 2/15, entonces, P(B)= 5/15

Además de P(AB) = P (A) P(B), resulta, P(A) = 9/15

a) P(AB´) = P (A) P(B´) = 9/15 * 10/15 = 6/15

8

b) P(A´B AB´ A´B´ ) = P(A´B) + P(AB´) + P( A´B´ )

= P(A´) P(B) + P(A) P(B´) + P( A´) P(B´)

= 6/15 * 5/15 + 9/15*10/15 + 6/15 * 10/15 = 12/15

1.13. PROBABILIDAD TOTAL

Si k eventos: A1, A2,..,AK, constituyen una partición del espacio muestral , entonces, para cualquier evento B en ,

P(B) = P(A1) * P(B/A1)+P(A2)*P(B/A2)+…+P(AK)*P(B/AK)

A1 A2 … AK

TEOREMA DE BAYES

Para cualquier evento Ai de la partición, se tiene:

P(Ai/B) = P (Ai ) P(B/ P(Ai) / P(B) , Si P(B) 0

Ejemplo:

Las probabilidades de que los socios S1 y S2 sean elegidos presidente de un club son respectivamente 0.4 y 0.6. Las probabilidades de que se aumenten las cuotas mensuales de los socios son de 0.9 si sale elegido S 1 y de 0.2 si sale elegido S2.

a) ¿Cuál es la probabilidad de que haya un aumento en las cuotas mensuales de los socios?.b) Si se aumenta la cuota mensual, ¿ cómo se modifican las probabilidades de que salgan elegidos los socios

S1 y S2 ?.

Solución: S1 0.9 A 0.4

0.6 S2 0.2 A

a) P(A) = P(S1) * P(A/S1)+P(S2)*P(A/S2) = 0.4*0.9 + 0.6*0.2 = 0.48

b)P(S1/A) = P (S1 ) P(A/ P(S1) / P(A) = 0.75

P(S2i/A) = P (S2) P(A/ P(S2) / P(A) = 0.25La probabilidad de S1 se modifica de 0.4 A 0.75 y la de S2 se modifica de 0.2 a 0.25

9

B

Laboratorio Nº 01

1. Sean A, B, y C tres eventos cualesquiera de un espacio muestral , expresar cada uno de los siguientes eventos compuestos en términos de operaciones entre A, B y C:

a) Ocurra por lo menos uno de los eventos.b) Ocurran todos los eventos.c) Ocurra exactamente uno de los eventosd) No ocurran ninguno de los eventos.e) No ocurra más de uno de los eventos.

2. Cada uno de cuatro amigos elige una bebida al azar en la cafetería. Describa el espacio muestral del experimento si hay disponibles en tres sabores denominados por L, N y F, ¿cuántos elementos tiene?.

3. Un lote de N artículos contiene k defectuosos, describir el espacio muestral del número de artículos extraídos hasta obtener el último defectuoso.

4. Un experimento consiste en observar la vida útil de dos objetos, describa el evento “la duración del primero más la duración del segundo es al menos 4 años”.

5. En un edificio de 10 pisos entran al ascensor al primer piso tres personas. Cada una baja al azar a partir del segundo piso. ¿De cuántas maneras distintas estas personas pueden bajar en pisos diferentes?.

6. Cierto producto se arma en tres etapas. En la primera hay 5 líneas de ensamblado, en la segunda 6, y en la tercera 4. ¿De cuántas maneras distintas puede hacerse circular el producto durante el proceso de ensamblado?

7. Una caja contiene 8 dulces de piña; 6 de naranja y 4 de fresa. ¿Cuántos elementos tiene el espacio muestral que resulta de extraer al azar un dulce de cada sabor?

8. Cierta marca de sierra eléctrica es calificada por especialistas, en cuanto a rendimiento, como: “Muy buena”, (B1); o, “buena”, (B2); o “regular”, (B3), y en cuanto al precio, como “cara”, (C1), o “barata”; (C2). ¿ De cuántas maneras es calificada la sierra eléctrica por los especialistas?.

9. Un grupo de 5 hombres y 10 mujeres, se divide al azar en 5 grupos de 3 personas cada una. Calcular el número de maneras en que cada grupo contenga un hombre.

10. ¿De cuántas maneras diferentes puede un padre dividir 8 regalos entre sus 3 hijos, si el mayor debe recibir 4 regalos y los menores 2 cada uno?

11. Un sistema está formado por dos componentes A y B cuyas probabilidades de falla son 1/6 y 2/5 respectivamente. Si la probabilidad de al menos una de las dos componentes falle es 7/30, calcular la probabilidad de que:

a) Ninguno de las dos componentes fallen.b) Sólo una de las componentes falle.

12. Un lote contiene n objetos. La probabilidad de que al menos uno sea defectuoso es 0.06, mientras que la probabilidad de que al menos dos sean defectuosos es 0.04. Calcular la probabilidad de que:

a) Todos los objetos sean no defectuosos.b) Exactamente un objeto sea defectuoso.

13. Doscientas personas están distribuidas de acuerdo a su sexo y lugar de procedencia de la siguiente manera: 130 son hombres, 110 son de la capital y 30 son mujeres y de provincias. Si se eligen dos personas al azar calcular la probabilidad de que:

a) Ambos sean hombres y de provincias.b) Al menos uno de los dos escogidos sea mujer.

14. Un comerciante tiene 12 unidades de cierto artículo de los cuales 4 tienen algún tipo de defecto. Un cliente pide para comprar 3 de tales artículos pero que no tengan defectos. Si el comerciante escoge al azar

10

y de una sola vez 4 de tales artículos, ¿cuál es la probabilidad de que con las 4 unidades escogidas satisfaga el pedido del cliente?

15. Cien personas fueron encuestadas acerca de sus preferencias sobre tres productos A, B, y C. Se encontró que 50 prefieren el A, 37 el B, y 30 el C. Además 12 prefieren A y B, 8 sólo A y C, 5 sólo B y C, y 15 sólo C. De cinco personas encuestadas elegidas al azar, calcular la probabilidad de que 2 de ellas prefieran B, y C, 2 sólo A y B, y una prefiera los tres productos.

16. Si P(A)=5/8, P(B)=3/4 y P(A/B)=2/3, calcular P(A/B´)

17. Si P(B)=3/15, P(B/A)=1/5, y P(AB)=1/15, calcular P(AB´)

18. De 20 clientes de crédito de una tienda comercial, 100 tienen créditos menores que $ 200, 15 tienen créditos de al menos $ 500, y 110 tienen créditos menores de 4 años. Además 30 clientes tienen créditos de al menos 4 años y de 200 a menos de $500, y 10 clientes tienen créditos al menos $500 y menos de 4 años.

a) Si se elige un cliente al azar, ¿cuál es la probabilidad de que tenga crédito menos de de 4 años si tiene saldo de crédito de menos de $ 200?

b) Si se eligen dos clientes al azar y resultan de al menos de 4 años de crédito, ¿cuál es la probabilidad de que uno tenga saldo de crédito de $ 500 o más?

19. Sólo el 60% de la mercadería que recibe un comerciante del fabricante A es de calidad excepcional, mientras que el 90% de la mercadería que recibe del fabricante B es de calidad excepcional. Sin embargo la capacidad del fabricante B es limitada, y, por esta razón sólo el 30% de la mercadería le es permitido adquirir del fabricante B, el 70% la adquiere de A. Se inspecciona un embarque que acaba de llegar y se encuentra que es de calidad excepcional, ¿cuál es la probabilidad de que provenga del fabricante A?.

2. DISTRIBUCIONES DE PROBABILIDAD

2.1. INTRPODUCCIÓN

En la primera unidad desarrollamos algunos modelos probabilísticas a través de espacios maestrales. Esto facilitó la comprensión del concepto de probabilidad y la obtención de algunas propiedades fundamentales de la teoría de probabilidad, sin embargo, para estudiar situaciones prácticas más generales, necesitamos ampliar estos conceptos para que tengamos distribuciones(o modelos) de probabilidad que representen todos los tipos de variables definidas e en la asignatura de Estadística Descriptiva. Así todo lo estudiado en tal asignatura para hacer un tratamiento descriptivo de las variables cuantitativas tendrá su correspondiente distribución( o modelo teórico). Estas variables numéricas a las cuales asociamos distribuciones de probabilidad, serán llamadas variables aleatorias.

2.2. VARIABLE ALEATORIA

Una variable estadística es una característica (cualitativa o cuantitativa) que se mide u observa en una población. Si la población es aleatoria y la característica es cuantitativa la variable estadística es denominada variable aleatoria. Las variables aleatorias se clasifican en discretas y continuas.

Definición. Se denomina variable aleatoria, a una variable estadística cuantitativa definida en un espacio muestral .

El dominio de la variable aleatoria X es el espacio muestral y el rango es un subconjunto de los números reales que denotaremos por RX, siendo,

RX = {x / x = X (w), w }

Ejemplo:

Sea el espacio muestral que se obtiene al lanzar al aire una moneda tres veces consecutivas, esto, es,

= {SSS, SSC, SCS, CSS, SCC, CSC, CCS, CCC}.

11

Si X es el número de caras obtenidas, entonces X es una variable aleatoria cuyo rango es: RX = {0, 1, 2, 3}.

2.2.1. VARIABLE ALEATORIA DISCRETA:

FUNCIÓN DE PROBABILIDAD Y FUNCIÓN DE DISTRIBUCIÓN ACUMULADA.

2.2.1.1. PROBABILIDAD EN EL RANGO RX.

Una variable aleatoria discreta asume cada uno de sus valores con cierta probabilidad que denotaremos por PX (probabilidad inducida por X).

En efecto, si el rango de la variable aleatoria X es el conjunto finito de números, RX = {1, 2,…, xn}y si B ={xi} es un evento en RX, entonces,

PX = ({xi}) = P ({x / X (w) = xi}),

PX = xi = P ({w / X (w) = xi}).

2.2.1.2. FUNCIÓN DE PROBABILIDAD

Sea X una variable aleatoria discreta. Se denomina función (ley o modelo o distribución) de probabilidad de X a la función f(x) definida por f(x) = PX = x para todo x número real y que satisface las siguientes condiciones:

i) f(x) >= 0 para todo x R, y ii)

NOTAS.

1. Si A RX, entonces, la probabilidad de A es el número:

=

2. La función de probabilidad de una variable aleatoria X se puede expresar: por una ecuación: f(x) = PX = x = expresión de x, o por el conjunto de pares {(xi,pi)/pi = f(xi), xi RX} o por una tabla, si RX es finito.

Valores de xi de X x1 x2 x3 … xn

Probabilidad Pi = p1 p2 p3 … pn

La gráfica de una distribución de probabilidades discreta es la gráfica de bastones.

Ejemplo:

Sea X la variable aleatoria definida como el número de caras que ocurren al lanzar un moneda 4 veces.

a) Determinar la distribución de probabilidades de X.

b) Calcular la probabilidad P0<X<=2

SOLUCIÓN.

a)

f(0) = PX=0 = 1/16

f(1) = PX=1 = 4/16

12

f(2) = PX=2 = 6/16

f(3) = PX=3 = 4/16

f(4) = PX=4 = 1/16

b)

P0<X<=2 =

2.2.1.2. FUNCIÓN DE DISTRIBUCIÓN ACUMULADA DE VARIABLE ALEATORIA DISCRETA

2.2.2. VARIABLE ALEATORIA CONTINUA:

Variable aleatoria continua: Función de densidad y función de distribución acumulada.

2.2.2.1. Función de densidad de probabilidad.

Definición.

Se dice que la función f(x) es función de densidad (ley o distribución) de probabilidad de la variable aleatoria

continua X si satisface las siguientes condiciones:

NOTAS.

1. La condición i) persona que la gráfica de f(x) no tiene puntos por debajo del eje de las abscisas.

La condición ii), indica que el área total bajo la curva es igual a uno.

La condición iii) expresa: probabilidad igual a área. Esto es, si la probabilidad es

igual a el área de la región limitada por la curva, el eje X y las rectas X = a, X = b, es decir: (ver figura 6.5).

2. No es difícil verificar que si el evento A es cualquier intervalo en la recta real, entonces, P(A) satisface los

axiomas de la probabilidad.

13

3. Cualquier función f(x) que satisfaga sólo las condiciones i) y ii) no es probabilidad, sólo es probabilidad

cuando la función de densidad es integrada entre dos límites. Por ejemplo, la función:

Satisface las condiciones i) y ii), pero f(x) no es probabilidad, ya que entre otros valores se tiene, f(w) = 1.5, f(1.8)

= 1.215.

4. Si x0 es cualquier valor específico de la variable aleatoria continua X, entonces:

Como consecuencia se tiene:

a)

b)

EJEMPLO 6.12.

Sea f(x) una función definida en todos los números reales por

a) Hallar el valor de la constante c para que, f(x) sea una función de densidad para alguna variable aleatoria X.

b) Calcular

SOLUCIÓN.

a) El área de la figura 6.6. debe ser igual a 1, entonces,

Resultando, c = 3/8. Luego.

La gráfica de esta función de densidad está dada en la figura 6.6.

b)

2.2.2.2. Función de distribución acumulada de variable aleatoria continua.

Definición.

14

La función de distribución acumulada (f.d.a.) F(x) de una variable aleatoria continua X con función de densidad f(),

se define (ver figura 6.7) por:

EJEMPLO 6.13.

Sea f(x) una función de densidad de probabilidad de una variable aleatoria X, cuya gráfica es la figura que sigue:

a) Determinar el valor de la constante c y luego la f.d.p. de X.

b) Hallar la función de distribución acumulada F(x) de X.

c) Usando F(x), calcular

SOLUCIÓN.

a) Si el área que encierra la figura con el eje X es igual a uno, entonces, c = ¼

La función de densidad se define a partir de la ecuación de la recta y -1/4 = (3/4 – ¼) (3-1) (x-1), o y = x/4. Luego,

b) La función de distribución acumulada, se calcula por:

F(x)= 0, si x > 1, F(x) = 1; si x > 3.

Si

Entonces,

La gráfica de esta función de distribución acumulada es la figura 6-8.

15

c)

2.2.3. Valor esperado o esperanza matemática.

La distribución de probabilidad de una variable aleatoria se caracteriza básicamente a través de medidas de

tendencia central y de la dispersión. Estas medidas características de la distribución denominadas parámetros se

describen por medio de la esperanza matemática.

2.2.3.1. Media de una variable aleatoria.

La media de una variable aleatoria X o media de la distribución de probabilidad de X es un número real que se

denota por o por . La media es denominada también esperanza matemática o valor esperado de X, y se denota

también por E(X).

Definición 1.

La media de una variable aleatoria discreta X con función de probabilidad f(x) es la expresión:

Si el rango de X es el conjunto finito entonces,

Si el rango de X es el conjunto infinito numerable

En este caso, si la suma indicada no es igual a un número real, se dice que la esperanza de X no existe.

Definición 2.

La media de una variable aleatoria continua X con función de densidad de probabilidad f(x) es la expresión:

siempre que el valor de la integral sea un número real, en caso contrario, se dice que la media de X no existe.

EJEMPLO 6.19.

Calcular la media de la distribución de probabilidad de la variable aleatoria X que se define como el número de

caras cuando se lanzan cuatro monedas.

16

SOLUCIÓN.

La distribución de probabilidad de X se da en la tabla 6-3.

TABLA 6-3

x1 0 1 2 3 4

F(xI)1/16 4/16 6/16 4/16 1/16

La media de X es el número

Esto significa que si una persona lanza 4 monedas, muchas veces, en promedio obtendrá 2 caras por lanzamiento.

NOTA: (Interpretación de la esperanza)

Refiriéndonos al ejemplo 6.19, supongamos que repetimos n veces el lanzamiento de las cuatro monedas y que se

obtienen las frecuencias absolutas n, n1, n2, n3 y n4 de las veces que ocurre; 0, 1, 2, 3 y 4 caras respectivamente. Lo

que resulta es una distribución de frecuencia cuyo promedio de caras por lanzamiento es igual a

En el cálculo de E(X) se usan probabilidades o proporciones teóricas, mientras que en el cálculo de se usan

frecuencias relativas o proporciones empíricas obtenidas a partir de una muestra de tamaño n. A medida que n vaya

creciendo es de esperar que las frecuencias relativas empíricas:

n0/ n, n1/n, n2/n, n3/n, y n4/n,

se vayan aproximando a las correspondientes probabilidades 1/16, 4/16, 6/16, 4/16, 6/16, 4/16 y 1/16. En

consecuencia es de esperar que se vaya aproximando a E(X) a medida que n crece indefinidamente. Entonces

E(X) es la media que ser obtiene a “largo plazo” o a la “larga”, en otras palabras es la media que se espera obtener.

NOTA: (Mediana y moda de una variable aleatoria).

La mediana de una variable aleatoria X es el número Me tal que:

Por ejemplo, acumulando las probabilidades ejemplo 6.19, resulta, y

Luego en x = 2 puede ocurrir cualquier valor entre 5/16 y 11/16. En particular F(2) = 0.5. Por lo tanto, la mediana =

2.

Por otra parte, la moda de una variable aleatoria X, es el valor de la variable con mayor probabilidad (caso directo),

o donde alcanza su máximo (caso continuo). En la distribución del ejemplo 6.19, la moda = 2.

2.2.3.2. Media de una función de una variable aleatoria.

17

Sea X una variable aleatoria discreta con rango Rx y función de probabilidad Entonces, la

función Y = H(X), es una variable aleatoria con rango , con función de probabilidad g(y)

dada por:

Por ejemplo, si es una variable aleatoria cuya distribución de probabilidad está dada por la tabla 6.4, y si Y = H(X)

= 2X – 3, entonces,

Tabla 6.4

x 0 1 2 3

F(x)1/8 3/8 3/8 3/8

Y es una variable aleatoria, cuya distribución de probabilidades es dada por la tabla 6.5, donde

.

H(x) = 2x - 3 -3 -1 1 3

g(y) = f(x)1/8 3/8 3/8 1/8

El valor esperado de H(x) es,

Definición.

Si X es una variable aleatoria con distribución con distribución de probabilidad f(x), la media o valor esperado o

esperanza matemática de la variable aleatoria H(x) está dada por la expresión:

Y por :

Si la suma o la integral indicadas no son iguales a un número real se dice que la esperanza de H(x) no existe.

2.2.3.3. Varianza de una variable aleatoria.

La varianza de una variable aleatoria X se denota por cualquiera de las formas:

Definición.

Sea X una variable aleatoria con distribución de probabilidad f(x) y con media igual a . La varianza de X es la

expresión:

si X es discreta, y

18

si X es continua.

siempre que la suma y al integral sean números reales.

Definición. La desviación estándar de la variable aleatoria X es la raíz cuadrada positiva de su varianza. Esto es,

.

Una de las propiedades de la varianza que sea usa en el cálculo es:

EJEMPLO 6.28.

Calcular la varianza y la desviación estándar de la distribución de probabilidad de la variable aleatoria X que se

define como el número de caras al lanzar cuatro monedas.

SOLUCIÓN.

La distribución de probabilidad de X es la tabla 6-9.

Xi 0 1 2 3 4

f(xi)1/16 4/16 6/16 4/16

1/16

En el ejemplo 6.19, se ha calculado E(X) = 2. Además,

Por lo tanto,

La desviación estándar de X es:

EJEMPLO 6.29.

Calcular la varianza y la desviación estándar de la variable aleatoria discreta X cuya función de probabilidad es:

SOLUCIÓN.

En el ejemplo 6.2 se ha calculado Además,

Luego, la varianza de X es:

La desviación estándar de X es

NOTA:

Otra forma de calcular esta varianza, es usando la siguiente expresión:

19

En efecto,

2.3. DISTRIBUCIONES DISCRETAS

Vamos a comenzar por estudiar las principales distribuciones discretas.

2.3.1 DISTRIBUCIONES DISCRETAS: BERNOUILLI

Es aquel modelo que sigue un experimento que se realiza una sola vez y que puede tener dos soluciones: acierto o fracaso:

Cuando es acierto la variable toma el valor 1

Cuando es fracaso la variable toma el valor 0

Ejemplo: Probabilidad de salir cara al lanzar una moneda al aire (sale cara o no sale); probabilidad de ser admitido en una universidad (o te admiten o no te admiten); probabilidad de acertar una quiniela (o aciertas o no aciertas)

Al haber únicamente dos soluciones se trata de sucesos complementarios:

A la probabilidad de éxito se le denomina "p"

A la probabilidad de fracaso se le denomina "q"

Verificándose que:

p + q = 1

Veamos los ejemplos anteriores :

Ejemplo 1: Probabilidad de salir cara al lanzar una moneda al aire:

Probabilidad de que salga cara: p = 0,5

Probabilidad de que no salga cara: q = 0,5

p + q = 0,5 + 0,5 = 1

Ejemplo 2: Probabilidad de ser admitido en la universidad:

Probabilidad de ser admitido: p = 0,25

Probabilidad de no ser admitido: q = 0,75

p + q = 0,25 + 0,75 = 1

Ejemplo 3: Probabilidad de acertar una quiniela:

Probabilidad de acertar: p = 0,00001

Probabilidad de no acertar: q = 0,99999

p + q = 0,00001 + 0,99999 = 1

20

2.3.2. DISTRIBUCIONES DISCRETAS: BINOMIAL

 La distribución binomial parte de la distribución de Bernouilli:

La distribución de Bernouiili se aplica cuando se realiza una sola vez un experimento que tiene únicamente dos posibles resultados (éxito o fracaso), por lo que la variable sólo puede tomar dos valores: el 1 y el 0

La distribución binomial se aplica cuando se realizan un número"n" de veces el experimento de Bernouiili, siendo cada ensayo independiente del anterior. La variable puede tomar valores entre:

0: si todos los experimentos han sido fracaso

n: si todos los experimentos han sido éxitos

Ejemplo: se tira una moneda 10 veces: ¿cuantas caras salen? Si no ha salido ninguna la variable toma el valor 0; si han salido dos caras la variable toma el valor 2; si todas han sido cara la variable toma el valor 10

La distribución de probabilidad de este tipo de distribución sigue el siguiente modelo:

¿Alguien entiende esta fórmula? Vamos a tratar de explicarla con un ejemplo:

Ejemplo 1: ¿Cuál es la probabilidad de obtener 6 caras al lanzar una moneda 10 veces?

" k " es el número de aciertos. En este ejemplo " k " igual a 6 (en cada acierto decíamos que la variable toma el valor 1: como son 6 aciertos, entonces k = 6)

" n" es el número de ensayos. En nuestro ejemplo son 10

" p " es la probabilidad de éxito, es decir, que salga "cara" al lanzar la moneda. Por lo tanto p = 0,5

La fórmula quedaría:

Luego,

P (x = 6) = 0,205

Es decir, se tiene una probabilidad del 20,5% de obtener 6 caras al lanzar 10 veces una moneda.

Ejemplo 2: ¿Cuál es la probabilidad de obtener cuatro veces el número 3 al lanzar un dado ocho veces?

" k " (número de aciertos) toma el valor 4

" n" toma el valor 8

" p " (probabilidad de que salga un 3 al tirar el dado) es 1 / 6 (= 0,1666)

La fórmula queda:

21

Luego,

P (x = 4) = 0,026

Es decir, se tiene una probabilidad del 2,6% de obtener cuatro veces el números 3 al tirar un dado 8 veces.

2.3.3. DISTRIBUCIONES DISCRETAS: POISSON

Cuando la variable aleatoria X es el número de eventos que ocurren en un intervalo de tiempo volumen o espacio de dice que sigue una distribución de Poisson. Como por ejemplo. El número de accidentes en una fábrica durante un año, el número de prestamos solicitados a una agencia Bancaria durante un año, el número de errores que se cometen al tejer 20 pies cuadrados de tela, el número de bacterias que se reproducen en un centímetro cúbico de agua, etc.

La distribución de Poisson sigue el siguiente modelo:

Vamos a explicarla:

El número "e" es 2,71828

" " = n * p (es decir, el número de veces " n " que se realiza el experimento multiplicado por la probabilidad " p " de éxito en cada ensayo)

" k " es el número de éxito cuya probabilidad se está calculando

Veamos un ejemplo:

La probabilidad de tener un accidente de tráfico es de 0,02 cada vez que se viaja, si se realizan 300 viajes, ¿cual es la probabilidad de tener 3 accidentes?

Como la probabilidad " p " es menor que 0,1, y el producto " n * p " es menor que 10, entonces aplicamos el modelo de distribución de Poisson.

Luego,

P (x = 3) = 0,0892

Por lo tanto, la probabilidad de tener 3 accidentes de tráfico en 300 viajes es del 8,9%

Otro ejemplo:

La probabilidad de que un niño nazca pelirrojo es de 0,012. ¿Cuál es la probabilidad de que entre 800 recien nacidos haya 5 pelirrojos?

22

Luego,

P (x = 5) = 4,602

Por lo tanto, la probabilidad de que haya 5 pelirrojos entre 800 recien nacidos es del 4,6%.

 2.4. DISTRIBUCIONES CONTINUAS: NORMAL

 

Es el modelo de distribución más utilizado en la práctica, ya que multitud de fenómenos se comportan según una distribución normal.

Esta distribución de caracteriza porque los valores se distribuyen formando una campana de Gauss, en torno a un valor central que coincide con el valor medio de la distribución:

Un 50% de los valores están a la dercha de este valor central y otro 50% a la izquierda

Esta distribución viene definida por dos parámetros:

X: N ( 2)

es el valor medio de la distribución y es precisamente donde se sitúa el centro de la curva (de la campana de Gauss).

2: es la varianza. Indica si los valores están más o menos alejados del valor central: si la varianza es baja los valores están próximos a la media; si es alta, entonces los valores están muy dispersos.

Cuando la media de la distribución es 0 y la varianza es 1se denomina "normal estándar ", y su ventaja reside en que hay tablas donde se recoge la probabilidad acumulada para cada punto de la curva de esta distribución.

Además, toda distribución normal se puede transformar en una normal estándar:

Ejemplo: una variable aleatoria sigue el modelo de una distribución normal con media 10 y varianza 4. Transformarla en una normal estándar.

X: N (10, 4)

Para transformarla en una normal estándar se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por su desviación típica (que es la raíz cuadrada de la varianza)

23

En el ejemplo, la nueva variable sería:

Esta nueva variable se distribuye como una normal estándar, permitiéndonos, por tanto, conocer la probabilidad acumulada en cada valor.

2.4.1. DISTRIBUCIONES ESTÁNDAR: NORMAL

Y 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,090,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,53590,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,57230,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,61410,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,65170,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,68790,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7090 0,72240,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,75490,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7813 0,78520,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,81330,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,83891,0 0,8416 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,86211,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,88301,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,90151,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,91771,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,93191,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,94411,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,95451,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,96331,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,97061,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,97672,0 0,97725 0,97778 0,97831 0,97882 0,97932 0,97982 0,98030 0,98077 0,98124 0,981692,1 0,98214 0,98257 0,98300 0,98341 0,98382 0,98422 0,98461 0,98500 0,98537 0,985742,2 0,98610 0,98645 0,98679 0,98713 0,98745 0,98778 0,98809 0,98840 0,98870 0,988992,3 0,98928 0,98956 0,98983 0,99010 0,99036 0,99061 0,99086 0,99111 0,99134 0,991582,4 0,99180 0,99202 0,99224 0,99245 0,99266 0,99286 0,99305 0,99324 0,99343 0,993612,5 0,99379 0,99396 0,99413 0,99430 0,99446 0,99461 0,99477 0,99492 0,99506 0,995202,6 0,99534 0,99547 0,99560 0,99573 0,99585 0,99598 0,99609 0,99621 0,99632 0,996432,7 0,99653 0,99664 0,99674 0,99683 0,99693 0,99702 0,99711 0,99720 0,99728 0,997362,8 0,99744 0,99752 0,99760 0,99767 0,99774 0,99781 0,99788 0,99795 0,99801 0,998072,9 0,99813 0,99819 0,99825 0,99831 0,99836 0,99841 0,99846 0,99851 0,99856 0,99861

¿Cómo se lee esta tabla?

La columna de la izquierda indica el valor cuya probabilidad acumulada queremos conocer. La primera fila nos indica el segundo decimal del valor que estamos consultando.

Ejemplo: queremos conocer la probabilidad acumulada en el valor 2,75.Entonces buscamos en la columna de la izquierda el valor 2,7 y en la primera fila el valor 0,05. La casilla de la intersección es su probabilidad acumulada (0,99702, es decir 99.7%).

Atención: la tabla nos da la probabilidad acumulada, es decir, la que va desde el inicio de la curva por la izquierda hasta dicho valor. No nos da la probabilidad concreta en ese punto. En una distribución continua en el que la variable puede tomar infinitos valores, la probabilidad en un punto concreto es prácticamente despreciable.

24

Ejemplo: Imaginemos que una variable continua puede tomar valores entre 0 y 5. La probabilidad de que tome exactamente el valor 2 es despreciable, ya que podría tomar infinitos valores: por ejemplo: 1,99, 1,994, 1,9967, 1,9998, 1999791, etc.

Veamos otros ejemplos:

Probabilidad acumulada en el valor 0,67: la respuesta es 0,7486

Probabilidad acumulada en el valor 1,35: la respuesta es 0,9115

Probabilidad acumulada en el valor 2,19: la respuesta es 0,98574

Veamos ahora, como podemos utilizar esta tabla con una distribución normal:

Ejemplo: el salario medio de los empleados de una empresa se distribuye según una distribución normal, con media 5 millones de ptas. y desviación típica 1 millón de ptas. Calcular el porcentaje de empleados con un sueldo inferior a 7 millones de ptas.

Lo primero que haremos es transformar esa distribución en una normal estándar, para ello se crea una nueva variable (Y) que será igual a la anterior (X) menos su media y dividida por la desviación típica

En el ejemplo, la nueva variable sería:

Esta nueva variable se distribuye como una normal estándar. La variable Y que corresponde a una variable X de valor 7 es:

Ya podemos consultar en la tabla la probabilidad acumulada para el valor 2 (equivalente a la probabilidad de sueldos inferiores a 7 millones de ptas.). Esta probabilidad es 0,97725

Por lo tanto, el porcentaje de empleados con salarios inferiores a 7 millones de ptas. es del 97,725%.

EJERCICIOS

 

Ejercicio 1: La renta media de los habitantes de un país es de 4 millones de ptas/año, con una varianza de 1,5. Se supone que se distribuye según una distribución normal. Calcular:

a) Porcentaje de la población con una renta inferior a 3 millones de ptas.

b) Renta a partir de la cual se sitúa el 10% de la población con mayores ingresos.

c) Ingresos mínimo y máximo que engloba al 60% de la población con renta media.

a) Porcentaje de la población con una renta inferior a 3 millones de ptas.

Lo primero que tenemos que hacer es calcular la normal estándar:

25

(*) Recordemos que el denominador es la desviación típica ( raíz cuadrada de la varianza)

El valor de Y equivalente a 3 millones de ptas es -0,816.

P (X < 3) = P (Y < -0,816)

Ahora tenemos que ver cuál es la probabilidad acumulada hasta ese valor. Tenemos un problema: la tabla de probabilidades (ver lección 35) sólo abarca valores positivos, no obstante, este problema tiene fácil solución, ya que la distribución normal es simétrica respecto al valor medio.

Por lo tanto:

P (Y < -0,816) = P (Y > 0,816)

Por otra parte, la probabilidad que hay a partir de un valor es igual a 1 (100%) menos la probabilidad acumulada hasta dicho valor:

P (Y > 0,816) = 1 - P (Y < 0,816) = 1 - 0,7925 (aprox.) = 0,2075

Luego, el 20,75% de la población tiene una renta inferior a 3 millones ptas.

b) Nivel de ingresos a partir del cual se sitúa el 10% de la población con renta más elevada.

Vemos en la tabla el valor de la variable estándar cuya probabilidad acumulada es el 0,9 (90%), lo que quiere decir que por encima se sitúa el 10% superior.

Ese valor corresponde a Y = 1,282 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la normal estándar:

Despejando X, su valor es 5,57. Por lo tanto, aquellas personas con ingresos superiores a 5,57 millones de ptas. constituyen el 10% de la población con renta más elevada.

c) Nivel de ingresos mínimo y máximo que engloba al 60% de la población con renta media

Vemos en la tabla el valor de la variable normalizada Y cuya probabilidad acumulada es el 0,8 (80%). Como sabemos que hasta la media la probabilidad acumulada es del 50%, quiere decir que entre la media y este valor de Y hay un 30% de probabilidad.

Por otra parte, al ser la distribución normal simétrica, entre -Y y la media hay otro 30% de probabilidad. En definitiva, el segmento (-Y, Y) engloba al 60% de población con renta media.

El valor de Y que acumula el 80% de la probabilidad es 0,842 (aprox.), por lo que el segmento viene definido por (-0,842, +0,842). Ahora calculamos los valores de la variable X correspondientes a estos valores de Y.

Los valores de X son 2,97 y 5,03. Por lo tanto, las personas con ingresos superiores a 2,97 millones de ptas. e inferiores a 5,03 millones de ptas. constituyen el 60% de la población con un nivel medio de renta.

 

Ejercicio 2: La vida media de los habitantes de un país es de 68 años, con una varianza de 25. Se hace un estudio en una pequeña ciudad de 10.000 habitantes:

26

a) ¿Cuántas personas superarán previsiblemente los 75 años?

b) ¿Cuántos vivirán menos de 60 años?

a) Personas que vivirán (previsiblemente) más de 75 años

Calculamos el valor de la normal tipificada equivalente a 75 años

Por lo tanto

P (X > 75) = (Y > 1,4) = 1 - P (Y < 1,4) = 1 - 0,9192 = 0,0808

Luego, el 8,08% de la población (808 habitantes) vivirán más de 75 años.

b) Personas que vivirán (previsiblemente) menos de 60 años

Calculamos el valor de la normal tipificada equivalente a 60 años

Por lo tanto

P (X < 60) = (Y < -1,6) = P (Y > 1,6) = 1 - P (Y < 1,6) = 0,0548

Luego, el 5,48% de la población (548 habitantes) no llegarán probablemente a esta edad.

Ejercicio 3: El consumo medio anual de cerveza de los habitantes de un país es de 59 litros, con una varianza de 36. Se supone que se distribuye según una distribución normal.

a) Si usted presume de buen bebedor, ¿cuántos litros de cerveza tendría que beber al año para pertenecer al 5% de la población que más bebe?

b) Si usted bebe 45 litros de cerveza al año y su mujer le califica de borracho ¿qué podría argumentar en su defensa?

a) 5% de la población que más bebe.

Vemos en la tabla el valor de la variable estándar cuya probabilidad acumulada es el 0,95 (95%), por lo que por arriba estaría el 5% restante.

Ese valor corresponde a Y = 1,645 (aprox.). Ahora calculamos la variable normal X equivalente a ese valor de la normal estándar:

Despejando X, su valor es 67,87. Por lo tanto, tendría usted que beber más de 67,87 litros al año para pertenecer a ese "selecto" club de grandes bebedores de cerveza.

b) Usted bebe 45 litros de cerveza al año. ¿Es usted un borracho?

Vamos a ver en que nivel de la población se situaría usted en función de los litros de cerveza consumidos.

27

Calculamos el valor de la normal estándar correspondiente a 45 litros:

Por lo tanto

P (X < 45) = (Y < -2,2) = P (Y > 2,2) = 1 - P (Y < 2,2) = 0,0139

Luego, tan sólo un 1,39% de la población bebe menos que usted. Parece un argumento de suficiente peso para que dejen de catalogarle de "enamorado de la bebida"

Ejercicio 4: A un examen de oposición se han presentado 2.000 aspirantes. La nota media ha sido un 5,5, con una varianza de 1,5.

a) Tan sólo hay 100 plazas. Usted ha obtenido un 7,7. ¿Sería oportuno ir organizando una fiesta para celebrar su éxito?

b) Va a haber una 2ª oportunidad para el 20% de notas más altas que no se hayan clasificados. ¿A partir de que nota se podrá participar en esta "repesca"?

a) Ha obtenido usted un 7,7

Vamos a ver con ese 7,7 en que nivel porcentual se ha situado usted, para ello vamos a comenzar por calcular el valor de la normal estándar equivalente.

A este valor de Y le corresponde una probabilidad acumulada (ver tablas) de 0,98214 (98,214%), lo que quiere decir que por encima de usted tan sólo se encuentra un 1,786%.

Si se han presentado 2.000 aspirante, ese 1,786% equivale a unos 36 aspirantes. Por lo que si hay 100 plazas disponibles, tiene usted suficientes probabilidades como para ir organizando la "mejor de las fiestas".

b) "Repesca" para el 20% de los candidatos

Vemos en la tabla el valor de la normal estándar que acumula el 80% de la probabilidad, ya que por arriba sólo quedaría el 20% restante.

Este valor de Y corresponde a 0,842 (aprox.). Ahora calculamos el valor de la normal X equivalente:

Despejamos la X y su valor es 6,38. Por lo tanto, esta es la nota a partir de la cual se podrá acudir a la "repesca".

2.5. Teorema Central del Límite

 El Teorema Central del Límite dice que si tenemos un grupo numeroso de variables independientes y todas ellas siguen el mismo modelo de distribución (cualquiera que éste sea), la suma de ellas se distribuye según una distribución normal.

Ejemplo: la variable "tirar una moneda al aire" sigue la distribución de Bernouilli. Si lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una independiente entre si) se distribuye según una distribución normal.

28

Este teorema se aplica tanto a suma de variables discretas como de variables continuas.

Los parámetros de la distribución normal son:

Media: n * (media de la variable individual multiplicada por el número de variables independientes)

Varianza: n * (varianza de la variable individual multiplicada por el número de variables individuales)

Veamos un ejemplo:

Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si sale cruz el valor 0. Cada lanzamiento es una variable independiente que se distribuye según el modelo de Bernouilli, con media 0,5 y varianza 0,25.

Calcular la probabilidad de que en estos 100 lanzamientos salga más de 60 caras.

La variable suma de estas 100 variables independientes se distribuye, por tanto, según una distribución normal.

Media = 100 * 0,5 = 50

Varianza = 100 * 0,25 = 25

Para ver la probabilidad de que salgan más de 60 caras calculamos la variable normal estándar equivalente:

(*) 5 es la raíz cuadrada de 25, o sea la desviación típica de esta distribución

Por lo tanto:

P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228

Es decir, la probabilidad de que al tirar 100 veces la moneda salga más de 60 caras es tan sólo del 2,28%

EJERCICIOS

Ejercicio 1.

La renta media de los habitantes de un país se distribuye uniformemente entre 4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al seleccionar al azar a 100 personas la suma de sus rentas supere los 725 millones ptas.

Cada renta personal es una variable independiente que se distribuye según una función uniforme. Por ello, a la suma de las rentas de 100 personas se le puede aplicar el Teorema Central del Límite.

La media y varianza de cada variable individual es:

= (4 + 10 ) / 2 = 7

2 = (10 - 4)^2 / 12 = 3

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:

Media: n * = 100 * 7 = 700

Varianza: n * = 100 * 3 = 300

29

Para calcular la probabilidad de que la suma de las rentas sea superior a 725 millones ptas, comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego:

P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749

Es decir, la probabilidad de que la suma de las rentas de 100 personas seleccionadas al azar supere los 725 millones de pesetas es tan sólo del 7,49%

Ejercicio 2.

En una asignatura del colegio la probabilidad de que te saquen a la pizarra en cada clase es del 10%. A lo largo del año tienes 100 clases de esa asignatura. ¿Cuál es la probabilidad de tener que salir a la pizarra más de 15 veces?

Se vuelve a aplicar el Teorema Central del Límite.

Salir a la pizarra es una variable independiente que sigue el modelo de distribución de Bernouilli:

"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10

"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9

La media y la varianza de cada variable independientes es:

= 0,10

2 = 0,10 * 0,90 = 0,09

Por tanto, la suma de las 100 variables se distribuye según una normal cuya media y varianza son:

Media: n * = 100 * 0,10 = 10

Varianza: n * = 100 * 0,09 = 9

Para calcular la probabilidad de salir a la pizarra más de 15 veces, calculamos el valor equivalente de la variable normal estándar:

Luego:

P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475

Es decir, la probabilidad de tener que salir más de 15 veces a la pizarra a lo largo del curso es tan sólo del 4,75%

Ejercicio 3.

Un día visitamos el Casino y decidimos jugar en la ruleta. Nuestra apuesta va a ser siempre al negro y cada apuesta de 500 ptas. Llevamos 10.000 ptas. y queremos calcular que probabilidad tenemos de que tras jugar 80 veces consigamos doblar nuestro dinero.

Cada jugada es una variable independiente que sigue el modelo de distribución de Bernouilli.

30

"Salir negro", le damos el valor 1 y tiene una probabilidad del 0,485

"No salir negro", le damos el valor 0 y tiene una probabilidad del 0,515

(*) La probabilidad de "no salir negro" es mayor ya que puede salir rojo o el cero

La media y varianza de cada variable individual es:

= 0,485

2 = 0,485 * 0,515 = 0,25

A la suma de las 80 apuestas se le aplica el Teorema Central del Límite, por lo que se distribuye según una normal cuya media y varianza son:

Media: n * = 80 * 0,485 = 38,8

Varianza: n * = 80 * 0,25 = 20

Para doblar nuestro dinero el negro tiene que salir al menos 20 veces más que el rojo (20 * 500 = 10.000), por lo que tendrá que salir como mínimo 50 veces (implica que el rojo o el cero salgan como máximo 30 veces).

Comenzamos por calcular el valor equivalente de la variable normal tipificada:

Luego:

P (X > 50) = P (Y > 2,50) = 1 - P (Y < 2,50) = 1 - 0,9938 = 0,0062

Es decir, la probabilidad de doblar el dinero es tan sólo del 0,62% (así, que más vale que nos pongamos a trabajar).

Ejercicio 4.

El precio de una acción en bolsa se mueve aleatoriamente entre 10 ptas. y 20 ptas., con la misma probabilidad en todo el tramo. Hemos dado la orden a nuestro broker de que nos compre paquetes de 1.000 acciones cada día durante las próximas 40 sesiones.

Una vez ejecutada la orden, tenemos un total de 40.000 acciones. A final de año vendemos todas las acciones al precio de 13 ptas./acción, recibiendo 520.000 ptas. Calcular la probabilidad de que ganemos dinero en esta operación.

El precio de cada paquete comprado es una variable aleatoria independiente que se distribuye uniformemente entre 10.000 ptas y 20.000 ptas. Su media y varianza son:

= (10.000 + 20.000 ) / 2 = 15.000

2 = (20.000 - 10.000)^2 / 12 = 833,3

El precio total de los 40 paquetes comprados se distribuye según una distribución normal cuya media y varianza son:

Media: n * = 40 * 15.000 = 600.000

Varianza: n * = 40 * 833,3 = 33.333,3

31

Para estimar la probabilidad de que ganemos dinero, calculamos el valor equivalente de la variable normal tipificada:

Luego:

P (X > 520.000) = P (Y > 2,40) = 1 - P (Y < 2,40) = 1 - 0,9918 = 0,0082

Por tanto, la probabilidad de que ganemos dinero con la "dichosa" operación es tan sólo del 0,82%

2.6. Aproximación de la Poisson a la normal.

Sean X1, X2…m Xn, n, variables aleatorias independientes e idénticamente distribuidas como Poisson cada una con

promedio en un intervalo dado. Es decir en el mismo intervalo cada X i, ocurre con media y varianza iguales a .

Entonces, para n suficientemente grande la variable:

tiene distribución de Poisson con media y varianzas iguales a n .

en consecuencia, por el teorema del límite central, la variable aleatoria:

Tiene aproximadamente distribución N(0,1), cuando n es suficientemente grande.

La aproximación es buena si .

EJEMPLO:

El promedio del número de accidentes de trabajo en una fábrica es 2 cada semana. Calcular la probabilidad de que se

produzcan más de 30 accidentes durante 50 semanas.

SOLUCIÓN.

Sea Xi; # de accidentes por semana con un promedio de Entonces,

es el número de accidentes en 25 semanas.

tiene distribución de Poisson con media y varianzas iguales a

Por el teorema del límite central, la variable aleatoria:

Tiene aproximadamente distribución N(01,1).

Laboratorio Nº 02

32

BinomiaI

1. Si X-B(n,p) tal que E(X)=3 y V(X)=2.4 ,calcular: P[X=3].

2. Un estudiante contesta al azar (o sea sin saber nada) a 9 preguntas, siendo cada una de 4 respuestas de las cuales sólo una es la correcta.a) Determinar la distribución de probabilidades del número de preguntas contestadas correctamente.b) Si para aprobar tal examen debe contestar correctamente al menos 6 preguntas, ¿cuál es la probabilidad de aprobar el examen?

.

3. En una producción, la probabilidad de que un objeto sea defectuoso es 0.2. Si en una muestra de n de tales objetos escogidos al azar uno por uno, se espera que haya un defectuoso,a) calcular la probabilidad de que haya un objeto defectuoso.b) ¿cuántos objetos defectuosos es más probable' que ocurra?

4. El 75% de la mercadería que recibe un comerciante del fabricante A es de calidad excepcional, mientras que el 80'% de la mercadería que recibe del fabricante B es de calidad excepcional. El 60% del total de la mercadería lo adquiere de A y el resto de B. Si se seleccionan 4 unidades de la mercadería, ¿qué probabilidad hay de que se encuentren 2 unidades que sean de calidad excepcional?

5. En una empresa donde los empleados son 80% hombres y 20% mujeres están aptos para jubilarse el 10% de las mujeres y el 10% de los hombres. De cinco solicitudes para jubilarse, ¿cuál es la probabilidad de que al menos dos estén aptos para jubilarse?

6. Un vendedor a domicilio compra diariamente 10 unidades de un producto a $2 cada una. Por cada uno, gana 13$ si vende o pierde 1$ si no vende en el día. Si la probabilidad de venta de cada unidad es 0.2 y si las ventas son independientesa) hallar la distribución de probabilidad de las unidades vendidas. b) calcular la utilidad esperada del vendedor.

7. Una computadora utilizada por un sistema bancario de 24 horas asigna cada transacción <tI azar y con igual probabilidad. a una de cinco posiciones de memoria: 1, 2, 3, 4, 5. Si al terminar el periodo nocturno de un día se han registrado 1 S transacciones, ¿cuál es la probabilidad de que el número de transacciones efectuadas a las posiciones de memoria par sea mayor que 3?

8. Una secretaria que debe llegar a la oficina a las 8 de la mañana, se retrasa 15 minutos en el' 20% de las veces. El gerente de la compañía que no llega si no hasta las 10 de la mañana llama ocasionalmente a la oficina entre las 8 y 8.15 de la mañana. Para dictar una carta. Calcular la probabilidad de que en 5 mañanas por lo menos una no encuentre a la secretaria.

9. Al realizar un experimento, la probabilidad de lograr el objetivo es 0.4. Si se realiza el experimento 20 veces bajo las mismas condiciones y asumiendo resultados independientes

a) Calcular la probabilidad de lograr el objetivo por lo menos en tres de las 20 vecesb) El costo de realizar el experimento es de SI.1500, si se logra el objetivo; y de S/.3000 si no se logra. Calcular el costo esperado para realizar el experimento.

Poisson

10. E] número medio de automóviles que llegan a una garita de peaje es de 120 por hora.

a) Calcular la probabilidad de que en un minuto cualquiera no llegue automóvil alguno.

b) Calcular la probabilidad de que en e] período de 3 minutos lleguen más de 5 automóviles.c) Si tal garita puede atender a un máximo de 3 automóviles en 30 segundos, calcular la probabilidad de que en un medio minuto dado lleguen más automóviles de lo que puede atender.

11. Un líquido contiene cierta bacteria con un promedio de 3 bacterias por cm. 3, calcular la probabilidad de que una

muestra,

33

a) de 1/3 de cm3 no contenga bacteria alguna.b) de 2 cm,3 . Contenga por lo menos una bacteria.

12. Suponga que el número de accidentes de trabajo que se producen por semana en una fábrica sigue la ley de

Poisson de manera que la probabilidad de que ocurran 2 accidentes es igual a 3/2 de ]a probabilidad de que ocurra

un accidente, Calcular la probabilidad de que no ocurran accidentes en 2 semanas consecutivas.

13. Un banco atiende todos los días de 8am. a 4pm. y se sabe que e] número de clientes por día que van a solicitar

un préstamo por más de $10,000 tiene una distribución de Poisson con una media de 3 clientes por día.

a) ¿Cuál es la probabilidad de que hasta el mediodía no se haya producido una solicitud de préstamo por más de

$10,000?b) En cuatro días, ¿cuál es la probabilidad de que en dos de los días hasta el mediodía no se haya producido una solicitud de préstamo por más de $10,000?

14. La demanda semanal de cierto producto tiene una distribución de Poisson. Actualmente su media es 3 por semana. Se estima que después de una campaña publicitaria, el valor esperado de la demanda se duplicará con probabilidad 0.8 y se triplicará con probabilidad 0,2, ¿cuál es la probabilidad de que después de la campaña la demanda sea igual a 4?

15. El número de personas que cada día se aloja en un hotel es una variable aleatoria X que tiene distribución de Poisson con parámetro , .que puede ser igual a 20 con probabilidad 0.5, igual a 15 con probabilidad 0.3, igual a 10 con probabilidad 0.2

a) Determinar P[X = k] , donde k = 1, 2, ..., etc.b) Calcular el valor esperado de X.

16. Cierto tipo de loceta puede tener un número X de puntos defectuosos que sigue una distribución de Poisson con una media de 3 puntos defectuosos por loceta. El precio de la loceta es $1 si X =0, de $0.70 si X=1 o 2, y de $0.1 si X>2. Calcular el precio esperado por loceta.

17. El número de usuarios que acuden a cierta base de datos confidencial sigue una distribución de Poisson con una media de dos usuarios por hora.a) Calcular la probabilidad de que entre las 8 amo y el mediodía (l2.m) acudan más de dos usuarios.b) Si un operador de la base de datos trabaja todos los días de 8 amo hasta el mediodía (l2.m), ¿cuál es la probabilidad de que este operador tenga que' esperar más de 7 días hasta observar el primer día en el cual acceden más de dos usuarios?

18. Cierta panadería dispone de una masa con frutas confitadas para hacer. 200 panetones. Agrega 2,000 pasas de uvas a la masa y la mezcla bien. Suponga que e] número de pasas es una variable aleatoria de Poisson con un promedio 10 pasas por panetón. 'a) Calcular ]a probabilidad de que un panetón elegido a] azar no contenga ninguna pasa.b) ¿Cuántos panetones se espera que contengan 6 pasas?

Normal

19. En cierta comunidad, el porcentaje del ingreso ahorrado por las familias tuvo una media del 10% y una desviación están dar de 1.2%. Suponga que la distribución es normal.a) Si el 2.28% de los ahorros son mayores que 12.4%, determine la desviación estándar.b) ¿Qué porcentaje de familias ahorró entre 9 y 12% de su ingreso?c) Determine el ahorro máximo para el 0.8% de las familias con bajos ahorros.

20. Una pequeña ciudad es abastecida de agua cada dos días. El consumo en volumen de agua (cada dos días) tiene distribución normal.

a) Determine la media y varianza de la distribución si se sabe que el 0.62% del consumo es al menos de 22,500 litros y que el 1.79% del consumo es a lo más 17,900 litros.b) Hallar la capacidad del tanque de agua de la pequeña ciudad para que sea sólo el 0.01 la probabilidad de que en el periodo de dos días el agua no sea suficiente para satisfacer toda la demanda.

21. Las calificaciones de una prueba final de Estadística tienen distribución normal con una media de 12. Si el

34

95.44% de los examinados obtuvieron calificaciones entre 8 y 16,a) Calcular la desviación estándar de la distribución.b) Si la nota aprobatoria es 11, ¿qué porcentaje de alumnos aprobaron el curso?c) ¿Qué nota como mínimo debería tener un alumno para estar ubicado en el quinto superior?

22. Los puntajes de una prueba de aptitud académica están distribuidos normalmente con una media de 60 y una desviación estándar de 10 puntos.a) Si el 12.3% de los alumnos con mayor puntaje reciben el calificativo A y el20% de los alumnos con menor nota reciben el calificativo C, calcular el mínimo puntaje que debe tener un alumno para recibir una A, y el máximo puntaje que debe tener un alumno para recibir una C.b) Si el resto de los alumnos recibe el calificativo B y si el total de alumnos es igual a 90, ¿cuántos alumnos recibieron el calificativo de A, B Y C?

.23. Las calificaciones de una prueba final de Matemática Básica tienen distribución normal con una media igual a 8. Si el 6.68% de los examinados tienen nota aprobatoria (mayor o igual a 11), ¿cómo debe modificarse cada nota para conseguir un 45% de aprobados?

24. Suponga que el ingreso familiar mensual en una comunidad tiene distribución normal con media $400 y desviación estándar $50.a) Si el 10% de las familias con mayores ingresos debe pagar un impuesto, ¿a partir de que ingreso familiar se debe pagar el impuesto?

b) Si el ahorro familiar está dada por la relación Y = X /4 - 50, ¿cuál es la probabilidad de que el ahorro sea superior a $75?

25. Una pieza es considerada defectuosa y por lo tanto rechazada si su diámetro es mayor que 2.02 cm. o menor de 1.98 cm.. Suponga que los diámetros tienen una distribución normal con una media de 2 cm. y una desviación estándar de 0.0 I cm.

a) Calcular la probabilidad de que una pieza sea rechazada

b) ¿Cuál es el número esperado de piezas rechazadas de un lote de 10,000 piezas?c) Si se escogen 4 piezas al azar, ¿cuál es la probabilidad de que 2 de ellos sean defectuosos? .d) Se necesitan 4 piezas sin defecto para una máquina. Si estos se prueban uno a uno sin reposición, ¿cuál es la probabilidad de que la cuarta pieza buena sea la sexta probada?

15. Un gerente viaja diariamente en automóvil de su casa a su oficina y ha -- encontrado que el tiempo empleado en el viaje sigue una distribución normal con media de 35.5 minutos y desviación estándar de 3 minutos. Si sale de su casa todos los días a las 8.20 a.m. y debe estar en la oficina a las 9 a.m.a) ¿Cuál es la probabilidad de que llegue tarde en un día determinado?b) Suponiendo independencia entre un día y otro, ¿cuál es la probabilidad de que llegue a tiempo a la oficina 3 días consecutivos?

16. Cierto líquido industrial contiene un porcentaje X por galón de un compuesto particular cuya distribución es normal con una media de 15% y una desviación estándar de 3%. El fabricante tiene una utilidad neta de $0.15, si 9 < X < 21, de $0.10, si 21<= X<=27, y una pérdida de $.05, si 3<= X<=9, calcular la utilidad esperada por galón.

17. El peso en kilogramos de los artículos que se hacen en la fábrica A tiene una distribución normal con una media de 25 Kg. Y con una desviación estándar de.4 Kg.. Mientras que el peso de los artículos que se hacen de la fábrica B tiene una distribución normal con una media de 28 Kg. Y con una desviación estándar de 3 Kg. De un lote que contiene el 40% de artículos de A y el 60% de B se elige uno al azar; ¿cuál es la probabilidad de que el peso de este artículo esté entre 25 Kg. Y 28 Kg?

3. MUESTREO Y DISTRIBUCIONES MUESTRALES

Al iniciar el estudio de la Estadística, encontramos que tiene como objetivo dar a conocer un conjunto de métodos para recolectar y clasificar información, que luego debe ser analizada e interpretada adecuadamente, de modo que sea útil en la toma de decisiones. Esto nos permitió encontrar dos ramas bien diferenciadas de la Estadística llamadas: Estadística Descriptiva y Estadística Inferencial.

35

La primera ya fue estudiada ampliamente en la ESTADISTICA GENERAL, la segunda es el propósito fundamental de nuestro estudio.

La ESTADISTICA INFERENCIAL O INFERENCIA ESTADÍSTICA, es el aspecto más importante en la toma de decisiones, tanto en las ciencias naturales como en las ciencias sociales. La inferencia Estadística se refiere a la ESTIMACION y a la PRUEBA DE HIPOTESIS, siendo la estimación el proceso de utilizar ESTADISTICOS (como la media de la muestra y desviación estándar de la muestra) que se obtienen de los datos muestrales y sirven para estimar su verdadero valor o PARAMETRO de la población. Como en las dos unidades anteriores examinamos las reglas básicas de probabilidad de un evento y las distribuciones de probabilidad como la binomial, de Poisson y la normal, en esta unidad utilizaremos estos conocimientos de probabilidad de modo que puedan utilizar ciertos estadísticos para hacer inferencias en cuanto a los parámetros de la población. En consecuencia, por provenir los estadísticos de la MUESTRA, es ésta el vehículo para llegar a conclusiones acerca de la población. Así tenemos que si queremos utilizar la media de la muestra para estimar la media de la población debemos determinar todas las muestras posibles y la media de cada una de ellas. A la distribución de probabilidad de estas medias se le denomina DISTRIBUCION MUESTRAL DE LA MEDIA.

Por último, recordaremos que una población está representada por el conjunto de todos los valores (observaciones) posibles que puede tomar una variable, por lo cual diremos indistintamente que la distribución de la población es la distribución de la variable.

3.1. MUESTREO

Los datos necesarios para tomar decisiones se reúnen ya sea estudiando todas las posibles observaciones de la población (CENSO), ya seleccionado unas pocas de la observaciones para realizar el estudio (MUESTRA). El propósito fundamental de muestreo es ESTIMAR EL PARAMETRO de la población basado en el ESTUDIO MUESTRAL

Existen muchas razones para realizar muestreo en una población, entre las que mencionaremos:

1) El costo elevado al exarninar a toda la población.

2) La imposibilidad de estudiar toda la población, como por ejemplo, los peces de un lago.

3) Las limitaciones de tiempo. como las que recaen sobre los encuestadores políticos antes de una elección.

4) La índole destructiva de Ciertas investigaciones, como por ejemplo, al estudiar el tiempo de vida de focos de luz de cierta marca.

Todas las anteriores razones nos indican que el uso de muestras ofrece las siguientes ventajas:

1. Ahorra dinero, tiempo y trabajo.

2. Permite una mayor exactitud en el estudio, pues los errores debidos al observador, al objeto observado y al método de observación, pueden disminuir y controlarse más efectivamente.

La única desventaja del uso de muestras es el llamado ERROR DE MUESTREO, dado por la diferencia entre el valor que describe a la muestra y el verdadero valor de la población. Este error se debe a que las muestras seleccionadas de una población difieren unas de otras y como nosotros estudiamos una muestra para generalizar luego a toda la población. Entonces los resultados son algo diferentes. Como el error por muestreo puede medirse, en consecuencia puede disminuirse a voluntad, con solo aumentar el tamaño de la muestra.

Una muestra es considerada como una BUENA muestra, si cumple con las siguientes condiciones:

a) BUENA EN CANTIDAD, si incluye un número óptimo de individuos, así por ejemplo, si una enfermedad se presenta tan solo en 1 % de la población, habrá la necesidad de estudiar por lo menos 100 casos, para tener la posibilidad de hallar una persona enferma, pero si la presencia es el 50%, basta estudiar dos personas

b) BUENA EN CALIDAD, si refleja fielmente las características de la población de la cual procede y difiere de

36

ella, solo en el número de unidades incluidas.

3.2 ETAPAS DEL MUESTREO

Los pasos principales para la recolección de la información de una muestra son:

1) Definir explícitamente la unidad de análisis.

2) Definir en forma clara la población que va ser muestreada

3) Seleccionar bien las variables que deben ser observadas en cada unidad que se va analizar.

4) Especificar el grado de precisión deseada.

5) Seleccionar la unidad muestral. En algunos casos es obvia, como en el caso de una población de estudiantes de un centro educativo, en donde la unidad es un estudiante. En otras ocasiones debe escogerse la unidad muestral, como en el caso de muestreo de residentes de una ciudad, donde la unidad es una persona, una familia o las familias de una cuadra.

6) Seleccionar la muestra, después de haber decidido el tamaño respectivo.

3.3. TIPOS DE MUESTRAS.

Como se muestra a continuación, existen dos tipos básicos de muestras: las muestras probabilísticas y las no probabilísticas. Estas últimas, son mucho más sencillas y baratas de obtener, entre estas tenemos las llamadas MUESTRAS DE JUICIO. MUESTRAS DE CUOTA y LAS MUESTRAS DE CONVENIENCIA

3.3.1. MUESTRAS NO PROBABILÍSTICAS

a) MUESTRAS POR JUCIO.

Como su nombre lo indica, es la muestra tomada de acuerdo con el juicio personal, los elementos que intervienen en una muestra por juicio son resultados del juicio experto del investigador sobre su "representatividad". En consecuencia, la probabilidad de que cada unidad elemental sea seleccionada de la muestra, es desconocida y la fidelidad de sus resultados no puede utilizarse para hacer inferencias de la población total, lo cual es el objetivo del muestreo.

Así por ejemplo, un gerente de ventas que selecciona ciertas localidades del Perú como típicas para probar nuevo tipo de campaña de ventas en ellas y extrae conclusiones de todo el país a partir de los resultados de las comunidades muestreadas. Las localidades seleccionadas constituyen una muestra del Perú en base a un juicio, pues el gerente CREE que ciertas localidades proporcionan un cuadro representativo del país completo. En consecuencia, la muestra solo puede evaluarse en términos de la solidez del criterio del gerente de ventas y no sobre la base de la muestra en si misma.

b) MUESTRA A CUOTA.

Una muestra a cuota es una muestra basada en un juicio dado. En una muestra a cuota, se instruye al entrevistador para que interrogue a cierto número de personas. Así por ejemplo, puede indicársele que entreviste a 30 hombres que vivan a cierto números de cuadros que caen dentro de un cierto rango de edades o cuyos ingreso caen dentro de un intervalo dado.

En la práctica es el entrevistador el que hace la selección real de las personas, resultando errores sistemáticos serios en los resultados.

Por ejemplo, un entrevistador tiende a seleccionar a las personas más fácilmente accesibles; así, si las entrevistas son en el día, pasará por alto a las personas que están trabajando; si una persona se rehúsa a responder, el entrevistador simplemente seleccionará a otra persona.

37

El elemento común en cada uno de esto casos de muestras basadas en un juicio dado, es el papel considerable que juega el juicio. Si bien las muestras basadas en un juicio dado pueden proporcionamos resultados útiles y de hecho a menudo lo hacen, no es posible estimar el error del muestreo en dicha muestras. Por consiguiente, la precisión del resultado de una muestra basada en un juicio, depende de la solidez del juicio y no puede evaluarse de la muestra misma.

c) MUESTRA DE CONVENIENCIA O TROZO.

Un trozo es una muestra que se conforma por un proceso de auto selección, es decir, un trozo es una simple "Muestra de conveniencia" un conjunto de sujetos fácilmente agrupados, como los miembros de una clase en particular, personas que responden a un anuncio. Personas que visitan una exhibición en un centro comercial, etc. También en este caso, la desventaja principal, es que no hay forma probabilística' de interpretar cuan representativa es la muestra, de la población total.

Así por ejemplo. al ensayar una nueva droga, en lugar de escoger individuos al azar, pueden suministrarse a los casos graves, pues se presume que si la droga es efectiva en tales casos, con mayor razón lo será en los casos leves de la enfermedad.

3.3.2. MUESTRAS PROBABILÍSTICAS

Las muestras probabilísticas son aquellas en que cada individuo de las población tiene una probabilidad conocida (no necesariamente igual) de ser incluida en la muestra.

La elección de una muestra probabilística requiere dos condiciones fundamentales:

i) Es esencial que la probabilidad de elegir cada individuo sea perfectamente conocida, pues si no lo es, no será posible calcular los errores que pueden cometerse al hacer su selección.

ii) Es indispensable que los individuos se elijan al azar, sin permitir la intervención de ningún factor que favorezca la elección de unos en perjuicio de los Otros.

Puesto que el estudio sobre tipos de muestras probabilísticas es muy extenso, solo mencionaremos algunas de las más utilizadas, tales como la muestra aleatoria simple. la muestra sistemática, la muestra estratificada y la muestra agrupada.

a) MUESTREO ALEATORIO SIMPLE.

Al haber definido las poblaciones y las muestras, distingamos más detalladamente entre las poblaciones que son finitas y las que son infinitas. Se dice que una población es FINITA si consta de un número finito (fijo) de elementos,. por ejemplo, la población de escuelas de la provincia de LIMA. En contraste con las poblaciones finitas, se dicen que una población es INFINITA si no hay límite en el número de elementos que contiene. Diremos que una muestra de una población finita es aleatoria si cada elemento de la población tiene igual probabilidad de ser incluido en la muestra. Existen dos métodos de seleccionar muestras aleatorias en poblaciones finitas:

1. MÉTODO DEL SORTEO

Consiste en colocar en un recipiente fichas con los nombres de todos los integrantes de la población en estudio, luego remover bien las fichas y extraer1as una a una con sustitución, hasta tener las integrantes que deben ir en las muestras.

2. METODO DE LOS NUMEROS ALEATORIOS.

Consiste en obtener los elementos de la muestra utilizando tablas especialmente elaboradas, llamadas TABLAS DE NUMEROS ALEATORIOS

Para ilustrar el uso de una tabla de números aleatorios, utilizamos el problema de seleccionar una muestra aleatoria simple, consistente de 15 boletas de notas elegidas de una población de 8 900 boletas.

En la tabla de números aleatorios adjunta, cada dígito o sucesión de ellos es aleatorio. por lo que se puede utilizar la tabla y leerla en sentido horizontal o ve/1ical, los márgenes de la tabla designa los números de fila (margen vertical) y los números de columna (margen horizontal). los dígitos están agrupados en sucesiones de cinco con el solo fin de facilitar la observación de la tabla.

38

Si se usa esta tabla en lugar de un recipiente para seleccionar la muestra, primero es necesario asignar números a los miembros individuales de la población, como la población es de N = 8900 boletas de notas, por ser un número de cuatro dígitos, cada número asignado también de ser de cuatro dígitos, a fin de que cada boleta tenga igual oportunidad de ser seleccionada. Por tanto, asignamos el. Número 0001 a la primera boleta, el número 0002 a la segunda boleta, y así sucesivamente hasta llegar al número 8900, para la 8900 ava boleta. Una vez que todas las boletas han sido numeradas, comenzamos a seleccionar la muestra leyendo las primeras cuatro cifras de la primera línea de la tabla de números aleatorios; digamos el número 6619. Luego pasamos a la segunda línea y leemos el número 7284 y así hasta el15 número.

b) MUESTREO SISTEMATICO.

En el muestreo sistemático, los elementos se seleccionan de la población a un intervalo uniforme que es medido en tiempo orden o espacio. El intervalo en mención se determina por la fórmula:

I= N / n

El primer elemento de la muestra es elegido al azar entre los I primeros elementos de la población y luego, el resto de los elementos se elegirán cada lavo elemento de la lista. Así por ejemplo si N = 10000 Y n = 1000, entonces 1 = 10, esto quiere decir que de cada 10 se elige uno.

Para obtener una muestra sistemática es necesario tener la lista de los elementos en estudio (alumnos de una universidad. por ejemplo), luego se les numera del 1 al 10000. En seguida se escoge al azar un número entre 1 y 10, siendo este el primer elemento que se va ha estudiar y completaremos la muestra cada diez elementos. Si el número escogido fue 8, los otros serán 18, 28, 38, etc.

Este procedimiento de muestreo por la sencillez de su aplicación suele utilizarse en todos aquellos casos en los cuales existen listados con los nombres de cada uno de los elementos de la población que se estudia.

La ventaja del muestreo sistemático es que requiere' menos tiempo y es menos costoso que el método de muestreo aleatorio simple.

c) MUESTREO ESTRATIFICADO.

Para utilizar el muestreo estratificado, se divide la población en grupos relativamente homogéneos. Llamados estratos. Entonces, se toma una muestra aleatoria simple de cada estrato, tomando ésta el nombre de muestra estratificada.

Una muestra estratificada puede ser proporcional o desproporcionada. En la primera, el número de unidades extraídas de cada estrato es proporcional al tamaño de este. Así por ejemplo, si la población es dividida en cuatro estratos. Siendo sus tamaños respectivos 10%, 20%. 30% Y 40% de la población y deseamos extraer una muestra de 500 unidades, entonces la muestra estratificada proporcional se obtiene de la siguiente manera:

ESTRATO Nº DE UNIDADES

1 500 (10%) = 50

2 500 (20%) = 100

3 500 (30%) = 150

4 500 (40%) = 200TOTAL 500

Como se verá en el ejemplo. la estratificación proporcional arroja una muestra en la que cada estrato aporta una cantidad de unidades proporcional al número de unidades de la muestra. Este procedimiento es aún más eficiente cuando las desviaciones estándares de cada estrato no difieren substancial mente entre si. Por tanto, para que la muestra estratificada sea más eficiente se debe dar mayor representación a un estrato con una gran dispersión y menor representación a los estratos con menor dispersión (pequeña desviación estándar).

Una muestra estratificada desproporcionada incluye los procedimientos de tomar un número igual de unidades de cada estrato sin tener en cuenta su tamaño, o de dar sólo una pequeña representación a uno o más estratos son

39

demasiado costosos de investigar, pues aún cierta representación es valiosa.

La ventaja de las muestras estratificadas es que cuando ellas están adecuadamente diseñadas reflejan con mayor precisión que otras muestras, las características de la población a partir de las cuales ellas fueron escogidas.

Por ejemplo, todos sabemos que el nivel de ingresos tiene una relación importante con la opinión pública en cuanto a una elección. Si el 60% de los votantes tienen ingresos bajos, el 30% ingresos medianos y el1 0% ingresos altos, entonces para una muestra estratificada proporcional de 500 votantes, seleccionaríamos 300 votantes de ingresos bajos (60% de 500) 150 de ingresos medianos (30% de 500) y 50 de ingresos altos (10% de 500)

d) MUESTREO AGRUPADO O POR CONGLOMERADOS

En esta clase de muestreo, se divide a la población en grupos o conglomerados, y luego se selecciona una muestra aleatoria de estos. Cuando los grupos son seleccionados, se pueden incluir en la muestra todas sus unidades elementales o tomar una muestra de las unidades elementales de los grupos escogidos. En el primer caso se tiene lo que se conoce como muestreo en una sola etapa y cuando se procede como en el último caso, tenemos lo que se conoce como muestreo en dos etapas o submuestreo, escogiéndose en ambas etapas muestras aleatorias simples. Cuando el muestreo por agrupación supone más de dos etapas para escoger la muestra final, se le denomina muestreo multietápico.

Tanto en el muestreo estratificado como en el muestreo agrupado, la población se divide en grupos bien definidos. Se usa el muestreo estratificado cuando cada grupo tiene pequeñas variaciones entre sus unidades elementales, pero hay una gran variación entre grupos. En tanto que el muestreo agrupado se usa cuando hay una variación considerable entre las unidades elementales de cada grupo, pero los grupos son esencialmente similares entre sI.

Así por ejemplo, supongamos que deseamos estudiar los gastos de las familias en el área del Cercado de Lima y que hemos decidido entrevistar a 1000 familias. Un modo económico de manejar esto puede ser dividiendo el área total del Cercado en áreas más pequeñas. Digamos, cuadras, y después entrevistar a todas las familias en un número de cuadras seleccionadas al azar.

3.2. DISTRIBUCIONES MUESTRALES

En la tercera unidad se vio que hay ciertos rasgos invariables dentro de una población que describen una de sus características, tales como la media y la desviación estándar , estas reciben el nombre de PARAMETROS de la población. Al extraerse una muestra, es posible tener un estimado de los parámetros, a partir de las observaciones de la muestra; estos estimados por estar en función de tales observaciones varían de muestra a muestra y reciben genéricamente el nombre de Estadísticos de la muestra. En consecuencia los estadísticos son variables y por tanto tienen su correspondiente distribución de probabilidad, la cual toma el nombre de DISTRIBUCION MUESTRAL DEL ESTADISTICO. En la práctica las distribuciones muestrales usuales son: la de una media, la de la diferencia de dos medias y la de una proporción.

3.2.1. DISTRIBUCIÓN MUESTRAL DE LA MEDIA

Si tomamos repetidamente muestras aleatorias de una población con distribución deprobabilidad cuyos parámetros son y , entonces la variable aleatoria media tiene la

misma distribución de probabilidad con parámetros

= YSi la Población es infinita muestreo con o sin reposición

=

Si la Población es finita y el muestreo es sin reposición

=

Luego, la variable bajo la transformación:

40

Z = - /

Se distribuyen como sigue:

CASO 1. Aproximadamente como la normal estándar, si la población es normal o no con conocida o no y el tamaño "n" de la muestra es igual o mayor de 30.

CASO 2. Exactamente como la normal estándar, si la población es normal con conocida y el tamaño "n" de la muestra menor que 30.

Nota: Si no se conoce la desviación estándar poblacional estimarla mediante la desviación estándar de la muestra “S”

EJEMPLO 4.1

La media de los puntajes de los cocientes de inteligencia (CI) de los alumnos de una universidad es 110 Y la desviación estándar es 10. Si los puntajes de los CI están distribuidos normalmente:

a) ¿Cuál es la probabilidad de que el puntaje medio de una muestra de 36 alumnos sea mayor que 112?

b) ¿Cuál es la probabilidad de que el puntaje medio de una muestra de 100 alumnos sea mayor que 112?

SOLUCION.

a) Por tener los puntajes de los C.I. variables que siguen una distribución normal, las medias de las muestras también se distribuyen normalmente con media y desviación estándar respectiva:

= = 110 y = = 10 La puntuación de que el puntaje medio de una muestra de 36 alumnos sea mayor que 112 es:

P( > 112) = P( - / >112-110 / (5/3))= P(Z > 1.2) = 1- P(Z <= 1.2)= 0.1151

b) Para una muestra de 100 alumnos se tiene que:

= = 110 y = = 10 Luego como en a:

P( > 112) = P( - / >112-110 / 1)= P(Z > 2) = 1- P(Z <= 2)= 0.0228

LABORATORIO Nº 03

1. En una muestra de 16 observaciones de una distribución normal con una media de 150 y una variancia de 256, encuentre:

a) P ( < 160) b) P ( > 142)Si, en lugar de 16 observaciones, se hicieran 9 observaciones, encuentre:

c) P ( < 160) d) P ( > 142)

2. En una muestra de 25 observaciones de una distribución normal con una media de 98.6 y una desviación estándar de 17.2, encuentre:

a) P (92 < < 102)b) La probabilidad correspondiente si tenemos una muestra de 36.

3. En una distribución normal con una media de 56 y una desviación estándar de 21, ¿de qué tama ño debe ser una muestra de modo que haya por lo menos 90% de probabilidades de que su media sea mayor que 52%

4. En una distribución normal con una media de 375 y una desviación están dar de 48, ¿de qué tamaño debe ser una muestra para que haya por lo menos .95 probabilidades de que la muestra se encuentre entre 370 y 380?

41

Un astrónomo del observatorio de Mount Palomar observa que, durante una lluvia de meteoros, un promedio de 40 meteoros aparecen cada hora, con una variancia de 16 meteoros al cuadrado. La lluvia de meteoros ocurrirá la próxima semana.a) Si el astrónomo ve la lluvia de meteoros durante 4 horas, ¿cuál es la probabilidad de que aparezca un mínimo de 36 meteoros por hora?b) Si el astrónomo mira durante una hora más, ¿aumentará o disminuirá esta probabilidad?

Explique su respuesta.

5. El costo promedio de un condominio con estudio en un desarrollo urbano es de $62,000 con una desviación estándar de $4,200.a) ¿Cuál es la probabilidad de que un condominio de este desarrollo cueste por lo menos

$65,000?b) ¿Es la probabilidad de que el costo promedio de una muestra de dos condominios sea al menos $65,000 mayor o menor que la probabilidad de que un condominio cueste esa cantidad?

¿En qué cantidad?

6. Una agencia de empleos normalmente aplica pruebas de inteligencia y aptitudes a todos los que buscan trabajo a través de ella. La empresa ha reunido datos durante años, habiendo descubierto que la distribución de las puntuaciones no es normal, sino que está sesgada a la izquierda con una media de 86 y una desviación estándar de 16. ¿Cuál es la probabilidad de que, en una muestra de 75 candidatos, la puntuación promedio sea por lo menos 84 o mayor que 90?Una refinería de petróleo tiene monitores de reserva para llevar un control constante del flujo y prevenir que las fallas de la máquina desorganicen el proceso. Un monitor tiene un promedio de vida de 4,300 horas, con una desviación estándar de 730 horas. Además del monitor primario, la refinería ha instalado dos unidades de emergencia, que son un duplicado de la unidad primaria En caso de avería de uno de los monitores, el otro se activa en forma automática. La vida de operación de los dos es independiente de los otros.a) ¿Cuál es la probabilidad de que determinado conjunto de monitores dure por lo menos

13,000 horas?b) ¿Y un máximo de 12,630 horas?

7. María Barrios es auditora de una gran compañía de tarjetas de crédito y sabe que, en promedio, el saldo mensual de determinado cliente es de $112, con una desviación están dar de $65. Si María revisa 50 cuentas seleccionadas al azar, ¿cuál es la probabilidad de que el saldo mensual promedio esté:a) Por debajo de $1oo?b) Entre $100 y $130?

8. El presidente de una empresa telefónica está molesto con el número de teléfonos producidos por la empresa que tienen aparatos defectuosos. En promedio, 120 teléfonos son devueltos diariamente a causa de ese problema, con una desviación estándar de 81. El presidente ha decidido que, a menos que logre una seguridad promedio de 85% de que al día no serán devueltos más de 135 teléfonos en los próximos 40 días, ordenará revisar el producto. ¿Tomará esta medida?

9. Clara Díaz, cuyo trabajo consiste en predecir el futuro de su compañía de riesgo compartido, acaba de recibir las estadísticas que describen el desempeño de la empresa en 1,800 inversiones realizadas el último año. Clara sabe que, en promedio, las inversiones generan utilidades que tienen una distribución normal con una media de $7,500 y una desviación estándar de $3,300. Aun antes de examinar los resultados concretos de cada una de esas inversiones del último año, Clara pudo hacer algunas predicciones exactas usando su conocimiento de las distribuciones muestrales. Continúe el análisis de ella y calcule la probabilidad de que la media muestral de las inversiones del año anterior:a) Superen los $7,700.b) Sean menores que $7,400.c) Sean mayores que $7,275, pero no lleguen a $7,650.

10. Un agricultor, que vende trigo a Alemania Occidental, posee 60 acres de campos de trigo. Basándose en su experiencia, sabe que el rendimiento de cada acre tiene una distribución normal con una media de 120 bushels y una desviación estándar de 12 bushels. Ayúdele a planear la cosecha del próximo año, calculando:a) La media esperada de los rendimientos de 60 acres de campo, destinados al cultivo de trigo. b) La desviación estándar de la media muestral de los rendimientos de los 60 acres.c) La probabilidad de que el rendimiento medio por acre rebase los 123.8 bushels.d) La probabilidad de que el rendimiento medio por acre oscile entre 117 y 122 bushels.

11. Un transbordador transporta 25 pasajeros. El peso de cada pasajero tiene una distribuci6n normal con una media de 165 libras y una variancia de 441 libras al cuadrado. Las normas de seguridad establecen que, para este

42

transbordador en particular, el peso total de sus pasajeros no de. be exceder de 4,375 libras más de 1 % de las veces. Supongamos que usted fuera el dueño del transbordador y tuviera que calcular:

a) La probabilidad de que el peso total de los pasajeros del transbordador exceda de 4,375 libras

b) El nonagésimo noveno percentil de la distribución del peso total de los pasajeros del transbordador. ¿Está cumpliendo el transbordador con las normas de seguridad?

12. Se espera que e! diámetro de las pelotas de pin-pon fabricadas en una planta grande tenga una distribución normal aproximada con media de 1.30 pulgadas y desviación están dar de 0.04 de pulgada. ¿Cuál es la probabilidad de que una pelota seleccionada al azar tenga un diámetro ..(a) Entre 1.28 y 1.30 pulgadas?(b) Entre 1.31 y 1.33 pulgadas?(e) ¿Entre qué dos valores (simétricos respecto a la media) estará el 60% de las pelotas de pin-pon (en términos del diámetro)?(d) Si se seleccionan muchas muestras de 16 pelotas,

(1) ¿cuáles son la media y la desviación estándar esperadas?(2) ¿qué distribución seguirán la medias muestrales'?(3) ¿qué proporción de las medias muestrales estará entre 1.28 y 1.30 pulgadas? (4) ¿qué proporción de las medias muestra les estará entre 1.31 y 1.33 pulgadas?

(5) ¿entre qué dos valores estará el 60% de las medias muestrales?

(e) Compare las respuestas de la (a) y {d)(3) con las de (b) y (d)(4). Analice(f) Explique la diferencia en los resultados de (c) y (d)(5).(g) ¿Qué es más probable que ocurra, una pelota individual arriba de 1.34 pulgadas, una media muestral arriba de 1.32 pulgadas en una media de tamaño 4, o una media muestral arriba de 1.31 pulgadas en una muestra de tamaño 16? Explique.

13. El tiempo que se usa el correo electrónico por sesión tiene una distribución normal con = 8 minutos y = 2 minutos. Si se seleccionan muestras aleatorias de 25 sesiones,

(a) calcule .(b) ¿qué proporción de las medias muestrales estará entre 7.8 y 8.2 minutos?(c) ¿qué proporción de las medias muestrales estará entre 7.5 y 8 minutos?(d) Si se seleccionan muestras de 100 sesiones, ¿qué proporción; de las medias muestrales estará entre 7.8 y 8.2 minutos?(e) Explique la diferencia entre los resultado de (b) y (d). .(f) ¿Qué es 'más probable que ocurra, una sesión de correo electrónico de más de 11 minutos, una media muestral mayor que 9 minutos en una muestra de 25 sesiones, o una media mueso-al mayor que 8.6 minutos en una muestra de 100 sesiones? Explique.

14. El tiempo que un cajero tarda con cada cliente tiene una media poblacional = 3.10 minutos y una desviación estándar = 0.40 minutos. Si se selecciona una muestra aleatoria de 16 clientes.

(a) ¿cuál es la probabilidad de que el tiempo promedio que pasa con cada cliente sea de al menos 3 minutos?(b) existe una posibilidad de 85% de que la media muestra] sea menor que ¿cuántos minutos? (c) ¿Qué suposición de¡"; hacerse para resolver los incisos (a) y (b)? (d) Si se obtiene una muestra aleatoria de 64 clientes, existe una probabilidad dc 85% de que la media muestral sea menos de ¿cuántos minutos"(e) ¿Qué suposición debe hacerse para resolver el inciso (d)?

f) ¿Qué es más probable que ocurra, un servicio individual de menos de 2 minutos, una media muestral mayor que 3.4 minutos en una muestra de 16 clientes, o una media muestral menor que 2.9 minutos en una muestra de 64 clientes? Explique.

15. La compañía de transportes Toby determinó que, con base anual, la distancia recorrida por camión tiene una distribución normal con media de 50.0 miles de millas y desviación estándar de 12.0 miles de millas. Si se selecciona una muestra aleatoria de 16 camiones,

(a) ¿cuál es la probabilidad de que la distancia promedio recorrida sea menor que 45.0 miles de millas en el año?,(b) ¿Cuál es la probabilidad de que la distancia promedio recorrida esté entre 44.0 y 48.0 miles de millas en el año?(c) ¿Qué suposición debe hacerse para resolver los incisos (a) y (b)

43

(d) Si se selecciona una muestra aleatoria de 64 camiones, existe una posibilidad de 95% de que la media muestral sea menor que ¿cuántas millas? (e) ¿Qué suposición debe hacerse para resolver el inciso (d)? (f) ¿Cuáles serían las respuestas de los incisos (a) a (d) si la desviación estándar fuera

10.0 miles de millas?

16. Se fabrican bolsa de plástico para empacar verduras de manera que la resistencia a roturas tenga una distribución normal con media de 5 libras por pulgada cuadrada y desviación estándar de 1.5 libras por pulgada cuadrada. Si se selecciona una muestra de 25 bolsas,(a) ¿cuál es la probabilidad de que la resistencia promedio(1) esté entre 5 y 5.5 libras por pulgada cuadrada'(2) Esté entre 4.2 y 4.5 libras por pulgada cuadrada?(3) sea menor que 4.6 libras por pulgada cuadrada'(b) ¿Entre qué dos valores simétricos respecto a la media estará el 95% de las resistencias promedio'(c) ¿Cuáles serían las respuestas a los incisos (a) y (b) si la desviación estándar fuera

1.0 libra por pulgada cuadrada'

Luego, la variable bajo la transformación:

4. ESTIMACIÓN ESTADÍSTICA

La inferencia estadística es el proceso que consiste en utilizar los resultados de una muestra para llegar a conclusiones acerca de las características de una población.

Existen dos tipos de estimaciones: estimaciones puntuales y estimaciones de intervalo. Una estimación puntual consiste en una sola estadística de muestra que se utiliza para estimar el valor verdadero de un parámetro de población. Puesto que la estadística de prueba varía de una muestra a otra necesitamos considerar este hecho con el fin de proporcionar una estimación más significativa y característica de la población. Para lograr esto, debemos desarrollar una estimación de intervalo de la media de población verdadera, tomando en consideración la distribución de muestreo de la media. El intervalo que construimos tendrá una confianza o probabilidad específica de estimar correctamente el valor verdadero del parámetro de población.

4.1. ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA MEDIA POBLACIONAL

Estimación de intervalo de confianza de la media (desvío de la población conocido):En la inferencia estadística debemos tomar los resultados de una sola muestra y llegar a conclusiones acerca de la población. En la práctica, la media de la población es la cantidad desconocida que se va a determinar. Para algunas muestras la estimación de intervalo de la media de la población será correcta y para otras no. Tenemos que recordar que para el cálculo del intervalo trabajamos con una estimación de intervalo de confianza de 95, por ejemplo, esto puede interpretarse como si se tomaran todas las muestras posibles del mismo tamaño, n, 95% de ellas incluirían la media de población verdadera en alguna parte del intervalo alrededor de sus medias de muestra, y solamente 5% de ellas no estarían incluidas. En general el nivel de confianza se simboliza como (1-α ) * 100%, en donde α es la porción que se encuentra en los extremos de la distribución que está fuera del intervalo de confianza. Por consiguiente para obtener la estimación del intervalo tenemos:

Z es el valor correspondiente a un área de (1-α )/2 desde el centro de una distribución normal estandarizada. El valor Z elegido para construir tal intervalo de confianza se conoce como el valor crítico.

Cualquier aumento en el nivel de confianza se logra ampliando simultáneamente el intervalo de confianza obtenido (haciéndolo menos preciso y menos útil).

Estimación de intervalo de confianza de la media (desvío desconocido)Del mismo modo en que la media de la población se desconoce, es probable que la desviación estándar real de la población tampoco sea conocida. Por lo tanto, necesitamos obtener una estimación de intervalo de confianza utilizando las estadísticas de muestra " " y "S". Para ello, utilizamos la distribución t-student.

44

De este modo, el intervalo de confianza se establecerá a partir de la siguiente fórmula:Estimado del intervalo de confianza de la porción

4.2. ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA DIFERENCIA DE DOS MEDIAS POBLACIONALES

( - ) Z 1-

Es el intervalo de confianza de 100(1- ) % de la diferencia de medias para:

1) Muestras grandes, varianzas conocidas y poblaciones normales o no.2) Muestras grandes, varianzas conocidas y poblaciones normales o no

3) Muestras pequeñas, varianzas conocidas y poblaciones normales.

( - ) t 1- ,

Es el intervalo de confianza de 100(1- ) % de la diferencia de medias para:

Muestras pequeñas, varianzas desconocidas y poblaciones normales

4.3. ESTIMACIÓN DEL INTERVALO DE CONFIANZA DE LA PROPORCIÓN POBLACIONAL

Podemos establecer la siguiente estimación de intervalo de confianza (1-α) para la proporción de la población:

  12 y2

2

Tamaño de muestra para la media:

Por consiguiente para determinar el tamaño de la muestra, deben conocerse tres factores:

1. El nivel de confianza deseado. 2. EL error de muestreo permitido. 3. La desviación estándar.

45

Determinación del tamaño de muestra para una proporción:

 Al determinar el tamaño de muestra para estimar una porción se deben definir tres incógnitas:

1. El nivel de confianza. 2. El error de muestreo permitido. 3. La porción verdadera de éxitos.

Estimación y determinación del tamaño de muestra para poblaciones finitas.

Estimación de la media

  Estimación de la proporción

Determinación del tamaño de muestra

5. PRUEBA DE HIPOTESIS

La prueba de hipótesis empieza con algo de teoría, afirmación o negación con respecto a un parámetro particular de una población. La hipótesis de que el parámetro de la población es igual a la especificación de la compañía se conoce como hipótesis nula. Una hipótesis nula es siempre una de status quo o de no diferencia. Se simboliza con el símbolo Ho.Siempre que especificamos una hipótesis nula, también debemos especificar una hipótesis alternativa, o una que debe ser verdadera si se encuentra que la hipótesis nula es falsa. La hipótesis alternativa se simboliza H1. La hipótesis alternativa representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la información de la muestra para decidir que es improbable que la hipótesis nula sea verdadera, y por tanto rechazarla. El hecho de no rechazar la hipótesis nula no es una prueba de que ésta sea verdadera. Nunca podemos probar que tal hipótesis sea correcta porque estamos basando nuestra decisión únicamente en la información de la muestra, no en la población entera.

- La hipótesis nula se refiere siempre a un valor especificado del parámetro de población, no a una estadística de muestra.

- El planteamiento de la hipótesis nula siempre contiene un signo de igualdad con respecto al valor especificado del parámetro.

- El planteamiento de la hipótesis alternativa nunca contiene un signo de igualdad con respecto al valor especificado del parámetro.

Regiones de rechazo y de no rechazo

46

La distribución de muestreo de la estadística de prueba se divide en dos regiones, una región de rechazo (conocida como región crítica) y una región de no rechazo. Si la estadística de prueba cae dentro de la región de no rechazo, no se puede rechazar la hipótesis nula.La región de rechazo puede considerarse como el conjunto de valores de la estadística de prueba que no tienen posibilidad de presentarse si la hipótesis nula es verdadera. Por otro lado, estos valores no son tan improbables de presentarse si la hipótesis nula es falsa. El valor crítico separa la región de no rechazo de la de rechazo.

Riesgos en la toma de decisiones al utilizar la metodología de prueba de hipótesis.Se pueden presentar dos tipos diferentes de errores:

- Un error tipo I se presenta si la hipótesis nula es rechazada cuando de hecho es verdadera y debía ser aceptada.

- Un error tipo II se presenta si la hipótesis nula es aceptada cuando de hecho es falsa y debía ser rechazada.

Nivel de Significación. La probabilidad de cometer un error tipo I denotada con la letra griega alfa, se conoce como nivel de significación de la prueba estadística. Está bajo el control directo del individuo que lleva a cabo la prueba. Ya que se ha especificado el valor de alfa, se conoce el tamaño de la región de rechazo, puesto que alfa es la probabilidad de un rechazo de la hipótesis nula.

Coeficiente de confianza. EL complemento ( 1- ) de la probabilidad de cometer un error de tipo I se conoce como coeficiente de confianza.

El coeficiente de confianza es la probabilidad de que la hipótesis nula no sea rechazada cuando de hecho es verdadera y debería ser aceptada.

Riesgo . La probabilidad de cometer un error de tipo II se conoce como nivel de riesgo del consumidor.

Potencia de una prueba. El complemento (1- ) de la probabilidad de cometer un error del tipo II se conoce como potencia de una prueba estadística.

La potencia de una prueba es la probabilidad de rechazar la hipótesis nula cuando de hecho esta es falsa y debería ser rechazada.

Una manera en que podemos controlar la probabilidad de cometer un error del tipo II en un estudio, consiste en aumentar el tamaño de la muestra. Tamaños más grandes de muestra, nos permitirán detectar diferencias incluso muy pequeñas entre las estadísticas de muestra y los parámetros de la población. Cuando se disminuye , aumentará de modo que una reducción en el riesgo de cometer un error de tipo I tendrá como resultado un aumento en el riesgo de cometer un error tipo II.

Prueba de hipótesis Z para la media (desvío de la población conocido)

El estadístico de prueba a utilizar es:

La Potencia de una prueba

β representa la probabilidad de que la hipótesis nula no sea rechazada cuando de hecho es falsa y debería rechazársele. La potencia de prueba 1-β representa la sensibilidad de la prueba estadística para detectar cambios que se presentan al medir la probabilidad de rechazar la hipótesis nula cuando de hecho es falsa y debería ser rechazada. La potencia de prueba estadística depende de qué tan diferente en realidad es la media verdadera de la población del valor supuesto.

Una prueba de un extremo es más poderosa que una de dos extremos, y se debería utilizar siempre que sea adecuado especificar la dirección de la hipótesis alternativa.

47

Puesto que la probabilidad de cometer un error tipo I y la probabilidad de cometer un error tipo II tienen una relación inversa y esta última es el complemento de la potencia de prueba (1-β), entonces α y la potencia de la prueba varían en proporción directa. Un aumento en el valor del nivel de significación escogido, tendría como resultado un aumento en la potencia y una disminución en α tendría como resultado una disminución en la potencia.

Un aumento en el tamaño de la muestra escogida tendría como resultado un aumento en la potencia de la prueba, una disminución en el tamaño de la muestra seleccionada tendría como resultado una disminución en la potencia.

Todos los procedimientos paramétricos tienen tres características distintivas: Los procedimientos de prueba paramétricos pueden definirse como aquellos.

1) que requieren que el nivel de medición obtenido con los datos recolectados esté en forma de una escala de intervalo o de una escala de cociente.

2) implican la prueba de hipótesis de valores de parámetros especificados.

3) y por último requieren un conjunto limitante de suposiciones.

Los procedimientos no paramétricos pueden definirse como aquellos que no tienen que ver con los parámetros de una población.

Prueba t de hipótesis para la media (δ2 desconocida)

En ocasiones se desconoce la desviación estándar de la población. Sin embargo, se la puede estimar con el cálculo de S, la desviación estándar de la muestra. Recordemos de muestreo de la media seguirá una distribución t con n-1 grado de libertad.

Prueba de hipótesis χ2 para la varianza (o desviación estándar)

Al intentar llegar a conclusiones con respecto a la variabilidad de la población, primero debemos determinar que estadística de prueba puede utilizarse para representar la distribución de la variabilidad de los datos de la muestra. Si la variable se supone que está distribuida normalmente, entonces la estadística de prueba para probar si la varianza de la población es igual o no a un valor especificado es:

Una distribución chi-cuadrado es una distribución sesgada cuya forma depende exclusivamente del número de grados de libertad. Conforma este aumenta, la distribución se vuelve más simétrica.

Pruebas de dos muestras con datos numéricos

Prueba t de varianza conjunta para diferencias entre dos medias

48

Supongamos que consideramos dos poblaciones independientes, cada una con una media y una desviación estándar. La estadística de prueba utilizada para determinar la diferencia entre las medias de las poblaciones está basada en la diferencia entre las medias de las muestras (X1 – X2). Debido al teorema del límite central esta estadística seguirá la distribución normal. La estadística de prueba Z es:

En donde X es la media de la muestra correspondiente a cada una de las dos muestras, n es el tamaño de la muestra y por último tenemos la varianza de la muestra.

Si suponemos que las varianzas son iguales y que las muestras fueron tomadas de manera aleatoria e independiente se puede utilizar una prueba t de varianza conjunta para determinar si existe alguna diferencia significativa entre las medias de las poblaciones. Si puede calcular la siguiente estadística de prueba t de varianza conjunta:

Donde:

 La estadística de prueba t de varianza conjunta sigue una distribución t con n1+n2-2 grados de libertad.

Prueba tde varianza separada para diferencias entre dos medias

Si suponemos que las varianzas no son iguales como en el caso anterior debemos replantear el estadístico a utilizar.

La estadística de prueba t puede ser aproximada con la fórmula de v, mostrada anteriormente.

Prueba t para la diferencia de medias

Con el propósito de determinar cualquier diferencia que exista entre dos grupos relacionados, deben obtenerse las diferencias en los valores individuales de cada grupo. Cuando la desviación estándar de la población de la diferencia es conocida y el tamaño de muestra es lo suficientemente grande. La estadística de prueba Z es:

49

Sin embargo, en la mayoría de los casos no conocemos la desviación estándar real de la población. La única información que se puede obtener son las estadísticas sumarias como la media y la desviación estándar de muestra. Si se supone que la muestra de resultados es tomada de manera aleatoria e independiente se puede realizar una prueba t para determinar si existe una diferencia media de población significativa. La estadística seguirá una distribución t con n-1 grados de libertad.

Ho= µd = 0 donde µd= µ1-µ2H1= µd ≠ 0

Se puede calcular el siguiente estadístico de prueba:

Prueba de hipótesis con datos categóricos

Prueba Z de una muestra para la proporción. Para evaluar la magnitud de la diferencia entre la proporción de la muestra y la porción de la población supuesta la estadística de prueba está dada por la ecuación siguiente:

La estadística de prueba Z está distribuida de manera aproximadamente normal.

Prueba Z para diferencias entre dos porciones (muestras independientes). Cuando se evalúan diferencias entre dos porciones basándose en muestras independientes se puede emplear una prueba Z. La estadística de prueba es:

Se supone que las dos porciones de población son iguales.

Ho= p1=p2H1= p1 ≠ p2

50

LABORATORIO Nº 04

1. Si X = 85, = 8 y n = 64, establezca un estimador del intervalo de confianza de 95% para la media poblacional 2. Si X = 125, = 24 Y n = 36, establezca un estimador del intervalo de confianza de 99% para la media poblacional

.

3. Una investigadora de mercado establece que tiene una confianza de 95% de que el promedio verdadero de las ventas mensuales de un producto está entre 170,000 y 200,000 dólares. Explique el significado de esta afirmación.

4. Suponga que el administrador de una tienda de pinturas desea estimar la cantidad real de pintura contenida en las latas de 1 galón compradas a un fabricante con renombre en todo el país. Se sabe, de las especificaciones de fabricación que la desviación estándar de la cantidad de pinturaes igual a 0.02 de galón. Se selecciona una muestra aleatoria de 50 latas y la cantidad promedio de pintura por galón es 0.995 de galón.(a) Establezca una estimación del intervalo de confianza de 99% para el promedio poblacional de la cantidad de pintura incluida en una lata de l galón.(b) Según estos resultados, ¿piensa que el dueño de la tienda tiene derecho a quejarse con el fabricante ¿Por qué?(c) La población cantidad de pintura por galón, tiene una distribución normal Explique.(d) Explique por qué un valor observado de 0.98 de galón en una lata no es raro aun cuando esté fuera del intervalo de confianza que calculó.(e) Suponga que usó un estimador de intervalo de confianza de 95%. ¿Cuáles serían las respuestas de los incisos (a) y (b)?

5. El gerente de control de calidad de una fábrica de focos necesita estimar la vida promedio de un envío grande. Se sabe que la desviación estándar del proceso es 1 00 hora.Una muestra aleatoria de 64 focos indica una vida media de la muestra de 350 horas. (a) Establezca una estimación del intervalo de confianza de 95% para la vida promedio real de los focos de este envío.(b)¿Piensa que el fabricante tiene derecho a establecer que los focos duran un promedio de 400 horas? Explique. (c) La vida de los focos, ¿debe tener una distribución normal Explique. (d) Explique por qué un valor observado de 320 horas no es raro, aun cuando está fuera del intervalo de confianza.(e) Suponga que la desviación estándar del proceso cambió a 80 horas. ¿Cuáles serían las respuestas a los incisos(a) y (b)?

6. La división de inspección de Lee County Weiglns and Measures Department esta interesada en la cantidad real de refresco que contienen las botellas de 2 litros en una embotelladora local de una compañía de refrescos conocida en too el país. La embotelladora informa a la división de inspección que la desviación estándar en estas botellas es 0.05 ele litro. Una muestra aleatoria de 100 botellas de 2 litros obtenida en esta planta indica un promedio muestral, de 1.99 litros. a) Establezca un intervalo de confianza de 95% de la cantidad promedio verdadera de refresco en cada botella.(b) La población de refrescos, ¿debe tener una distribución normal? Explique.(c) Explique por qué el valor observado de 2.02 litros no es raro, aun cuando está fuera del intervalo de confianza calculado.(d) Suponga que el promedio muestral es 1.97 litros. ¿Cuál sería la respuesta al inciso a)?

7. Determine el valor crítico de I en las siguientes circunstancias:(a) 1- = 0.95, n = 10. (b) 1- = 0.99, n = 10.(c) 1- = 0.95, n = 32. (d) 1- = 0.95, n = 65. (e) 1- = 0.90, n = 16.

8. Si = 75, S = 24 y n= 36, suponga que la población tiene una distribución normal y establezca una estimación del intervalo de confianza de 95% de la media poblacional .9. Si =50, S = 15 Y n = 16, suponga que la población tiene distribución normal y establezca una estimación del intervalo de confianza de 99% de la media poblacional.

10. Establezca una estimación del intervalo de confianza de 95% para la media poblacional, con base en los siguientes conjuntos de datos; suponga que la población tiene distribución normal:

Conjunto 1: 1, 1, 1, 1, 8, 8, 8, 8 Conjunto 2: 1, 2, 3, 4, 5, 6, 7, 8

51

Explique por qué tienen intervalos de confianza distintos aun cuando tienen la misma media y el mismo rango.

11. Calcule un intervalo de confianza de 95% para la media poblacional, con base en los números 1,2, 3, 4, 5, 6, 20. Cambie el número 20 a 7 y calcule de nuevo el intervalo de confianza. Con estos resultados, describa el efecto del valor extremo en el intervalo de confianza.

12. El departamento de transportes del gobierno de Estados Unidos requiere que los fabricantes de neumáticos proporcionen información acerca de la cara de la llanta para que un cliente potencial esté mejor informado al tornar su decisión de compra. Una medida muy importante en el desempeño de la llanta es el índice de desgaste de las cuerdas, que indica la resistencia de la llanta al desgaste de las cuerdas comparada con el grado de la llanta de 100, Esto significa que una llanta con grado de 200 debe durar el doble, en promedio, que una llanta con gracia 100. Suponga que una organización para el consumidor desea estimar el índice de desgaste real de las cuerdas de una marca de llantas con grado 200 que produce cierto fabricante. Una muestra aleatoria de 18 llantas indican índice de desgaste promedio muestral de 195.3 y una desviación estándar de 21.4. (a) Suponga que los índices de desgaste de cuerdas de lo población tiene distribución normal; establezca un intervalo de 95% de confianza estimado del índice de desgaste promedio de la población para las llantas que produce el fabricante de esta marca.(b) ¿Piensa que la organización para el consumidor debe denunciar al fabricante por producir llantas que no cumplen la información de desempeño proporcionada en la cara de la llanta? Explique.(e) Diga por qué un índice de desgaste observado de 210 para una llanta en particular no es raro, aunque esté fuera del intervalo de confianza desarrollado en (a).

13. Un auditor del departamento estatal de seguros desea determinar la proporción de reclamaciones pagadas por una compañía de seguros de salud dentro de los 2 meses siguientes a la recepción de la solicitud. Se selecciona una muestra aleatoria de 200 reclamaciones y se determina que 80 se pagaron en menos de 2 meses.(a) Establezca una estimación del intervalo de confianza de 99% de la proporción de la población de reclamaciones pagadas en menos de 2 meses.(b) Si se supone que 90% O más reclamaciones se pagan en menos de 2 meses, ¿qué de be informar el auditor al departamento estatal de seguros acerca del desempeño de los pagos de la compañía de seguros?

14.Un distribuidor de automóviles desea estimar la proporción de clientes que todavía tienen los autos comprados hace 5 años. Una muestra aleatoria de 200 clientes seleccionada de los registros del distribuidor indica que 82 clientes conservan el auto comprado 5 años antes.(a) Establezca un intervalo de confianza de 95% de la proporción de la población de todos los clientes que conservan los autos 5 años después de comprarlos.(b) ¿Cómo puede el distribuidor usar los resultados de (a) para estudiar la satisfacción del cliente con el auto que le compraron?

14. Una papelería recibe un cargamento de un fabricante de cierta marca de bolígrafos de bajo costo. Se prueba una muestra aleatoria de 300 bolígrafos y se encuentra que 30 están defectuosos.(a) Establezca un intervalo de confianza de 90% para estimar la proporción de bolígrafos defectuosos en el cargamento.(b) El cargamento se puede regresar si contiene más de 5% de bolígrafos defectuosos; según los resultados de la muestra, ¿puede la papelería regresarlo? (c) Suponga que se desea un intervalo estimado de 99% de confianza en (a). ¿Cuál sería el efecto de este cambio en sus repuestas de (a) y (b)?

15. La compañía de teléfonos quiere estimar la proporción de viviendas que comprarían una línea telefónica adicional si estuviera disponible a un costo de instalación reducido de manera sustancial. Se selecciona una muestra aleatoria de 500 viviendas. Los resultados indican que 135 de las viviendas comprarían la línea adicional a un costo de instalación reducido.(a) Establezca un intervalo de confianza de 99% para la proporción de la población de viviendas que comprarían una línea de teléfono adicional.(b) ¿Cómo usaría estos resultados el gerente a cargo de programas promocionales para clientes residenciales?

16. Un grupo de consumidores desea estimar el monto de las facturas de energía eléctrica pa ra el mes de julio para las viviendas unifamiliares en una ciudad grande. Con base en estudios realizados en otras ciudades, se supone que la desviación estándar es 25 dólares. El grupo desea estimar el monto promedio para julio dentro de dólares del promedio verdadero con 99% de confianza.(a) ¿Qué tamaño de muestra necesita?(b) Si desea 95% de confianza, ¿qué tamaño de muestra requiere?

17. Una agencia de publicidad que da servicio a una estación de radio desea estimar. el tiem po promedio diario que la

52

audiencia escucha la estación. De estudios anteriores, la desviación estándar se estima en 45 minutos.(a) ¿Qué tamaño de muestra se necesita si la, agencia desea una confianza de 90% con minutos del resultado correcto?(b) Si se desea 99% de confianza, ¿qué tamaño de muestra necesita?

18. Suponga que un proveedor de gas desea estimar el tiempo de espera promedio para la instalación del servicio dentro de días con 95% de confianza. Debido a que no tiene acceso a datos históricos, hace una estimación independiente de la desviación estándar, que piensa es de 20 días. ¿Qué tamaño de muestra necesita?

19. Un encuestador político desea estimar la proporción de electores que votarán por el candidato demócrata en una campaña presidencial. El encuestador desea 99% de confianza de que su predicción será correcta dentro de de la proporción de la población.(a) ¿Cuál es el tamaño de muestra necesario?(b) Si desea 95% de confianza, ¿qué tamaño de muestra requiere?(c) Si desea 95% de confianza y un error muestral de , ¿qué tamaño de muestra necesita?(d) Según las respuestas de (a) a (e), ¿qué conclusión general se deriva acerca del efecto del nivel de confianza deseado y el error muestral aceptable en el tamaño de la muestra requerido?

20. El gerente de un banco desea 90% de confianza de tener un resultado correcto dentro de de la proporción de población real de ahorradores que tienen cuentas de ahorros y de cheques en el banco. ¿De cuántos ahorradores debe ser su muestra?

21. Para Ho: , H1: 100 y una muestra de tamaño n, será mayor si el valor real de es 90 que si el valor real de es 75. ¿Por qué?

22. En el sistema legal norteamericano se supone que un acusado es inocente hasta que se pruebe su culpabilidad. Considere una hipótesis nula Ho. de que el acusado es inocente y la hipótesis alternativa H1 de que es culpable. Un jurado tiene dos decisiones posibles: declararlo culpable (es decir, rechazar la hipótesis nula o declararlo inocente (es decir, no rechazar la hipótesis nula). Explique el significado de los riesgos de cometer un error tipo I o un error tipo II.

53