Manual Estadistica I

89
Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 1 Lic. Carlos A. Ávila (MAE Administración de Empresas) UNIVERSIDAD CATOLICA DE HONDURAS NUESTRA SEÑORA DE LA PAZ CAMPUS DE SAN PEDRO Y SAN PABLO ESTADISTICA I Lic. Carlos a. Ávila TEMA I: CONCEPTOS BASICOS LA ESTADISTICA Importancia de la Estadística : El análisis estadístico permite la toma de decisiones en diversas áreas como ser la formulación de políticas económicas por parte de algún gobierno, las tasas tributarias, programas sociales, gastos en presupuesto, la búsqueda de rentabilidad, control de calidad, minimización de costos, combinación de productos e inventarios, el éxito de un nuevo producto, evaluación de oportunidades de inversión, la efectividad de un nuevo medicamento, etc. Oportunidades que ofrece la Estadística : Como la Estadística tiene aplicación universal, esta persigue dos objetivos primordiales: A. Tomar decisiones B. Solucionar problemas Ramas de la Estadística : 1. Estadística Descriptiva : Es una evaluación del comportamiento de los valores de una variable o característica. Para realizar dicha evaluación, el experto se ayuda de graficas, tablas y diagramas para mostrar los datos y así facilitar su comprensión. 2. Estadística Inferencial : Se usa, para realizar comparaciones con datos históricos y bajo una determinada tendencia, tratar de predecir lo que podría suceder más adelante. 3. Teoría de decisiones : Los métodos y las técnicas de la inferencia estadística son usadas por los administradores para tomar decisiones en situaciones de incertidumbre. (Significa no saber con precisión que ocurrirá más adelante, pero además significa anticiparse y prepararse a lo que podría suceder más adelante). Definiciones Básicas : Datos : Son colecciones de cualquier cantidad de observaciones relacionadas a una característica que se denomina Variable. A una colección de datos se le conoce como Conjunto de Datos.

Transcript of Manual Estadistica I

Page 1: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 1 Lic. Carlos A. Ávila (MAE Administración de Empresas)

UNIVERSIDAD CATOLICA DE HONDURAS

NUESTRA SEÑORA DE LA PAZ

CAMPUS DE SAN PEDRO Y SAN PABLO

ESTADISTICA I Lic. Carlos a. Ávila

TEMA I: CONCEPTOS BASICOS LA ESTADISTICA

Importancia de la Estadística:

El análisis estadístico permite la toma de decisiones en diversas áreas como ser la

formulación de políticas económicas por parte de algún gobierno, las tasas tributarias,

programas sociales, gastos en presupuesto, la búsqueda de rentabilidad, control de calidad,

minimización de costos, combinación de productos e inventarios, el éxito de un nuevo

producto, evaluación de oportunidades de inversión, la efectividad de un nuevo

medicamento, etc.

Oportunidades que ofrece la Estadística:

Como la Estadística tiene aplicación universal, esta persigue dos objetivos primordiales:

A. Tomar decisiones

B. Solucionar problemas

Ramas de la Estadística:

1. Estadística Descriptiva: Es una evaluación del comportamiento de los valores de una

variable o característica. Para realizar dicha evaluación, el experto se ayuda de

graficas, tablas y diagramas para mostrar los datos y así facilitar su comprensión.

2. Estadística Inferencial: Se usa, para realizar comparaciones con datos históricos y

bajo una determinada tendencia, tratar de predecir lo que podría suceder más

adelante.

3. Teoría de decisiones: Los métodos y las técnicas de la inferencia estadística son

usadas por los administradores para tomar decisiones en situaciones de

incertidumbre. (Significa no saber con precisión que ocurrirá más adelante, pero

además significa anticiparse y prepararse a lo que podría suceder más adelante).

Definiciones Básicas: Datos: Son colecciones de cualquier cantidad de observaciones relacionadas a una

característica que se denomina Variable. A una colección de datos se le conoce como

Conjunto de Datos.

Page 2: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 2 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Población: Es el conjunto completo o total de los individuos, objetos o medidas que

poseen alguna característica común observable. Es la recolección completa de todas

las observaciones de interés que el investigador desea estudiar y que por lo general

suele ser inaccesible. Generalmente las poblaciones pueden ser finitas o infinitas.

Parámetro: Es toda medida que describa una población. Ej. El ingreso promedio de

los asalariados en Honduras, la producción total de todas las maquilas. El parámetro

describe una población.

Muestra: Es una colección de algunos elementos o datos de una Población, pero no

de toda la población. Es un subconjunto o parte de la población, que lleva implícita

todas las características del universo. Ej.: Para determinar el sabor de una sopa no

necesita comerse toda la olla, solo basta con comerse un plato. Una muestra

contiene relativamente las características principales de una población.

Muestra Aleatoria: Muestra elegida independientemente de todas las demás, con la

misma probabilidad que cualquier otra, y cuyos elementos están elegidos

independientemente unos de otros con la misma probabilidad.

Nota: Estudiar en base a una muestra es más sencillo que basar un estudio con una

Población completa por las siguientes razones:

a. Ahorra tiempo. Estudiar a menos individuos es evidente que lleva menos tiempo.

b. A consecuencia del punto anterior, se ahorran costos.

c. Estudiar la totalidad de individuos con una característica determinada en

muchas ocasiones puede ser una tarea inaccesible o imposible de realizar.

d. Aumenta la calidad del estudio. Al disponer de más tiempo y recursos, las

observaciones y mediciones realizadas a un reducido número de individuos

pueden ser más exactas y plurales que si se tuviese en realidad que realizar a una

población.

Estadístico: Es una medida descriptiva de una muestra. El Estadístico es a la muestra

lo que el Parámetro es a la población. Además se puede definir como el elemento

que describe una muestra y sirve como una estimación del parámetro de la población

correspondiente.

Muestra Representativa: Contiene las mismas características relevantes de la

población en la misma proporción en que están incluidas en tal población.

Page 3: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 3 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Variable: Es cualquier rasgo o característica de la muestra o población que se

observa, que pueda medirse o clasificarse. Ej.: Edad, Sexo, Estado Civil, Peso, Grado

de Motivación, Temperatura, Partidos Políticos.

Tipos de Variable: Las variables se clasifican en dos grupos generales:

a) Cualitativas: Estas variables normalmente se miden por atributos. Ej.: La

variable Sexo puede tener dos posibles resultados en su escala, Masculino o

Femenino. Dentro de las variables cualitativas tenemos:

Variables Nominales: Los resultados de estas características se registran dentro de

categorías o clases desordenadas. Ej.: Una muestra de personas puede agruparse según su

tipo de sangre, de manera que:

1----- A 1----- O

2----- B 2----- A

3----- AB 3----- B

4----- O 4----- AB

El orden o las secuencias no tienen relevancia alguna, solo pueden enlistarse. Ej. Marcas de

Vehículos, preferencia religiosa, color de cabello y raza de una persona.

Variables Ordinales: Al igual que las nominales, estas clasifican sus resultados dentro de

clases o categorías, solo que de forma ordenada. El orden entre categorías es relevante. Ej.:

Los daños en general se pueden clasificar por su grado de gravedad:

1----- Fatal 5----- Sobresaliente

2----- Severo 4----- Muy bueno

3----- Daño moderado 3----- Bueno

4----- Daño menor 2----- No satisfactorio

Nota: El orden de las categorías puede ser Ascendente o Descendente. En estas variables la

magnitud no es relevante.

b) Cuantitativas: Estas variables se miden en base a números o cifras. Ej.: Una

muestra de 100 personas puede ser clasificada por su Peso (en libras), Un

periodo de 30 días puede ser medido por su Temperatura (en grados

centígrados). Las variables cuantitativas se clasifican en:

Variables Discretas: Se refieren a que las características tienen una cantidad finita de

resultados. Estos resultados generalmente se restringen a valores enteros. Ej.: cantidad de

veces que una mujer da a luz, número de camas disponibles en un hospital, numero de autos

vendidos por una compañía, numero de estudiantes en una clase, etc.

Page 4: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 4 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Variables Continuas: Aquí los datos o resultados de una característica no precisamente se

restringen a ciertos valores específicos (admite tanto valores enteros como fraccionarios).

Una variable de este tipo puede tomar cualquier valor entre dos valores dados. Ej.: El tiempo

(horas, minutos, segundos), el nivel de colesterol en la sangre, la temperatura, peso, talla de

ropa, etc.

Nota: Una regla práctica para distinguir una variable discreta de una continua es: “Si los

datos son el resultado de medir, son variables continuas, y si los datos son el resultado de

contar, son discretas.

c) Variables de clasificación de Rango: De una característica central se puede

desglosar características más específicas. Estas observaciones pueden

ordenarse de mayor a menor de acuerdo a su magnitud y después asignarle

números para determinar secuencias correspondientes a su lugar en la lista.

Ej.:

“Principales problemas sociales que aquejan a Honduras”:

Rango Problema Total

1 Desempleo 2750

2 Inseguridad 1845

3 Problemas económicos 1270

4 Falta de vivienda 850

5 Poca calidad educativa 785

n = 7500

“Principales causas de muerte natural en Honduras en 2008”

1 Enfermedades del Corazón 12365

2 Diversos tipos de cáncer 10350

3 Enfermedades cerebro vasculares 7650

4 Neumonía 3820

5 SIDA 2815

n = 37000

La importancia del muestreo:

Gran parte del trabajo en Estadística se realiza en base a muestras. Las muestras son

necesarias debido a que con frecuencia las poblaciones son demasiado grandes para ser

estudiadas en su totalidad. Por su demanda de Costo y Tiempo excesivo, lo primordial es

seleccionar una muestra de la población, calcular el estadístico de la muestra, y utilizar este

resultado para estimar el parámetro correspondiente de la población.

Page 5: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 5 Lic. Carlos A. Ávila (MAE Administración de Empresas)

La exactitud es vital en toda estimación. Esto depende en gran parte de la forma como se

tomo la muestra. Sin embargo, frecuentemente se comprueba que la muestra no es del todo

representativa de la población, lo cual provocara un error de muestreo. Un error de

muestreo es la diferencia entre el parámetro desconocido de la población y el estadístico de

la muestra utilizado para calcular el parámetro.

Un error de muestreo puede presentarse por dos razones:

1) El azar en el proceso de muestreo: es posible seleccionar elementos de muestra

atípicos que no representan a la población.

2) El Sesgo muestral: este ocurre cuando hay una tendencia a seleccionar determinados

elementos de muestra en lugar de otros. Ej. En una encuesta a mujeres, tener una

tendencia a seleccionar mujeres casadas por sobre las solteras.

Funciones Primordiales de la Estadística:

Recolección de los datos

Organización de los datos

Presentación de los datos

Análisis de los datos

Interpretación de los datos

Problemas de la sección 1: 1. Clasifique cada variable de acuerdo a su tipo y ejemplifique cada uno:

a. Ciudad

b. Calidad de producto

c. Distancia recorrida

d. Ingreso salarial

e. Temperatura ambiente

f. Magnitud de un desastre natural

g. Puntaje en un examen de Estadística

h. Estado civil de una persona

i. Religión

j. Sexo

k. Raza

l. Color de cabello

m. Estatura

n. Compra de alimentos

o. Número de vehículos producidos

p. Número de estudiantes inscritos en la UNICAH

q. Edad

Page 6: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 6 Lic. Carlos A. Ávila (MAE Administración de Empresas)

r. Preferencia política

s. Profesión

t. Marcas de gaseosas

u. Área de un terreno

v. Perímetro de una zona

w. Volumen de un objeto

x. Número de goles anotados por un equipo

y. Peso de una caja de cereal

z. Numero de amigos en Facebook

aa. Clasificación de los hoteles

bb. Calificación de un Banco

cc. Tiempo de llegada a la universidad

dd. Duración de una batería

ee. Precio de un paquete de harina

ff. Marcas de ropa

gg. Tipos de Empresa

hh. Grado de motivación

ii. Cantidad de miembros de una familia

jj. Número de camas en una clínica

kk. Número de partos en una mujer

ll. Numero de Identidad

mm. Cantidad de pasajeros en una aerolínea

nn. Problemas más graves de Honduras

oo. Principales causas de decesos en el país

pp. Modos de transporte

qq. Intensidad de un huracán

rr. Color de los ojos

ss. Talla de Zapato

tt. Duración de una película

uu. Domicilio

vv. Tipos de empresa de acuerdo al tamaño

ww. Tipos de película cinematográfica

xx. Numero de operarios en una maquila

yy. Promedio de una asignatura

zz. Deuda de una tarjeta de crédito

aaa. Tipos de Fruta

bbb. Numero de planetas en el sistema solar

ccc. Cantidad de Remesas recibidas

Page 7: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 7 Lic. Carlos A. Ávila (MAE Administración de Empresas)

ddd. Desempeño laboral de un empleado

eee. Departamentos de un país

fff. Grado de instrucción educativa

ggg. Grado militar

hhh. Jerarquía familiar

2. Genere 15 variables diferentes a las del listado anterior. Agregue el respectivo

ejemplo para cada una.

Page 8: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 8 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA II: ORDENAMIENTO Y ARREGLOS DE DATOS

Arreglo de Datos: A partir de datos sin procesar, el ordenamiento de datos tiene sus

ventajas:

a. Ordenados de forma ascendente o descendente, permite notar

rápidamente los valores mayor y menor de los datos.

b. Permite dividir los datos en secciones.

c. Permite ver si los valores aparecen más de una vez en el

ordenamiento.

d. Permite observar la distancia entre valores sucesivos de los

datos.

A. Distribuciones o Tablas de Frecuencias: Es la forma más común de organizar los

datos en categorías o clases parciales y luego contar el numero de observaciones que

quedan dentro de cada categoría. Las tablas de frecuencia (también conocida como

Tabla Estadística) pueden organizar datos de solo una variable a la vez. Esto se

realiza debido a que cuando la cantidad de datos o elementos a analizar es

demasiado grande, este análisis se vuelve extenuante y monótono.

Características de las Distribuciones de Frecuencias:

1. Las clases o categorías son completamente inclusivas pues todos los datos de una

muestra caen en una u otra categoría.

2. Las clases son mutuamente inclusivas ya que ningún dato cae en más de una

categoría.

3. Cada clase tiene un límite superior (LS) y un límite inferior (LI). Estos límites se

pueden convertir por conveniencia, en limites reales superiores (LRS) y limites reales

inferiores (LRI).

4. Los Estadísticos toman como un estándar el hecho de que en una distribución de

Frecuencias, el número de clases este en un rango de entre 5 a 15 clases. (5< # clases

<15)

5. Existe una fórmula para determinar el número de intervalos aproximados a usar. A

partir de n muestras, el # de clases se obtiene a partir de la formula:

2c ≥ n

C ≥ Log n

Log 2

6. Para crear un arreglo de datos es “preferible” que la cantidad de datos obtenidos sea

mayor o igual a 30.

Page 9: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 9 Lic. Carlos A. Ávila (MAE Administración de Empresas)

7. Las categorías deben tener la misma amplitud.

8. Las clases jamás pueden traslaparse. Debe conocerse exactamente donde comienzan

y donde terminan.

9. Existen clases abiertas cuando se usan “menos de” o “mas de”, para reducir el

número de clases porque existe valores mucho menores o mucho mayores que el

resto de datos.

Elementos importantes de una Tabla Estadística o Distribución de Frecuencias:

a. Límites Reales Inferiores y Superiores (LRI y LRS): Se calculan a partir de los límites

inferiores y superiores normales. Se realiza para que cualquier tabla o distribución

quede mejor estructurada. Se encuentra a través de un promedio entre el límite

inferior de una clase y el límite superior de la clase anterior o por arriba de ella.

b. Frecuencia Absoluta (Fabs): Es el número de datos que se encuentra presente en

cada intervalo o clase.

c. Ancho del intervalo (W): Diferencia entre dos límites sucesivos de clase ya sean

superiores o inferiores y también puede ser la diferencia entre dos puntos medios

sucesivos (marca de clase).

El ancho de que tendrá cada clase se puede definir a través de la siguiente fórmula:

Anchura del intervalo (W) = Valor unitario siguiente Valor mas

después del valor más __ pequeño de

grande de los datos los datos

_______________________________________

Número total de clases (C)

d. Frecuencia Relativa (Fr): Es el porcentaje que representa cada frecuencia del número

total de datos.

Fr = (Fabs/n)*100.

e. Marca de Clase (Xm): Es el punto medio entre los límites superior e inferior de un

intervalo o clase.

Xm = (LS + LI)/2.

f. Frecuencia Acumulada (Fac): De un intervalo es el número total de observaciones

entre cada clase y todas las anteriores a esta. Es la suma sucesiva (en grada) de la

frecuencia absoluta de una clase y las frecuencias absolutas de las clases anteriores.

Fac = ∑ sucesiva de Fabs

Page 10: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 10 Lic. Carlos A. Ávila (MAE Administración de Empresas)

g. Frecuencia Relativa Acumulada (Frac): De un intervalo es el porcentaje del número

total de observaciones con un valor menor o igual al límite superior del intervalo.

También, es la suma sucesiva de la frecuencia relativa de una clase y las frecuencias

relativas de las clases anteriores.

Frac = ∑ sucesiva de Fr

Frac = (Fac/n)*100

B. Tablas de CONTINGENCIA: A diferencia de las tablas de frecuencia, las tablas de

contingencia permiten examinar y comparar dos o más variables al mismo tiempo.

Problemas de la sección 2: 1. Un conjunto de datos contiene 60 observaciones, la más grande de 679 y la más

pequeña de 140.

a. ¿Cuántas clases debería tener la tabla de frecuencias?

b. ¿Cuál sería la anchura del intervalo correspondiente?

c. ¿Cuáles son los límites y puntos medios de cada clase?

2. En un estudio reciente sobre 580 graduados de administración de negocios, el salario

inicial más alto que se reporto fue de L. 42,499 lempiras y el más bajo fue de L.

14,800 lempiras. Usted desea crear la tabla de frecuencias para analizar y comparar

estos datos con las ofertas de trabajo que usted ha recibido.

a. ¿Cuántas clases pondrá en su tabla de frecuencia?

b. ¿Cuál es el intervalo de clase?

c. ¿Cuáles son los límites y puntos medios de cada clase?

3. Los siguientes datos representan el número de pasajeros que reporta la aerolínea

TACA de los últimos 58 vuelos. Los datos son los siguientes:

58 89 45 67 54 110

64 76 65 45 49 93

79 56 71 85 87 77

74 98 69 79 81 86

62 56 88 69 79 48

71 54 69 62 86 90

65 79 46 77 106 115

55 75 62 73 66 57

73 64 69 101 50

90 70 74 61 73

Desarrolle una tabla de distribución de frecuencias completa.

Page 11: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 11 Lic. Carlos A. Ávila (MAE Administración de Empresas)

4. Los siguientes resultados sobresalen a partir de un estudio sobre el número de horas

que pasan conectados a internet, algunos usuarios seleccionados al azar por semana:

23.6 31.9 12.1 10.3 20.8 42.0 24.0 15.2 19.1 11.6 34.3 42.4 60.0

30.5 31.8 22.4 13.2 10.4 17.2 35.4 56.0 13.0 42.5 31.8 38.5 23.8

44.2 50.8 16.5 52.3 34.2 42.6 14.1 22.4 48.2 29.6 64.3 75.0 32.0

15.2 26.9 41.3 53.7 32.4 13.8 25.1 43.2 39.7 67.2 23.8 40.6 23.7

67.0 54.0 49.8 23.9 36.3 45.4 33.2 20.9 14.7 53.1

Construya una tabla de distribución de frecuencias.

5. El departamento de tránsito a través de sus agentes, ha reportado el número de

licencias que se han decomisado en San Pedro Sula, por faltas graves en los últimos 5

años:

125 157 113 127 201

165 145 119 148 158

148 168 117 105 136

136 125 148 108 178

179 191 225 204 104

205 197 119 209 157

209 205 221 178 247

235 217 222 224 187

265 148 165 228 239

245 152 148 115 150

265 190 135 180 120

Desarrolle una tabla de distribución de frecuencias completa.

6. A continuación se presentan los datos de 39 personas que llegaron a una entrevista

de trabajo, de acuerdo a su tipo de sangre:

A B A O AB O B O A O

O AB B A O A O B AB O

O A B O O B A O B A

B O O AB A AB O A O

Desarrolle una tabla de distribución de frecuencias.

7. Un dueño de auto lote, tiene registrados los automóviles que ha vendido en los

últimos 6 meses. Aquí detallamos los datos:

Nombre Marca y Modelo Nombre Marca y Modelo

a. Roberto Hyundai Accent ’00 p. Alejandra Isuzu KB ‘99

b. Estela Kia Sorento ’04 q. Ramiro Toyota Corolla ‘06

Page 12: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 12 Lic. Carlos A. Ávila (MAE Administración de Empresas)

c. Antonio Kia Spectra ‘02 r. Romeo Hyundai Elantra ‘02

d. Benjamín Isuzu Rodeo ’98 s. Fernanda Toyota RAV4 ‘03

e. Daniel Isuzu Dmax ’07 t. Armando Hyundai SantaFe ‘04

f. Edgardo Toyota Camry ’08 u. Rocío Kia Sephia ‘00

g. José Toyota 3.0 ’07 v. Carlos Toyota Yaris ‘02

h. Esther Hyundai Veracruz ’05 w. Oscar Toyota Corolla ‘97

i. Oswaldo Isuzu Rodeo ’02 x. Lorena Hyundai Tiburón ‘98

j. Javier Toyota Echo ’03 y. Iván Kia Rio ‘00

k. Pedro Isuzu Dmax ’07 z. Waleska Toyota Prado ‘08

l. Nelson Kia Sportage ’01 aa. Sandra Hyundai H100 ‘00

m. Mario Kia Sorento ’06 bb. Ricardo Toyota Corona ‘04

n. Juan Toyota Tundra ’08 cc. Carolina Toyota Pickup ‘98

o. Vanessa Isuzu KB ’98 dd. Cristian Kia Spectra ‘05

Desarrolle una tabla de contingencia completa con las variables Sexo y Marca.

8. El director de transporte noroccidental de SOPTRAVI está muy preocupado por la

velocidad a la que los conductores manejan en un tramo de carretera principal. Los

datos de la velocidad de 48 conductores expresada en mph son los siguientes:

15 32 45 46 42 39 68 47 18 31 48 59 56 42 39 48 69 61

44 42 38 52 55 58 62 48 53 56 58 48 47 52 37 64 29 55

38 29 62 49 69 18 61 55 49 70 81 50

El Departamento de transporte ha determinado que la velocidad más segura para

esta carretera es más de 39 y menos de 56 mph. ¿Qué proporción de conductores

maneja dentro de este intervalo?

9. En una población bajo estudio existen 5,600 mujeres y 14,400 hombres. Si se decide

seleccionar una muestra de solo 550 individuos de esta población, ¿Cuántos deberán

ser mujeres y cuantos deberán ser hombres para que esta muestra sea considerada

estrictamente representativa?

10. Si los siguientes grupos de edad son incluidos en las proporciones indicadas,

¿Cuántos individuos de cada grupo de edad deben incluirse en una muestra de 2800

personas para que esta sea representativa?

Grupo de edad 12 – 17 18 – 23 24 – 29 30 – 35 36 +

Proporción relativa 0.17 0.31 0.26 0.21 0.05

Page 13: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 13 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA III: GRAFICOS ESTADISTICOS

Para efectos de representación la mayoría de graficas se usaran en dos dimensiones (dos

ejes). El eje horizontal muestra los valores de la variable (la característica que se está

midiendo). El eje vertical indica o representa las frecuencias absolutas, relativas o

acumuladas según sea el caso.

La utilidad de los gráficos es doble. En primer lugar, sustituir a las tablas estadísticas, y

segundo, constituir por si mismos una poderosa herramienta para el análisis de los datos,

siendo en la mayoría de ocasiones el medio más efectivo no solo para describir y resumir la

información, sino también para analizarla.

El propósito de un grafico es ayudar a la comprensión y comunicación de la evidencia

aportada por los datos respecto a una hipótesis en estudio.

Gráficos para distribuciones de variables Continuas:

a) Histogramas: Consiste en una serie de rectángulos, cuyo ancho es proporcional a la

anchura de intervalo (limites superior e inferior de cada clase) de los datos que se

encuentran dentro de una clase y cuya altura es proporcional al número de

elementos que caen dentro de cada clase. Describe una distribución de frecuencias

discretas o continúas. Un Histograma puede ser de frecuencias absolutas o relativas.

Ventajas del Histograma:

1. Los rectángulos muestran cada clase de la distribución por separado.

2. El área de cada rectángulo, en relación con el resto, muestra la proporción del

número total de observaciones que se encuentran en esa clase.

Page 14: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 14 Lic. Carlos A. Ávila (MAE Administración de Empresas)

b) Polígonos de Frecuencias: Es muy parecido al Histograma en varios aspectos. Esta

grafica emplea los mismos ejes que el Histograma. Se construye a partir del punto

medio de cada clase (marca de clase). La altura de los rectángulos es directamente

relacionada a la frecuencia absoluta o relativa de cada clase. Luego se unen los

puntos relacionados (marca de clase con su frecuencia correspondiente) con una

línea recta para formar el polígono. Para completar la grafica es necesario agregar

dos clases, una en cada extremo, que contienen cero observaciones para que el

polígono alcance el eje horizontal en ambos extremos.

Ventajas de los Polígonos de Frecuencia:

1. Son más sencillos que el Histograma.

2. Traza con claridad el patrón de los datos.

3. El polígono se vuelve cada vez más liso y parecido a una curva conforme se aumenta

el número de clases y de observaciones.

c) Ojivas: También se les conoce como Polígonos de Frecuencia Acumulada (También

puede construirse a partir de frecuencias relativas acumuladas). Esta grafica se

construye a partir de una distribución de frecuencias acumuladas “menor que” y

“mayor que”. Las clases se forman a partir del Limite Real Inferior de cada intervalo.

Esta grafica nos permite obtener Deciles, Cuartiles y Percentiles (Valores de posición).

Page 15: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 15 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Gráficos para distribuciones de variables Discretas:

d) Diagrama de Barra: Constituye un tipo popular de graficas para presentar

distribuciones de frecuencia de variables nominales u ordinales. En el diagrama, las

diferentes categorías de las observaciones se presentan a lo largo de un eje

horizontal. Se dibuja una barra vertical sobre cada categoría de forma que la altura

de la barra represente la frecuencia o la frecuencia relativa de las observaciones de

cada clase. Las barras deben de ser de igual amplitud y estar separadas de forma que

no se perciba continuidad.

Page 16: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 16 Lic. Carlos A. Ávila (MAE Administración de Empresas)

e) Diagrama Circular: Esta grafica es de especial utilidad para mostrar proporciones

(porcentajes) relativas de una variable. Este grafico se construye en un círculo, que

tiene como medida 360 grados. La grafica representa una superficie o área, mas no

un volumen. Los ángulos se grafican en sentido contrario a las manecillas del reloj y

en cada sector circular generado se escribe el valor de la frecuencia y el nombre de

su categoría correspondiente.

f) Grafico con líneas: Se usa cuando los datos se relacionan entre sí, es decir, cuando

existe cierta continuidad entre las observaciones, como por ejemplo, el crecimiento

poblacional, la evolución del peso o estatura de una persona a través del tiempo, los

ingresos o egresos de una empresa medido por días o semana, las variaciones

presentadas en la medición realizada en algún experimento cada segundo o minuto.

La grafica de líneas consiste en una serie de puntos trazados en las intersecciones de

las marcas de clase y las frecuencias de cada una, uniéndose consecutivamente con

líneas. Además, es posible presentar varias series de observaciones en un mismo

grafico para así realizar análisis de información.

Page 17: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 17 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Problemas de la sección 3: 1. Construya para los ejercicios 3 y 5 de la sección 2:

a. Histograma

b. Polígono de Frecuencia

c. Ojiva “Menor Que”

2. Para el ejercicios 6 de la sección 2, construya:

a. Diagrama de Barras

b. Diagrama Circular

3. En el siguiente reporte se muestran las muertes por lesiones de 150 niños de entre 5

a 9 años de edad en EUA (2005 – 2010).

Causa No. de muertes

Homicidios 11

Ahogamiento 21

Insolación 42

Incendios 18

Accidentes 15

Otros 13

Construya: a) Grafico de Barras b) Grafico circular.

4. IHADFA ha generado un estudio sobre el consumo anual de cerveza por botella (en

millones) en HONDURAS.

Año 2004 2005 2006 2007 2008 2009 2010

Consumo 250 290 570 420 600 540 690

Construya un grafico de barra y un grafico de línea.

5. Según información del departamento de Migración, el numero de deportados que se

han reportado en los últimos 6 años es:

Año 2005 2006 2007 2008 2009 2010

Casos 5358 6632 7849 7221 9388 11297

Page 18: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 18 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA IV: MEDIDAS DE TENDENCIA CENTRAL

Por lo general las distribuciones de frecuencia nos indican ciertas tendencias y patrones en

los datos. Para describir completamente estas tendencias se requieren medidas más

precisas. Estas medidas conforman una serie de números que se conocen como Estadística

Sumaria, para así describir las características del conjunto de datos. Las características antes

especificadas pueden ser:

A. TENDENCIA CENTRAL: Se refiere al punto medio de una distribución. A estas medidas

se le conocen también como medidas de posición. Estas medidas ubican e identifican

el punto alrededor del cual se centran los datos.

B. DISPERSION: Se refiere a la extensión de los datos en una distribución, es decir, el

grado en que las observaciones se distribuyen. Las medidas de dispersión indican el

punto hasta el cual las observaciones individuales se esparcen alrededor del punto

central. Miden la dispersión o la variabilidad de los datos y reflejan la tendencia de

las observaciones individuales a desviarse de dicho punto central.

C. SESGO: Esta relacionado a las curvas que representan los puntos de un conjunto de

datos, que pueden ser simétricas o sesgadas. Las curvas simétricas tienen una forma

tal que una línea vertical que pase por el punto más alto de la curva, dividirá el área

de esta en dos partes iguales. Las curvas son sesgadas cuando los valores de una

distribución de frecuencias están concentrados en el extremo inferior o en el

superior de la escala de medición del eje horizontal. Los valores no se encuentran

igualmente distribuidos.

D. CURTOSIS: Se refiere al grado de agudeza de una curva. Dos curvas pueden tener la

misma tendencia central, la misma dispersión, y ser ambas simétricas. Pero una de

las curvas tendrá un pico de grafica más agudo que el otro.

Las medidas de Tendencia Central y de Dispersión se pueden calcular a partir de datos

Agrupados y datos No Agrupados.

MEDIDAS DE TENDENCIA CENTRAL (DATOS NO AGRUPADOS)

La Media Aritmética: es la medida de tendencia central a la cual se le considera

como un simple promedio aritmético.

Page 19: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 19 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Ventajas:

1. Es una medida familiar para la mayoría y es intuitivamente claro.

2. Cada conjunto de datos posee una y solo una media.

3. Es útil para llevar a cabo procedimientos estadísticos como la comparación de medias

de varios conjuntos de datos.

4. La media puede calcularse aun cuando la serie de datos no esté ordenada.

Desventajas:

1. Aunque la media es confiable en el sentido de que toma en cuenta todos los valores

del conjunto de datos, puede verse afectada por valores extremos que no son

representativos del resto de los datos.

2. Cuando el conjunto de datos es muy extenso (por decir 200 datos), resulta

extremadamente tedioso calcular la media. En ese caso se tendría que usar el

método de datos agrupados.

3. Es imposible calcular la media a partir de clases con un extremo abierto, ya sea en el

inferior o superior de la escala.

Para datos No Agrupados se calcula de la siguiente forma:

µ = ∑X (Media para Población) ẋ = ∑x (Media para muestra)

N n

La Mediana: Es llamada también como la media posicional, porque queda

exactamente en la mitad del conjunto de datos, después de que las observaciones se

han colocado en serie ordenada. La mitad de las observaciones estará a la izquierda

de la mediana y la otra mitad estará a la derecha de la mediana.

Ventajas:

1. Los valores extremos de una serie ordenada de datos no afectan tan intensamente a

la mediana así como afecta a la media aritmética.

2. La mediana es fácil de entender y se puede calcular a partir de cualquier tipo de

datos, incluido en clases con extremo abierto.

3. Es posible encontrar la mediana a partir de descripciones cualitativas en lugar de

números.

Desventajas:

1. Como la mediana es una posición promedio, para poder calcularla, la serie de datos

debe estar totalmente ordenada a diferencia de la media que no lo necesita.

Page 20: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 20 Lic. Carlos A. Ávila (MAE Administración de Empresas)

2. Ciertos procedimientos estadísticos que utilizan la mediana, son más complejos que

aquellos que utilizan la media.

3. Cuando la serie de datos es extensa, se consume tiempo en demasía para calcular la

mediana.

NOTA: Si se desea utilizar una estadística de muestra para estimar un parámetro de

población, es preferible usar la media aritmética, en lugar de la mediana.

Para datos No Agrupados se calcula de la siguiente forma:

a) Se obtiene la POSICION donde está ubicada la mediana.

Mediana X = (n+1) / 2 (Posición de la mediana)

b) Se define el VALOR de la mediana a través de la posición.

Si el conjunto de datos contiene:

Un número par de elementos, la mediana es el promedio de los dos elementos de

en medio.

Un número impar de elementos, la mediana es el valor que está en medio del

arreglo de datos (Posición exacta).

La Moda: Es una medida de tendencia central diferente de la media, pero un tanto

parecida a la mediana, pues en realidad no se calcula a partir de un proceso

aritmético ordinario. La moda es el valor que más se repite en una serie de datos. Es

la observación que se presenta con mayor frecuencia. La moda rara vez se usa como

medida de cálculo para sacar conclusiones en datos no agrupados. Preferiblemente

debe usarse para datos agrupados. Es importante destacar que así como una serie de

datos normalmente una moda, también que no tenga ninguna o que tenga más de

una moda.

Ventajas:

1. La moda, al igual que la mediana, se puede utilizar como una posición central para

datos tanto cuantitativos como cualitativos.

2. Al igual que la mediana, la moda no se ve mayormente afectada por los valores

extremos.

3. La moda se puede calcular incluso a partir de clases con extremo abierto.

Page 21: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 21 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Desventajas:

1. La moda es la medida de tendencia central menos utilizada.

2. Cuando los conjuntos de datos contienen más de una moda, estas resultan más

difíciles de interpretar y comparar.

Problemas de la sección 4:

1. Los talleres de servicio del grupo Q, registran el numero de autos revisados el mes

anterior por cada una de sus 25 sucursales de la forma siguiente:

823 648 321 634 752

669 427 555 904 586

722 360 468 847 641

217 588 349 308 766

634 480 590 805 720

La compañía tiene la creencia de que una sucursal no puede mantenerse con menos

de 390 servicios mensuales. Es también política de la compañía otorgar una

bonificación económica al gerente de la sucursal que genere más de 695 servicios

mensuales.

a. ¿Ordene los datos de la tabla e indique cuantas sucursales no pueden

mantenerse y cuantas recibirán bonificación?

b. Obtenga las medidas de Tendencia Central: Media, Moda y Mediana.

c. Destaque dos conclusiones con los datos encontrados anteriormente.

2. El administrador de un hospital privado ordeno un estudio del tiempo que un

paciente tiene que esperar antes de ser tratado por el personal de urgencias. Los

datos que presentamos a continuación fueron tomados durante un día normal:

Tiempo de espera (en minutos):

12 16 21 20 24 3 11 17 29 18 26 4

7 14 25 3 27 15 6 5 13 9 8 21

A partir de estos datos encuentre los valores de medidas de tendencia central.

3. Una fábrica hizo un muestreo del numero de ausencias de los trabajadores por

semana, obteniendo los resultados siguientes:

4 12 8 14 11 6 7 13 11 13 11 20 5 19 10 15

24 7 29 6 13 9

a. Encuentre las medidas de tendencia central.

b. La junta directiva de la fábrica define que si el promedio de ausencias es de al

menos 8 días, entonces debería tomar medidas drásticas. ¿Sera esto necesario?

Page 22: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 22 Lic. Carlos A. Ávila (MAE Administración de Empresas)

4. La UNICAH tiene registrados el número de estudiantes de primer ingreso que se

matriculan por trimestre durante los últimos 6 años:

350 275 180 315 228 145 250 160 210 125 380 220

415 335 295 245 190 278

Calcule las medidas de Tendencia central.

La administración de la universidad no ha tenido necesidad de poner publicidad pues

asumen que con un promedio de 350 estudiantes de primer ingreso por periodo se

considera muy aceptable. ¿Es correcta la información?

5. Un médico general recibe pacientes de todas las edades, en su clínica privada, en el

que cobra precios módicos por cada consulta. Se presentan las edades de los

pacientes que ha atendido la última semana:

10 25 50 4 12 24 12 31 24 36 66 55 42 48 27 19 23

44 30

Calcule las Medidas de tendencia central.

6. Una fabrica realiza un estudio sobre el numero de fallas por día que una maquina

ensambladora presenta, en el depto. de producción. El gerente de la empresa decide

que si el numero de fallas es de 10 o más, reemplazara la maquina:

14 5 9 10 9 12 7 12 13 7 8 6 11 5 4 7 9 13 11

a. ¿Sera necesario reemplazar la maquina?

b. Encuentre la Moda y la Mediana.

7. Un fabricante de cosméticos adquirió una máquina para llenar de botellas de

perfume de 3 ml. Para probar la precisión del volumen que deposita la maquina en

cada botella, se hizo una corrida de prueba con 18 recipientes. Los volúmenes

resultantes (en ml) de la prueba fueron los siguientes:

3.02 2.89 2.92 2.84 2.90 2.97 2.95 2.94 2.93

3.01 2.97 2.95 2.90 2.94 2.96 2.99 3.03 2.97

a. La compañía no está dispuesta a recalibrar la maquina a menos que el volumen de

llenado este 0.04 ml por debajo de los 3 ml. ¿Deberán recalibrar?

b. Encuentre la Moda y la Mediana.

Page 23: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 23 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA V:

OTRAS MEDIDAS DE TENDENCIA CENTRAL (MEDIA PONDERADA)

La Media Ponderada o Pesada: Nos permite calcular el promedio que toma en

cuenta la importancia de cada valor respecto al total.

Se calcula de la siguiente forma:

Xw = ∑ (w * x) donde w = peso asignado a cada observación

∑w

Problemas de la sección 5: 1. Un fontanero vende 5 tipos de limpiadores para desagües. A continuación se muestra

la tabla con los resultados siguientes:

Limpiador Utilidad por lata Volumen de ventas en latas

Glunk Out L 2.25 7

Bubble Up L 3.50 9

Dream Drain L 5.75 15

Clear More L 7.50 12

Main Drain L 6.30 10

Encuentre la media correspondiente a este caso.

2. El director de planta de LACTHOSA desea comparar los salarios promedio en su

planta de Honduras con los de la competencia que está ubicada en Guatemala. De los

5,930 empleados que tiene 1,212 ganan $12.30 la hora; a 650 les paga $15.50; 3098

ganan $23.50 y al resto se les paga $17.12. De los 5,364 empleados que laboran en la

otra planta 1,654 ganan $12.75; 815 ganan $17.80 y los demás $20.10. Saque sus

propias conclusiones.

3. Los miembros de un club deben pagar cuotas con base en su precio promedio. De los

80 miembros, 18 pesaron 110 libras, 23 pesaron 130 libras, 22 hicieron girar la

balanza hasta 150 libras y el resto pesaron 180 libras. Si los miembros deben pagar L.

60.00 por cada libra que pesan en promedio. ¿Cuánto debe desembolsar cada

miembro?

4. Un profesor decide utilizar un promedio pesado para obtener las calificaciones

finales de los estudiantes que acuden a la clase que imparte. El promedio de tareas

tendrá un valor de 10% de la calificación final, el examen semestral valdrá 20% de la

nota final, el examen final, 30%; el proyecto semestral 25%, y los exámenes parciales

Page 24: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 24 Lic. Carlos A. Ávila (MAE Administración de Empresas)

15%. A partir de los datos siguientes, calcule el promedio final para cinco estudiantes

del seminario.

Estudiante Tareas Ex. Parciales Proyecto Ex. Semestral Ex. Final 1 85 89 94 87 90 2 78 84 88 91 92 3 94 86 93 86 89 4 82 79 88 84 93 5 95 90 92 82 88

5. Un despacho de asesoría financiera y administrativa, tiene 4 tipos de profesionistas

entre su personal: asesores financieros, asociados principales, personal de campo, y

personal de oficina. Las tasas promedio que se cobran a los clientes por el

desempeño da cada una de estas categorías profesionales son $75/hora, $55/hora,

$40/hora y $25/hora, respectivamente. Los registros de la firma indican el siguiente

número de horas cobradas el año anterior en cada categoría: 8,500, 13,750, 21,300, y

30,450 respectivamente. Si el despacho intenta allegarse una tasa promedio de cobro

para estimar lo que se debe cobrar a los clientes en el año siguiente. ¿Cuál será la

tasa promedio a cobrar?

6. La Ferretería Monterrosa vende tres tipos de cerca para casas, en San Pedro Sula. El

tipo A cuesta L. 112.00 por pie de instalación, el tipo B cuesta L. 145.00 por pie, y el

tipo C, el de mejor calidad cuesta L. 180.00 por pie. Ayer se vendieron 370 pies del

tipo A, 250 pies del tipo B y 160 del tipo C.

a. ¿Cuál fue el costo medio por pie vendido?

b. ¿Cuál es el monto de la factura?

7. Mauricio Ruiz compro 35 acciones a L. 300.00 cada una, 54 acciones a L. 400.00 cada

una, 96 acciones a L. 600.00 y 65 acciones a L. 700.00 cada una.

a. ¿Cuál es el monto total de su inversión?

b. ¿Cuál es el precio promedio por acción?

8. La siguiente tabla da el porcentaje de la fuerza laboral que está desempleada y el

tamaño de la fuerza laboral en las tres ciudades más importantes de Honduras. El

ministro de trabajo presenta un informe para el evento HOP. ¿Cuál sería la tasa de

desempleo adecuada para presentarla como representativa del país?

Ciudad % Desempleo Tamaño fuerza laboral

La Ceiba 12.5 152,500

San Pedro Sula 19.8 473,800

Tegucigalpa 23.2 669,320

Page 25: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 25 Lic. Carlos A. Ávila (MAE Administración de Empresas)

9. Don Mario Flores, fabrica una pintura sellante para automóviles en San Pedro Sula. El

utiliza 4 químicos diferentes en el proceso de producción. Para hacer su producto,

Don Mario debe utilizar 2 galones de calcimina que cuesta L. 50 el galón, ½ galón de

kalsolita a L.25 por galón, 1 galón de aglutinante que cuesta L. 15 por galón, y 3

galones de aceite secante a L. 40 por galón. Calcule el costo de un galón de sellante.

TEMA VI:

OTRAS MEDIDAS DE TENDENCIA CENTRAL (MEDIA GEOMETRICA)

La Media Geométrica: Proporciona una medida precisa de un cambio porcentual

promedio en una serie de números. Estas cantidades tienden a cambiar en un cierto

periodo de tiempo, por lo que la media geométrica busca encontrar para estas

cantidades, una tasa de cambio promedio. El cálculo de la media geométrica es una

forma apropiada de tomar en cuenta efectos multiplicativos, como la inflación y el

interés compuesto.

La media geométrica usa una variable conocida como factor de crecimiento que es

Igual a:

Tasa de interés

FC = 1 + 100

La fórmula para encontrar la media geométrica es:

________________________________

M.G. = N

√ FC1 * FC2 * FC3 * FC4 *………………* FCn

Problemas de la sección 6: 1. El director ejecutivo de la compañía textilera Rio Lindo, desea determinar la tasa de

crecimiento en los ingresos de la empresa en los últimos 7 años. Los resultados se

presentan a continuación:

Año Ingreso

2004 $48,000

2005 $56,000

2006 $70,000

2007 $65,000

2008 $74,000

2009 $69,000

2010 $69,000

El director determina que si el crecimiento promedio es menor que el promedio de

mercado que es de 10%, se asumirá una nueva campaña publicitaria.

Page 26: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 26 Lic. Carlos A. Ávila (MAE Administración de Empresas)

a. ¿Qué decisión tomara el director en este caso?

b. Cuantos factores de “crecimiento” aparecen en el problema

2. El descontento de los empleados de una maquila se refleja en el número de quejas

oficiales durante los últimos 8 meses: 36, 41, 37, 49, 42, 38, 40 y 28. Con base en

estos datos ¿Cuál es el incremento promedio mensual en las quejas?

3. Una procesadora de frutas ha elevado el costo de la canasta completa en un periodo

de que abarca los últimos 5 años en los siguientes porcentajes:

2006 2007 2008 2009 2010 2011

6.75% 12.5% 9% 6% 7.5% 5.25%

¿Cuál es el aumento porcentual promedio del costo de la fruta en el periodo de 5

años?

4. Luis Silva se encuentra calculando el factor de crecimiento promedio de su tienda de

aparatos de sonido en los últimos seis años. Utilizando una media geométrica, llega a

un resultado de 1.22. los factores de crecimiento individuales de los últimos 5 años

fueron 1.19, 1.35, 1.23, 1.28 y 1.30, pero Bob perdió los registros del sexto año

después de haber calculado la media. ¿Cuál era el factor de crecimiento del último

año?

5. Una compañía fabricante de tableros de circuitos eléctricos, ha producido el

siguiente número de unidades en los últimos 5 años:

2004 2005 2006 2007 2008

12500 13250 14310 15741 17630

Calcule el aumento porcentual promedio de unidades producidas en este periodo y

utilice el resultado para estimar la producción proyectada para el 2011?

6. Una empresa de equipos deportivos está probando el efecto de tres planes

publicitarios sobre las ventas en los últimos 6 meses. Dados los siguientes datos,

¿cuál de los planes es el más efectivo?

Mes Plan A Plan B Plan C

Enero 33,200 28,400 26,750

Febrero 36,800 31,450 29,675

Marzo 40,425 35,875 33,980

Abril 43,340 38,740 37,390

Mayo 46,395 41,250 40,465

Junio 44,875 42,550 40,955

Page 27: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 27 Lic. Carlos A. Ávila (MAE Administración de Empresas)

7. Una compañía tiene registros del costo de procesamiento de cada pedido. Durante

los últimos 5 años, este costo fue (en lempiras) de 1045, 1202, 1089, 1195 y 1254.

¿Cuál fue el crecimiento porcentual promedio de la empresa durante ese lapso? Si

esta tasa promedio se mantiene estable durante 3 años más, ¿Cuánto le costara a la

empresa procesar un pedido al final de ese periodo?

TEMA VII:

MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS

La Media Aritmética: la formula general es:

_

X = ∑ (Fabs x Xm)

N

Existe un método “más corto” para calcular la media aritmética. A este método se le conoce

como Codificación.

A través de este método se elimina el problema de tener puntos medios o marcas de clase

muy grandes o inconvenientes. En lugar de usar los puntos medios reales para realizar los

cálculos, se pueden asignar enteros consecutivos de valor pequeño, conocidos como

códigos, a cada uno de los puntos medios. El entero cero puede ser asignado a cualquier

punto medio, pero para que los enteros asignados sean “pequeños”, se asigna el cero al

punto medio de la parte media de la distribución (o la parte más cercana a esta). A partir de

ahí se asignan enteros negativos a los valores menores a dicho punto medio y enteros

positivos a los valores más grandes. La formula bajo este método es:

_

X = X0 + w ∑ (u x fabs)

n

En donde: X0 = valor del punto medio al que se le asigno el código 0

w = ancho del intervalo

u = código asignado a cada punto medio de clase

fabs = frecuencia absoluta de cada clase

n = número total de observaciones de la muestra

La Mediana: La fórmula para calcularla es:

X = Lmed + (n+1) - (F+1)

2 w

fm

En donde: Lmed = Limite inferior de la clase mediana

n = número total de elementos de la distribución

Page 28: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 28 Lic. Carlos A. Ávila (MAE Administración de Empresas)

F = frecuencia acumulada anterior a la clase mediana

fm = frecuencia absoluta de la clase mediana

w = anchura del intervalo

La Moda: La fórmula para calcularla es:

X = Lmod + d1 w

d1 + d2

En donde: Lmod = Limite inferior de la clase modal

d1 = fabs clase modal menos fabs clase anterior a la clase modal

d2 = fabs clase modal menos fabs clase posterior a la clase modal

w = anchura del intervalo

Problemas de la sección 7: 1. A continuación se presenta una distribución de frecuencias con un resumen de los

niveles de azúcar en la sangre en una muestra de 70 pacientes que presentan

problemas renales crónicos.

Nivel de Azúcar Número de pacientes

65 – 79 7

80 – 94 8

95 – 109 9

110 – 124 9

125 – 139 12

140 – 154 10

155 – 169 8

170 – 184 7

Calcule las medidas de tendencia central.

Construya una ojiva menor que y formule 2 preguntas en sentido contrario

2. La siguiente tabla clasifica en categorías 100 visitas al consultorio de especialistas en

enfermedades cardiovasculares en Honduras según la duración en cada visita.

Duración (minutos) Cantidad de visitas

1 – 5 12

6 – 10 15

11 – 15 21

16 – 20 30

21 – 25 13

26 – 30 9

Page 29: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 29 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Total 100

Encuentre las medidas de tendencia central para este caso.

3. Una muestra de 90 comerciantes en San Pedro Sula, revelo las siguientes ventas del

año pasado:

Ventas (en miles de Lempiras) Numero de microempresas

100 – 149 9

150 – 199 14

200 – 249 20

250 – 299 25

300 – 349 16

350 – 399 6

a. Encuentre las medidas de tendencia central.

b. Construya una ojiva menor que y saque dos conclusiones.

4. Las edades de 50 gerentes de las empresas más grandes del país, aparecen en la

siguiente tabla de frecuencias.

Calcule las medidas de tendencia central.

Edades Frecuencia

50 y menos de 55 8

55 y menos de 60 13

60 y menos de 65 15

65 y menos de 70 10

70 y menos de 75 3

75 y menos de 80 1

5. A continuación el gerente de una sucursal bancaria presenta el saldo promedio

mensual de 600 cuentas de cheques:

Monto (dólares) Frecuencia Monto (dólares) Frecuencia

0.00 – 49.99 78 250.99 – 299.99 47

50.00 – 99.99 123 300.00 – 349.99 13

100.00 – 149.99 187 350.00 – 399.99 9

150.00 – 199.99 82 400.00 – 449.99 6

200.00 – 249.99 51 450.00 – 499.99 4

a. Encuentre la media aritmética a través de los dos métodos.

b. Encuentre la moda y la mediana de la distribución.

Page 30: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 30 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA VIII:

MEDIDAS DE DISPERSION

Medidas de Dispersión (Datos No Agrupados)

En un conjunto de datos, la media, la moda y la mediana solo revelan una parte de la

información importante sobre las características de los datos. La otra parte relevante de la

información para entender el patrón de los datos lo encontraremos en las medidas de

dispersión, también conocidas como medidas de extensión o variabilidad.

¿Porque es importante la dispersión en una distribución de datos?

Proporciona información adicional que permita juzgar la confiabilidad de las medidas

de tendencia central. Si los datos se encuentran ampliamente dispersos, la posición

central es menos representativa de los datos, a diferencia de cuando estos se

agrupan más estrechamente alrededor de la media.

Permite reconocer y rechazar distribuciones de datos que tengan las dispersiones

más grandes o amplias.

Como existen problemas característicos para dispersiones muy grandes, es necesario

distinguir qué tipo de dispersión presentara una distribución de datos.

El Rango o Alcance: Es la medida de dispersión más simple pero menos utilizada. El

alcance es la diferencia entre la observación más baja y la observación más alta de un

arreglo de datos.

Su fórmula es:

Alcance = Valor más alto del arreglo - Valor más bajo del arreglo

El alcance es fácil de usar pero de utilidad muy limitada, pues aparte de estos dos valores, no

toma en cuenta ninguna otra observación del arreglo. En consecuencia ignora la variación

entre todos los demás datos y se ve influido por los valores extremos.

La Varianza (σ2): Es una de las medidas que calculan la distancia promedio de

cualquier observación del conjunto de datos con respecto a la media de la

distribución. La Varianza es el promedio de las observaciones respecto a su media

elevadas al cuadrado. Cada población y cada muestra tiene su propia varianza. Las

unidades que expresan la varianza se muestran elevadas al cuadrado lo cual provoca

que la varianza se exprese en términos que en la realidad no tienen significado o

interpretación lógica.

a. La fórmula para Varianza de una población es :

σ2 = ∑ (x - µ)2 = ∑ x2 - µ2

N N

Page 31: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 31 Lic. Carlos A. Ávila (MAE Administración de Empresas)

b. La fórmula para Varianza de una muestra es:

S2 = ∑ (x – x)2 = ∑ x2 - nx2

n-1 n-1 n-1

La Desviación Estándar: Es otra medida del cálculo de la distancia promedio de

cualquier observación del conjunto de datos respecto de la media aritmética de la

distribución. Es en esencia, la raíz cuadrada de la varianza.

a. La fórmula para desviación estándar de la población es:

σ = √ σ2

b. La fórmula para desviación estándar de la muestra es:

S = √ S2

Medidas de Dispersión (Datos Agrupados)

a. La formula de Varianza es:

σ2 = ∑ fabs (Xm - µ)2 = ∑ (fabs) Xm2 - µ2 (Población)

N N

S2 = ∑ (fabs) Xm2 - nX2 (Muestral)

n - 1

b. La formula de Desviación Estándar es:

σ = √ σ2 (Población)

S = √ S2 (Muestra)

El Coeficiente de Variación: En ocasiones cuando se consideran dos o más

distribuciones, con medias significativamente diferentes o que están medidas en

unidades distintas, no es adecuado sacar conclusiones respecto a la dispersión solo

con base en la desviación estándar.

El Coeficiente de Variación es una medida relativa (porcentual) de dispersión.

Determina el grado de dispersión de un conjunto de datos relativo a su media. La

formula es la misma tanto para datos agrupados como no agrupados.

CV = S x (100) (Muestra) CV = σ x (100) (Población)

X µ

Page 32: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 32 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Problemas de la sección 8: 1. La empresa de Transportes Rodríguez lleva un registro del kilometraje de todos sus

vehículos. A continuación presentamos registros del kilometraje semanal:

810 450 756 789 210 657 589 488 876 689

1250 560 689 890 987 559 788 943 447 775

a. Calcule la media para el kilometraje de los 20 camiones.

b. Encuentre las medidas de dispersión.

2. Calcule las medidas de dispersión del problema 5, sección 4.

3. Los siguientes datos de muestras se han obtenido para el número de clientes diarios

en Tiendas Nichita:

34 45 23 37 26 32 31 41 39 42 29 30 43 36 34 40 38 27

a. Calcule las medidas de Dispersión.

b. Calcule las medidas de tendencia central.

c. ¿Si el número de clientes no sobrepasa los 32 clientes, la tienda cerraría operaciones.

En este caso lo hará?

4. Dos marcas de Zapatos para correr fueron evaluados en cuanto a uso y desgaste.

Cada uno reporto los siguientes números de horas de uso antes de que se detectara

algún desgaste significativo.

Marca A 97 83 75 82 98 65 75 93

Marca B 78 56 87 54 89 65 89

a. ¿Cuál zapato presenta mayor desgaste? (Media Aritmética)

b. ¿Cuál zapato parece tener un programa de control de calidad que produzca la mejor

consistencia en su desgaste? (Coeficiente de Variación)

5. Se usan dos procesos para producir diskettes de computadora. Han surgido

problemas respecto a las variaciones en los tamaños de tales discos. Con base en los

datos de muestra aquí observados, de ocho tamaños de discos en pulgadas para cada

proceso, explique cual proceso aconsejaría usted si su objetivo es minimizar la

desviación en el tamaño alrededor de la media.

Proceso 1 Proceso 2

3.41 3.22 3.81 3.26

3.74 3.06 3.26 3.79

3.89 3.65 3.07 3.14

3.65 3.33 3.35 3.51

Page 33: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 33 Lic. Carlos A. Ávila (MAE Administración de Empresas)

6. Encuentre las medidas de dispersión para datos agrupados de los ejercicios 2 y 3 de

la sección 7.

7. Datos sobre las edades de los 100 mejores ejecutivos de las 500 mejores firmas de la

Revista Fortune revelan una edad media de 56.2 años y una desviación estándar de

12.7 años. Su ingreso medio es de $89,432 con s=$16,097. ¿Cuál variable, edad o

ingreso presentan la mayor variación?

8. Daniel Benítez, usa dos máquinas diferentes para producir papeleras para las

fotocopiadoras CANON. Una muestra de las papeleras de la primera máquina

midieron 12.2, 11.9, 11.8, 12.1, 11.9, 12.4, 11.3 y 12.3 pulgadas. Las bandejas

elaboradas de la segunda maquina midieron 12.2, 11.9, 11.5, 12.4, 12.2, 11.9 y 11.8

pulgadas. Daniel debe usar la maquina con mayor consistencia en los tamaños de las

papeleras. ¿Cuál maquina deberá usar?

9. Dos compañías de Radio mantienen una férrea competencia, para encontrar cual de

las dos complace con más canciones. Durante las últimas 24 horas se recolectaron y

tabularon los datos sobre el número de canciones puestas por ambas estaciones.

Utilice los datos para preparar un reporte para comparar las estaciones.

a. Calcule las medidas de tendencia central y de dispersión.

b. Cual estación es más consistente en sus operaciones.

Numero de canciones por hora Radioactiva W105

5 – 10 2 4

11 – 16 4 5

17 – 22 6 7

23 – 28 8 5

29 – 34 2 3

35 – 40 3 1

10. El chef jefe del restaurante Taco Bell acaba de recibir dos docenas de jitomates de su

proveedora, pero todavía no los acepta. Sabe por la factura que el peso promedio de

un jitomate es 7.5 onzas, pero insiste en que todos tengan un peso uniforme.

Aceptara los jitomates solo si el peso promedio es 7.5 onzas y la desviación estándar

sea menor a 0.5 onzas. Los pesos de los jitomates son los siguientes:

6.3 7.2 7.3 8.1 7.8 6.8 7.5 7.8 7.2 7.5 8.1 8.2 8.0 7.4 7.6 7.7 7.6 7.4 7.5 8.4 7.4 7.6 6.2 7.4 ¿Cuál es la decisión del chef y por qué?

Page 34: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 34 Lic. Carlos A. Ávila (MAE Administración de Empresas)

11. El gerente de Cinemark en San Pedro Sula, saco un balance del número de asistentes

por día que han llegado a las salas en los últimos 6 meses (datos en días):

Número de asistentes Frecuencia (días)

180 – 249 18

250 – 319 37

320 – 389 49

390 – 459 44

460 – 529 19

530 – 599 13

Calcule las 3 medidas de dispersión.

Page 35: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 35 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA IX:

OTRAS MEDIDAS DE DISPERSION

Otras Medidas de Dispersión: También son conocidas como medidas posicionales

de dispersión. Se utilizan para determinar a partir de qué valor o entre que valores se

ubica un determinado segmento de los datos de una distribución. Entre ellas

tenemos:

Cuartiles (Q): Dividen una distribución en 4 segmentos iguales, en donde cada

una de ellas representa el 25% de los datos. Cada distribución tiene un máximo

de 3 cuartiles.

La fórmula para calcular la ubicación respectiva es:

Qi = (n + 1) Q (Datos no Agrupados)

4

Qi = LRI + (PQ - fai ) w ; en donde fac ≥ (N + 1) i = PQ (Datos Agrupados)

FQ 4

Deciles (D): Dividen una distribución en 10 segmentos iguales, en donde cada una

de ellas representa el 10% de los datos. Cada distribución tiene un máximo de 9

deciles.

La fórmula para calcular la ubicación respectiva es:

Di = (n + 1) D (Datos no Agrupados)

10

Di = LRI + (PD - fai) w; en donde fac ≥ (N + 1) i = PD (Datos Agrupados)

FD 10

Percentiles (P): Dividen una distribución en 100 segmentos iguales, en donde

cada una de ellas representa el 1% de los datos. Cada distribución tiene un

máximo de 99 percentiles.

La fórmula para calcular la ubicación respectiva es:

Pi = (n + 1) P (Datos no Agrupados)

100

Pi = LRI + (PP - fai) w; en donde fac ≥ (N + 1) i = PP (Datos Agrupados)

FP 100

Alcance o Rango Intercuartilico (RIQ): Es la diferencia entre el tercer cuartil y el

primer cuartil. Dentro de este rango o alcance se ubican la mitad de las

observaciones. Consta del 50% de los datos, que se ubican entre Q1 y Q3,

cortando y dejando de paso al 25% inferior y al 25% superior de los datos. Esto

Page 36: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 36 Lic. Carlos A. Ávila (MAE Administración de Empresas)

permite que esta medida no se vea influenciada por valores extremos. La formula

es:

RIQ = Q3 – Q1

Problemas de la sección 9: 1. Encuentre dos cuartiles, dos deciles y dos percentiles de los ejercicios 2 y 4, de la

sección 4.

2. Encuentre dos cuartiles, dos deciles y dos percentiles de los ejercicios 1 y 3 de la

sección 7.

3. Encuentre Rango Intercuartilico de los Problemas 2 (Sección 4) y 3 de (Sección 7)

Page 37: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 37 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA X:

APLICACIONES ADICIONALES DE LA DESVIACION ESTANDAR

El Teorema de Chebyshev = Formulado por P.L. Chebyshev, matemático ruso, 1821 –

1894, establece que para todo conjunto de datos, por lo menos 1 – 1/K2 % de las

observaciones están dentro de K desviaciones estándar de la media, en donde K es

cualquier número mayor que 1:

Teorema de Chebyshev = 1 – (1/K2)

La Regla Empírica y la Distribución Normal: la desviación estándar se puede usar

para sacar ciertas conclusiones si el conjunto de datos está distribuido normalmente.

Una distribución normal es una distribución de datos continuos que produce una

curva simétrica en forma de campana. Las observaciones ubicadas a los extremos de

la curva ocurren con muy poca frecuencia, las observaciones que están más cerca de

la mitad ocurrirán con mayor frecuencia, estas condiciones producen la campana

simétrica. La observación modal (la más frecuente) se encuentra ubicada en el pico

de la distribución. En una distribución normal la media, la moda y la mediana están

ubicadas en la misma posición (son iguales). Es importante agregar que la mitad de

las observaciones está por encima de la media y la otra mitad está por debajo (50% y

50%).

La Regla Empírica, que es una extensión al Teorema de Chebyshev (en la cual se dice

que no importa qué forma tenga la distribución, al menos 75% de los valores caen

dentro de +/- 2σ a partir de la media y al menos 89% de los valores caen dentro de

+/- 3σ a partir de la media), específica que:

68.3% de las observaciones caen dentro de +/- 1 desviación estándar de la

media.

95.5% de las observaciones caen dentro de +/- 2 desviaciones estándar de la

media.

99.7% de las observaciones caen dentro de +/- 3 desviaciones estándar de la

media.

Page 38: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 38 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Resultado Estándar: A través de este resultado se puede describir que tan lejos las

observaciones individuales de una distribución se apartan de la media de la

distribución. Específicamente nos da el número de desviaciones estándar que una

observación en particular ocupa por debajo o por encima de la media. Se calcula

como:

Resultado estándar = x - µ

σ

Sesgo: Se refiere a que no todas las distribuciones son normales, ya que algunas

pueden estar sesgadas ya sea a la derecha o a la izquierda. En ambos casos, la moda

es por definición la observación que ocurre con mayor frecuencia. Por lo tanto, se

encuentra en el pico de la observación. Sin embargo por su sola naturaleza, la media

se ve afectada por las observaciones extremas. Por tanto, es halada en dirección del

sesgo, más de lo que esta la mediana, la cual se encuentra en algún sitio entre la

moda y la media. El sesgo puede medirse mediante el Coeficiente de sesgo de

Pearson:

Coeficiente de Sesgo (P) = 3 (X – mediana)

S

Si P < 0, los datos están sesgados a la izquierda

Si P > 0, los datos están sesgados a la derecha

Si P = 0, los datos están distribuidos normalmente

Page 39: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 39 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Problemas de la sección 10: 1. Un conjunto de datos distribuidos normalmente tiene una media de 5,000 y una

desviación estándar de 450. Qué porcentaje de las observaciones (Si el numero de

observaciones o elementos es 350) están:

a. Entre 4550 y 5450.

b. Entre 4100 y 5900.

c. Entre 3650 y 6350.

d. Por encima de 6350

e. Por debajo de 4550.

2. Una empresa maderera corta troncos a una longitud media de 25 pies, con una

desviación estándar de 4.5 pies. Si los cortes están distribuidos normalmente (tenga

en cuenta que en bodega hay 34,500 troncos inventariados) que porcentaje de

troncos tienen:

a. ¿Menos de 20.5 pies?

b. ¿Mínimo 16 pies?

c. ¿A lo sumo 25 pies?

d. ¿Máximo 29.5 pies?

3. Un conjunto de datos sobre el peso de contenido de 1000 bolsas de comida para

perros marca Puppy Chow tiene una media de 50 libras y una desviación estándar de

2.3 libras. No se sabe si los datos están distribuidos normalmente. Los fabricantes

esperan que por lo menos 750 de las bolsas pesen entre 40.8 y 59.2 libras. ¿Qué

seguridad puede darles?

4. Debido a que las tasas de interés han caído desde 2008 debido a la crisis mundial, se

encontró que una muestra de las tasas hipotecarias a 15 años en las instituciones

bancarias fue de:

7.1%, 7.3%, 7.0%, 6.9%, 6.6%, 6.9%, 6.5%, 7.3%, 6.85% a. Calcule las medidas de tendencia central. b. Calcule el coeficiente de Sesgo de Pearson, para determinar el tipo de sesgo del

arreglo. c. Calcule la Varianza y la desviación estándar.

5. Una supervisora en una planta ensambladora recibió las siguientes clasificaciones de

eficiencia durante 12 meses:

56, 69, 48, 75, 65, 72, 81, 43, 61, 42, 36, 52. a. ¿Cuál de las medidas de tendencia central será la que ella debe colocar para crear

una impresión más favorable?

Page 40: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 40 Lic. Carlos A. Ávila (MAE Administración de Empresas)

b. Calcule el coeficiente de Sesgo de Pearson.

6. Dados los siguientes puntajes de 12 pruebas para una clase de Estadística, calcule el

coeficiente de Sesgo de Pearson. Asuma que estos datos son muestrales:

80, 83, 87, 85, 90, 86, 84, 82, 88, 98, 92, 77, 95

7. La compañía American Airlines revelo en el año 2009, una media de 78.7 pasajeros

por día, con una desviación estándar de 12.14. Para programar los tiempos para una

nueva ruta que la compañía ha abierto, la gerencia desea saber con qué frecuencia

los pasajeros están dentro de K = dos desviaciones estándar de la media, y cual es

dicho intervalo.

8. Calcule Pearson para el problema 9, sección 8.

9. Un conjunto de 60 observaciones tiene una media de 66.8, una varianza de 12.60 y

una forma de distribución desconocida.

a. ¿Entre que valores deberán caer al menos 75% de las observaciones, de acuerdo con

el teorema de Chebyshev?

b. Si la distribución es simétrica y con forma de campana, aproximadamente cuantas

observaciones deberán encontrarse en el intervalo 59.7 – 73.9?

c. Encuentre los resultados estándar para las siguientes observaciones tomadas de la

distribución: 61.45, 75.37, 84.65, 51.50.

10. David Ordoñez, propietario de una enorme panadería, afirmo que el nivel de

producción promedio por semana de su empresa fue 11,398 barras de pan, con una

varianza de 49,729. Si los datos utilizados para calcular los resultados se recolectaron

en el periodo de 32 semanas, ¿Durante cuantas semanas estuvo el nivel de

producción debajo de 11,175? ¿Y cuántas arriba de 11,844?

11. Una compañía multinacional tiene 3 oficinas en 3 ciudades distintas. Los niveles de

salario difieren de una ciudad a otra. En la oficina de Washington, D.C. el aumento

promedio a los salarios durante el año anterior fue de $1500 con una desviación

estándar de $400. En la sucursal de Nueva York, el aumento promedio fue de $3760

con una desviación estándar de $622. En Los Ángeles, el aumento promedio fue de

$850, con una desviación estándar de $95. Se entrevisto a 3 empleados. El empleado

de Washington recibió un aumento de $1100; el de Nueva York obtuvo un aumento

de $3200 y el de Los Ángeles, $500. ¿Cuál de los tres tuvo el menor aumento en

relación con la media y la desviación estándar de los aumentos correspondientes a su

oficina?

Page 41: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 41 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA XI: PRINCIPIOS DE PROBABILIDAD

En la actualidad, la teoría matemática de la Probabilidad es la base para las aplicaciones

estadísticas tanto en investigaciones sociales como en la toma de decisiones.

Conceptos básicos de la probabilidad:

Probabilidad: Es la posibilidad de que algo pase. Las probabilidades se pueden

expresar como fracciones propias o como decimales que están entre cero y uno.

Tener una probabilidad de cero, significa que algo nunca va a suceder y una

probabilidad de uno significa que algo va a suceder siempre.

Evento: Es uno o más de los posibles resultados de hacer un experimento.

Ej. Los eventos del experimento de lanzar una moneda son cara y cruz. Sacar un as de copas de una baraja de naipes. Ser elegido de entre cien estudiantes para responder una pregunta.

Experimento: es la actividad principal que genera dichos eventos.

Ej. Lanzar una moneda.

Lanzar un dado.

Sacar una carta de una baraja.

Cursar una materia en la universidad

Espacio Muestral: Es el conjunto de todos los resultados posibles de un experimento.

Ej. Del lanzamiento de una moneda se puede obtener cara o cruz.

Del lanzamiento de un dado se pueden obtener resultados del 1 al 6.

Al cursar una materia en la universidad, uno puede aprobar o reprobar.

De una baraja se pueden obtener 52 resultados posibles.

Eventos Mutuamente Excluyentes: Se dice que los eventos son mutuamente

excluyentes si uno y solo uno de ellos puede tener lugar a un tiempo.

Ej. De lanzar una moneda podemos obtener cara o cruz, pero no ambas.

Usted puede pasar o reprobar una materia, pero no ambos resultados.

Usted puede llegar tarde o temprano a clase, pero no ambas al mismo

tiempo.

Page 42: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 42 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Lista Colectivamente Exhaustiva: Una lista es exhaustiva cuando en una lista de

posibles eventos que pueden resultar de un experimento se incluyen todos los

resultados posibles.

Ej. Del lanzamiento de un dado los posibles resultados van del 1 al 6.

Los estudiantes de una escuela pueden estar a tiempo o no estar en el salón

de clase cuando se pasa lista.

Tipos de Probabilidad:

Probabilidad Clásica: El Planteamiento clásico define la probabilidad de que un

evento ocurra como:

Probabilidad de un evento = Numero de resultados en los que puede ocurrir un evento

Número total de resultados posibles

A la probabilidad clásica también se le define como probabilidad a priori, debido a que si se

usan ejemplos previsibles como monedas no alteradas, dados no cargados y mazos de

barajas normales, entonces es posible establecer el resultado sin la necesidad de realizar el

experimento. Las conclusiones son basadas en puro razonamiento lógico. Este

planteamiento es útil en experimentos como los mencionados anteriormente, pero se ve en

problemas al quererlo aplicar en tomas de decisiones administrativas. Es importante tomar

en cuenta que el experimento descrito de un evento puede ser “con reemplazo o sin

reemplazo” después de cada intento.

Probabilidad de Frecuencia relativa de presentación: También conocida como

probabilidad a posteriori, define la probabilidad como:

1. La frecuencia relativa observada en un evento durante un gran número de intentos

2. La fracción de veces que un evento se presenta a la larga, cuando las condiciones

son estables.

Frecuencia Relativa = Numero de veces que ha ocurrido un evento en el pasado

Número total de observaciones

Ej. Cuál es la probabilidad de que yo viva hasta los 85 años.

La probabilidad de que mañana haya un accidente aéreo.

Este método usa la frecuencia relativa de las presentaciones pasadas de un evento como

probabilidad. Se determina que tan frecuente ha sucedido algo en el pasado y se usa esa

cifra para predecir la probabilidad de que el evento suceda de nuevo en el futuro. Otra

característica es que el resultado de la probabilidad obtiene mayor precisión a medida

Page 43: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 43 Lic. Carlos A. Ávila (MAE Administración de Empresas)

aumenta el número de observaciones. Claro está que hay que tener en cuenta el tiempo y el

costo que implicaría tener más observaciones.

Probabilidad Subjetiva: Están basadas en las creencias de las personas que efectúan

la estimación de probabilidad.

Ej. Al dolerle los huesos, una anciana cree que se avecina la lluvia.

Construir una planta nuclear sobre una falla geológica, en ese caso sería la

probabilidad de que suceda un accidente en la planta, sin contar con antecedentes

de ese tipo.

Reglas de PROBABILIDAD

La mayoría de administradores que usa la probabilidad se preocupa por dos condiciones:

El caso en que un evento u otro se presente.

La situación en que dos eventos presenten al mismo tiempo.

Probabilidad Marginal o Incondicional: Es también denominada como probabilidad

sencilla, que quiere decir que solo un evento puede llevarse a cabo.

Relaciones entre eventos: Un Conjunto es toda reunión de objetos. Cada conjunto

contiene una serie de elementos. Es totalmente probable que algunos elementos

estén presentes en ambos conjuntos, si esto sucede, se dice que existe una

Intersección de eventos, que es cuando los elementos tienen las dos características

de los conjuntos. La intersección se simboliza como A∩B.

Una herramienta muy importante para mostrar la relación entre conjuntos, es

conocida como Diagrama de Venn, desarrollado por John Venn, matemático ingles

(1834 – 1923). Los eventos se representan por medio de círculos que pueden ir o no

ir interceptados, que van dibujados dentro de un rectángulo cuya área mide 1.

El diagrama de Venn representado en el ejemplo 1 puede describirse como la

relación entre el conjunto A y el conjunto B. El área combinada de ambos conjuntos

recibe el nombre de unión de los conjuntos A y B. La unión en este caso contiene

Page 44: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 44 Lic. Carlos A. Ávila (MAE Administración de Empresas)

todos los tipos de criaturas que tienen dos piernas, pueden volar, o ambas cosas a la

vez. El área donde los conjuntos A y B se solapan se define como la intersección de A

y B. Contiene todos los tipos de criaturas que pertenecen a la vez a A y a B, es decir,

que tienen dos piernas y pueden volar.

Un diagrama de Venn de dos conjuntos define 4 áreas diferentes (la cuarta es la

exterior), que pueden unirse en 6 posibles combinaciones:

A (dos patas)

B (vuelan)

A y B (dos patas y vuelan)

A y no B (dos patas y no vuelan)

no A y B (más o menos de dos patas, y vuelan)

no A y no B (ni tienen dos patas ni vuelan)

Diagrama de Venn mostrando todas las intersecciones posibles entre tres conjuntos A, B y C.

La Unión de A y B, se simboliza como AUB, consta de elementos que están o en A o en B o

en ambos.

Regla de la Adición:

Para eventos Mutuamente Excluyentes (eventos no pueden darse al mismo tiempo):

P (AUB) = P (A) + P (B)

Para eventos No Mutuamente Excluyentes (eventos pueden darse al mismo tiempo):

P (AUB) = P (A) + P (B) – P (A∩B)

Eventos Complementarios: Son los eventos en que si uno de ellos ocurre, el otro no

puede ocurrir. Estos eventos por supuesto que son mutuamente excluyentes y

colectivamente exhaustivos. La referencia exacta es que de un mismo evento en

particular, puede que este ocurra o no ocurra. La formula es:

Page 45: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 45 Lic. Carlos A. Ávila (MAE Administración de Empresas)

P (A) + P (no A) = 1

P (A) = 1 – P (no A)

Problemas de la sección 11: 1. Sea A, el evento de que un estudiante en particular curse Calculo I y el evento B sea

que curse Estadística I.

¿Qué significado tiene el evento AΩB?

¿Qué significado tiene el evento AUB?

¿Cuál es el complemento de A?

¿Cuál es el complemento de B?

¿Son los eventos A y B mutuamente excluyentes?

2. Al lanzar un dado, cual es la probabilidad de obtener:

Un número impar

Un 4

Sacar un número que no sea 5

Sacar un 7

No sacar un 2

3. Considere una pila de 9 cartas de espadas, numeradas del 2 al 10 y un dado.

Proporcione la probabilidad de cada uno de los siguientes totales, al sumar los

valores del dado y de la carta:

2 3 8 9 12 14 16

4. Durante el año anterior, las ventas semanales en una Tienda de mascotas, han sido

“bajas” durante 10 semanas, “considerables” durante 26 semanas, y “altas” el resto

del año. Cuál es la probabilidad de que las ventas de esta semana sean:

Considerables

Bajas

Altas

No Bajas

Por lo menos considerables

5. Clasifique las siguientes estimaciones de probabilidad en cuanto a su tipo (clásica,

frecuencia relativa o subjetiva):

La probabilidad de lograr un tiro penal en hockey sobre hielo es 0.47

La probabilidad de que el presidente Lobo renuncie es de 0.75.

Page 46: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 46 Lic. Carlos A. Ávila (MAE Administración de Empresas)

La probabilidad de sacar 2 seises al lanzar dos dados es 1/36.

La probabilidad de caerme al caminar es 0.38.

La probabilidad de que viaje a Europa este año es 0.14.

La probabilidad de que un auto arranque en un día muy frio es 0.97

6. El gerente de Cinemark en San Pedro Sula, saco un balance del número de asistentes

por día que han llegado a las salas en los últimos 6 meses (datos en días):

Número de asistentes Frecuencia (días)

180 – 249 18

250 – 319 37

320 – 389 49

390 – 459 44

460 – 529 19

530 – 599 13

Calcule la probabilidad de que mañana lleguen a Cinemark:

a) Entre 390 y 460 personas.

b) Máximo 320 personas.

c) Por lo menos 250 personas.

d) No lleguen más de 530 espectadores.

e) A lo sumo 180 personas.

7. Para el caso de bebes nacidos en Honduras, la probabilidad de que su peso sea

menor a los 8.5 libras es de 19% y la probabilidad de que el periodo de gestación sea

menor a 8 meses y medio es de 31%. Además la probabilidad de que estos dos

eventos ocurran simultáneamente de 0.14.

En el caso de una niña se elija al azar ¿Cuál es la probabilidad de que ocurra A o B?

Trace un diagrama de Venn para ilustrar la relación entre los eventos.

¿Cuál es la probabilidad que un bebe, su peso no sea menor a 8.5 libras?

¿Son estos eventos mutuamente excluyentes?

8. Las siguientes estadísticas muestran el número de veces que una misma persona

haya ido varias veces al cine.

Edad Probabilidad

Menos de 6 0.0030

6 – 10 0.1240

11 – 15 0.2630

16 – 20 0.2900

21 – 25 0.2200

Page 47: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 47 Lic. Carlos A. Ávila (MAE Administración de Empresas)

26 – 30 0.0850

31 – 35 0.0140

Más de 35 0.0010

Total 1.0000

¿Cuál es la probabilidad de que una persona haya ido menos de 20 veces al cine en el

año?

¿Cuál es la probabilidad de que esta persona haya ido por lo menos 30 veces?

¿Cuál es la posibilidad de que una persona no haya ido entre 20 y 25 veces al cine?

¿Cuál es la posibilidad de que una persona haya ido al cine entre 25 y 40 veces al

año?

9. Se realizo un sondeo entre el personal del Hospital Mario Catarino Rivas sobre la

destitución del Dr. Juan Carlos Zúñiga. El sondeo se realizo entre médicos y

enfermeras de la institución:

Sondeo de opinión Médicos (M) Enfermeras (E)

Muy de acuerdo 5 3

Poco de acuerdo 7 5

NS/NR 8 6

Nada de acuerdo 20 26

¿Cuál es la probabilidad de que un trabajador, seleccionado al azar del grupo

sondeado, no haya respondido sobre la destitución?

¿Cuál es la posibilidad de que una enfermera seleccionada al azar este de alguna

forma de acuerdo con la destitución?

¿Cuál es la probabilidad de que un trabajador seleccionado al azar no esté de

acuerdo con la destitución?

¿Son mutuamente excluyentes los eventos? ¿Explique?

¿Existe dependencia o influencia alguna entre los eventos, Explique?

10. A continuación se presenta una distribución de frecuencias de las tomas de muestra

de los niveles de azúcar en la sangre que presentan 500 pacientes del Hospital

Escuela en Tegucigalpa.

Nivel de azúcar en la sangre Frecuencia

60 – 69 14

70 – 79 23

80 – 89 95

90 – 99 106

100 – 109 122

110 o más 140

Page 48: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 48 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Si se considera que los pacientes que tienen un nivel de 110 o más de hemoglobina

son personas diabéticas, ¿Cuál es la probabilidad de que un paciente escogido al azar,

tenga diabetes?

¿Cuál es la probabilidad de que un paciente tenga nivel normal de azúcar en la

sangre? Tome en cuenta que el nivel normal de azúcar es de 80 a 110.

¿Cuál es la probabilidad de que una persona seleccionada al azar tenga muy bajo

nivel de azúcar?

¿Cuál es la probabilidad de que el nivel de azúcar de una persona no esté entre 90 y

100?

¿Son estos eventos independientes? Explique por qué.

11. A continuación se presentan datos de la probabilidad del número de hijos que en

promedio tiene una familia en Honduras:

Número de hijos Proporción de familias que tienen esta cantidad de hijos

0 0.04

1 0.12

2 0.32

3 0.23

4 0.13

5 0.09

6 0.07

¿Cuál es la probabilidad de que una familia escogida al azar tenga 4 hijos o más?

¿Cuál es la probabilidad de que una familia escogida al azar tenga 2 o 3 hijos?

¿Cuál es la probabilidad de que una familia elegida al azar tenga al menos un hijo?

¿Cuál es la probabilidad de que una familia al azar no tenga hijos?

¿Cuál es la probabilidad de que una familia no tenga 5 hijos?

12. Hondutel registra la duración de las llamadas telefónicas efectuadas por 175

personas durante el día de navidad:

Duración (minutos) Frecuencia

1 – 7 45

8 – 14 32

15 – 21 34

22 – 28 22

29 – 35 16

36 – 42 12

43 – 49 9

50 – 56 5

Page 49: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 49 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Cuál es la probabilidad de que la siguiente llamada dure:

a. ¿Cuándo muchos 21 minutos?

b. ¿Hasta 42 minutos?

c. ¿Entre 22 y 36 minutos?

d. ¿Mínimo 56 minutos?

e. ¿Máximo 1 minuto?

f. ¿No pase de 29 minutos?

13. La siguiente tabla muestra el número de computadores vendidos diariamente por

una tienda minorista.

Numero de computadores vendidos Número de días

0 10

1 38

2 16

3 26

4 20

Determine la probabilidad de que el número de computadores que se vendan hoy

sea:

a. 2

b. Menos de 3

c. Más de 1

d. Por lo menos 1

e. Ninguno

f. No sea 4

14. La compañía multinacional Pfizer, ha producido una capsula para controlar la presión

arterial. El departamento de producción realiza inspecciones permanentes de cada

capsula ya terminada. Uno de los inspectores se ha dado cuenta que de cada 1000

capsulas que se revisan, 25 tienen defectos internos, 18 tienen defectos de

empaquetado y 9 tienen ambos tipos de defectos. En su informe, el inspector debe

incluir la probabilidad de que haya defectos en las capsulas.

¿Cuál es la probabilidad que haya defectos en las capsulas?

¿Cuál es la probabilidad de que una capsula no tenga defectos internos?

¿Cuál es la probabilidad que una capsula tenga defectos internos y de empaquetado?

¿Cuál es la probabilidad de que una capsula no tenga defectos?

Construya un diagrama de Venn

Page 50: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 50 Lic. Carlos A. Ávila (MAE Administración de Empresas)

15. La empresa CEMCOL distribuye una marca específica de tractor. El gerente de

mantenimiento ha encontrado dos tipos de fallas en los tractores. Uno de los fallos es

de problemas eléctricos y el otro consiste en problemas de temperatura. El gerente

sabe que la probabilidad que un tractor seleccionado al azar tenga problemas

eléctricos es del 45%. La probabilidad que un tractor tenga ambas fallas es del 35%.

La probabilidad que el tractor tenga falla eléctrica o de temperatura es 70%

a. ¿Cuál es la probabilidad que un tractor tenga falla de temperatura?

b. ¿Cuál es la probabilidad que un tractor no tenga fallo eléctrico?

c. ¿Cuál es la probabilidad que un tractor no tenga fallo eléctrico y no tenga fallo de

temperatura?

d. ¿Cuál es la probabilidad que un tractor tenga fallo de temperatura y fallo eléctrico?

16. Si suponemos que es igualmente posible que un bebe nazca en cualquier día de la

semana, ¿Cuáles son las probabilidades de que un bebe nazca,

a) ¿Un martes?

b) ¿Un día que empiece con M?

c) ¿Entre miércoles y viernes, incluyéndolos?

d) No nazca un domingo.

e) Nazca Lunes o Martes.

f) Nazca Viernes y Sábado.

17. Un inspector de una compañía tiene la tarea de comparar la confiabilidad de dos

estaciones de bombeo. Cada estación es susceptible a dos tipos de falla:

descompostura en el bombeo y fugas. Cuando ocurre una de las dos (o ambas), la

estación debe parar. Los datos disponibles indican que prevalecen las siguientes

probabilidades:

Estación P(falla en bombeo) P(fuga) P(ambas)

1 0.07 0.10 0

2 0.09 0.12 0.06

¿Qué estación tiene la mayor probabilidad de parar?

Page 51: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 51 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA XII

TABLAS DE CONTINGENCIA

Tablas de Contingencia: Estas tablas son útiles para calcular probabilidades de

experimentos con eventos múltiples. Los valores en los márgenes de la tabla se

llaman probabilidades marginales. De acuerdo a las celdas de la estructura principal

de la tabla, la probabilidad de la intersección de dos eventos se denomina como

probabilidad conjunta.

Problemas de la sección 12: 1. En una compañía de cobros, un gerente tiene 120 cuentas por cobrar pendientes. El

gerente informa que de las 25 cuentas que están en el intervalo de $0 a $4999, 10

están vencidas, 5 atrasadas y el resto son morosos, colocando al deudor en peligro de

ser visitado por el representante legal. De las 37 cuentas comprendidas entre $5000

y $9999, 15 están vencidas, 10 están atrasadas y el resto son morosas. Hay 39

cuentas en el intervalo entre $10000 y $14999, de las cuales 11 están vencidas, 18

son morosas y el resto están atrasadas. De las cuentas restantes que están en el

intervalo comprendido entre $15000 y más, 7 están morosas, 7 están atrasadas y el

resto están vencidas. El gerente general de la compañía desea ver una tabla de

contingencia de estas cuentas. Calcule:

La probabilidad de que las cuentas no sean morosas.

La probabilidad de que las cuentas estén vencidas.

La probabilidad de que las cuentas no estén atrasadas.

Las cuentas de menos de $10,000 que no estén atrasadas.

Las cuentas de más de $5,000 que hayan vencido.

2. Una organización recolecta datos sobre 500 economistas en la academia, la industria

privada, y el gobierno respecto a sus opiniones sobre si la economía podría ser

estable, podría expandirse o podría entrar en un periodo de contracción en el futuro

próximo. Sin embargo, parte de la información se perdió, resultando la siguiente

tabla de contingencia parcial. Con base en los datos restantes, cree una tabla de

probabilidad. ECONOMIA

Economistas Estable (S) Expansión (E) Contracción (C) Total

Academia (A) 125 100

Industria Privada (I) 35 110

Gobierno (G) 25 40 65

Total 200

De la tabla de probabilidad, encuentre:

Page 52: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 52 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Pb (I)

Pb (G)

Pb (A U I)

Pb (S ∩ E)

Pb (G U C)

Pb (no E)

Pb (S ∩ no G)

3. La empresa Zip Zona Verde tiene 560 empleados de los cuales 320 son hombres y el

resto son mujeres. 170 hombres son de Personal, 95 son Auxiliares y el resto son de

Línea. De las mujeres, 140 son de Línea, 40 de Auxiliar y el resto de Personal.

Construya una tabla de contingencia y calcule:

a. Pb (A)

b. Pb (no L)

c. Pb (H ∩ no P)

d. Pb (M U L)

e. Pb (A ∩ P)

4. De 1000 jóvenes de 18 años, 550 tienen empleo y 780 son bachilleres. De los 780

bachilleres, 450 tienen empleo. Cuál es la probabilidad de que un joven de 18 años

tomado aleatoriamente sea:

Un bachiller empleado

Empleado pero no bachiller

Desempleado o un bachiller

Desempleado y no bachiller

No bachiller

5. Una caja contiene 75 canicas, 45 son azules, 30 de estas tienen una apariencia

veteada. El resto de ellas son rojas y 20 de estas también están veteadas. Las canicas

que no están veteadas, son transparentes. Cuál es la probabilidad de sacar:

a) ¿Una canica azul?

b) ¿Una canica transparente?

c) ¿Una canica azul veteada?

d) ¿Una canica roja transparente?

e) ¿Una canica no transparente?

f) ¿Una canica roja o transparente?

g) ¿Una canica veteada transparente?

Page 53: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 53 Lic. Carlos A. Ávila (MAE Administración de Empresas)

6. Editorial McGraw Hill, tiene en bodega 75 títulos distintos de libros, clasificados por

tipo y costo de la siguiente manera:

Costo

Tipo US$10 US$15 US$20 Total

Ficción 10 3 21

Biografías 12 10

Histórico 17 23

Total 2

Complete la tabla de contingencia y encuentre las siguientes probabilidades:

Pb (B)

Pb (no H)

Pb (no $10)

Pb (H ∩ F)

Pb ($20 U B)

Pb (B U >$10)

Pb ($15 ∩ no F)

Page 54: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 54 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA XIII

PROBABILIDADES BAJO INDEPENDENCIA ESTADISTICA

Se dice que los eventos son estadísticamente independientes, cuando la

presentación de uno de ellos, no tiene efecto alguno, sobre la probabilidad de

presentación de cualquier otro evento. Existen tres tipos de probabilidad bajo esta

condición:

a) P. Marginal: Es la probabilidad simple de la presentación de un evento. Si se lanza

una moneda la primera vez y se obtiene como resultado una cruz, y luego se vuelve a

lanzar por segunda vez, el resultado podría ser cara o cruz. El resultado del primer

lanzamiento no marca en lo absoluto el resultado del segundo o de cualquier otro

lanzamiento. Estos eventos son independientes.

b) P. Conjunta: La probabilidad de dos o más eventos que se presentan juntos o en

sucesión es el producto de sus probabilidades marginales.

a. P (A∩B) = P (A) x P (B)

c) P. Condicional: Es la probabilidad de que un segundo evento (B) se presente si un

primer evento (A) ya ha sucedido.

a. P (A/B) = P (B)

b. P (B/A) = P (A)

Aunque parezca incongruente, la formula lo que en realidad presenta es que en la realidad

aunque se quiera establecer que un evento está condicionado porque otro ya haya sucedido,

en la realidad no se da de esa forma.

Problemas de la sección 13:

1. Al observar la población de Honduras, se concluye que la probabilidad de que un

adulto entre 50 y 65 años no cuente con un seguro de salud con cualquier tipo de

cobertura es de 55%.

Suponga que usted elige aleatoriamente a una mujer de 52 años y a un hombre

sin relación alguna con ella de 59 años, entre esta población ¿Cuál es la

posibilidad de que ninguno de los dos este asegurado?

¿Cuál es la probabilidad de que ambos posean seguro medico?

Si se eligen 5 adultos de la población no relacionados entre sí de 50 y 64 años de

edad, ¿Cuál es la probabilidad de que 3 de ellos carezcan de seguro?

De 4 adultos al azar, cual es la probabilidad que dos de ellos cuenten con seguro.

Page 55: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 55 Lic. Carlos A. Ávila (MAE Administración de Empresas)

¿Son estos eventos Independientes?

2. La Probabilidad de que una mujer casada elegida aleatoriamente al azar no use

ningún método de anticoncepción es de 0.48

¿Cuál es la probabilidad de que 5 mujeres de este grupo elegida al azar 3 no usen

método anticonceptivo?

¿Cuál es la probabilidad que de las 5 mujeres elegidas todas usen método

anticonceptivo?

¿Cuál es la probabilidad de que ninguna use método anticonceptivo?

¿Son estos eventos mutuamente excluyentes?

¿Son estos eventos independientes?

3. La señora Victoria ha llegado al hospital a dar a luz y el resultado es un lindo varón.

Tres horas después llega doña Carmen a dar a luz al hospital.

¿Cuál es la probabilidad de que doña Carmen dé a luz una niña, dado que doña

Victoria ha dado a luz un varón?

¿Cuál es la probabilidad de que doña Carmen dé a luz un varón, dado que doña

Victoria ha dado a luz un varón?

¿Cuál es la probabilidad de que doña Carmen y doña Victoria den a luz un varón y

una niña respectivamente?

4. Una clínica tiene 4 aparatos de Rayos X, que cuando fallan cada una se repara por

separado. A partir de la experiencia se sabe que cada aparato se encuentra fuera de

servicio el 14% del tiempo.

Si la primera máquina está funcionando normalmente, ¿Cuál es la probabilidad de

que tres de las otras maquinas estén defectuosas?

Si la primera máquina se encuentra defectuosa, ¿Cuál es la probabilidad de que al

menos dos de las otras maquinas se encuentren defectuosas?

¿Si la clínica tuviera 6 aparatos, Cuál es la probabilidad de que cuatro de ellas

maquinas estén funcionando correctamente?

¿Cuál es la posibilidad de que 2 de las maquinas presenten fallos?

5. El señor William Robertson, ejecutivo de una tabacalera está consciente de la

responsabilidad social que la empresa debe tener con la sociedad. La compañía lanza

una campaña publicitaria para hacer conciencia en el consumo del cigarrillo. El señor

Robertson acaba de instalar 4 anuncios panorámicos en la carretera a la entrada de la

ciudad y sabe por su experiencia, la probabilidad de cada anuncio sea visto por un

conductor escogido aleatoriamente. La probabilidad de que el primer anuncio sea

Page 56: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 56 Lic. Carlos A. Ávila (MAE Administración de Empresas)

visto por un conductor es de 0.75, la probabilidad de que el segundo sea visto es de

0.83, la probabilidad para el tercero es de 0.86, y la del cuarto es de 0.90.

Suponiendo que el evento consistente en que un conductor vea uno cualquiera de

los anuncios es independiente de si ha visto o no los demás; ¿Cuál es la probabilidad

de que:

Los cuatro anuncios sean vistos por un conductor escogido aleatoriamente.

El primero y el cuarto anuncios sean vistos, sin que el segundo y el tercero sean

notados.

Ninguno de los anuncios sea visto.

El tercero y el cuarto no sean vistos.

Dos de los anuncios no sean vistos.

Tres anuncios sean vistos.

6. Una bolsa tiene 32 canicas: 4 rojas, 9 negras, 12 azules, 6 amarillas y 1 morada. Las

canicas se sacan una a la vez con reemplazo. Calcule la probabilidad de que:

La segunda canica sea amarilla dado que la primera fue amarilla

La segunda canica sea roja dado que la primera fue negra

La tercera canica sea morada dado que la primera y segunda fueron moradas

La primera canica sea roja o azul

La primera canica no sea negra

La primera canica sea azul y morada

7. El departamento de salud efectúa rutinariamente dos inspecciones independientes a

los restaurantes; un restaurante aprobara la inspección solo si ambos inspectores lo

aprueban en cada una de ellas. El inspector A tiene mucha experiencia, en

consecuencia, solo aprueba 4% de los restaurantes que realmente están violando el

reglamento sobre salubridad. El inspector B tiene menos experiencia y aprueba 12%

de los restaurantes con fallas. Cuál es la probabilidad de que:

El inspector A apruebe el restaurante, aun cuando el inspector B haya encontrado

violaciones al reglamento

El inspector B apruebe un restaurante que este violando el reglamento, aun cuando

el inspector A ya lo haya aprobado

Un restaurante que este violando el reglamento sea aprobado por el departamento

de salud

Uno de los inspectores apruebe el restaurante

El inspector B no apruebe el restaurante

Page 57: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 57 Lic. Carlos A. Ávila (MAE Administración de Empresas)

8. Cuando fallan las compuertas de una pequeña represa hidroeléctrica, se les repara

de manera independiente una de la otra; la represa tiene 4 compuertas. A partir de la

experiencia, se sabe que cada compuerta esta fuera de servicio 6% de todo el

tiempo.

Si la compuerta uno está fuera de servicio, ¿Cuál es la probabilidad de que las

compuertas 2 y 3 estén fuera de servicio?

Cuál es la probabilidad de que 2 de ellas funcionen correctamente.

Cuál es la probabilidad de todas funcionen bien.

Cuál es la probabilidad de que al menos una de ellas no funcionen.

Page 58: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 58 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA XIV

PROBABILIDADES BAJO DEPENDENCIA ESTADISTICA

La dependencia estadística existe cuando la probabilidad de que se presente algún evento

depende o se ve afectada por la presentación de otro evento. Existen dos tipos de

probabilidad bajo esta condición:

P. Condicional:

P (A/B) = P (A∩B) / P (B)

P (B/A) = P (A∩B) / P (A)

P. Conjunta:

P (A∩B) = P (A/B) x P (B)

P (B∩A) = P (B/A) x P (A)

Cuando existe dependencia entre dos eventos, cada evento desempeña un rol importante

para definir condicionalidad.

Bajo estas condiciones siempre un evento ocurrirá primero (llamado condicionante) e

inmediatamente ocurrirá el segundo evento (llamado condicionado).

La condicionalidad se presenta de dos maneras:

Condicionado DADO Condicionante

2do. Evento / 1er. Evento

Si Condicionante ENTONCES Condicionado

1er. Evento 2do. Evento

1. CONDICIONADO DADO CONDICIONANTE

2. SI CONDICIONATE ENTONCES CONDICIONADO

El Condicionante es el evento que ocurre en primera instancia.

El Condicionado es el evento que ocurre después de haber ocurrido el Condicionante.

Problemas de la sección 14: 1. En un comedor de beneficencia, una trabajadora social, reúne los siguientes datos.

De las personas que acuden al comedor, 62% son hombres, 35% son alcohólicos y

24% son hombres alcohólicos.

a. ¿Cuál es la probabilidad de que un hombre que asiste al comedor, tomado al azar sea

alcohólico?

Page 59: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 59 Lic. Carlos A. Ávila (MAE Administración de Empresas)

b. ¿Cuál es la probabilidad de que una persona seleccionada al azar no sea alcohólica?

c. ¿Cuál es la probabilidad de que una persona seleccionada sea mujer?

d. ¿Cuál es la probabilidad de que la persona al azar sea hombre o alcohólico?

e. ¿Cuál es la posibilidad de que la persona no llegue al comedor no sea alcohólica?

2. Según una investigación, la probabilidad de que una familia posea dos seguros

diferentes dado que sus entradas anuales son mayores de $50,000 es de 0.77. De las

personas entrevistadas, 59% de las familias tuvieron entradas mayores a los $50,000

anuales y 48% tiene dos seguros diferentes.

a. ¿Cuál es la probabilidad de que una familia tenga dos seguros diferentes y una

entrada mayor a $50,000 al año?

b. ¿Cuál es la probabilidad de que una familia no tenga 2 seguros diferentes?

c. ¿Si una familia posee dos seguros, entonces cual es la posibilidad de que tenga

entradas mayores a $50,000.00?

d. ¿Cuál es la probabilidad de que una familia no tenga entradas mayores a $50,000?

3. Durante un estudio sobre accidentes automovilísticos, el Consejo de Seguridad en las

carreteras encontró que 60% de los accidentes suceden de noche, 52% están

relacionados con conductores alcoholizados y 37% se presentan de noche y están

relacionados con conductores ebrios.

a. ¿Cuál es la probabilidad de que un accidente esté relacionado con un conductor

alcoholizado, dado que sucedió de noche?

b. ¿Cuál es la probabilidad de que un accidente haya sucedido de noche, dado que está

relacionado con un conductor ebrio?

c. ¿Cuál es la probabilidad de que un accidente suceda de día?

d. ¿Cuál es la probabilidad de que un accidente no esté relacionado con conductores

ebrios?

e. ¿Cuál es la probabilidad de que el accidente ocurra de noche o esté relacionado con

un conductor alcoholizado?

4. El director regional de salud, está preocupado por la posibilidad de que algunos de

sus empleados vayan a huelga. Estima que la posibilidad de que sus médicos vayan a

huelga es de 0.70 y la probabilidad de que sus enfermeras vayan a huelga es de 0.55.

Además estima que si las enfermeras van a huelga, existe 85% de posibilidades de

que los médicos realicen un paro solidario de actividades.

a. ¿Cuál es la probabilidad de que ambos grupos se vayan a huelga?

b. Si los médicos hacen huelga, ¿Cuál es la probabilidad de que las enfermeras lo hagan

también como acto de solidaridad?

c. ¿Cuál es la probabilidad de que las enfermeras no vayan a huelga?

Page 60: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 60 Lic. Carlos A. Ávila (MAE Administración de Empresas)

d. ¿Cuál es la probabilidad de que los médicos no vayan a huelga?

e. ¿Cuál es la probabilidad de que los médicos o las enfermeras vayan a huelga?

5. Una compañía desea actualizar su sistema de computación y una parte importante

de la actualización es un nuevo sistema operativo. La compañía ha pedido a un

ingeniero que evalúe el sistema operativo. Suponga que la probabilidad de una

evaluación favorable es 0.65. Si la probabilidad de que la compañía actualice su

sistema dada una evaluación favorable es 0.85. ¿Cuál es la probabilidad de que la

compañía actualice su sistema y reciba una evaluación favorable?

6. La biblioteca de la universidad ha entrevistado a afiliados elegidos al azar durante el

último mes para ver quienes usan la biblioteca y que servicios requieren. Los afiliados

se clasifican en licenciatura, postgrado y académicos. Los servicios se clasifican como

consulta, publicaciones periódicas o libros. La tabla contiene los datos de 350

personas. Suponga que los afiliados usan solo un servicio por visita.

Afiliados Referencia Publicaciones periódicas Libros

Licenciatura 44 26 72

Postgrado 24 61 20

Académicos 16 69 18

84 156 110

Encuentre la probabilidad de que un afiliado seleccionado al azar:

a) Sea estudiante de Licenciatura.

b) Visite la sección de publicaciones periódicas, dado que es un estudiante de

Postgrado.

c) Sea Académico y visite la sección de libros.

d) Si visita la sección de Referencias, entonces sea estudiante de Postgrado

e) No sea Académico

f) No visite las publicaciones periódicas

g) Visite la sección de libros o no sea estudiante Académico

7. Dado que Pb (A)=3/4, Pb (B)=1/6, Pb (C)=1/3, Pb (AC)=1/7 y Pb (B/C)=5/21, encuentre

las siguientes probabilidades: Pb (A/C), Pb (C/A), Pb (BC) y Pb (C/B).

8. Suponga que para 2 eventos A y B, Pb (A)=0.65, Pb (B)=0.80, Pb (A/B)=Pb(A) y Pb

(B/A)=0.85. ¿Es esta una asignación de probabilidad consistente?

Page 61: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 61 Lic. Carlos A. Ávila (MAE Administración de Empresas)

TEMA XV

INTRODUCCION A LAS DISTRIBUCIONES DE PROBABILIDAD

En cierta medida, estas distribuciones están relacionadas a las distribuciones de frecuencia.

Es un despliegue de todos los posibles resultados de un experimento junto con las

probabilidades de cada resultado. Es un listado de las probabilidades de todos los posibles

resultados que podrían obtenerse si el experimento se llevara a cabo. Existen dos tipos de

distribuciones de Probabilidad:

Discreta: Aquí la variable principal solo puede tomar un número limitado de valores.

Continua: En este tipo de distribución, la variable considerada puede tomar cualquier

valor dentro de un rango o intervalo dado.

Una variable es aleatoria si toma diferentes valores como resultado de un experimento

aleatorio. Esta variable puede ser:

Variable aleatoria discreta: la variable puede tomar solo un número limitado de

valores.

Variable aleatoria continua: la variable puede tomar cualquier valor dentro de un

rango o intervalo dado.

Valor Esperado E(X): De una variable aleatoria discreta, es la media ponderada de todos los

posibles resultados en los cuales los pesos son las probabilidades respectivas de tales

resultados.

Media o Valor Esperado µ = E(X) = ∑ (Xi) P (Xi)

Varianza de una distribución σ2 = ∑ (Xi - µ)2 P (Xi)

Page 62: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 62 Lic. Carlos A. Ávila (MAE Administración de Empresas)

PROBLEMAS SECCION 15 1. Basándose en la siguiente grafica de una distribución de probabilidad, construya una

tabla que corresponda a la grafica.

2. La presidenta nacional de la asociación contra el cáncer, intenta estimar la cantidad

que ofrecerá cada persona en la tele maratón anual de la asociación. Usando los

datos recolectados en los últimos 10 años, calculo las siguientes probabilidades de las

diferentes cantidades prometidas. Dibuje una grafica que ilustre esta distribución de

probabilidad.

Donaciones $25 $50 $75 $100 $125

Probabilidades 0.45 0.25 0.15 0.10 0.05

3. Las siguientes variables aleatorias ¿son discretas o continuas? En cada caso explique

el porqué de su respuesta.

Los carros vendidos por Roberto

Los ingresos que gana Roberto

Los tiempos de terminación de un trabajo en particular

Los empleados requeridos para completar dicho trabajo

4. Bob Walters, quien invierte con frecuencia en el mercado de valores, estudia con

detenimiento cualquier inversión potencial. En la actualidad examina la posibilidad

de invertir en una compañía de electricidad. Mediante el estudio del rendimiento en

el pasado, Walters ha desglosado los resultados potenciales en cinco resultados de

sus probabilidades asociadas. Los resultados son tasas de rendimientos anuales sobre

una sola acción que hoy cuesta $150. Encuentre el valor esperado del rendimiento

sobre la inversión en una sola acción de la compañía.

Rendimiento de la inversión ($) 0.00 10.00 15.00 25.00 50.00

Probabilidad 0.20 0.25 0.30 0.15 0.10

5. José Martínez acaba de comprar un Blue Ray en Jetstereo a un costo de L. 5700.00.

Ahora tiene la opción de comprar una póliza de servicio extendido que ofrece 5 años

de cobertura por L. 1900.00. Después de hablar con sus amigos y leer los informes,

José cree que puede incurrir en los siguientes gastos de mantenimiento durante los

próximos 5 años:

Gasto 0 50 100 150 200 250 300

Probabilidad 0.35 0.25 0.15 0.10 0.08 0.05 0.02

Page 63: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 63 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Encuentre el valor esperado de los costos de mantenimiento pronosticados. ¿Debe

José pagar L. 1900.00 por la garantía?

6. Sea X una variable aleatoria discreta que representa la cantidad de servicios de

diagnostico que un niño recibe durante una visita al consultorio de un pediatra; estos

servicios incluyen procedimientos como los análisis de sangre y de orina. La

distribución de probabilidad de X se muestra a continuación:

r P (X=r)

0 0.671

1 0.229

2 0.053

3 0.031

4 0.010

5+ 0.006

Total 1.000

a) Elabore una grafica de distribución de probabilidad.

b) Encuentre el valor esperado.

c) ¿Cuál es la probabilidad de que un niño reciba exactamente tres servicios de

diagnostico en una visita al consultorio del pediatra?

d) ¿Cuál es la probabilidad de que el niño reciba por lo menos un servicio?

e) ¿Cuál es la probabilidad de que un niño reciba cuatro o más servicios?

7. Sea X una variable aleatoria de una distribución de probabilidad, que representa el

orden de nacimiento de los niños nacidos en Honduras:

r P (X=r)

1 0.416

2 0.330

3 0.158

4 0.058

5 0.021

6 0.009

7 0.004

8+ 0.004

Total 1.000

a) ¿Cuál es la probabilidad de que un niño sea el primogénito o el segundo hijo?

b) ¿Cuál es la probabilidad de que un bebe sea cuando mucho el tercer hijo nacido?

c) Dibuje una grafica de distribución de probabilidad.

d) Calcule el valor esperado.

Page 64: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 64 Lic. Carlos A. Ávila (MAE Administración de Empresas)

SECCION XVI

DISTRIBUCIONES DE PROBABILIDAD DISCRETA

Entre las distribuciones aleatorias discretas más comunes tenemos:

Distribución Binomial: Esta distribución describe una variedad de procesos de

interés para los administradores y economistas, y describe datos discretos, que son

resultado de un experimento conocido como Proceso de Bernoulli, en honor al

matemático suizo del siglo XIX, Jacob Bernoulli. La distribución Binomial es apropiada

solo si la probabilidad de éxito permanece constante, esto ocurre si el muestreo se

realiza con reemplazo o cuando la población es infinita (muy grande). Este proceso

puede describirse en cuatro propiedades:

1. Cada intento tiene solamente dos resultados posibles: Éxito o Fracaso.

2. La probabilidad de un éxito (p) sigue siendo constante de un ensayo al siguiente, al

igual que lo hace la probabilidad de fracaso (q). Dicho de otro modo, la probabilidad

de resultado de cualquier intento, permanece fijo con respecto al tiempo.

3. El éxito y el fracaso son mutuamente excluyentes.

4. Los intentos son estadísticamente independientes, es decir, el resultado de un

evento no afecta el resultado de cualquier otro evento subsecuente.

5. El experimento puede repetirse muchas veces.

La formula Binomial es:

Probabilidad de r éxitos en n ensayos = n! pr qn-r.

r! (n-r)!

En donde:

p = probabilidad de tener éxito

q = probabilidad de de fracaso (q = 1 – p)

r = numero de éxitos deseados

n = numero de intentos hechos

En distribución Binomial es posible obtener la media y la desviación estándar, así:

La Media µ = np

La desviación estándar σ = √npq

PROBLEMAS SECCION 16 1. En 2007, 35% de los adultos son fumadores de alguna forma (cigarrillos, puros o

pipas). A través de una distribución Binomial, de una muestra de 14 personas,

encuentre la probabilidad de:

a. ¿Que por lo menos 6 personas fumen de alguna forma?

Page 65: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 65 Lic. Carlos A. Ávila (MAE Administración de Empresas)

b. ¿Cuándo mucho 3 personas fumen?

c. ¿Que 4 personas fumen de cualquier forma?

d. ¿Que todas fumen?

e. ¿Que ninguna persona fume?

f. Encuentre la media y la desviación estándar para este caso.

2. Al ministerio de Salud le interesa estudiar la probabilidad de que un paciente que ha

sido inyectado con una jeringa infectada con hepatitis B contraiga la enfermedad. Si

30% de los pacientes expuestos a la hepatitis B se infecta, encuentre a partir de una

muestra de 17 personas:

a. ¿La probabilidad de que por lo menos 3 individuos contraigan hepatitis B?

b. ¿La probabilidad de que cuando mucho 6 pacientes contraiga la enfermedad?

c. ¿La probabilidad de que 14 pacientes contraigan la enfermedad?

d. Encuentre la media y la desviación Standard para este caso.

3. De acuerdo con la Encuesta Nacional de Salud en Honduras, 20% de la población es

zurda.

a. ¿Cuál es la probabilidad de que exactamente tres de once personas sean zurdas?

b. ¿Cuál es la probabilidad de que por lo menos seis de once personas sean zurdas?

c. ¿Cuál es la probabilidad de que cuando muchos dos individuos del total de la muestra

sean zurdos?

d. ¿Cuál es la probabilidad de que por lo menos cuatro personas sean zurdas?

e. Encuentre la media y la desviación estándar de este caso.

4. En un fin de semana en la Emergencia del Hospital Mario Catarino Rivas, se

presentan 9 casos sospechosos de ser portadores de la Influenza AH1N1, pues

presentan los síntomas característicos de la enfermedad. De acuerdo a esta muestra

asumiendo que tiene las características de una distribución Binomial (la tasa de

incidencia es de 25%) encuentre:

a. ¿Cuál es la probabilidad de que dos personas del grupo sean casos confirmados de la

enfermedad?

b. ¿Cuál es la probabilidad de que 9 de ellas tengan un cuadro positivo confirmado de la

enfermedad?

c. ¿Cuál es la probabilidad de que a lo sumo tres de ellas sean casos confirmados de la

enfermedad?

d. Encuentre la media y la desviación Standard de esta situación

Page 66: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 66 Lic. Carlos A. Ávila (MAE Administración de Empresas)

5. En un jardín de niños, una profesora ha encontrado que existe un 60% de

posibilidades de que un estudiante lleguen temprano. Encuentre la probabilidad de

que de una muestra de 12 estudiantes:

a. Tres lleguen tarde a clases

b. Por lo máximo 7 lleguen tarde a clases

c. Uno de ellos llegue tarde a clases

d. Por lo menos 5 lleguen tarde a clases

e. Encuentre la media y la desviación estándar para esta situación.

6. En una encuesta a boca de urna hoy 29 de noviembre, día de las elecciones

generales, muy a pesar de los esfuerzos de la resistencia por no validar las elecciones,

un periodista ha encontrado que existe un 55% de posibilidades de que una persona

vote por el partido liberal. Cuál es la probabilidad de que de una muestra de 20

electores:

a. ¿8 electores voten por el partido nacional?

b. ¿Ningún elector vote por el partido nacional?

c. ¿17 voten por el partido nacional?

d. ¿Cuándo mucho 10 voten por el partido nacional?

e. ¿Por lo menos 5 electores voten por el partido nacional?

f. Encuentre la media y la desviación estándar de la intención de voto del día 29 de

noviembre.

Distribución Hipergeometrica: esta distribución aplica en casos cuando la

población (N) es pequeña y ocurre el muestreo sin reemplazo, lo que implica que la

probabilidad de éxito variara, y no será constante. La formula es:

Distribución P (x) = rCx N-rCn-x

Hipergeometrica NCn

En donde:

N = tamaño de la población

r = numero de éxitos de la población

n = tamaño de la muestra

x = numero de éxitos de la muestra

Page 67: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 67 Lic. Carlos A. Ávila (MAE Administración de Empresas)

PROBLEMAS SECCION 16B 1. Como subgerente de una empresa de materias primas, usted debe contratar 10

personas entre 30 candidatos, de los cuales 22 tienen títulos universitarios. ¿Cuál es

la probabilidad de que 5 de los que usted contrate tengan un titulo?

2. Cuarenta trabajadores de una oficina han recibido nuevos computadores. 27 tienen

una nueva tecnología llamada MMX. Si se seleccionan 10 aleatoriamente, ¿Cuál es la

probabilidad de que 3 de ellos estén equipados con la tecnología?

3. Una encuesta ha revelado, que 6 de 10 empleados ganan más de L.200,000 al año.

De 3 empleados seleccionados, ¿Cuál es la probabilidad de que los 3 ganen esa cifra?

Distribución de Poisson: Ideada por el matemático francés Simeón Poisson (1781 –

1840), la distribución Mide la probabilidad de un evento aleatorio sobre algún

intervalo de tiempo o espacio. Ejemplo de algunos procesos descritos a través de

esta distribución como ser: la distribución de llamadas telefónicas que llegan a un

conmutador, la demanda de pacientes que requieren servicio en una institución de

salud, la llegada de automóviles a una caseta de peaje y el numero de accidentes

registrados en cierta intersección de calles. Las características principales que

determinan una distribución de Poisson son:

1. La probabilidad de ocurrencia del evento es constante para dos intervalos

cualesquiera de tiempo o espacio.

2. La ocurrencia del evento en un intervalo es independiente de la ocurrencia de otro

intervalo cualquiera.

La fórmula para esta distribución es:

P (x) = λx x е-λ

X!

En donde:

X = número de veces que se presenta el evento.

λ = número promedio de ocurrencias por unidad de espacio o tiempo.

e = 2.71828, base de la función exponencial natural.

λ = np (Así se puede calcular la media cuando no se da directamente el valor de esta

variable)

Es importante destacar que la distribución de Poisson es una buena aproximación de

la distribución Binomial cuando n es igual o mayor que 20 y p es igual o menor a 0.05

Page 68: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 68 Lic. Carlos A. Ávila (MAE Administración de Empresas)

PROBLEMAS SECCION 16C 1. De acuerdo con el Departamento de Salud de Massachusetts, 224 mujeres que

dieron a luz en este estado, en 1998, obtuvieron resultados positivos del anticuerpo

del VIH. Suponga que con el tiempo 25% de los bebes nacidos de estas mujeres

lleguen a ser seropositivos. Bajo la distribución de Poisson:

a) Si se eligen muestras de n=224 individuos de una población de niños nacidos de

mujeres con el anticuerpo de VIH. ¿Cuál sería la cantidad media de niños infectados

por muestra?

b) ¿Cuál sería la desviación Standard?

2. La cantidad de casos de tuberculosis informados por la Secretaria de Salud durante

un solo mes posee una distribución de Poisson con parámetro λ=3.5.

a) ¿Cuál es la probabilidad de que se informen al menos 8 casos de tuberculosis en un

mes determinado?

b) ¿Cuál es la probabilidad de que a lo sumo se presenten 5 casos de esta enfermedad?

c) ¿Cuál es la probabilidad de que no se presente ningún caso?

d) ¿Cuál es la probabilidad de que se presenten 7 casos de la enfermedad?

e) Encuentre la media y la desviación Standard de este situación

3. En cierto municipio la cantidad de suicidios reportados cada mes en promedio es de

2.75 (λ). Suponga que la cantidad de suicidios da como resultado una distribución de

Poisson.

a) ¿Cuál es la posibilidad de que no se reporte un suicidio durante un mes

determinado?

b) ¿Cuál es la probabilidad de que se reporten 8 suicidios?

c) ¿Cuál es la probabilidad de que a lo sumo se reporten cuatro suicidios?

d) ¿Cuál es la posibilidad de que se reporten seis o más suicidios?

e) Encuentre la desviación Standard.

4. El juzgado contencioso de San Pedro Sula, maneja varios tipos de litigios, pero la

mayoría de tipo conyugal. De hecho 96% de los pleitos que se atienden en el juzgado

son de tipo conyugal. Cuál es la probabilidad de que de 80 litigios que se atienden en

los juzgados:

a) Exactamente 7 no sean de tipo conyugal.

b) 10 de ellos no sean de tipo conyugal.

c) Por lo menos 8 no sean de tipo conyugal.

d) A lo sumo 5 no sean de tipo conyugal.

Page 69: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 69 Lic. Carlos A. Ávila (MAE Administración de Empresas)

5. El departamento de impresiones y grabados es el principal responsable de imprimir

papel moneda en los Estados Unidos. El departamento tiene una impresionante baja

frecuencia de errores de impresión; solo 0.5% de los billetes presentan errores graves

que no permiten su circulación. Cuál es la probabilidad de que de un fajo de 1000

billetes:

a) ¿Ninguno presente errores graves?

b) ¿Diez presenten errores que no permitan su circulación?

c) ¿A lo sumo catorce no presenten errores de circulación?

d) ¿Por lo menos 8 presenten errores que impidan su circulación?

6. Sea X una variable aleatoria que representa la cantidad de niños en un grupo de 2000

que mueren antes de alcanzar su primer año de vida. En América Central, la

probabilidad de que un niño muera durante su primer año de vida es de 0.0085.

Asuma que este caso origina una distribución de Poisson. (Haga uso de la formula)

a) ¿Cuál es la cantidad media de niños que morirían en un grupo de este tamaño?

b) ¿Cuál es la probabilidad de que a lo sumo cinco años de un total de 2000 mueran en

su primer año de vida?

c) ¿Cuál es la probabilidad de que entre 15 y 20 niños mueran durante su primer año de

vida?

d) ¿Cuál es la probabilidad de que a lo sumo tres niños mueran durante su primer año

de vida?

e) ¿Cuál es la probabilidad de que 7 niños mueran durante su primer año de vida?

f) Encuentre la desviación estándar de esta situación.

Distribución Exponencial: Es una distribución continua. Mide el paso el paso del

tiempo entre el numero de ocurrencias, a diferencia de la distribución de Poisson que

mide el numero de ocurrencias en un determinado intervalo de tiempo o espacio.

Mientras la distribución de Poisson describe las tasas de llegada dentro de algún

periodo dado, la distribución exponencial estima el lapso entre tales arribos. Si el

número de ocurrencias tiene distribución de Poisson, el lapso entre las ocurrencias

estará distribuido exponencialmente. La probabilidad de que el lapso sea menor o

que o igual a cierta cantidad x es:

Distribución Exponencial P (X≤x) = 1 – е-µt

En donde:

t = lapso de tiempo

е = la función exponencial natural

µ = tasa promedio de ocurrencia

Page 70: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 70 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Es importante mencionar que con el paso del tiempo X aumenta, y la probabilidad

disminuye.

PROBLEMAS SECCION 16D 1. Los aviones llegan a un pequeño aeropuerto en Roatán, a una proporción de dos por

hora. Tomara una hora reparar un rampa utilizada para desembarcar pasajeros. ¿Cuál

es la probabilidad de que un avión llegue mientras la rampa esta en reparación?

2. El computador principal de la universidad queda fuera de línea tres veces por

semana. Un catedrático debe completar un proyecto que necesita de la

computadora. ¿Cuál es la probabilidad de que el computador este fuera de línea toda

la semana?

3. Durante un día típico de trabajo de 8 horas, las computadoras usadas para vigilar la

etapa de enfriamiento en la producción de neumáticos para autos señalan que la

temperatura no se mantiene en forma apropiada en 30 oportunidades. El director

ejecutivo de la compañía, está por hacer una inspección de la planta durante 30

minutos. ¿Cuál es la probabilidad de que este allí cuando se active la señal del

computador?

Distribución Uniforme: Es una distribución en la cual las probabilidades de todos

los resultados son las mismas. Todos los resultados sobre el rango total de

posibilidades de distribución son igualmente posibles desde el mínimo valor a hasta

el máximo valor b. En una distribución uniforme, las probabilidades son las mismas

para todos los posibles resultados.

La media o valor esperado de una distribución uniforme esta a la mitad de camino

entre sus dos puntos extremos, así:

E (x) = µ = a + b

2

La varianza de una distribución uniforme de probabilidad es:

σ2 = (b – a)2

12

El área total bajo la curva debe ser igual a 1 o 100%. Debido a que el área es la altura

por el ancho, la altura es:

Altura = Área = 1

Ancho b - a

Page 71: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 71 Lic. Carlos A. Ávila (MAE Administración de Empresas)

En donde b-a es el ancho o rango de la distribución.

La probabilidad de que una observación caiga entre dos valores es:

P (X1≤X≤X2) = X2 – X1

Rango

PROBLEMAS SECCION 16E 1. Generalmente le toma entre 1.2 y 1.7 horas aproximadamente hacer su tarea de

estadística. Los tiempos están distribuidos de manera uniforme. ¿Qué tan probable

es que usted termine a tiempo para reunirse con sus amigos dentro de 1.4 horas?

2. Las latas de alimentos para perros Puppy Chow tiene un promedio de 16 onzas, con

un rango de 4.2 onzas.

a) ¿Cuál es la lata más pequeña en onzas que usted puede comprar para un perro?

b) ¿Cuál es la lata más grande que usted puede comprar para su perro lobo llamado

Killer?

c) ¿Si usted selecciona una lata al azar, cual es la probabilidad de que pese entre 15.8 y

16.5 onzas?

3. El tiempo requerido para conseguir una pista de bolos en un local oscila entre 23.5 y

40.5 minutos. Asumiendo una distribución uniforme, si la probabilidad de que usted

tenga que esperar más de 30 minutos excede del 60%, usted piensa jugar golf. ¿Cual

bolsa debería colocar en su baúl, la bolsa de golf o la de bolos?

4. El agua utilizada por un car-wash para lavar los carros es de 30 galones por carros. Lo

menos que se utiliza son 27 galones, y su uso esta distribuidora uniformemente. Una

encuesta muestra que los carros no quedan limpios a menos que se utilicen 32

galones de agua en la lavada. ¿Qué porcentaje de carros que salen del car-wash

quedan limpios?

Page 72: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 72 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Distribución Normal: Es una distribución continua, pues se puede tomar cualquier

valor que este en un intervalo de valores dado. Aunque varios matemáticos han

contribuido a su desarrollo, su principal aporte se le debe al astrónomo matemático

Karl Gauss (siglo XIX). Existen dos razones básicas para definir que la distribución

normal es la más usada y más importante de todas en la Estadística:

1. Tiene algunas propiedades que la hacen aplicable a un gran número de situaciones

en las que es necesario hacer inferencias mediante la toma de muestras.

2. La distribución normal casi se ajusta a las distribuciones de frecuencias reales

observadas en muchos fenómenos, que incluyen características humanas (pesos,

alturas, IQ), resultados de procesos físicos (dimensiones y rendimientos), etc.

Características de la Distribución Normal

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene una forma de campana.

2. La media de la población distribuida normalmente cae en el centro de su curva

normal.

3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda

de la distribución se encuentran también en el centro; en consecuencia, para una

curva normal, la media, la mediana y la moda tienen el mismo valor.

4. Los dos extremos de la distribución normal de probabilidad se extienden

indefinidamente y nunca tocan el eje horizontal.

Se dice que no hay una sola distribución normal, sino una familia de curvas normales. Para

definir una distribución de este tipo, solo se necesitan dos parámetros: la media (µ) y la

desviación estándar (σ). No importa cuáles sean los valores de µ y σ para una distribución

normal, el área total bajo la curva es 1.00, destacando que las aéreas bajo la curva se

consideran como probabilidades.

Page 73: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 73 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Ya que puede existir un número infinito de distribuciones normales, cada uno con su propia

media y desviación estándar, es imposible analizar por separado cada una de ellas, por lo

tanto es necesario convertir todas estas distribuciones normales a una forma estándar. Esta

conversión a la distribución normal estándar se efectúa con la formula de conversión o

formula Z.

(Formula Z) Z = X - µ

σ

Valor de Z: Es el numero de desviaciones estándar a las que una observación estará por

encima o por debajo de la media.

PROBLEMAS SECCION 16F

1. La presión arterial diastólica entre las mujeres de 18 a 74 años de edad se encuentra

distribuida normalmente con una media de μ=80 mm Hg y una desviación Standard

de σ= 11.6 mm Hg.

a) ¿Cuál es la probabilidad de que una mujer elegida al azar tenga una presión arterial

diastólica menor de 65 mm Hg?

b) ¿Cuál es la probabilidad de que la mujer tenga la presión arterial diastólica mayor

que 85 mm Hg?

c) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica de

entre 60 y 90 mm Hg?

d) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica

superior a 70 mm Hg?

e) ¿Cuál es la probabilidad de que una mujer tenga una presión arterial diastólica de por

lo menos 80 mm Hg?

2. La distribución de pesos de la población de varones en Estados Unidos es

aproximadamente normal con una media de μ= 172.2 libras y una desviación

estándar de σ= 29.8 libras.

a) ¿Cuál es la probabilidad de que un hombre elegido al azar pese menos de 130 libras?

b) ¿Cuál es la probabilidad de que pese más de 210 libras?

c) ¿Cuál es la probabilidad de que un varón escogido al azar tenga un peso fuera del

rango de 130 a 210 libras?

d) ¿Cuál es la probabilidad de que pese más de 160 libras?

e) ¿Cuál es la probabilidad de que pese menos de 180 libras?

Page 74: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 74 Lic. Carlos A. Ávila (MAE Administración de Empresas)

3. En la zona noroccidental, la jefatura de transito ha determinado basado en hechos

históricos, que anualmente se presentan 8000 accidentes de tránsito con una

desviación estándar de 600.

a) ¿Cuál es la probabilidad de que en este año 2009 se presenten menos de 7500

accidentes?

b) ¿Cuál es la probabilidad de que en esta zona sucedan más de 9,000 accidentes?

c) ¿Cuál es la probabilidad de que transito reporte entre 7000 y 8500 accidentes?

d) ¿Que se presenten cuando mucho 8300 accidentes?

e) ¿Que no se presenten a lo sumo 9500 accidentes?

4. En una unidad de la Cruz Roja se midieron los niveles de colesterol en la sangre en un

grupo de personas mayores de 45 años resultados que arrojaron una media μ= 244

mg/100 ml y la desviación estándar σ= 51 mg/100 ml. A partir de estos datos estime:

a) ¿Cuál es la probabilidad de que el nivel de colesterol para este grupo sea de cuando

mucho 220 mg/100 ml?

b) ¿Cuál es la probabilidad de que una persona seleccionada al azar de este grupo tenga

más de 260 mg/100 ml?

c) ¿Si se establece que con un nivel de 300 mg/100 ml, una persona desarrollo una

enfermedad coronaria, Cual es la probabilidad de que un individuo padezca de una

enfermedad coronaria?

5. Una institución ha creado un programa de entrenamiento diseñado para mejorar las

habilidades de supervisión para aplicar en el departamento de producción de

cualquier empresa. Debido a que el programa es auto administrado, los supervisores

requieren un número diferente de horas para terminarlo. Bajo estudios anteriores, el

tiempo medio que se lleva para completar el programa es de 500 horas, con una

desviación estándar de 100 horas, normalmente distribuida. Encuentre la

probabilidad de que un participante requiera:

a) ¿Más de 450 horas para completar el programa?

b) ¿Entre 480 y 530 horas para finalizar el entrenamiento?

c) ¿A lo sumo 700 horas para finalizar el programa?

d) ¿Cuándo mucho 600 horas para finalizar el programa?

e) ¿Un máximo de 460 horas?

f) ¿Encuentre la media y la desviación estándar de la situación?

6. En su tercer año de funcionamiento, una liga de futbol tuvo un promedio de 16200

aficionados por juego, con una desviación estándar de 2500. De acuerdo con los

datos cual es la probabilidad de que el número de aficionados en cualquier juego sea:

Page 75: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 75 Lic. Carlos A. Ávila (MAE Administración de Empresas)

a) ¿Mayor de 20,000?

b) ¿Menor a los 10,000?

c) ¿Este entre 13,000 y 18,500?

d) ¿Por lo menos 12,000?

e) ¿Cuándo mucho 17,600?

7. Los sobrecostos por actualización de computadoras en su empresa tienen un

promedio de $23,500, con una desviación estándar de $9,400. Como director

ejecutivo de la división de investigación, usted no desea arriesgarse a más de 34% de

probabilidad que el sobrecosto en una actualización propuesta recientemente

exceda de $25,000. ¿Debería ejecutar la actualización?

8. Los empleados de una compañía trabajan un promedio de 55.8 horas por semana,

con una desviación estándar de 9.8 horas. Los ascensos son más probables para los

empleados que están dentro del 10% de los que pasan más tiempo trabajando.

¿Cuánto debe trabajar usted para mejorar sus oportunidades de ascenso?

Page 76: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 76 Lic. Carlos A. Ávila (MAE Administración de Empresas)

ANEXO

TABLAS ESTADISTICAS

Page 77: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 77 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 78: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 78 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 79: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 79 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 80: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 80 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 81: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 81 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 82: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 82 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 83: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 83 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 84: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 84 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 85: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 85 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 86: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 86 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 87: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 87 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 88: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 88 Lic. Carlos A. Ávila (MAE Administración de Empresas)

Page 89: Manual Estadistica I

Asignatura: ESTADISTICA I UNIVERSIDAD CATOLICA DE HONDURAS Página 89 Lic. Carlos A. Ávila (MAE Administración de Empresas)