Estadisticas y Probabilidades 1

78
UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION Facultad de Ingeniería Industrial, Sistemas e Informática ESTADISTICA y PROBABILIDADES MOISES E. ARMAS HUACHO, 2008

Transcript of Estadisticas y Probabilidades 1

Page 1: Estadisticas y Probabilidades 1

UNIVERSIDAD NACIONAL JOSE FAUSTINO SANCHEZ CARRION

Facultad de Ingeniería Industrial, Sistemas e Informática

EESSTTAADDIISSTTIICCAA yy PPRROOBBAABBIILLIIDDAADDEESS

MOISES E. ARMAS

HUACHO, 2008

Page 2: Estadisticas y Probabilidades 1

2

Presentación

A continuación se presenta una guía de prácticas de Estadística y

Probabilidades para que los alumnos puedan contar con un material

didáctico y tengan a la mano una serie de ejercicios y problemas de los

tópicos tratados en el desarrollo del presente curso.

Se hace esta publicación con el ánimo de contribuir a facilitarles el

proceso de aprendizaje y que este le sirva como guía preliminar para

compenetrarse en más profundidad revisando y ejercitándose con los libros

de texto que abundan en este curso y han sido enunciados en la bibliografía.

Un curso se hace interesante y didáctico cuando tiene una relación

con el entorno, micro y macro, y de paso de un sentido práctico a la carrera

elegida; en este sentido los problemas y ejercicios están orientados hacia

esto; como una mención adicional se introduce, al inicio de cada sección

frases célebres de los grandes hombres que tuvieron influjo en la sociedad e

invitan a la reflexión, tan necesario en nuestro medio.

Page 3: Estadisticas y Probabilidades 1

3

Sección 1

Frases para meditar:

Uno no puede alcanzar el éxito, son los

demás quienes lo brindan.

La inteligencia es arma de dos filos; con

muy poca, uno no se puede dar abasto,

con demasiada, uno pierde contacto con

la realidad, adolece del síndrome del

profesor distraído.

Cuanto más inteligente es una persona,

tanto más dependerá de sí misma.

Para llegar a ser una persona libre y

sana, tienes que aprender a ser diferente

Estadística Descriptiva

Estadística: Parte de la matemática, que proporciona un conjunto de

métodos utilizados para recolectar, resumir, clasificar, analizar e

interpretar los datos.

Datos: Conjunto de individuos o elementos que de por sí no tienen ningún

significado; pueden ser de naturaleza cualitativa o cuantitativa. Un tipo de

dato de naturaleza cualitativa expresa una cualidad, tal como el color de un

objeto, o el estado civil de una persona, etc.; un tipo de dato cuantitativo

expresa una cierta cantidad que puede ser medida en términos de una escala

de medida.

Recopilación de datos: Los diferentes tipos de datos con los cuales se

trabajan en la estadística, pueden ser recopilados mediante diferentes

procedimientos, los cuales dependen de las oportunidades y facilidades con

las que se cuentan; dentro de ellas podemos obtenerlas mediante:

Page 4: Estadisticas y Probabilidades 1

4

encuestas, entrevistas, diversas publicaciones, u observando directamente

el terreno de los hechos, cada metodología tiene sus propias

particularidades, ventajas y desventajas que deberán sopesarse al momento

de elegir la técnica más adecuada; las principales características de estas

técnicas se describen a continuación.

a) Encuestas. Mediante este procedimiento se recopilan datos ya

encasillados; para ello se diseñan formularios de preguntas donde el

encuestado contestará adecuándose a las características de las

respuestas presentadas en el formulario de la encuesta; el problema de

la veracidad de los datos podría ser si el que contestó lo dijo con

franqueza, sin omitirlo o sin mentirlo, o el tipo de pregunta estuvo mal

formulada, lo cual podría inducir a una respuesta equivocada; otro

problema que podría surgir es cuando las encuestas no son respondidas

en la medida de las expectativas; sin embargo su ventaja está asociado

a su costo y la rapidez de procesar la información.

b) Entrevistas. Mediante esta técnica se obtienen datos más fiables, dado

que se desarrolla un procedimiento de entrevista directa con la persona

a quién se desea obtener una información, para ello la persona que hará

la entrevistas, lo primero que deberá hacer es averiguar los

antecedentes de la información que deseará obtener, lo cual significa

que el entrevistador tendrá que ser una persona bien preparada, dado

que el entrevistador podría rehuir la respuesta correcta cuando las

preguntas no son bien formuladas o podrían comprometer alguna

situación que el entrevistado no quisiera dar. Es un buen procedimiento

para obtener informaciones más fidedignas, pero tiene el inconveniente

de ser costoso y de mayor tiempo de duración.

c) Publicaciones. Cuando las dos técnicas anteriores no son posibles

desarrollarlos o no son necesarios, pueden acudirse a esta fuente de

información; para ello existen diferentes medios publicitarios donde

podrían obtenerse los datos requeridos; así tenemos los que se ofrecen

a través de las revistas especializadas, libros, catálogos, periódicos,

tablas, informes, resúmenes, tesis, memorias, etc.

d) Observaciones. Finalmente, cuando no es posible obtener datos por

estos tres medios en razón de que lo que se desea obtener como fuente

de información es un producto nuevo, o no existen antecedentes sobre

ello, o no es conveniente las tres metodologías anteriores, puede

acudirse a la observación directa del fenómeno; esto consiste en que el

analista registrará paso a paso los acontecimientos observados para

luego ir seleccionado solo aquellos datos que les serán necesarios; es

Page 5: Estadisticas y Probabilidades 1

5

obvio que la calidad de los datos capturados, estará en función del

conocimiento del problema, experiencia y habilidad del investigador.

Escala de medida de datos. Cuando trabajamos con datos cuantitativos,

estos pueden expresarse en las escalas nominales, ordinales, de intervalos o

de razón.

Escala nominal. Se refiere cuando a un elemento se le asigna un solo

número que lo identifique; así, el número de DNI de una persona es

único, como lo es también con el número telefónico, etc.

Escala Ordinal. Está referido a que los elementos guardan una

numeración ordenada; por ejemplo, el orden de mérito de los alumnos

en un salón de clase; también pertenece a esta escala, las numeraciones

de las calles, etc.

Escala de Intervalos. Es una escala ordinal, con la diferencia de que

puede establecerse una razón de intervalo entre dos numeraciones; por

ejemplo si hablamos de dos estudiantes cuyos órdenes de méritos son

tercer puesto y décimo puesto, entonces podemos decir, que éste último

está alejado siete veces más que aquel.

Escala de razón. Es una escala de intervalos, con la diferencia con tiene

un punto de partida, que comienza del cero; los números que están

hacia su derecha representan los positivos, y lo que están a su izquierda

los negativos.

Solo con los datos pertenecientes a esta última escala, pueden desarrollarse

todas las operaciones aritméticas; con las otras pueden hacerse construirse

tablas y hacerse representaciones gráficas.

Redondeo de datos. Cuando se desarrollan cálculos aritméticos o se

obtienen datos, éstas se presentan con diferentes características que deben

expresarse en forma homogénea, para ello se hacen ciertas aproximaciones

convencionales que permiten reducir los márgenes de error; así por

ejemplo, el número 46,8 redondeado en unidades enteras es 47 porque el

0,8 está más próximo al uno que al cero, en consecuencia 46,8 está más

cerca a 47 que a 46. Sin embargo 46,81634 redondeado a milésimos (tres

decimales) es 48,816, porque el 0,0003 está más próximo al 0,0000 que al

0,0009. En el caso de querer redondear 46,8165 a tres decimales, podría

generarse un pequeño problema, ya que 0,0005 está a la misma distancia

de 46,816 que a 46,817; en vista de que no se sabe a cuál de ellos

redondearlo se utiliza el siguiente criterio:

Page 6: Estadisticas y Probabilidades 1

6

Así 46,8165 se redondea a 46,816 si el número que lo precede es par; en

este caso el número 6 es par.

46,8175 se redondea a 46,818 si el número que lo precede es impar,

como puede apreciarse, el 7 es impar.

Del mismo modo: 10,45 redondeado con un decimal es 10,4

10,55 redondeado con un decimal es 10,6

Dígitos significativos: Si un número se dice que está con buena precisión

como por ejemplo el número 1,7 significa, que éste está entre 1,65 y 1,75.

Los dígitos empleados, aparte de los ceros necesarios para localizar

el punto decimal se llaman dígitos significativos o cifras significativas.

1,7 tiene dos cifras significativas

3,472 tiene cuatro cifras significativas

9,72800 tiene seis

0,0245 tiene tres

0,002 tiene uno = 2 * 10-3

0,00493 = 4,93*10-3

tiene tres

Cálculos. Los resultados de las multiplicaciones, cocientes y raíces, solo

deben tener como dígitos significativos de uno de aquellos que tengan el

menor número de cifras.

Ejemplos: 3,875 * 2,14 = 8,0999 debe ser como cifras significativa 8,10

0,754 * 12,53 = 9,4478, su resultado final debe expresarse

en forma aproximada por 9,45, porque uno de los elementos

del multiplicador tiene dos cifras.

153,841/0,9214 = 166,9644; el resultado final debe

expresarse como 166,964; si se lo quiere expresar como un

entero será 167.

Información: Conjunto de datos procesados que proporcionan un

significado real; los siguientes ejemplos ilustran este concepto: a) El 90%

de los estudiantes provenientes de la educación secundaria de nuestro

sistema educativo, ocuparon el último lugar, entre concursantes similares

de otros países, en una olimpiada de matemáticas, b) De los quince mil

habitantes con las que cuenta una pequeña ciudad de la sierra peruana, diez

mil son varones y el resto mujeres; c) Sólo el 8% de los aficionados al

fútbol, creen que nuestra selección cuenta con buenos jugadores, capaces

de levantar la imagen de este alicaído deporte.

Page 7: Estadisticas y Probabilidades 1

7

División de la estadística; la estadística se divide en dos grandes grupos:

descriptiva e inferencial.

1. Estadística Descriptiva: Constituye un conjunto de métodos que

permite recolectar, clasificar, presentar y analizar datos de una

población o muestra; tal como lo dice su nombre, la estadística

descriptiva permite describir los hechos tal como suceden, sin

tergiversarlos ni desnaturalizarlos. Las conclusiones obtenidas serán

basadas en estos acontecimientos.

2. Estadística Inferencial: Esta parte de la estadística, permite extraer

conclusiones o predecir el comportamiento de una población en base a

los resultados de su muestra elegida al azar.

Población: Es una colección de individuos u objetos que poseen al menos

una característica en común; puede ser finita o infinita; es finita cuando sus

elementos son contables, e infinita, cuando son incontables. Generalmente

la población está asociada a números grandes; por ejemplo la población de

los habitantes de la provincia de Huaura, que es numerosa tiene una

característica en común, como el de estar habitando en ese lugar, etc.

Parámetro de una Población. Es una medida resumen que describe una

característica representativa; como unidades de medida se tienen la media

aritmética o el promedio al que se le simboliza por , la desviación

estándar al que se le simboliza por , su varianza poblacional 2 y la

proporción poblacional p.

Muestra: Parte de la población elegida mediante un proceso técnico

llamado muestreo; sus medidas se llaman estadísticos, dentro de los

cuales se tienen a la media aritmética y la desviación estándar,

simbolizados por x y s respectivamente; de igual manera se tiene la

varianza muestral y la proporción muestral. Ejemplo: El promedio de

ingresos mensuales de un grupo de ingenieros químicos que laboran en el

sector privado, seleccionados al azar, se le simboliza por x, y s a su

desviación estándar, si ambos se refieren a muestras poblacionales, de otro

modo se los denotará por y respectivamente.

Las técnicas de muestreo indican la forma cómo se seleccionarán

los elementos representativos de la población; para esto existen

básicamente cuatro tipo de muestreos: muestreo aleatorio simple,

Page 8: Estadisticas y Probabilidades 1

8

muestreo sistemático, muestreo estratificado y muestreo por

conglomerados.

a) El muestreo aleatorio consiste en individualizar a cada elemento de

la población y por sorteo o al azar, se selecciona a la muestra; esto

quiere decir quiere decir que cada elemento de la población tendrá

las mismas oportunidades de salir seleccionado. También puede

asignarse a cada elemento de la población un número, y

seleccionando al azar ése número, elegir al elemento muestral.

b) El muestreo sistemático sigue una técnica parecida al anterior, con

la diferencia que a la población se le asigna un número correlativo

y se los divide en tantos grupos como elementos muestrales desea

obtenerse, luego del primer grupo se selecciona a la muestra

utilizando la técnica anterior, éste número más el número total del

subgrupo, será la segunda muestra, y así sucesivamente. El

ejemplo aclarará el concepto: Supongamos que una población está

compuesta de 1 000 individuos y queremos obtener diez individuos

que los representen; para ello numeramos del 1 al 1 000 a los

individuos y lo dividimos en diez grupos de cien personas; del

primer grupo seleccionamos al azar a un individuo, si a éste le

corresponde el número 55, el siguiente será el 155, el tercero el

255, y así sucesivamente.

c) Muestreo sistemático a los elementos de la población se los divide

en grupos homogéneos: por sexo, grupos de edad, procedencia,

etc., y sus elementos muestrales son seleccionado siguiendo

cualquiera de las dos técnicas anteriores.

d) Muestro por conglomerados a los elementos de la población se los

divide en conglomerados más pequeños, luego se selecciona al azar

un conglomerado y de allí a los elementos muestrales, siguiendo las

técnicas anteriores.

Variable. Es una característica de la población o de la muestra el que

puede tomar diferentes valores. Se clasifican en dos grandes grupos,

cualitativa o cuantitativa; como ya hemos mencionado, las variables

cualitativas expresan una relación de cualidad como blanco, negro o rojo,

en cambio las cuantitativas expresan relaciones numéricas de cantidad; con

las variables cualitativas pueden representarse en forma numérica o de otra

forma pero no pueden desarrollarse operaciones algebraicas. Ejemplo, si la

variable estado civil de una persona se expresara como: Casado por 0,

Soltero por 1, Divorciado por 2 y Viudo por 3, entonces los números 0, 1,

Page 9: Estadisticas y Probabilidades 1

9

2, y 3 no indican ninguna relación entre sí, con los que podrían realizarse

operaciones aritméticas, sólo indican estados diferentes; sin embargo con

las variables cuantitativas si pueden desarrollarse las operaciones

aritméticas; estas pueden ser discretas o continuas; se dice que es discreta

cuando las variables toman valores enteros; por ejemplo cuando se cuenta

el número de personas que están reunidos en una sala de conferencias, y

continuas cuando toman cualquier valor dentro de un intervalo; por

ejemplo, el tiempo es una variable continua.

Las variables también pueden ser independientes o dependientes; se

dice que la variable es independiente cuando su valor depende de sí misma,

es decir que no está asociado a ningún otro factor; en cambio, una variable

es dependiente cuando su valor está asociado a la variable independiente;

por ejemplo, cuando se estudia la relación entre el nivel de consumo y el

nivel de ingresos de una persona, se tienen dos variables: consumo e

ingresos, el problema es decidir cuál es independiente y cuál dependiente;

es obvio que el nivel de consumo de una persona depende de su ingreso,

entonces se dice que el consumo es la variable dependiente y el ingreso la

variable independiente; de otro modo, puede afirmarse que el ingreso nada

tiene que ver con el nivel de consumo, por lo que aquel es una variable

independiente; de igual manera, el rendimiento académico de un alumno y

las horas dedicadas al estudio son dos variables, el rendimiento académico

es una variable dependiente, porque es dable suponer, que cuanto más horas

de estudio se dedica el alumno, su rendimiento académico tenderá a ser

mejor, de otra manera, ésta decaerá.

Se dice que una variable es aleatoria, cuando independientemente

puede tomar cualquier valor, sin estar sujeto a la voluntad del que lo

manipula; las variables aleatorias son parte inherente de la estadística,

debido a que se trabaja solo con variables aleatorias.

RReepprreesseennttaacciióónn ggrrááffiiccaa ddee ddaattooss.. Los datos procesados, según

correspondan a las necesidades de los interesados, pueden representarse

gráficamente, los cuales permitirán una mejor interpretación; para ello hay

distintas formas de hacerlo, dependiendo de la manera cómo se los quiere

representar y qué es lo que más se quiere resaltar; entre los diferentes tipos

de representarlos tenemos: gráficas de barras, gráficas circulares o de

pastel, gráficas de línea, histogramas, gráficas de áreas, etc., cada una de

ellas contienen sus propias particularidades y obedecen a una forma de

representar el comportamiento de los datos; en el mercado existen

diferentes tipos de software que simplifican el trabajo humano para hacer

Page 10: Estadisticas y Probabilidades 1

10

estas representaciones, la hoja de cálculo Excel, la más accesible a todos,

proporciona una serie de modelos de estas gráficas que pueden aprenderse a

utilizarlo fácilmente.

GGrrááffiiccoo ddee bbaarrrraass:: Pueden representarse datos cualitativos o cuantitativos;

este gráfico se expresa como un conjunto de rectángulos, cuya base

representa una característica del dato y la altura el número de

observaciones o cantidades proporcionales a éste.

Ejemplo 1.1 Consideremos el caso de una encuesta desarrollada a u grupo

de personas donde se averiguó su estado civil; la tabla 1.1 proporciona el

resumen obtenido.

TTaabbllaa 11..11 Estado civil de un grupo de pobladores

Estado civil Número de

personas

Soltero 12

Casado 25

Viudo 8

Divorciado 10

Los datos proporcionados en esta tabla corresponden a los del tipo

cualitativo, ya que no se pueden sumar solteros con casados, etc. Estos

datos pueden representarse mediante el diagrama de barras bidimensionales

en la siguiente forma:

0

5

10

15

20

25

30

Soltero Casado Viudo Divorciado

Fig. 1.1 Gráfico de barras de la Tabla 1.1

Page 11: Estadisticas y Probabilidades 1

11

También pueden representarse de otra manera, como un diagrama de barras

cilíndricas, mostrado en forma horizontal.

GGrrááffiiccooss cciirrccuullaarreess:: Sirven para hacer representaciones gráficas de datos

cualitativos; el conjunto de observaciones se muestra en forma circular;

cada porción de la observación es proporcional al valor observado; las

observaciones pueden expresarse en forma porcentual o absoluta, en el

sistema de coordenadas cartesianas; una forma parecida a ésta, es la gráfica

en pastel o tarta, en el que se puede vislumbrarlo espacialmente.

0 5 10 15 20 25

Soltero

Casado

Viudo

Divorciado

Fig. 1.2 Gráfico de barras cilíndrico de la Tabla 1.1

Soltero; 12

Casado; 25

Viudo; 8

Divorciado; 10

Soltero

Casado

Viudo

Divorciado

Fig. 1.3 Gráfico de tarta de la Tabla 1.1

Page 12: Estadisticas y Probabilidades 1

12

Este ejemplo, también se puede representar en forma circular, como el

siguiente:

Fig. 1.4 Gráfico circular correspondiente a la Tabla 1.1

Viudo

Soltero

Divorci

Casado

En general, la forma de representar gráficamente un dato, depende de su

respectiva naturaleza, y la forma cómo pudiese mostrar una mejor

presentación.

GGrrááffiiccooss ddee llíínneeaass:: Este tipo de gráfico está relacionado cuando existen

dos variables, una independiente y otra dependiente, o sea datos de tipo

cuantitativo y presentados en forma ordenada; cada valor de la variable

independiente va asociado con un valor de la variable dependiente,

representándose ambos en el sistema de coordenadas cartesianas; se

asocian los pares por cada uno de ellos ubicándolos en el plano, luego estos

puntos son unidos mediante segmentos de recta, tal como podemos

apreciarlo en la Fig. 1.5, correspondiente a los datos de la Tabla 1.2. sin

embargo debe comprenderse que esta característica no es excluyente solo

para datos cuantitativos, dado que los datos cualitativos también pueden

representarse, pero teniendo en cuenta que no habrá ninguna relación de

dependencia entre los datos mostrados.

Ejemplo 1.2 Consideremos el caso de dos variables, donde la

independiente denota la edad de una persona, y la dependiente su peso; la

Page 13: Estadisticas y Probabilidades 1

13

relación entre estas dos variables están expresadas mediante la siguiente

tabla.

Tabla 1.2 Edad versus peso de un grupo de personas

Edad en años Peso en kilos

5 18,5

10 32,3

14 42,8

19 52,1

25 65,2

34 67,9

40 72,3

Fig. 1.5 Gráfico de línea relacionando datos de la Tabla 1.2

GGrrááffiiccoo ddee bbaarrrraass ssuuppeerrppuueessttaass:: Conocido también como barras apiladas,

es utilizado cuando se quiere resaltar el total observado respecto a uno de

ellos. La Fig. 1.6 muestra este gráfico para los datos correspondientes a lo

proporcionado en la Tabla 1.1; la comparación puede ser en forma absoluta

o en forma porcentual; en este caso en forma absoluta.

12.5

22.3

42.8

52.1

65.267.9

72.3

0

10

20

30

40

50

60

70

80

5

Page 14: Estadisticas y Probabilidades 1

14

GGrrááffiiccoo ddee ttrroonnccooss:: Es parecido al gráfico de barras, con la diferencia que

se va anotando el número de observaciones que aparecen dentro de una

determinada clase de datos; esta clase de datos es conocida como el tronco,

y el conjunto de troncos proporciona el gráfico de troncos

NNúúmmeerroo ddee ccllaasseess ddee ddaattooss kk:: Para saber cuántas clases deben formarse de

un conjunto de datos, se puede seguir un criterio empírico de escoger entre

5 y 20 clases, dependiendo de la cantidad de datos que hay; también se

puede seguir otro criterio, como el conocido como la Regla de Stuges, el

cual indica que el número de clases o el número de troncos estará

constituido por el entero inmediato de k = 1 + 3,3*log10N, siendo N el

número total de datos; de este modo si tenemos 50 observaciones, entonces

habrán k = 1 + 3,3*log1050 = 7 clases de datos.

CCllaassee ddee ddaattooss:: Indica que dentro de ella, éstas tienen algunas

características comunes; por ejemplo, los alumnos en cualquier centro

educativo están agrupados en clases comunes como: primer ciclo, segundo

ciclo, etc., o primer año, segundo año, etc.

AAnncchhoo ddee ccllaassee:: Una vez determinado la cantidad de clases con las que

serán agrupados los números, será necesario determinar qué amplitud o

ancho deberá tener cada clase; para ello identificamos el mayor y el menor

y lo restamos, este resultado lo dividimos entre el número de clases, lo cual

finalmente nos dará el ancho de cada clase. Sabiendo este ancho de clase,

empezamos a formar todas las clases, comenzando desde el menor número,

hasta finalizar en el máximo.

12

25

8

10

0

10

20

30

40

50

60N

úm

ero

de

in

div

idu

os

Fig. 1.6 Gráfico de barras superpuestas para indicar el estado civil de las personas

Divorciado

Viudo

Casado

Soltero

Page 15: Estadisticas y Probabilidades 1

15

Ejemplo 1.3 Consideremos que las notas promocionales de 25 alumnos

del curso de Estadística y Probabilidades fueron los siguientes: 02, 12, 16,

14, 11, 10, 09, 06, 13, 04, 05, 08, 12, 11, 14, 10, 17, 07, 06, 13, 15, 10, 08,

18, 09. Construya un diagrama de troncos para este tipo de observaciones.

Solución. Como el número de observaciones son pocos, no es necesario

seguir la regla de Stuges, y podemos aplicar el criterio empírico de

subdividirlos en cinco clases, de ancho cuatro, donde el menor número será

cero y el mayor 20; de este modo construimos el rango de notas por cada

clase, y vamos marcando con un rectángulo el número de observaciones

que van apareciendo en cada clase, conforme se muestra en Fig. 1.7; por

ejemplo observamos que en la clase del 00 al 04, hay solo una nota, por lo

que se anota con el respectivo rectángulo.

Fig. 1.7 Gráfico de troncos, indicando la distribución de notas

promocionales de los alumnos del curso de Estadística y

Probabilidades. Rango de notas Número de alumnos

[00 – 04[ █

[04 – 08[ █ █ █ █ █

[08 – 12[ █ █ █ █ █ █ █ █ █

[12 – 16[ █ █ █ █ █ █ █

[16 – 20[ █ █ █

GGrrááffiiccoo ddee hhoojjaass:: Tiene las mismas características que el caso anterior,

con la diferencia que los datos que aparecen en el tronco son anotados uno

por uno, de modo que las características de la información se vean con más

detalles.

Continuando con el caso del ejemplo anterior, observamos que en

la primera clase, del 00 al 04, solo hay una nota el 02; entonces en esta

clase escribimos el 2; de igual modo, observamos que en clase

correspondiente del 16 al 20, hay tres notas: 16, 17 y 18, entonces en esta

clase, escribimos el 6, 7 y 8; y así sucesivamente; la Fig. 1.8 muestra los

resultados obtenidos.

Page 16: Estadisticas y Probabilidades 1

16

Fig. 1.8 Gráfico de hojas del ejemplo de las notas promocionales del

curso de Estadística y Probabilidades.

Rango de notas

Número de alumnos

[00 – 04[ 2

[04 – 08[ 6 4 5 7 6

[08 – 12[ 1 0 9 8 1 0 0 8 9

[12 – 16[ 2 4 5 2 4 3 5

[16 – 20[ 6 7 8

Ejemplo 1.4 Interpretación y análisis de datos: A continuación vamos a

presentar un caso de interpretación y análisis de datos, mediante su

representación gráfica; para ello, consideremos que en una determinada

empresa manufacturera, existen tres tipos de máquinas llenadoras de

botellas de cerveza, según la procedencia del país donde se los fabricó, los

que funcionan en base a microprocesadores y supervisados por un personal

técnico especializado; estas máquinas trabajan en los tres turnos del día; la

primera es de marca alemana, la segunda italiana y la tercera brasilera; los

registros de llenado de botellas de cerveza, por hora en miles de unidades

se indican en la siguiente tabla.

Tabla 1.3. Registro de llenado de botellas en miles de unidades/ hora,

de acuerdo a la procedencia de los equipos, según turnos de trabajo

Turno de Trabajo

Llenadora botella

según marca de

procedencia

Mañana Tarde Noche

Brasilero 25 32 26

Alemán 40 35 31

Italiano 35 37 39

Represente gráficamente el comportamiento de esta producción y analice

las observaciones más impactantes de acuerdo al tipo de máquina,

procedencia y otros elementos.

Solución:

Las características de presentación de estos datos pueden expresarse como

en las dos siguientes figuras.

Page 17: Estadisticas y Probabilidades 1

17

Fig. 1.9 Gráfico de tipo columna que registra el comportamiento de los

datos bivariados de la Tabla 1.3

Los datos observados se están representando mediante un gráfico de

columnas tridimensionales; en ella observamos que la producción de las

máquinas brasileñas son menores que sus similares, por lo que podemos

decir, que éstas son menos productivas que sus similares; además podemos

apreciar también, que quien mantiene uniformidad en la producción es la

máquina italiana, etc. Las mismas conclusiones también pueden extraerse

utilizando el gráfico tubular, representado horizontalmente en la siguiente

página.

0

5

10

15

20

25

30

35

40

MAÑANA TARDE NOCHE

25

32

26

40

35

31

3537

39

BRASILERO

ALEMAN

ITALIANO

Page 18: Estadisticas y Probabilidades 1

18

Fig. 1.10 Gráfico tipo tubular horizontal que representa el

comportamiento de los datos bivariados de la tabla 1.3.

EEjjeerrcciicciiooss ssoobbrree eessttaaddííssttiiccaa ddeessccrriippttiivvaa

1.1. Defina el concepto de estadística.

1.2. ¿Por qué puede ser importante para su carrera profesional, el estudio

de la estadística?

1.3. ¿De cuántas formas se clasifica la estadística, y de qué trata cada una

de ellas?

1.4. ¿Qué diferencia existe entre un estadístico y un parámetro?

Proporcione ejemplos para cada caso,

1.5. ¿A qué se define una población, y a qué una muestra?

1.6. ¿Cuál es la diferencia entre una muestra y una muestra aleatoria.

1.7. Enuncie las técnicas de seleccionar muestras aleatorias.

1.8. ¿En qué se diferencia un muestreo aleatorio simple de un muestreo

estratificado?

1.9. Explique las diversas formas en que pueden obtenerse los datos, ¿y

cuál considera ser la más apropiada?

1.10. ¿En qué se diferencia una encuesta de una entrevista?

0 10 20 30 40

MAÑANA

TARDE

NOCHE

ITALIANO

ALEMAN

BRASILERO

Page 19: Estadisticas y Probabilidades 1

19

1.11. ¿Qué técnica utilizaría para recopilar datos acerca del ingreso diario

que captan los negocios dedicados a brindar servicios de Cabinas de

Internet en las provincias de Huaura y Barranca?

1.12. ¿Porqué una entrevista podría ser mejor que una encuesta?

1.13. ¿En qué casos es más conveniente observar, antes que encuestar o

entrevistar, para recopilar datos?

1.14. Defina el concepto de variable, y enuncie sus clasificaciones.

1.15. Defina las escalas de medición de los datos.

1.16. ¿Pueden desarrollarse operaciones aritméticas con los datos

ordinales?, explique.

1.17. ¿De qué manera los datos pueden convertirse en información?,

proporcione ejemplos de estos casos.

1.18. ¿De qué manera puede explicarse objetivamente los datos

procesados?

1.19. ¿En qué casos se pueden usar las gráficas lineales?

1.20. Si usted está elaborando un nuevo producto y desea lanzarlo al

mercado para que sus clientes potenciales puedan comprarlo, y

como tal no sabe si este tendrá o no aceptación por parte de este

público, a fin de obtener mejor información sobre el estado de

ánimo de estos potenciales clientes, ¿qué técnica estadística

utilizaría para obtener esta información?

1.21. Explique las formas en que pueden graficarse los datos procesados.

1.22. En los gráficos circulares ¿pueden representarse variables

cualitativas?

1.23. La siguiente tabla presenta resultados del informe sobre desarrollo

humano hecho en el Perú:

Esperanza de vida al nacer 68,3 años

Hombres 65,9 años

Mujeres 79,9 años

Tasa de alfabetización de adultos 88,7%

Hombres 93,9%

Mujeres 83,7%

a) ¿Al conjunto de estos elementos puede considerarse como

estadística descriptiva o estadística inferencial?

b) Represente gráficamente el comportamiento de estas variables, de

acuerdo a los rubros principales, y dentro de ellos sus sub grupos.

1.24. La siguiente tabla muestra la evolución de siembras de algunos

productos agrícolas durante la campaña de producción, en el Perú,

comprendida entre los períodos del 2002 al 2004.

Page 20: Estadisticas y Probabilidades 1

20

Campaña Agrícola de Producción de Alimentos: Período 2002- 2004

Producción en Toneladas métricas Productos

Cultivados 2002-2003 2003-2004

Variación:

Tn

Variación

Porcentual

Total Nacional 1 388 912 1 339 930

Maíz amiláceo 227 654 220 734

Maíz amarillo 154 383

Papa amarilla 206 348 176 534

Papa negra 117 364

Arroz en cáscara 152 387 173 232

Cebada grano 106 201 99 864

Trigo 82 737 76 453

Yuca 293 822 252 732

Algodón rama 57834 60283 Fuente: …..

a) Complete los casilleros vacíos con sus respectivos datos y

explique las características de las tendencias de cultivos de estos

productos.

b) ¿De qué manera puede explicarse el contenido de estas cifras?

1.25. ¿En qué circunstancias los siguientes numerales pueden ser

considerados como poblaciones, y en qué otros pueden ser muestras?:

a) Los estudiantes de la UNJFSC.

b) Los estudiantes del sistema universitario peruano.

c) Cemento Tipo V, exportada el pasado año a los mercados del grupo

andino.

d) Las mujeres que mueren por aborto en el Hospital de Barranca.

e) Los automóviles que circulan por el frontis de la Universidad en un

día cualquiera.

f) Cantidad de toneladas de cemento producidos en el Perú.

g) Consumo de ácido cítrico en la industria alimentaria durante el mes

pasado.

1.26. Redondee los siguientes números en las siguientes cifras decimales:

a) 123,4859 tres decimales

b) 0,89755 cuatro decimales

c) -85,4855 dos decimales

d) 100,355 un decimal

1.27. ¿Cuáles de las siguientes proposiciones son verdaderas, y cuáles

falsas?, sustente su respuesta:

a) Una población es una agrupación de elementos inconmensurables.

Page 21: Estadisticas y Probabilidades 1

21

b) Un estadístico representa el dato de una población.

c) La estadística inferencial proporciona conocimientos generales.

d) La estadística inferencial permite generalizar conclusiones.

e) Una muestra puede tener elementos infinitos.

f) Los datos cualitativos pueden expresarse gráficamente mediante

diagrama de barras o diagramas circulares.

g) Una encuesta proporciona mejores elementos de información que

una entrevista.

h) La estadística descriptiva permite mostrar casos particulares.

i) Una muestra aleatoria no necesariamente representa a la

población.

j) La estadística es una técnica cualitativa que permite procesar

datos.

k) El parámetro es un valor representativo de una muestra.

l) Los estadísticos y los parámetros son los mismos.

1.28. El siguiente cuadro muestra el proyecto de presupuesto asignado al

Ministerio de Agricultura para el año 2006: Sector agricultura: Presupuesto 2005-2006

Millones S/. Variación Estructura %

Pliego PIA 2005 PIA 2006 Mill S/ % 2004 2005

Minag 373,4 414,5 41,2 11,0 68,1 72,5

Senasa 55,9 48,3 -7,6 -13,6 10,2 8,4

Conacs 5,3 5,3 0,0 0,4 1,0 0,9

Inrena 68,0 57,7 -10,3 -15,1 12,4 10,1

INIEA 45,9 45,7 -0,2 -0,4 8,4 8,0

Total 548,5 571,6 23,1 4,2 100,0 100,0 Fuente: La revista Agraria, N° 68, Setiembre del 2005. Diario la República, 14/10/05

Represente gráficamente el comportamiento de estos datos, y explique

las características asignadas a cada pliego, así como los cambios

totales, según muestra el cuadro.

1.29. En la provincia de Huaura, un día cualquiera se entrevista a un

conjunto de 200 personas para saber si estos estarían de acuerdo que en

la ciudad de Huacho se constituya una universidad particular; de este

grupo, 80 manifestaron no estar de acuerdo con ello:

a) ¿Cuál es la muestra?

b) ¿Cuál es la población?

c) La respuesta proporcionada, ¿a qué tipo de información

corresponde?

Page 22: Estadisticas y Probabilidades 1

22

1.30. En los siguientes casos, ¿cuáles representan variables aleatorias

discretas y cuáles continuas?

a) Cantidad de kilocalorías que consume por día una persona.

b) Toneladas de cemento producido mensualmente por una planta.

c) Número de ladrillos comercializados por una distribuidora de

materiales de construcción.

d) Tiempo de llegada entre los clientes de un banco a una ventanilla.

e) La difusión de la luz en el firmamento.

f) Número de llamadas telefónicas registradas por la operadora de una

central telefónica.

g) Tiempo de llegada de un atleta en una maratón de 10 kilómetros.

h) Número de pacientes infectados con el virus del SIDA en un

hospital.

i) Cantidad de gas emitido por una fundición en un turno de trabajo.

j) Volumen de combustible transportado por un camión cisterna.

k) Nivel concentración de plomo en la sangre de una persona.

l) Virus y bacterias lanzadas en el escenario de una guerra química.

1.31. ¿Es la materia una variable aleatoria continua?

1.32. Una empresa cuenta con cuatro máquinas que les permite envasar

cajas de aceite; estas máquinas trabajan a tres turnos por día; los

registros de cantidad de aceites envasados en los tres turnos de trabajo

se indican en la siguiente tabla.

Registro de cajas de aceite envasadas según tipo de máquinas y

turnos de trabajo. Tipo Máquina Mañana Tarde Noche

A 302 312 366

B 240 401 411

C 334 286 298

D 285 253 319

Represente gráficamente el comportamiento de esta producción e

indique las observaciones más resaltantes.

1.33. ¿Qué tipo de variable representa el sonido?

1.34. ¿Puede considerarse el criterio de clasificación de las razas, en el

reino animal, como variables, y si así lo fuere cómo lo graficaría?

1.35. Como consecuencia del éxito de los megamercados implementados

en la ciudad de Lima, los promotores de esta están interesados en abrir

nuevos centros comerciales en diferentes ciudades del país; para ello

deben hacer estudios de mercado de modo que permita evaluar la

perceptibilidad de los clientes potenciales; para tales fines se considera

Page 23: Estadisticas y Probabilidades 1

23

como factor de evaluación, la ubicación, la oferta de precios, trato de

personal, sistema de créditos y otros factores (higiene, entretenimiento,

remates, facilidades de crédito, etc.) en diferentes días de la semana; de

este modo se entrevistó a 500 clientes potenciales y se determinó los

siguientes resultados: El 23 % decía que un factor importante era la

ubicación del centro comercial, el 27 % decía que era importante la

oferta de precios, un 11% decían que era importante el sistema de

créditos, 20% optaba como factor importante el trato de personal, y el

resto se inclinaba por otros factores. Represente gráficamente el

comportamiento de estas respuestas y explique las conclusiones que

pueda obtener.

1.36. La siguiente tabla muestra la composición atómica de la bacteria

Escherichia coli en los seres vivos:

Porcentaje de composición atómica de la bacteria Escherichia coli

en los seres vivos Elemento Humanos Alfalfa Bacterias

Carbono 19,37 11,34 12,14

Hidrógeno 9,31 8,72 9,94

Nitrógeno 5,14 0,83 3,04

Oxígeno 62,81 77,90 73,68

Fósforo 0,63 0,71 0,60

Azufre 0,64 0,10 0,32 TOTAL 97,90 99,60 99,72

Fuente: Biología; Helena Curtis; N. Sue Barnes; Ed. Panamericana, Sexta ed.

Construya un gráfico y explique cualitativa y cuantitativamente la

existencia de estos elementos en los seres vivos.

1.37. Según estadísticas de la DIPROCT/PNP, relacionadas con las

causas de los accidentes de tránsito ocurridos en Lima metropolitana,

en el período Enero – Octubre del 2004, fueron atribuidos los

siguientes factores: El 27,7% se debía a la Imprudencia del conductor;

el 17,9% a la Imprudencia del peatón; el 13,5% a la Ebriedad del

peatón; el 12,1% por Exceso de velocidad; el 6,5% por Ebriedad del

conductor, y el porcentaje restante a otros factores (mal

funcionamiento de los semáforos, malas condiciones de la pista, etc.);

también en relación a estas causas, los accidentes fueron reportadas en

diferentes días de la semana; de este modo se reportó que el 35% de

ellos ocurrió los días sábados, el 40% los domingos, y el 25% otros

días. Mediante una representación gráfica del comportamiento de este

Page 24: Estadisticas y Probabilidades 1

24

fenómeno explique las principales causas de los accidentes,

considerando que durante este período se registraron 562 accidentes.

1.38. La siguiente tabla muestra datos mundiales de producción de

camote anaranjado durante el año 2003:

Camote: datos mundiales 2003

Superficie

miles h.

Rendimiento

t/h

Producción

millones t

Mundo 9 026.10 13,49 121 799

Asia 6 126,71 17,56 107 583

África 2 494,99 4,32 10 787

América 291,05 9,58 2 788

Oceanía 113,35 5,66 641 Fuente: ……..

Represente gráficamente las características de esta producción y

explique la naturaleza de los datos.

1.39. En los siguientes casos indique cuál es la variable independiente, y

cuál la variable dependiente:

a) Temperatura vrs. Calor.

b) Velocidad vrs. Distancia recorrida.

c) Consumo vrs. Nivel de ingresos.

d) Peso vrs. Estatura de una persona.

e) Utilidad vrs, Oferta.

f) Cantidad de software vendido vrs. Número de estudiantes de

informática.

g) Rendimiento académico vrs. Horas de estudio.

h) Número de habitantes de una ciudad vrs. Tiempo transcurrido.

i) Velocidad de reacción vrs. Presión.

j) Peso de una persona vrs. Calorías consumidas.

k) Compra de vestidos vrs. Nivel cultural de la persona.

l) Estatura de una persona vrs. Edad de la misma.

m) Producto bruto interno vrs. Años transcurridos

n) Llegada de turistas al país vrs. Nivel de consumo del país

o) Preferencia de platos típicos vrs. Nivel de información respecto a

la existencia de platos típicos.

p) Fortalecimiento del Nuevo Sol, frente a la moneda norteamericana.

q) Alza del precio de los pasajes. Vrs. Precio del petróleo.

r) Aumento del terrorismo a nivel internacional vrs. Situación

económica de los países en vías de desarrollo.

s) Contaminación ambiental vrs. destrucción de la capa de ozono.

Page 25: Estadisticas y Probabilidades 1

25

t) Número de postulantes a la universidad vrs. número de egresados

de la misma.

1.40. Utilizando la matriz de insumo-producto de 1994 que el Mincetur

utiliza, se ha determinado el empleo neto resultante de la aplicación del

TLC, como se muestra en la siguiente tabla:

Efectos directos del TLC Perú_EE.UU. en la creación de puestos

de trabajo Sector Efecto directo

por incremento

de exportaciones

(1)

Efecto directo

por incremento

de importaciones

(2)

Saldo neto

Número de

puestos de

trabajo (1-2)

Total 32 552 -27 108 5 444 Agricultura, caza

y silvicultura 18 578 -13 552 5 026

Fabricación de

textiles 1 870 - 1 798 72

Fabricación de

prendas de vestir 4 161 -842 3 219

Extracción de

minerales 1 733 -109 1 624

Otros sectores 6 210 -10 807 -4 597 Fuente: Bruno Seminario y Oswaldo Molina (setiembre 2004) Revista Agraria

N° 60 - La República, Nov. 2004

Gráficamente, analice el comportamiento de estas variables

1.41. El régimen del gobierno de Alberto Fujimori, en los años de 1990 al

2000, destinó los fondos de la privatización del siguiente modo: para el

pago de la deuda externa US $ 1 053, para la compra de armas $ 992,

para el gasto social politizado $ 1 356, para el gasto social normal $

528, y para otros rubros la cantidad de $ 429, todas estas cifras en

millones. Construya una tabla y su respectivo gráfico indicando el

comportamiento de estos pagos y explique, desde su concepción, la

naturaleza de estos ¿Considera que estos gastos estuvieron bien

orientados, o es que generó una fuente de corrupción, como se

considera hoy en estos tiempos?

1.42. ¿Para qué sirve la Regla de Stuges?

1.43. ¿Qué información proporciona un diagrama de hojas?

1.44. ¿Hasta cuántas clases pueden conformarse en un conjunto de

observaciones?

Page 26: Estadisticas y Probabilidades 1

26

1.45. La siguiente tabla presenta cifras proyectadas del presupuesto de

ingresos del gobierno del Gobierno Central, para el año 2006, en

millones de Nuevos Soles:

Proyección de ingresos del Gobierno Central

(Millones de Nuevos Soles)

Años 2002 2003 2004 2005 2006

1.Gob. Central 28 307 30 872 33 426 36 113 39 529

Tributarios 24 048 26 953 29 347 31 698 34 598

Renta 6 011 8 020 8 335 9 516 10 642 Importación 2 487 2 560 2 782 2 873 2 998 IGV (incluye IPM) 12 611 13 958 15 690 16 534 18 323 ISC 4 184 4 550 5 000 5 370 5 796 Otros ingresos 1 737 1 295 1 340 1 414 1 165 Devoluc. Tributos -2 983 -3 430 -3 800 -4 008 -4 327 No Tributarios 4 258 3 919 4 079 4 416 4 931

2. Otras entidades 5 667 5 555 5 980 6 212 6 491

3. Total Ingresos 33 974 36 427 39 407 42 326 46 019

Explique el comportamiento de las proyecciones de estas cifras

macroeconómicas.

1.46. En la siguiente tabla se proporciona información de la evolución de

los sueldos y salarios en el país, en el último semestre del 2006, cifras

proporcionadas por el Ministerio de Trabajo, y publicadas por el Diario

el Comercio, el día 14 de julio de 2007.

Remuneraciones mensuales en Nuevos Soles

Sector productivo Sueldo de

Empleados

Salario de

Obreros

Agricultura 2 024 741

Minería 4 374 2 385

Industria 2 444 953

Electricidad, gas y agua 2 938 1 787

Construcción 2 015 1 236

Comercio 2 153 946

Transporte, almacenamiento

y comunicaciones

2 300 1 040

Establecimientos financieros

y seguros

2 772 993

Servicios gubernamentales 1 905 841

Page 27: Estadisticas y Probabilidades 1

27

Comente, analítica y gráficamente el comportamiento de estas

remuneraciones en los diferentes sectores productivos de nuestra

sociedad.

1.47. Considere que mediante una encuesta desarrollada a través de los

alumnos, acerca de los ingresos mensuales percibidos por los

pobladores de una determinada región, permitieron recaudar los

siguientes sueldos y salarios: 1400, 1890, 1600, 1400, 1300, 750, 900,

1100, 1250, 650, 2400, 1700, 1350, 1380, 1540, 1560, 1610, 1615,

1610, 840, 1100, 1205, 1100, 760, 2300, 1990, 2000, 2308, 3000,

1300, 1265, 1150, 950, 980, 1200, 1950, 1875, 2654, 2535, 2900,

1500, 1620, 1290, 1350, 1410, 1580, 1700, 1890, 1900, 1856, 1700,

1650, 1740, 1680, 1800, 2100, 2110, 2200, 1985. Construya un

diagrama de árbol y un diagrama de hojas, de modo que represente

gráficamente el comportamiento de los ingresos mensuales; para ello

haga una subdivisión de estos datos en cinco sub intervalos.

1.48. ****

Page 28: Estadisticas y Probabilidades 1

28

Sección 2

Frases para meditar:

Cuando hayas logrado modificar tus

pensamientos, entonces empezarán a

surgir nuevos sentimientos y habrás

dado el primer paso en tu camino hacia

tu libertad

Que las equivocaciones o el error te

sirvan de lección, haz el propósito de no

repetirlas.

El enemigo no es tan grande como

parece. Lo que sucede es que lo

vemos así porque estamos de

rodillas... ¡de pie¡

Distribuciones de Frecuencia

Consideremos el siguiente ejemplo: supongamos que de una

encuesta hecha a un grupo de alumnos de una universidad, se han

registrado sus respectivas edades en años, cuyos resultados fueron los

siguientes: 23, 25, 17, 26, 20, 21, 26, 24, 19, 16, 20, 23, 29, 19, 17, 23,

25, 24, 19, 16, 15, 22, 23, 27, 31, 24, 21, 20, 18, 25, 23, 28, 21, 24, 24, 18,

20, 23, 22, 19, 22, 17, 26, 23, 24, 22, 21, 20, 29, 23, 30.

Estos datos de por sí no proporcionan mucha información

respecto a la edad de los alumnos; así por ejemplo podría interesarnos

saber cómo están distribuidos estas edades, o qué porcentaje de alumnos

son menores de 22 años, o saber si existen demasiados alumnos mayores,

o qué tendencias muestran el comportamiento de estas edades, etc.; para

poder analizarlo y encontrar una información utilitaria, es necesario

agruparlos en un determinado número de clases, tal como se explicó en el

capítulo anterior; ello nos permitirá analizar el conjunto de ellos y extraer

conclusiones que podrán apoyar una mejor toma de decisiones.

Agrupándoles en cualquier determinado número de clases

podremos apreciar en primera instancia, que las edades de los alumnos

están comprendidos entre los 15 y 31 años, el alumno de menor edad, o el

más joven tiene 15 años, y el de mayor edad tiene 31 años; una

Page 29: Estadisticas y Probabilidades 1

29

apreciación simple nos permitirá manifestar que el rango de edades

es de 16 años; de este modo podemos seguir prosiguiendo con una serie

de análisis los cuales nos permitirán encontrar otros elementos de

información, induciéndonos a una toma de decisiones en un proceso de

gestión, que pueden afectar los resultados de la organización. Para

uniformizar y comprender algunos términos, es preciso conocer los

términos utilizados en la estadística, que a continuación mostramos.

AAmmpplliittuudd ddee ddaattooss oo rraannggoo ddee ddaattooss:: Es la diferencia entre el mayor

valor observado y el menor valor observado.

CCllaassee:: Es un grupo de datos que contienen por lo menos una

característica en común. Ejemplo; en el servicio militar se agrupa a todas

las personas por año de nacimiento; si nacieron en 1988, se dice que

pertenecen a la clase 88, si nacieron en el año 2000, se dice que

pertenecen a la clase 2000, etc.; en los colegios los alumnos están

clasificados de acuerdo al año que están cursando; a los sectores

socioeconómicos de la sociedad se los pueden clasificar en cinco clases,

como las que conocemos, en concordancia a sus ingresos familiares: A.

B, C, D, E; de este modo los que pertenecen a la clase A puedes estar

incluidos las familias cuyos niveles de ingresos mensuales son los más

altos que los demás, y así sucesivamente.

AAnncchhoo ddee ccllaassee oo iinntteerrvvaalloo ddee ccllaassee:: Es la diferencia entre el mayor

valor y el menor valor de la respectiva clase.

NNúúmmeerroo ddee ccllaassee:: Como se explicó en el capítulo anterior, dependiendo

de la cantidad de observaciones, los datos pueden ser agrupados entre 5 y

20 clases; pero si aplicamos la regla de Stuges: K = 1 + 3,3 log10N,

podemos tener un número de clases ya explícito, donde K representa el

número de clase y corresponde a su entero inmediato y N el total de

observaciones.

Dividiendo la amplitud de datos entre el número de clases, se obtiene la

amplitud de clase = K

datosdeAmplitud __, que también es conocida

como intervalo de clase o ancho de clase.

Page 30: Estadisticas y Probabilidades 1

30

MMaarrccaa ddee ccllaassee:: Es el punto medio de una clase, igual a xi =

2

1ii LL donde Li representa el límite inferior de la clase y Li+1 su

límite superior.

NNúúmmeerroo ttoottaall ddee oobbsseerrvvaacciioonneess:: Es la suma total de los elementos de la

población N o muestra n, y es N = n= x1 + x2 + …+xk, donde cada valor

de x representa un valor observado; cuando los datos se presentan

agrupados en clases se representan por N = n = ki

i

if1

siendo fi el

número de veces que aparece un valor para una clase i.

FFrreeccuueenncciiaa aabbssoolluuttaa:: Es el número de observaciones que aparece en una

clase, se le denota por fi..

FFrreeccuueenncciiaa rreellaattiivvaa:: Es la relación entre la frecuencia absoluta y el

número total de observaciones; también expresa una proporción de la

clase o un porcentaje de las observaciones, se le denota por hi = N

fi.

FFrreeccuueenncciiaa aabbssoolluuttaa aaccuummuullaaddaa FFrr:: Es la suma acumulada de

frecuencias absolutas correspondientes a la clase r; está expresado por

Fr = r

i

rf1

.

FFrreeccuueenncciiaa rreellaattiivvaa aaccuummuullaaddaa HHrr:: Es la suma acumulada de las

frecuencias relativas correspondientes a la clase r; de igual manera se lo

expresa por Hr =

r

i 1

ih .

TTaabbllaa ddee ddiissttrriibbuucciioonneess ddee ffrreeccuueenncciiaa:: Es la tabla donde se muestra en

forma cuantitativa las clases, marcas de clase, frecuencias de clase

(frecuencias absolutas y relativas), y frecuencias acumuladas (absolutas

y relativas), todas ordenadas en forma ascendente.

La tabla 2.1, denotada tabla de distribución de frecuencias

permite presentar de una manera objetiva el comportamiento de las

edades de una muestra de 820 alumnos captados de una universidad.

Estas edades se han agrupado en seis clases cuyos anchos tienen la

Page 31: Estadisticas y Probabilidades 1

31

misma amplitud, presentados en un intervalo semi abierto por la

derecha; la primera clase está comprendida entre los 14 y 17 años, sin

incluir a esta última, y así sucesivamente. El rango total de las edades de

estas observaciones varía entre: 32 – 14 = 18 años, dividido entre 6,

proporciona un ancho de clase de 3 años.

Tabla 2.1 Distribución de frecuencias de edad de los alumnos

de la Universidad en el año …. Clase:

I

Marca de

clase

xi

Frecuencia

absoluta

fi

Frecuencia

relativa

hi

Frecuencia

absoluta

acumulada

Fi

Frecuencia

relativa

acumulada

Hi

[ 14 - 17[ 15,5 65 0.0793 65 0.0793

[ 17 - 20[ 18,5 167 0.2037 232 0.2829

[ 20 - 23[ 21,5 321 0.3915 553 0.6744

[ 23 - 26[ 24,5 186 0.2268 739 0.9012

[ 26 - 29[ 27,5 64 0.0780 803 0.9793

[ 29 - 32[ 30,5 17 0.0207 820 1.0000

Total 820

Fuente:….

Elaboración: …

NNoottaa::

1. Para construir esta tabla se omitió la regla de Stuges, por cuestiones de

comodidad y practicidad es que se dispuso esta forma de presentarlo.

2. Cuando se presentan tablas que proporcionan cualquier tipo de información,

deberán indicarse, cuándo y dónde se los obtuvieron, los cuales pueden ser

indicados a través de la Fuente, y si éstos fueron procesados previamente

por el autor, los cuales pueden ser indicados en Elaboración; de este modo

estaremos mostrando que los datos con los cuales trabajaremos y con los que

eventualmente podremos tomar decisiones, tendrán sustento sólido, dado que

están basadas en situaciones objetivas o reales.

HHiissttooggrraammaa:: La definición clásica manifiesta que este es un conjunto de

rectángulos formados por las clases y sus respectivas frecuencias

absolutas o relativas; con el avance de la informática y el desarrollo de

nuevos paquetes de software, este concepto no se presenta rigurosamente

como tal, dado que los histogramas no necesariamente pueden presentarse

tal como lo manifestado, dado que existen otras formas también de

hacerlo; si utilizamos el espacio tridimensional, pueden presentarse en

Page 32: Estadisticas y Probabilidades 1

32

forma cilíndrica o formas de paralepípedos, etc.; en las

siguientes figuras se presentan diversas formas de histogramas para un

solo tipo de casos.

De este histograma podemos extraer algunas conclusiones:

a) Pocos son los alumnos comprendidos entre los 14 y 17 años.

b) Alumnos comprendidos entre los 29 y 32 años, representan una

minoría respecto al total.

c) La mayor cantidad de alumnos están comprendidos entre

lo s 20 a 23 años.

d) El promedio de edad de los alumnos está comprendido entre los 20 y

23 años.

e) La mayoría de los alumnos se concentran alrededor de los 20 a 23

años, etc.

La figura 2.3 permite apreciar el comportamiento de edades de los

alumnos del mismo caso.

14 -17

17 - 20

20 -23

23 -26

26 -29

29 - 32

0

50

100

150

200

250

300

350

1

Can

tid

ad d

e al

um

no

s

Grupos de edad (En años)

Fig. 2.1 Histograma presentada en forma

tradicional, que muestra la distribución de las

edades de los alumnos de una universidad .

14 -17

17 - 20

20 -23

23 -26

26 -29

29 - 32

Page 33: Estadisticas y Probabilidades 1

33

Fig. 2.4 Histograma mostrado en forma columnas tridimensionales, el que

presenta las distribuciones de edades de los alumnos de una universidad.

0

100

200

300

400

14 -17

17 - 20

20 -23

23 -26

26 -29

29 - 32

Can

tid

ad d

e al

um

no

s

Grupos de edad (En años)

Fig. 2.3 Histograma mostrado en forma cilíndrica, el

que presenta las distribuciones de edades de los

alumnos de una universidad.

14 -17

17 - 20

20 -23

23 -26

26 -29

29 - 32

0

50

100

150

200

250

300

350

11 -14 14 -17 17 -20

20 -23 23 -26 26 -29 29 -32

32 -35

0

65

167

321

186

64

170

Page 34: Estadisticas y Probabilidades 1

34

Como podemos apreciar, el histograma de la Fig. 2.3 tiene una

presentación tridimensional, lo cual puede generar mayor impacto visual,

lo cual podría coadyuvar a una mejor toma de decisiones; en la figura 2.4

también lo podemos presentar mediante barras tridimensionales, que

también podría generar otro tipo de impacto visual.

PPoollííggoonnoo ddee ffrreeccuueenncciiaass:: Figura geométrica que se obtiene uniendo las

marcas de clase con las frecuencias posteriores (absolutas o relativas).

OOjjiivvaa oo ccuurrvvaa ddee ffrreeccuueenncciiaa aaccuummuullaaddaa:: Es una curva geométrica

formada por las frecuencias absolutas o relativas acumuladas, con sus

respectivas clases: la curva corresponde a una función continua, que tiene

como cota inferior el mínimo valor de la clase inferior, y como cota

superior el máximo valor de la última clase. En el caso de la frecuencia

absoluta acumulada, el último punto debe ser igual al total de

observaciones, y en la ojiva de la frecuencia relativa acumulada, el último

valor es igual uno.

Fig. 2. 5 Polígono de frecuencias de la distribución de edades de los

alumnos de una universidad.

Edad Frec

11 -14 0 14 -17 65 17 - 20 167 20 -23 321 23 -26 186 26 -29 64 29 - 32 17

32 - 35 0

0

50

100

150

200

250

300

350

11 -14 14 -17 17 - 20 20 -23 23 -26 26 -29 29 - 32 32 - 35

Page 35: Estadisticas y Probabilidades 1

35

Fig. 2. 6 Ojiva de la distribución de edades de los alumnos.

De la tabla de frecuencias y de sus respectivas figuras

geométricas, pueden seguirse extrayendo una diversidad de

conocimientos y conclusiones, los que podrán contribuir a apoyar a una

mejor toma de decisiones; los siguientes casos proporcionan los

siguientes conocimientos:

a) Cantidad de alumnos menores de 20 años: La frecuencia absoluta

acumulada proporciona la respuesta: 232 alumnos

b) Cantidad de alumnos mayores de 23 años; de igual manera, la columna

correspondiente a la frecuencia absoluta acumulada proporciona esta

información: Total de alumnos – alumnos comprendidos entre 14 y 23

años: 820 – 553 = 267; también puede determinarse sumando los fi de las

clases que corresponden a estas edades: 186 + 64 + 17 = 267.

Por otro lado, hay que tener en cuenta que no siempre la tabla

podrá proporcionar respuestas directas como los ejemplos presentados;

cuando esta situación no se da, deberán desarrollarse procesos de

aproximación matemática utilizando interpolación y razones geométricas;

en los dos siguientes ejemplos se proporcionan los procedimientos del

que deberán seguirse cuando esos casos sucedan:

c) Cantidad de alumnos comprendidos entre los 18 y 25 años.

Como no se puede obtener una respuesta directa, se hace el

siguiente razonamiento: En la columna correspondiente a la frecuencia

065

232

553

739803 820

0

100

200

300

400

500

600

700

800

900

11 -14 14 -17 17 - 20 20 -23 23 -26 26 -29 29 - 32

Page 36: Estadisticas y Probabilidades 1

36

absoluta, en la clase de 17 a 20 años, hay 167 alumnos, en la clase

de 20 a 23 años hay 321 alumnos, y en la clase 23 a 26 años hay 186

alumnos; se busca calcular el número de alumnos comprendidos entre los

18 y 25 años; observando el diagrama lineal se nota que dicho valor

estará conformado por la suma de x + 321 + y alumnos; x, y se obtiene

por interpolación lineal de la ojiva o utilizando razones geométricas, en

forma matemática:

x

321

y

17 20 23 25 2618

167 186

167

1720 ==

x

1820 de donde x = 111,3;

186

2326 ==

y

2325 por lo que y = 124; de este modo entre los 18 y 25

años hay un total de 526 alumnos.

d) ¿Qué proporción de alumnos son menores de 21 años?

Siguiendo el mismo procedimiento, en la columna correspondiente a las

frecuencias relativas se obtiene el siguiente esquema:

0,0793 0,2037 x

14 17 20 21 23

Estableciendo las razones geométricas:

15,39,0

2023 =

x

2021, de donde x = 0,1305; luego, la proporción de

alumnos menores a los 21 años es: 0,0793 + 0,2037 + 0,1305 = 41,35%.

CCuurrvvaass ddee ffrreeccuueenncciiaa oo ccuurrvvaass ddee tteennddeenncciiaa: Curva suave y continua

que representa una curva de tendencia de la distribución de frecuencias

teóricas de la población; es el límite del histograma y del polígono de

Page 37: Estadisticas y Probabilidades 1

37

frecuencias cuando el número de valores de la muestra es muy

grande y los intervalos de clase muy pequeños.

Curva simétrica: Cuando las curvas de frecuencias se asemejan a la

figura de una campana, se dice que es simétrica porque los datos

observados se distribuyen en la misma proporción a ambos extremos de

la línea media que divide a la campana; ahora, esta campana puede ser

achatada, alargada o mantener un punto neutral, ni chata ni alargada, al

que se le conoce como mesocúrtica; cuando la curva es muy achatada se

le conoce como platicúrtica, significa que los datos están demasiado

dispersos alrededor de su centro, en tanto que si es muy alargada, se le

conoce como leptocúrtica, lo cual significará que los datos estarán

bastante concentrados alrededor de la línea central.

Curva asimétrica: Cuando la curva de tendencia no se parece a una

curva de campana normal, sino que éste se degenera por uno de sus lados,

decimos que la distribución de los datos es asimétrica o está sesgada; si la

cola se deforma más por el lado derecho, decimos que la curva es

asimétrico positivo, y si la cola se deforma más por el lado izquierdo,

entonces la curva es asimétrico negativo.

En los siguientes ejemplos observaremos casos en que pueden

presentarse los tres tipos de distribuciones de frecuencia.

0

50

100

150

200

250

300

350

11 -14 14 -17 17 - 20 20 -23 23 -26 26 -29 29 - 32 32 - 35

Fre

cuencia

observ

ada

Grupos de edades

Fig. 2.7 Curva de tendencia de edad de los alumnos

Page 38: Estadisticas y Probabilidades 1

38

Caso 1. Consideremos el siguiente caso del comportamiento

de ventas de equipos de PC, desarrollados en un centro comercial entre

los años 2000 al 2008; las cantidades vendidas se presentan tabuladas en

la tabla 2.2 Se trata de construir un histograma de frecuencias y analizar

el comportamiento de estas ventas, durante el período observado.

Tabla 2.2 Cantidades vendidas de PC

Entre los años de 2000 - 2007

Evolución durante los años

Cantidades vendidas en

und.

00 - 01 25

01 – 02 125

02 – 03 378

03 – 04 845

04 – 05 1368

05 – 06 784

06 – 07 423

07 – 08 137

Fuente: …..

Con estos datos se construye el histograma de frecuencias de

ventas absolutas, como el presentado en la Fig.2.8; éste muestra las

distribuciones de los datos expresados en el histograma; analizando el

comportamiento del histograma podría deducirse a simple vista , que su

curva de tendencia tiene dos características: primero que sigue una

tendencia lineal creciente durante los primeros cinco años, y a partir de

allí tiene una tendencia lineal decreciente; uniendo estas dos rectas, y

teniendo como referencia el eje X, podríamos deducir que se puede

formar un triángulo, concluyendo que el comportamiento de ventas de

las PC en este centro comercial sigue una distribución triangular; sin

embargo si buscamos una figura geométrica más utilizada en la

estadística, podría conjeturarse que el comportamiento de este fenómeno,

se aproxima más a una curva de campana, tal como se muestra en la Fig.

2.9; más adelante se presentarán los sustentos que validen esta

afirmación; continuando con el análisis podríamos seguir extrayendo una

serie de conclusiones; podemos decir que las ventas en los primeros cinco

años tuvo un crecimiento sostenido, pero a partir de ello, estas empezaron

Page 39: Estadisticas y Probabilidades 1

39

a disminuir, razones que deberán ser analizados por las personas

inmersas en esta situación, etc.

Fig. 2.9 Curva de tendencia, simétrica del ejemplo de ventas presentadas en

la Tabla 2.2

Observando la curva de tendencia de esta figura, concluimos que

la curva de tendencia del comportamiento de ventas de las PC, sigue una

0

200

400

600

800

1000

1200

1400

25125

378

845

1368

784

423

137

Cantid

ades d

e P

C v

endid

as

Fig. 2.8 Gráfico del sistema de ventas de las PC(Curva de tendencia simétrica)

0

200

400

600

800

1000

1200

1400

1600

99 -00

00 -01

01 -02

02 -03

03 -04

04 -05

05 -06

06 -07

07 -08

08 -09

Page 40: Estadisticas y Probabilidades 1

40

curva de campana simétrica, con una cierta cantidad vendida con

mayor frecuencia en los años 2004 al 2005, y escasas cantidades vendidas

en los primeros años, así como escasas cantidades vendidas en los últimos

años; podemos también concluir que el negocio tuvo sus buenos

momentos, y conforme transcurre el tiempo, las ventas tendrán tendencia

a ir disminuyendo, salvo que se adopten otras estrategias para seguir

manteniéndose con una tendencia creciente.

Caso 2. En un centro poblado se toma una muestra aleatoria de un grupo

de personas comprendidos entre los cero y 45 años de edad, con la

finalidad de conocer su distribución por edades; como resultado de este

proceso se registraron los siguientes resultados:

Tabla 2.3 Grupos de personas clasificadas de acuerdo

a sus respectivas edades en el Centro Poblado

Grupos de edades Número de

en años personas

[0 - 5[ 12

[5 - 10[ 38

[10 - 15[ 150

[15 - 20[ 90

[20 - 25[ 55

[25 - 30[ 27

[30 - 35[ 15

[35 - 40[ 9

[40 - 45[ 3

Fuente: ….

El histograma de frecuencias de la Fig. 2.10 muestra el

comportamiento de las edades de estas personas; podemos observar que la

mayor cantidad de personas comprende a aquellos que tienen entre los 10

y 15 años, y que a partir de éste último, el número va decreciendo; pero

también podemos decir que hay mayor número de personas mayores de

15 años, y así sucesivamente. Si buscamos una curva de tendencia para el

comportamiento de estas observaciones, encontraremos que este es

parecido a una curva de campana, salvo que la cola derecha de la

campana se deforma más (Fig. 2.11), por lo que decimos que esta

distribución es asimétrico (positivo).

Page 41: Estadisticas y Probabilidades 1

41

Caso 3. El siguiente ejemplo corresponde a otro posible

comportamiento no asimétrico, donde los datos pueden presentarse de

modo que su distribución de frecuencias sea una curva de distribución

asimétrica negativa. Consideremos otra ciudad donde una muestra

0

20

40

60

80

100

120

140

160

12

38

150

90

55

27

159

3

Pers

onas o

bserv

adas

Grupos de edades en años

Fig. 2.10 Histograma de comportamiento de edades de las personas del centro poblado

0

20

40

60

80

100

120

140

160

Fig. 2.11 Curva de tendencia de la edad de las personas del centro poblado.

Page 42: Estadisticas y Probabilidades 1

42

aleatoria de un grupo de personas, comprendidas entre los 0 y 45 años,

presentó el siguiente comportamiento de edades: Tabla 2.4 Personas clasificadas de acuerdo a

Grupo de edades en la ciudad X.

Grupos de edades en años

Número de personas

[0 - 5[ 3

[5 - 10[ 9

[10 - 15[ 15

[15 - 20[ 27

[20 - 25[ 55

[25 - 30[ 90

[30 - 35[ 150

[35 - 40[ 38

[40 – 45]_ 12

Fuente:

El histograma de frecuencias de esta tabla, permite apreciar que

la mayoría de las personas están comprendidas entre los 30 y 35 años, y

que también la gran mayoría son personas menores de los 35 años, etc. Al

construir su curva de tendencia, podemos afirmar que la distribución de

estos datos corresponde a una distribución asimétrica negativa (Fig. 2.12

y 2.13).

0

50

100

150

3 9 1527

55

90

150

38

12

Fre

cuencia

de p

edid

os

Amplitud de edades en años (cada 5)

Fig. 2.12 Curva de tendencia de la edad de las personas del centro poblado.

Page 43: Estadisticas y Probabilidades 1

43

Fig. 2.13 Curva de tendencia del comportamiento de edades de las

personas de la ciudad X (Curva asimétrica negativa)

0

20

40

60

80

100

120

140

160

-5 - 0 0 -5

5 -10

10 -15

15 -20

20 -25

25 -30

30 -35

35 -40

40 -45

45 -50

Page 44: Estadisticas y Probabilidades 1

44

EEjjeerrcciicciiooss ssoobbrree ddiissttrriibbuucciioonneess ddee ffrreeccuueenncciiaa

2.1. ¿Cuál es el objeto de clasificar y ordenar los datos?

2.2. Describa las características de clase y el de las frecuencias

absolutas y relativas.

2.3. ¿Es posible que solo los datos con variables discretas pueden ser

clasificados en distribuciones de frecuencia?

2.4. Defina el concepto de marca de clase y su respectivo uso.

2.5. ¿De qué depende el número de clases para poder construir una

tabla de distribución de frecuencias?

2.6. ¿Qué representa un histograma de frecuencias y qué tipos existen?

2.7. ¿Qué significado tiene la frecuencia relativa, y qué el de la

frecuencia relativa acumulada?

2.8. Con los datos que a continuación se muestran: 78,56 82,34

40,76 34,71 32,11 55,67 43,21 54,23 78,90 102,02

50,13 45,55 63,29 67,18 46,34 61,21 39,76 53,21 88,45

78, 65 64,66 68,62 90,56 39,46 40,04 58,68 98,99 61,73

60,03 74,34 74,00 100,25 85,99 100,98 47,74 35,94

40,12 76,51; determine: a) La amplitud de los datos, número de

clases y un intervalo de clase b) Su tabla de frecuencias c) Su

histograma de frecuencias absolutas y relativas así como las curvas

de frecuencias acumuladas absolutas y relativas d) Su polígono

de frecuencias absolutas y relativas e) ¿A qué distribución se

aproxima su curva de frecuencias?

2.9. Una empresa química está interesado en producir nuevos modelos

de zapatillas deportivas para hombres y mujeres cuyas edades

fluctúan entre los 16 y 40 años, todos residentes dentro del ámbito

de la provincia de Huaura; a fin de tener como punto de referencia

el promedio de edad de este grupo, el departamento de marketing,

hace un muestreo aleatorio un día cualquiera preguntando la edad,

en años, de cada persona que circulaba por la Av. 28 de julio,

obteniendo los siguientes datos: 18, 30, 17, 32, 21, 24, 45, 51, 42,

21, 29, 53, 28, 29, 32, 16, 45, 48, 50, 20, 23, 27, 21, 20, 26, 24,

33, 33, 38, 40, 37, 24, 26, 48, 38, 30, 32, 33, 45, 52, 37, 27, 40, 44,

21, 16, 18, 16, 21, 23, 27, 33, 32, 19, 21, 20, 36, 37, 23, 31, 33, 21,

27, 29, 40, 41, 50, 19, 21, 24, 20,18, 17, 40, 34, 31.

a) ¿Cuál fue el tamaño de la muestra? b) ¿Cuál es la amplitud de

edades? c) ¿Cuántos intervalos de clase pueden construirse con

estos datos? d) ¿Qué grupos de edades aparecen con mayor

Page 45: Estadisticas y Probabilidades 1

45

frecuencia? e) Presente los datos en forma de un histograma de

frecuencias f) Trazar un polígono de frecuencias relativas g)

¿A qué forma puede aproximarse su polígono de frecuencias? h)

Grafique un polígono de frecuencia acumulada i) ¿Qué

porcentaje de personas son menores de 30 años? j) ¿Qué

porcentaje de personas son mayores de 28 años? k) ¿Qué

porcentaje de personas se encuentran entre los 20 y 30 años?

2.10. Construya el gráfico de tronco y hojas para el problema anterior.

2.11. Averiguando sobre los salarios percibidos semanalmente en

Nuevos Soles por un grupo de obreros del sector construcción civil se

pudo captar los siguientes datos: 350, 400, 360, 320, 400, 350, 380,

420, 360, 300, 360, 350, 380, 370, 330, 325, 300, 380, 370, 350, 320,

380, 350, 380, 400, 325, 320, 340, 410, 320, 350, 360, 400, 410, 330,

340, 350. Construya un histograma de frecuencias y determine su

curva de tendencia; del mismo modo construya el gráfico de hojas,

explicando sus principales características.

2.12. En un centro comercial se reportan ventas de PC cuyos precios

fluctúan entre los US $ 400 y $1 800, dentro de un período

determinado; las cantidades vendidas de estas PC se reportan en un

cuadro incompleto como el indicado a continuación:

Ventas de PC en el Centro Comercial durante el año …. Precios en

USA $

Cantidad

vendida

Cantidades

acumuladas

Proporción

de ventas

Proporciones

acumuladas

14 14 0.035

74

0.435

92

84

388 0.095

12

a) Complete este cuadro, graficando su histograma de frecuencias

relativas, su distribución de frecuencias y su ojiva porcentual

b) ¿Qué proporción de ventas de PC representa cantidades menores de

$1 100? R: 55%

c) Si a ventas superiores de $ 1 100 se les recarga con 20% de

impuestos a la renta, ¿qué cantidades se verán afectadas por estas

ventas? R: 180

Page 46: Estadisticas y Probabilidades 1

46

d) Si el 25% de las ventas producidas se destinaron para el

mercado de Lima Provincias, sin considerar precio, ¿de qué cantidad

se dispuso?

2.13. Haga el siguiente experimento: Averigüe el promedio de notas de

sus compañeros de clase durante el pasado ciclo académico; luego

construya una tabla de frecuencias y determine: a) Su histograma de

frecuencias b) Explique a qué tipo de curva de frecuencias se

distribuye este comportamiento c) ¿Qué proporción de alumnos están

aprobados? d) ¿Qué proporción de alumnos fueron desaprobados?

e) Si se considera que solo aquellos que tienen promedio más de trece

“tienen buenas notas”, ¿cuántos y qué proporción de alumnos estarán

considerados dentro de esta categoría?

2.14. La siguiente tabla, proporciona datos sobre remuneraciones

mensuales, en Nuevos Soles, de una muestra de trabajadores

registradas en una determinada ciudad:

i Rango de

ingresos en S/

Cantidad de

trabajadores

1 [600 – 943[ 5

2 [943 – 1286[ 10

3 [1286 – 1629[ 18

4 [1629 – 1972[ 12

5 [1972 – 2315[ 8

6 [2315 – 2658[ 3

7 [2658 – 3001[ 2

a. Explique el comportamiento de ingresos de este grupo de

trabajadores; para ello construya su histograma de frecuencias y

luego establezca su curva de tendencia.

b. ¿Qué porcentaje de trabajadores ganan menos de S/ 1 605,34?

c. ¿Qué porcentaje de trabajadores ganan más de S/ 1 514,67?

d. ¿Qué porcentaje de trabajadores ganan más de S/ 2 000?

e. ¿Qué porcentaje de trabajadores ganan entre S/ 600 y S/ 1 500?

2.15. Considere los datos proporcionados en la Tabla 2.4 y determine:

a. Proporción de personas mayores de 23 años.

b. Proporción de personas comprendidas entre los 12 y 26 años.

c. ¿Cuántas personas hay cuyas edades están comprendidas entre los

24 y 36 años.

d. Si se considera que las personas mayores de 25 años, ya son

adultos, ¿cuántos estarán comprendidos en este grupo?

Page 47: Estadisticas y Probabilidades 1

47

2.16. Sobre encuestas relacionadas con los sueldos de los

trabajadores correspondientes al sector privado, se encontró que estos

fluctuaban entre S/ 350 y un poco más de S/ 1 550 mensuales, según se

muestra en la siguiente tabla:

Sueldos de trabajadores del sector privado

Sueldo promedio (S/) Número de trabajadores

*350 – 500 178

500 – 650 440

650 – 800 816

800 – 950 576

950 – 1 100 120

1 100 – 1 250 85

1 250 – 1 400 60

1 400 – 1 550 36

1 550 a más 14 (*) Trabajan menos de las horas normales

Determine:

a) Su curva de frecuencias, explicando el tipo de distribución.

b) Su ojiva

c) Número de empleados que ganan menos de S/ 1 200. R: 2187

d) Número de empleados que ganan entre S/ 800 y S/ 1 300.

e) Número de empleados que ganan más de S/1 200.

f) Porcentaje de empleados que ganan menos de S/ 700.

g) Porcentaje de empleados que ganan más de S/ 900.

h) Porcentaje de empleados que ganan entre S/ 520 y S/ 1 000. R: 78%

i) La confederación que los agrupa solicita que a los trabajadores que

ganan menos de S/ 600 se les aumente un 15% más y a los que ganan

entre S/ 600 y S/ 700 se les aumente un 5% más, ¿cuántos

trabajadores se beneficiarían con este aumento, y cuántos no

percibirían ningún aumento? R: 890 y 1 435

Page 48: Estadisticas y Probabilidades 1

48

Sección 3

Frases para meditar:

Haz que tu cabeza trabaje a favor tuyo y

poco a poco adquirirás la costumbre de

no molestarte cuando las cosas vayan mal

Sí estas seguro de ti mismo, y tienes

confianza en lo que piensas, no querrás ni

necesitarás que los demás sean como tú

Los accidentes ocurren, los triunfadores

aprovechan los accidentes; los que no

tienen éxito son personas orientadas a su

interior, no escuchan

Nunca se tiene una segunda oportunidad

para producir una primera impresión

Medidas de Tendencia Central y Medidas

de Variabilidad

Medidas de tendencia central: Una medida de esta naturaleza,

representa a la población o a la muestra; la media aritmética o su

promedio, la mediana, la moda, la media geométrica y la media armónica,

son ejemplos de estas medidas.

Ejemplo 3.1 Cuando se dice que el promedio de salario de los obreros de

una planta pesquera es de S/ 40 diarios; se está indicando que esta

cantidad está representando lo que en promedio gana el conjunto de todos

estos trabajadores, aunque algunos pueden ganar S/ 120 diarios y otros

pudieran ganar S/ 15 diarios, sin embargo el valor de S/ 40 diarios, es su

medida representativa.

Promedio o media aritmética: Se obtiene sumando todos los valores

observados y dividiéndole entre el total de estas observaciones.

Page 49: Estadisticas y Probabilidades 1

49

Existen dos formas para determinarlo: Cuando los datos

están dispersos y cuando los datos están agrupados; cuando los datos

están dispersos, el promedio es igual µ = x = n

xxx n...21, donde n

corresponde al número total de observaciones; cuando los datos se

presentan agrupados, como en una tabla de distribución de frecuencias,

el promedio se determina de la siguiente manera:

µ = x = n

nn

fff

fxfxfx

...

...

21

*2*21*1

µ = x = n

i

i

n

i

ii

f

fx

1

1

*

, donde los xi representan las marcas

de clase y las fi sus frecuencias absolutas o frecuencias relativas.

Media aritmética ponderada: Se determina cuando el conjunto de

observaciones están afectadas por otro conjunto de factores de

ponderación o pesos. Así si se tienen las siguientes observaciones, x1, x2,

..., xn y a estas observaciones se les asignan las siguientes ponderaciones

o pesos w1, w2,...wn, entonces la media ponderada se obtiene:

µ = x = n

nn

www

wxwxwx

...

...

21

*2*21*1

µ = x = n

i

i

n

i

ii

w

wx

1

1

*

; si observamos esta última expresión, nos

damos cuenta que los wi están reemplazando a los fi en una tabla de

frecuencias.

Media con grupos de datos: Cuando a la población se los sub divide en

dos o más grupos de diferentes tamaños su promedio se obtiene del

mismo modo que una media ponderada: µ = x =

Page 50: Estadisticas y Probabilidades 1

50

k

i

i

k

i

ii

n

xn

1

1

*

, donde los ni k

kk

nnn

xnxnxn

...

...

21

*2*21*1

=

representan los tamaños de los sub grupos y los xi sus respectivos

promedios, k el total de observaciones.

Ejemplo 3.2 Una empresa comercial cuenta con 50 empleados,

conformados por 50 varones y 30 mujeres; si el promedio de

remuneraciones de los empleados varones es de S/ 1 600 mensuales, en

tanto que el de las mujeres es de S/ 1 400 mensuales, determine el

promedio general de sueldos del personal de la empresa.

Promedio general de sueldos = 3050

1400*301600*50 = S/ 1 525.

En todos estos casos, el promedio aritmético o media ponderada

es un valor idealizado, debido a que representa un valor a los que todos

tenderían a ser.

Desviación: Cuando a un dato cualquiera xi se le resta una constante, al

proceso se le denomina una desviación respecto a esa constante; cuando

ese dato xi es restado por su media aritmética, se le denomina desviación

alrededor de su media; esto es di = xi – µ; la suma de todas estas

desviaciones es igual a cero.

0)(1 1

k

i

k

i

ii xd

Mediana o valor medio: Es otra medida de tendencia central; es un

número que divide al total de observaciones en dos partes iguales, su

significado es similar al dividir una naranja en dos partes iguales; en el

caso de tener una serie de observaciones, para obtenerlo, primero se les

ordena en forma ascendente, y si el conjunto de ellos es impar, la mediana

es el número que divide al conjunto en dos partes iguales; de esta

manera, la median se interpreta como que el 50% de las observaciones

están por debajo de éste, y el resto por su encima.

Ejemplo 3.3 Si un conjunto de observaciones presenta los siguientes

valores: 12, 15, 23, 7, 10, 25, 18; para determinar su mediana deberá

Page 51: Estadisticas y Probabilidades 1

51

a mayor: 7, 10, 12, 15, 18, 23, 25; ordenársele previamente de menor

el número que divide a estas observaciones es el número 15; por lo tanto

la mediana es este número.

Si el conjunto de observaciones es un número par, la mediana se

obtiene promediando los dos números centrales.

Cuando los datos están agrupados, la mediana se calcula

determinando en primer lugar, la clase donde se encuentra la mitad de las

observaciones; de ésta se toma su límite inferior y la frecuencia

acumulada anterior a esta clase; de igual modo, se determina la frecuencia

modal de esta clase, y con ello la mediana se podrá calcular del siguiente

modo: Mediana = Li + cf

FN

m

i

*21

, siendo Li es el límite inferior de la

clase donde se encuentra la mediana, N el número total de observaciones,

Fi-1 frecuencias acumulada anterior a la clase i, c el ancho de clase y fm,

frecuencia donde se encuentra la mediana.

Moda: También es otra medida de tendencia central y denota el valor

observado que aparece con mayor frecuencia; pueden existir más de una

moda, si existen dos valores, se dicen bimodales porque hay dos modas,

o multimodales si hay más de dos; cuando la moda está constituido de un

sólo elemento se le llama unimodal; la expresión que permite calcular

este valor en datos agrupados es: Moda = Li + 21

1

ff

f*c, donde f1 es la

diferencia entre la frecuencia donde se encuentra la moda con la

frecuencia anterior y f2 la diferencia de la frecuencia donde se encuentra

la moda con la frecuencia posterior. Generalmente la moda se utiliza

para datos de tipo cualitativo.

Cuartil: Cuando se divide al conjunto de observaciones en cuatro partes

iguales, se dice que hay cuartiles; el cuartil uno Q1, representa la cuarta

parte de las observaciones, el cuartil dos Q2, la mitad de las

observaciones, y el cuartil tres Q3, las tres cuartas partes de las

observaciones; en la Fig. 3.1 se muestra esquemáticamente estos tres

cuartiles.

Page 52: Estadisticas y Probabilidades 1

52

Fig. 3.1 Representación esquemática de los cuartiles.

Q1 Q2 Q3

La manera de determinar los cuartiles, en datos agrupados, se sigue el

mismo criterio empleado para obtener la mediana, teniendo en cuenta lo

mencionado con cada uno de los cuartiles; de este modo el cuartil uno es:

Q1 = Li + cf

FN

m

i

*41

; N/4 corresponde a la cuarta parte de las

observaciones donde se encuentre el primer cuartil, Fi-1, la frecuencia

acumulada anterior a N/4, Li el límite inferior de la clase donde se

encuentra el cuartil uno, fi la frecuencia que le corresponde a la clase

donde está el cuartil, y c el ancho de la clase. El primer cuartil indicará el

porcentaje de observaciones que está por debajo del 25% del total.

Decil: Sucede cuando se divide al conjunto de observaciones en diez

partes iguales; aquí el quinto decil es igual a la mediana; se los denotan

por D1, D2, ... D9. Para determinar sus respectivos valores, en caso de que

los datos se presenten agrupados, se sigue el mismo criterio de

determinación de los cuartiles.

Interpretar un decil es similar a interpretar un cuartil; por ejemplo

el decil dos, indicará que el 20% de las observaciones se encuentran por

debajo de todas las observaciones, etc.

Percentil: Sucede cuando se divide al conjunto de observaciones en cien

partes iguales; aquí el percentil 25 es igual al primer cuartil. Los

percentiles se denotan por P1, P2, P3, ....P99. Cada percentil, denota el

porcentaje de observaciones que están por debajo de este valor. Así el P50

y la mediana son iguales, entonces es viable decir que el P50 representará

el 50% de las observaciones que estarán por debajo éste, y etc.

Ejemplo 3.4 Consideremos que se registraron los ingresos mensuales en

Nuevos Soles, de un grupo de personas, los que están dados por las

siguientes cantidades: 900, 1 200, 1 500, 1 400, 800, 2 000, 770, 1 500.

Determine a) Promedio de ingresos. b) El sueldo medio. c) La moda

de estos sueldos. d) Los cuartiles uno y tres.

Page 53: Estadisticas y Probabilidades 1

53

Solución: a) El promedio de los sueldos se determina fácilmente aplicando su

concepto: Promedio = S/ 1 258,75.

b) Para hallar el sueldo medio o la mediana, deberá ordenarse primero

los datos en forma ascendente: 770, 800, 900, 1 200, 1 400, 1 500,

1 500, 2 000. De acuerdo a esto, el sueldo medio, o mediana está

entre los 1 200 y 1 400, o sea: S/ 1 300.

c) La moda, o sueldo que aparece con mayor frecuencia es: S/ 1 500.

d) El cuartil uno, corresponde a la cuarta parte de las observaciones

registradas, esto querrá decir que el 25% de los sueldos estará por

debajo de este cuartil, estando comprendido entre 800 y 900, luego Q1

= S/ 850. De igual manera el cuartil tres, corresponde a las tres

cuartas partes de las observaciones, y su valor se determina

observando que su valor estará comprendido estará entre 1 500 y

1500, o sea Q3 = S/ 1 500.

Medidas de dispersión: También se conoce como medidas de

variabilidad o medidas de variación; es una medida que explica la forma

cómo los datos pueden estar agrupados o dispersos, referidos alrededor de

un valor representativo, que puede ser la media aritmética; la amplitud, la

desviación cuartílica, la desviación media, la varianza, la desviación

estándar y el coeficiente de dispersión, son medidas que explican la

dispersión de los datos.

Una medida de tendencia central no explica la forma cómo los

datos están agrupados; por ejemplo, si se tuvieran a cuatro personas cuyas

edades son de 24, 26, 22, y 28 años, es fácil darse cuenta que estas

personas parecerían tener las mismas edades, queriendo decir que estas

cuatro personas pueden aparentar tener en promedio 25 años; sin

embargo si tuviéramos a otras cuatro personas con estas edades: 42, 38,

15 y 5 años; aunque el promedio de edad de estas cuatro personas sigue

siendo de 25 años, sería ilógico pensar que este promedio representa la

edad de los cuatro, porque por más desarrollado que esté un niño o joven

de esas edades, jamás se podría pensar que aparenta una edad de 25 años,

o también al revés,, por más conservado que esté una persona de 42 o 38

años, jamás se podría decir que aparenta una edad de 25 años.

Estos dos situaciones permiten deducir que en el primer caso los

datos están bastante concentrados alrededor del promedio, en cambio en

el segundo, los datos están bastante alejados del promedio; hablando en

Page 54: Estadisticas y Probabilidades 1

54

términos de variabilidad, podemos decir que en el primer caso, esta

es pequeña, en cambio en el segundo caso es grande; un valor pequeño o

muy pequeño en la medida de variabilidad indicará alta concentración de

datos alrededor del promedio, en tanto que un valor muy grande indicará,

que los datos estarán alejados o muy alejados de este promedio; de otra

manera también los datos pueden concentrase en un solo extremo, a esto

se dice sesgo; si están muy concentrados a la derecha, se dice sesgado a la

derecha, y si están muy concentrados a la izquierda, sesgados a la

izquierda.

Ejemplos de datos concentrados a la derecha: 2, 3, 34, 45, 28, 30;

ejemplos de datos concentrados hacia la izquierda: 3, 5, 1, 6, 2, 5, 8, 4,

17, 15, 16.

Las medidas de variabilidad pueden explicarse con la amplitud, la

desviación media, la desviación cuartílica, la varianza, la desviación

estándar y el coeficiente de dispersión.

Amplitud o rango: Es la medida de variabilidad más simple que indica

el rango de dispersión de los datos, se obtiene por diferencia entre el

mayor y el menor valor observado. Ejemplo: Si se conoce que las

edades de cuatro personas son de 12, 32, 54 y 20 años, entonces su

amplitud es de 54 – 12 = 42 años.

La amplitud es una medida de variabilidad muy simple, solo

proporciona información de la forma cómo están ubicados los datos

extremos, sin embargo no explica si éstos están concentrados hacia uno

de los extremos, o están próximos al promedio, por ello no proporciona

mucha información, de modo que su uso está muy limitado,

especialmente cuando se cuenta con muchos datos.

Desviación media DM: Es otra medida de variabilidad que se obtiene

sumando los valores absolutos de las desviaciones medias de los valores

observados y luego divididos entre el número total de datos.

DM = n

xi

, para datos dispersos

DM = N

xf ii *

, cuando los datos están agrupados y xi representa

las marcas de clase, y N = fi

Page 55: Estadisticas y Probabilidades 1

55

La razón de tomar el valor absoluto de las desviaciones medias

se hace con la finalidad de anular la suma cero de todas las desviaciones;

esta medida con respecto al anterior proporciona mejor información,

dado que va tener en cuenta toda la variación de los datos.

Desviación cuartílica DQ: Se define como el promedio de la diferencia

entre el tercer cuartil y el primer cuartil.

DQ = 2

13 QQ

Varianza V(x): Es una medida de variabilidad que se obtiene sumando

al cuadrado la diferencia de las desviaciones alrededor de la media y

dividiéndole entre el total de observaciones menos uno.

V(x) = 2 = S

2x =

1

2)(

n

xi

, siendo n el número de

observaciones; en el caso de tener datos agrupados:

V(x) = 2 = S

2x =

1

)( 2*

N

xf ii

en este caso xi representa

las marcas de clase y N = fi.

Desviación estándar: Es la medida de variabilidad más utilizada, se

obtiene extrayendo la raíz cuadrada de la varianza.

= Sx = )(xv

Esta medida se le utiliza bastante junto con el promedio; un valor

grande indicará que los datos están muy dispersos, mientras que un valor

pequeño, indicará que estarán muy concentrados; el problema es que

altos valores de esta medida, no indicarán en qué extremos estarán

concentrados los datos, ya que su medida puede verse afectada por la

existencia de uno o más valores en sus extremos; así considerando a tres

personas cuyas edades son de 5, 8 y 80 años, el promedio de edad de estas

es de 31 años y su desviación estándar igual a 42,462 = años; en cambio

para otras tres personas cuyas edades son de 34, 30 y 29 años, el

promedio de edad estas también es igual a 31 años, en cambio su

desviación estándar es igual a 2,645 años; estos ejemplos muestran cuánto

puede verse reflejado una medida de esta naturaleza cuando uno o más de

sus valores están en situaciones muy extremas o muy anormales.

Page 56: Estadisticas y Probabilidades 1

56

Ejemplo 3.5 Los ingresos mensuales en S/ de diez ingenieros es el

siguiente: 1 800, 2 000, 2 500, 1 600, 3 000, 2 600, 2 400, 1 700,

1 900 y 2 500; encuentre la varianza y su desviación estándar.

Solución: Primero deberá calcularse el promedio de ingresos:

= 10

2500...20001800= S/ 2 200

Luego habrá que determinar su varianza:

2 =

9

2)22002500(...2)22002000(2)22001800(=

2 =

9

1920000= 213 333,33, y finalmente su desviación estándar:

= S/ 461,19

Cálculos complicados de sumar y multiplicar números muy

grandes pueden simplificarse, extrayendo un factor común a todos los

valores observados; sea por ejemplo en este caso 1000; luego retomando

los cálculos:

= 10

)5,2...0,28,1(1000=

10

)0,22(1000S/ 2 200

Se observa que es más fácil sumar números pequeños, y al final el

resultado multiplicar por el factor común; de igual manera para la

varianza, extrayendo el factor común de 1000 a cada elemento dentro del

paréntesis:

2 =

9

2)20,250,2(...2)20,200,2(2)20,280,1(*2)1000(=

2 = 1000

2*1,92/9 = 213 333,33 y

= S/ 461,19.

A manera de conclusión, los cálculos de la media aritmética, de la

varianza y la desviación estándar pueden simplificarse extrayendo un

factor común a todos los valores observados y al final multiplicar los

resultados por ese factor común.

Índice de Asimetría: Cuán simétrica o no es una curva de distribución de

frecuencias, es un problema que se resuelve determinando su índice de

Page 57: Estadisticas y Probabilidades 1

57

asimetría. Una curva es simétrica si su índice de asimetría es cero, de

otro modo será asimétrica; se determina mediante la relación:

Is = EstándarDesviación

ModaMedia

Si el Is es menor de cero significa que la moda es mayor que la

media, por lo tanto la curva tendrá asimetría negativa, en cambio si éste

índice es positivo, significa que la media es mayor que la moda, por lo

que la asimetría será positiva; si la media y la moda son iguales, significa

que la curva es simétrica; de otra manera, se dice que una distribución de

frecuencias es asimétrica positiva si: moda < mediana < promedio, lo cual

quiere decir que la mayoría de las observaciones están por debajo del

promedio, y que también existe una gran mayoría que está muy por

debajo de la mediana; en cambio si la distribución de frecuencias es

asimétrica negativa, sucederá que el promedio < mediana < moda, lo cual

quiere decir que la mayoría de las observaciones está por encima del

promedio.

Curtosis: Cuando la curva de distribución de frecuencias es simétrica, su

forma es acampanada; en este caso nos interesará conocer la forma cómo

se dispersan los datos alrededor de la media; la curtosis explica este

problema; si la mayor cantidad de datos se concentran alrededor de la

media, la curva simétrica es muy alargada en la media, a lo que se le

denomina leptocúrtica; si la mayoría de los datos están más concentrados

en sus extremos, la curva simétrica es más achatada, y se le denomina

platicúrtica, en los otros casos se le denomina curva de distribución

normal o mesocúrtica.

En una curva de distribución simétrica, la media, la moda y la

mediana coinciden, y estos están en el centro de la campana; cuando la

curva es normal, la desviación estándar se interpreta geométricamente

como el punto de inflexión de la curva y está exactamente a una distancia

de la media; también sucede que:

El 68,27% de las observaciones están comprendidos en el

intervalo µ ± ;

El 95,45% de las observaciones están comprendidos en el

intervalo µ ± 2 , y

El 99,73% de las observaciones están comprendidos en el

intervalo µ ± 3 .

Page 58: Estadisticas y Probabilidades 1

58

El siguiente es el gráfico de una curva de distribución normal:

Fig. 3.2 Curva de distribución normal

Coeficiente de variabilidad o coeficiente de dispersión: Es la relación

entre la desviación estándar y su media aritmética CV = = x

Sx; es una

medida sin dimensiones, que puede ser expresado porcentualmente, y

mide la variación de la desviación estándar respecto a su promedio

aritmético. Se usa cuando se quiere comparar la variación de más de un

conjunto de observaciones, o cuando estos se expresan en diferentes

unidades de medida.

Ejemplo 3.6 Se cuenta con dos grupos de profesionales, uno conformado

por ingenieros de Sistemas y el otro conformado por ingenieros

Químicos, los primeros ganan en promedio S/ 4 000 mensuales con una

desviación estándar de S/ 475, en tanto que los segundos ganan en

promedio S/ 2 800 mensuales con una desviación estándar de S/ 350; a

simple vista no podría afirmarse que la distribución de sueldos en los

ingenieros químicos es más uniforme comparado con la de los ingenieros

de sistemas; para dilucidar estas dudas debe determinarse el coeficiente de

variabilidad para ambos grupos y compararlos; aquel que presenta menor

coeficiente de variabilidad, será el que presenta mayor homogeneidad en

los sueldos.

Page 59: Estadisticas y Probabilidades 1

59

Ingenieros de

Sistemas

Ingenieros

Químicos

CVS = 4000

475*

100 = 11,87%

CVQ = 2800

350*

100 = 12,50%

Comparando estos dos coeficientes se concluye que mayor uniformidad

en los sueldos, los tienen los ingenieros de Sistemas.

Variable estándar o variable tipificada: Es también otra forma de

uniformizar datos que presentan diferentes grupos de distribuciones,

teniendo en cuenta la media y su desviación estándar y un valor

observado; la expresión que permite determinarlo es con z = x

, si

este valor es positivo, indicará que el valor observado es mayor al

promedio, y viceversa.

Ejemplo 3.7 Considerando el caso anterior, si un ingeniero de Sistemas

gana S/ 4 300 y un ingeniero Químico S/ 3 050, ¿cuál de ellos estará

mejor pagado en comparación al grupo?

Solución: Para responder a esto debe determinarse la variable estándar por

cada grupo:

Ingenieros de Sistemas

Ingenieros Químicos

zS = 475

40004300= 0,63 zQ =

350

28003050= 0,71

Analizando y comparando estos resultados, se observa que el

ingeniero Químico está mejor pagado en comparación al otro grupo;

aunque en apariencia un ingeniero de sistemas gana más en su entorno,

éste sueldo podría no ser muy alto comparado con lo que gana el otro

profesional, dado que en su medio el costo de vida, o cualquier otro tipo

de condiciones podría hacer que el sueldo no tendría las mismas

características. Un caso típico de esto se da en Lima, aunque aquí las

remuneraciones son más altas debido al alto costo de vida, los sueldos

también deberían tender hacia eso, comparadas con la ciudad de Trujillo,

donde el costo de vida es mucho menos, y lo poco que se gana, podría ser

suficiente como para llenar la canasta básica familiar.

Page 60: Estadisticas y Probabilidades 1

60

Ejemplo 3.8 Otra manera de utilizar el coeficiente de variación y

las variables tipificadas, se dan cuando se quieren comparar poblaciones

diferentes; para ello consideremos el caso de dos universidades que

presentan sistemas de evaluaciones diferentes y que a simple vista es

difícil cuáles de los alumnos están mejor considerados en relación al

grupo. Supongamos que en una de ellas el promedio general de notas de

los alumnos de la universidad, en un determinado período académico fue

de 13,8 con una desviación estándar de 4,2, y en la otra universidad, el

promedio general fue de 12,6 con una desviación estándar de 3,5. Ahora

consideremos que a un puesto de trabajo se presentan dos postulantes,

ambos egresados de cada una de las universidades; si un criterio de

evaluación será el rendimiento académico, entonces supongamos que el

primer postulante, egresado de la primera universidad tiene un

rendimiento académico promedio de 14,6 y el segundo, de la otra

universidad, un rendimiento académico de 13,4, ¿en cuál de las

universidades hay mayor uniformidad de notas y cuál de los postulantes

está mejor en su rendimiento académico?

Solución: Para determinar en qué universidad hay mayor uniformidad en

la evaluación, se determinará el coeficiente de dispersión:

Coeficiente de dispersión: Primera universidad: = 8,13

2,4= 0,3043

Segunda universidad: = 6,12

5,3= 0,2778

Comparando estos dos índices, apreciamos que en la segunda

universidad el coeficiente de dispersión es menor que su similar, por lo

que concluimos que aquí hay mayor uniformidad en las notas, dado que

hay mayor concentración de datos alrededor del promedio de notas.

Para saber cuál de los postulantes presenta mejor rendimiento

académico, se compararán sus variables tipificadas o variables

estandarizadas:

Variable estandarizada:

Primera universidad: z = x

= 2,4

8,136,14= 0,19

Page 61: Estadisticas y Probabilidades 1

61

5,3

6,124,13=0,23 Segunda universidad: z =

x =

De igual modo apreciamos que la variable estandarizada de la

segunda universidad es mayor que el de la primera, lo cual quiere decir

que el postulante de esta universidad está mejor que el de la primera, pese

a presentar un menor rendimiento académico que su competencia; esto

podría explicarse por las diferentes condiciones en que se presentan las

evaluaciones en ambas universidades.

Ejemplo 3.9 El siguiente caso resume el procedimiento de obtención de

cálculo de las principales medidas estadísticas tratadas en el presente

capítulo.

En un centro comercial, se venden computadoras personales, de

diferentes modelos, cuyo precio máximo alcanza los US $ 1 600; las

cantidades vendidas según estos precios están clasificadas en la tabla que

se adjunta:

Precio de venta Cantidad

De las PC en US $ Vendida

[0 – 200[ 21

[200 – 400[ 53

[400 – 600[ 98

[600 – 800[ 150

[800 – 1 000[ 127

[1 000 – 1 200] 98

[1 200 – 1 400[ 60

[1 400 – 1 600] 18

Solución: Para entender el comportamiento de la distribución de estos

datos, construimos su tabla de frecuencias, luego su histograma de

frecuencias absolutas y su curva de tendencia; posteriormente calculamos

sus estadísticos.

En primer lugar, la cantidad total de computadoras personales

vendidas es N = if = 625, y su tabla de distribución de frecuencias

se muestra en la siguiente tabla:

Page 62: Estadisticas y Probabilidades 1

62

Tabla 3.1 Tabla de distribuciones de frecuencias de las PC vendidas

Precio venta Marca Cantid. Frec. Frec. Abs. Frec. Rel.

de PC: US $ clase vendida relativa acumulada Acumulada

clase i xi fi hi = fi /n Fi Hi

[0 – 200 [ 100 21 0.034 21 0.034

[200 – 400 [ 300 53 0.085 74 0.118

[400 – 600 [ 500 98 0.157 172 0.275

[600 – 800 [ 700 150 0.240 322 0.515

[800 – 1000 [ 900 127 0.203 449 0.718

[1 000 – 1 200[ 1 100 98 0.157 547 0.875

[1 200 – 1 400[ 1 300 60 0.096 607 0.971

[1 400 – 1 600] 1 500 18 0.029 625 1.000

Construido esta tabla, puede obtenerse los diferentes tipos de

gráficos, que se muestran a continuación.

Fig. 3.3 Histograma de frecuencias absolutas de ventas de PC en el Centro

Comercial

Observando esta figura podríamos asegurar que su curva de tendencia se

aproxima a una curva de campana simétrica.

0

50

100

150

21

53

98

150

127

98

60

18

mero

de

PC

ven

did

as

Precios de la PC en $

Page 63: Estadisticas y Probabilidades 1

63

De igual manera, una curva de frecuencias relativas acumuladas se

muestra en la siguiente figura.

Fig. 3.5 Frecuencia relativa acumulada de la distribución de ventas de PC en

el Centro Comercial

Prosiguiendo con los cálculos, se determinará los principales estadísticos

que nos podrán permitir extraer algunas conclusiones sobre el

comportamiento de ventas de estas PC en el mercado informático.

Precio promedio de ventas de las PC: = N

fx ii

= $ 798,56. Quiere

decir que en el mercado puede conseguirse una PC en un precio promedio

de $ 798,56.

Precio medio de ventas de las PC que divide a estas observaciones en

dos partes iguales: N/2 = 312,5 (posición donde se encuentra la mediana),

Li = 600 (límite menor de la clase donde se encuentra la mediana), Fi-1 =

172 (frecuencia acumulada anterior al valor donde se encuentra la

mediana), fm = 150 (frecuencia donde se encuentra la mediana), C = 200

(rango de clase); por lo tanto Mediana = 600 + 150

1725,315*200 = $

787,33. También quiere decir que la mitad de las PC ofertadas costarán

menos de este valor.

0.000

0.200

0.400

0.600

0.800

1.000

1.200

1 2 3 4 5 6 7 8

Page 64: Estadisticas y Probabilidades 1

64

Moda (Precio de venta de una PC que aparece con mayor regularidad);

observando el cuadro se nota que el mayor número de PC vendidas están

entre $ 600 y $ 800, luego se deduce que la moda debe estar comprendido

dentro de este intervalo; con las referencias para el cálculo de este valor,

la frecuencia modal, donde se encuentra la moda = 150, límite inferior

donde se encuentra la moda Li = 600, f1 = frecuencia modal – frecuencia

anterior = 150 – 98 = 52, f2 = frecuencia modal – frecuencia posterior =

150 – 127 = 23; por lo tanto Moda = 600 + 2352

52*200 = $ 738,67.

Comparando estas tres medidas de tendencia central, podríamos

darnos cuenta que tanto el promedio como la mediana y la moda son casi

aproximadamente iguales, por lo que podríamos estar tentados a decir que

la curva de distribución de frecuencias de ventas de estos aparatos, sigue

una distribución normal; más adelante, cuando se conozcan otras

herramientas de análisis, podrá aceptarse o refutarse esta suposición, por

ahora nos quedamos con esa afirmación superficial.

Cuartil 1, Los cálculos son similares al obtenido para la mediana con la

diferencia que este valor está referido al 25% de las observaciones, por lo

tanto: Q1: 0,25N = 156,25; L1 = 400; fm = 98; 1fi =74,

Q1 = 400 + 98

7425,156*200 = $ 567,86. Este cuartil indica que el

25% de las PC estarán por debajo del $ 567,86.

Cuartil 2: Igual a la mediana = $ 787,33. Se interpreta igual que la

mediana.

Cuartil 3: Q3: 0,75N = 467,85; L1 = 1 000; fm = 98; 1fi = 449,

Q3 = 1 000 + 98

44975,468*200 = $ 1 040,31. Interpretando este

cuartil se dice que las tres cuartas partes, o el 75% de ventas de las PC

están por debajo de los $ 1 040,31.

Decil 8; Cálculos similares a los obtenidos con los Cuartiles y la

mediana, solo que debe considerarse que las medidas están referidos a las

Page 65: Estadisticas y Probabilidades 1

65

décimas partes; por lo tanto para este decir: 0,8N = 500; L1 = 1 000;

fm = 98; 1fi = 449

D8 = 1 000 + 98

449500*200 = $ 1 104,08, quiere decir que el 80%

de las PC estarán por debajo de este precio.

Percentil 42; 0,42N = 262,5; L1 = 600; fm = 150; 1fi =172

P42 = 600 + 150

1505,262*200 = $ 750,00; esto es, el 42% de las PC

vendidas estarán por debajo de este precio.

Desviación Media: = DM =

625/)56,7981500(*18...)!56,798100(*!21 $ 275,44

Desviación cuartílica DQ: (Q3 – Q1)/2 = $ 236,22

Varianza V(x) = 2 =

1

2)(

N

xf ii

que en su forma abreviada es

equivalente a: )1(

2)(2

NN

xfxfN iiii

= 108 603,692 (unidades

monetarias cuadráticas)

Desviación estándar: = $ 329,551

Coeficiente de variabilidad: 56,798

551,329*100 = 41,27%

Variable estandarizada para un valor observado x = $856:

z = 551,329

)56,798856( = 0,174

Page 66: Estadisticas y Probabilidades 1

66

EEjjeerrcciicciiooss:: MMeeddiiddaass ddee tteennddeenncciiaa cceennttrraall yy mmeeddiiddaass

ddee ddiissppeerrssiióónn..

3.1. ¿Qué características tiene la media ponderada?

3.2. ¿Cuál es el significado de mediana?

3.3. ¿Qué significado tiene la moda?

3.4. ¿En qué se diferencian la mediana, la media aritmética y la moda?

3.5. Indique las ventajas y desventajas de usar el promedio

aritmético.

3.6. Defina el concepto de asimetría, y ¿en qué casos se dice que hay

asimetría a la derecha y en qué casos hay asimetría a la izquierda?

3.7. ¿Qué relación tiene la media, la mediana y la moda en una

distribución de frecuencias asimétrica?

3.8. En una fábrica el jefe de sección de la planta de entubado

increpaba a sus obreros en el sentido de que el rendimiento de

producción de su sección estaba por debajo del promedio general de

toda la planta, por lo tanto dijo que no quería obreros que

produjeran por debajo del promedio general, debiendo implementar

un programa de racionalización del trabajo o, cerrar la sección; según

su criterio, ¿qué podría decir acerca del juicio de este jefe?

3.9. En un laboratorio laboran 120 trabajadores conformados por

obreros y empleados, quienes perciben en promedio S/ 2 780 y S/ 3

440 mensuales; si el promedio general del grupo es de S/ 3 000

mensuales, determine el número de obreros y empleados. R: 80 y 40.

3.10. Según reportes observados en el Peaje de Huacho, un

determinado día pasaron por caja 5 760 vehículos, entre ligeros y

pesados, los vehículos ligeros pagaron en promedio S/ 5,50 por peaje,

en tanto los pesados S/ 16,50; determine el número de vehículos por

cada grupo que circularon por ese lugar, si el promedio general pagado

por estos vehículos ascendió a S/ 10,39; además diga el monto

recaudado.

3.11. Demuestre si en un conjunto de observaciones x1, x2, ….,xn, cada

uno de estos elementos es multiplicado por una constante k, su nueva

desviación estándar será 1 = k .

3.12. Demuestre que si a cada elemento de un grupo de observaciones

se le añade una constante k, el promedio del grupo se incrementa en k;

de igual manera, demuestre que su desviación estándar permanece

igual.

Page 67: Estadisticas y Probabilidades 1

67

3.13. Demuestre que si a cada elemento de un grupo de

observaciones se le incrementa en p%, la media del grupo y su

desviación estándar se incrementarán en (1 + p)%.

3.14. Demuestre que 2 =

1

2)(

N

xfi

)1(

2)(2

NN

xfxfN iiii

,

donde N = if

3.15. Una empresa tiene 43 empleados y 87 obreros que en promedio

perciben mensualmente S/ 2 365 y S/ 1 764, respectivamente; debido

a la actual recesión económica, la dirección de la empresa está

dispuesto a despedir a un grupo de sus trabajadores a fin de bajar el

promedio general de remuneraciones y de paso elevar la rentabilidad

de la misma; sin embargo el Jefe de Personal sugiere que para no

generar reacciones traumáticas en estas personas se opte por reducir

en 22 por ciento las remuneraciones de los empleados y se despida

solo a un pequeño grupo de 15 obreros; el Técnico de Estadística cree

que este sistema no logrará reducir el promedio esperado. Apoye o

sustente los argumentos de este profesional.

3.16. Se está probando la efectividad de un nuevo fertilizante para la

producción de zanahoria en terrenos agrícolas de Lima y Huacho; en

tal sentido se toman parcelas del mismo tamaño en diferentes lugares

de estas dos provincias, y los rendimientos obtenidos en toneladas

después de la cosecha son los siguientes: Parcela N° Rendimiento Lima

(Tn zanahoria) Rendimiento Huacho (Tn de zanahoria)

1 1 875 2 616

2 2 108 2 484

3 3 188 2 768

4 2 956 3 002

5 1 844 2 517

6 3 502 4 403

7 3 979

8 1 601

a) ¿Cuáles son los rendimientos promedios de zanahoria en Lima y

en estos dos lugares?

b) ¿En cuál de las provincias hay más homogeneidad de producción?

c) ¿Por qué el cálculo de la media aritmética puede ser distorsionada

si quisiera hacerse comparaciones?

Page 68: Estadisticas y Probabilidades 1

68

3.17. De una promoción de graduados de una universidad, el

23% eran de ingeniería química, el 38% eran de enfermería, el 26 %

de agronomía y el resto de derecho; si las calificaciones medias de los

graduados en química fue de 12,3, de los de enfermería 13,1, de los de

agronomía 12,8 y de los de derecho 14,5, ¿cuál fue la calificación

media de la promoción?

3.18. En el curso de Estadística y Probabilidades hay 25 alumnos que

los llevaron por primera vez, ocho los llevaron por segunda vez y tres

los llevaron por tercera vez. El promedio de notas de los que llevaron

por primera vez fue de 12, y de los que llevaron por segunda vez fue

de 13; determine el promedio de notas de los alumnos que llevaron

por tercera vez, si se sabe que el promedio general fue de 12,8 y la

suma total de las notas fue 575. Res. 14.

3.19. Un grupo de pacientes sometidos a la prueba de colesterol en la

sangre, presentó los siguientes resultados: 205, 210, 320, 300, 202,

240, 218, 190, 216, 270, 235, 212, 235, 196, 320, 350, 205, 190, 312,

210, 195, 188, 202, 205, 204, 290, 240. Construya un histograma de

frecuencias, así como su curva de frecuencias y determine: a) El

promedio del grupo b) ¿Qué significado tiene una persona que tiene

cantidades superiores a 220? c) La mediana d) La moda e) Si el

promedio normal de colesterol en la sangre es de 200, ¿cuántas

personas están por debajo de este promedio?

3.20. En una empresa los obreros ganan en promedio S/ 1 500

mensuales, en tanto que los empleados S/ 2 000 mensuales. ¿Qué

relación de obreros a empleados debería existir, si se deseara que el

promedio general de las remuneraciones de estos trabajadores fuese de

S/ 1 600 mensuales? R. 4:1

3.21. En una sección de Química del segundo ciclo, 32 alumnos llevan

el curso de Física por primera vez, siete los llevan por segunda vez, y

seis por tercera vez. Se conoce además que 13 es el promedio de los

que llevan por primera vez, y que las notas de los que llevan por

segunda vez es en promedio 10% más de los que los llevan por

primera vez. Determine el promedio de notas de los que llevan por

tercera vez, si el promedio general del grupo de alumnos es de 13,5. R:

13

3.22. Una entidad pública cuenta con 180 empleados que en promedio

tienen 15 años de antigüedad; a este total se los divide en grupos

ocupacionales de Profesionales, Técnicos y Auxiliares, siendo los

tiempos promedios de servicios por cada uno de ellos de 12,2 15,5 y

Page 69: Estadisticas y Probabilidades 1

69

18 años respectivamente; encuentre el número de servidores

por especialidad si se sabe que la suma de los grupos ocupacionales

de profesionales y técnicos es de 85. R: 25, 50, 95

3.23. De la siguiente tabla de frecuencias: Clase Frecuencia

3,57 – 4,56 2

4,57 – 5,56 K

5,57 – 6,56 86

6,57 – 7,56 8k

7,57 – 8,56 45

8,57 – 9,56 3k

9,57 – 10,56 5

Calcule el valor de k si el promedio de estas observaciones es de 7,065;

además determine: a) Histograma de frecuencias relativas b) Mediana y

moda. R: k = 8; b) 7,12 6,90

3.24. De la tabla de distribución de frecuencias:

Clase Frecuencia

observada

[ 3 - 7 > 15

[ 7 - 11> 63

[11 - 15> 2k

[15 - 19> 81

[19 - 23> k

[23 – 27> 6

a) Determine el valor de k si el promedio observado fue de 14,28;

además determine los cuartiles uno y tres b) ¿Qué proporción de

observaciones corresponden a clases menores de 13,5? R: k = 45

3.25. Durante el pasado año, la empresa “Metálica Industrial S.A”

fabricó y vendió, en el mercado nacional, calderas a vapor, cuyos

precios fluctuaban entre los 2 500 y 25 000 US$. Las cantidades

vendidas se muestran de una manera incompleta en la siguiente tabla: Precio de venta de las Calderas USA $

Unidades vendidas

Proporción de ventas

4k

9k

6k 0,300

2

1

Page 70: Estadisticas y Probabilidades 1

70

Determine:

a) El cuadro completo de las distribuciones de frecuencia de la

producción y venta de estas calderas b) El tipo de distribución de

frecuencias c) Porcentaje de calderas vendidas cuyos precios superan

a los $15 000 d) Precio promedio de las calderas vendidas e) Su

desviación cuartílica f) Percentil cinco. R: c) 11,67% d) $10 225 e)

$2 750 f) $ 3 625

3.26. Explique el significado de una medida de variabilidad.

3.27. Explique las razones por las que la desviación estándar, una

medida de variabilidad, es usado con mayor frecuencia.

3.28. Al clasificar 480 varillas de fierro de construcción en una tabla de

frecuencias, se obtuvo los siguientes resultados: fixi2 = 58 467,

promedio de peso de cada varilla 10,7 kg. Determine la desviación

estándar del peso de estas varillas. R: 2,70 kg

3.29. En el primer examen de Estadística y Probabilidades, el promedio

general de notas, obtenidos por los alumnos fue de 08,5, con una

desviación estándar de 4,4; dado que estas notas estaban por debajo del

promedio esperado, el profesor del curso decide bonificar con dos

puntos más a toda la sección; ¿cuál será el nuevo promedio general y

cuál su desviación estándar?

3.30. En términos generales, en promedio, un Menú Ejecutivo,

ofrecidos en restaurantes destinados a la clase media, en US cuesta $

8,00 con una desviación estándar de $ 3,00, y en Lima cuesta S/ 9,00

con una desviación estándar de S/ 3,50.

a) ¿En cuál de los lugares hay mayor uniformidad en los precios de

los Menús?

b) Un viajero estuvo en Lima y USA; en Lima pagó por un Menú

Ejecutivo S/ 10,50, en tanto que en USA pagó por el mismo tipo

de Menú, $ 9,20. ¿En cuál de los dos lugares le salió más barato?

3.31. A un grupo de 250 estudiantes cuya estatura promedio es de 1,69

m., se los divide en dos grupos cuya estatura media del primero es de

1,73 cm. y el del segundo 1,63 m; determine el número de estudiantes

por grupo. R: 150, 100

3.32. Una mega empresa cuenta con una plana de 40 profesionales

varones que ganan en promedio mensualmente S/ 3 400 y 22

profesionales mujeres que en promedio ganan 15% menos que los

varones; determine el ingreso promedio del conjunto de todos los

profesionales que trabajan en esta empresa.

Page 71: Estadisticas y Probabilidades 1

71

3.33. Se introducen dos solutos A y B en dos reactivos C y D,

respectivamente; A demora en disolverse en C diez minutos, mientras

que B en D doce minutos; se intercambian los reactivos y se observa

que A demora en disolverse nueve minutos en D y B diez minutos en

C; ¿de qué manera puede entenderse la uniformidad de estos tiempos y

cuál de las soluciones presenta una disolución más homogénea.

3.34. Un grupo de ingenieros industriales y químicos postulan para

ocupar vacantes disponibles en una empresa; ambos rinden un examen

general de conocimientos que se califica en la escala de cero a cien. El

promedio de notas del grupo fue de 68; si los seis ingenieros

industriales obtuvieron un promedio 70, y los ingenieros químicos

obtuvieron una nota promedio de 64; determine la cantidad de

ingenieros químicos que se presentaron al examen.

3.35. La siguiente tabla muestra la pirámide del sistema de ahorro

bancario de nuestro país: 1 2 3 4

Personas % del total de personas

Monto, en US $ millones

% del total

5 078 518 * 88,31 831 6,3

600 249 * 10,44 3 443 26,2

71 438 **

1,24 4 980 37,8

651 ***

0,01 3 907 29,7 5 750 856 100,0 13 160 100,0

* Ahorro de personas naturales

** Cerca de 20 000 son personas naturales y el resto personas jurídicas

*** Personas jurídicas

Fuente: SBS y Asociación de Bancos (La República, 28/12/2003)

El total de personas naturales y jurídicas que ahorran en el Perú se da

en la columna 1; el total ahorrado por el conjunto de ellos se da en la

columna 3; determine: a) Promedio ahorrado por persona por cada

nivel y por el nivel general b) ¿Puede decirse que existe buena

capacidad de ahorro por parte de las personas naturales? c) ¿Por qué

es que en estos casos los promedios son engañosos? d) ¿Qué puede

afirmar del 0,01% de personas que ahorran? e) Si el Gobierno está

implementando un impuesto a las transacciones financieras por el

movimiento de estos fondos, ¿quiénes serán los más perjudicados?

3.36. Se toma una muestra aleatoria de 20 botellones conteniendo

aceite y se encuentra que la variable de sus pesos x, medidos en kilos

indicaban los siguientes valores: x = 800, x2 = 8 320; determine

Page 72: Estadisticas y Probabilidades 1

72

la media aritmética y la desviación estándar de estos

botellones. R: 20, 4

3.37. En un estudio sobre jornales diarios que percibían en US$, cierto

grupos de trabajadores pertenecientes al sector textil, los datos

obtenidos fueron destinados a clasificarlos en una tabla de distribución

de frecuencias, divididas en cinco clases de igual amplitud; sin

embargo el Técnico en Estadística no completó el llenado de este

cuadro aduciendo pérdida de datos, pero que sí tenía alguna referencia

de algunos de ellos. En este sentido, manifestó que la frecuencia

absoluta de la segunda clase fue de 72, la frecuencia absoluta

acumulada de la cuarta clase era de 404; la frecuencia relativa de la

primera clase fue 0,10 y la frecuencia relativa acumulada de la tercera

clase fue de 0,5358, en tanto que la marca de clase de la tercera clase

era de 60. Sí el total de trabajadores observados fue de 200 personas, y

el jornal promedio por día era de S/ 85,54, de un máximo de S/ 120

diarios; reconstruya el cuadro de frecuencias, así como determine su

desviación cuartílica y los percentiles 20 y 70.

3.38. En una empresa el promedio mensual de sueldos de sus

empleados es de S/ 1 750 con una desviación estándar de S/ 480; el

sindicato que los agrupa solicita un aumento del 15%; sin embargo al

empresa propone una aumento del 10% más una bonificación de S/ 50

por cada trabajador; determine. a) El nuevo promedio de sueldos y su

desviación estándar solicitados por el sindicato y propuestos por la

empresa b) ¿Cuál de las nuevas propuestas le sería más beneficiosa

para la empresa?

3.39. Una empresa dedicada a la fundición de piezas fabrica y vende

bombas hidráulicas; las ventas anuales de estos productos se hacen al

por mayor y sólo por lotes de pedidos superiores a las 200 unidades,

llegando a un máximo de 1 600 unidades, según se muestra en la

tabla: Unidades

producidas

Número de veces

solicitadas

200 - 15

32

87

108

24

15

– 1 600 7

Page 73: Estadisticas y Probabilidades 1

73

a) Complete la tabla y construya su curva de frecuencias

explicando la relación entre la media, la mediana y la moda b)

Interprete el resultado de µ sx, c) ¿Cuántas veces se ordenaron

menos de 900 unidades? d) Si la escala de producción y ventas

comprendida en el intervalo [900 – 1 100] se considera satisfactoria,

¿cuántos pedidos deberán ordenarse? e) Determine la mediana y

moda, así como los percentiles: 5, 25, 32, 64, y 82. R: c) 188 d) 120

3.40. A fin de mejorar la formación académica de los alumnos de

ingeniería química, la autoridad universitaria contratará por horas a

cuatro nuevos profesionales de esta carrera, para dictar los cursos de

Corrosión, Transferencia de masa, Termodinámica y Textiles. Las

tarifas que estos profesionales cobran, en Nuevos Soles, por hora

dictada son de: 40, 45, 50, 47, respectivamente. También se está

considerando que las horas asignadas a cada uno de ellos sea el

siguiente: 30 horas para Corrosión, 35 horas para Transferencia, 38

horas para Termodinámica, y 27 horas para Textiles. a) ¿Cuánto

deberá invertir la universidad en el dictado de estos cursos? b) ¿Cuál

será el promedio de pago que deberá desembolsarse por cada

profesional? c) ¿Si estos profesionales exigen se les abonen un ocho

por ciento más por hora dictada, como concepto de viáticos y gastos de

alojamiento, cuánto más le costará a la universidad, y en cuánto más se

incrementará el promedio de pagos?

3.41. En el puerto del Callao se acopian diariamente, diferentes tipos de

minerales provenientes de las concentradoras del país, listos para ser

embaladas y exportarlos. En una observación de 325 días se reportó

que la máxima cantidad acopiada fue de 280 toneladas, con el cual se

intenta configurar una tabla de frecuencias como el mostrado: Item Toneladas de

minerales Días observados

1 20

2 K

3 2k

4 120

5 50

6 0,25k

7 5

Construya una tabla de frecuencias y calcule: a) Promedio y desviación

estándar de los minerales ingresados b) ¿Qué porcentaje de días

representan ingresos de minerales superiores a 180 toneladas? R: a)

Page 74: Estadisticas y Probabilidades 1

74

Determine el índice de asimetría, e Promedio 123.38 Tn. C)

indique sus características.

3.42. En una empresa el jornal promedio de los obreros es de S/ 45,00

con una desviación estándar de S/ 12,62; dado el incremento del costo

de vida, el sindicato propone a la empresa un aumento diario del 7%,

en tanto la empresa propone un aumento general del 3% más S/ 1,75.

a) Determine la media y la desviación estándar de los nuevos salarios

propuestos por el sindicato b) La media y la desviación estándar

propuesto por la empresa c) ¿Cuál de las propuestas favorece más a

los obreros? R: a) 48,15 13,50 b) 48,10 13,0

3.43. Actualmente los profesores universitarios pertenecientes al sector

público ganan en promedio S/ 1 800 mensuales con una desviación

estándar de S/ 700; la FENDUP está presentando su pliego de

reclamos ante el Ministerio de Economía y Finanzas para que se lo

homologue de acuerdo a Ley; el MEF no cuenta con la partida

presupuestaria para atender este pliego de reclamos y como una

medida de paliatoria les propone un aumento general del 20% a todos

los docentes más una remuneración adicional de S/ 120 por función

educativa a cada docente a) Si la docencia universitaria está compuesto

por 20 000 docentes, determine: a) El nuevo promedio de ingresos de

los docentes b) La varianza de los nuevos sueldos c) ¿Cuánto le

significará este nuevo aumento al MEF? d) ¿Desde el punto de vista

del docente universitario, le convendría un aumento según un

porcentaje a su remuneración, o una bonificación general para todos,

sustente su respuesta.

3.44. De dos grupos de trabajadores de una empresa que fabricaban

tubos de PVC, en un período de trabajo, se obtuvo las siguientes

cantidades producidas: Días Trab 1 2 3 4 5 6 7 Grupo A 3 000 3 100 2 879 3 219 2 989 3 010 3 208

Grupo B 3 253 2 542 2 165 3 604 4 398 3 056 2 482

a) ¿Cuál de los dos es más uniforme y eficiente en sus trabajos? b)

¿Qué implicancias tiene el cálculo de la media para estos dos grupos

de trabajadores? c) ¿Cuál de los dos grupos tiene mayor desviación

estándar? d) ¿Cómo podría mejorarse la desviación estándar de los

dos grupos? Sugerencia: Use el concepto de medidas de variabilidad

3.45. Una empresa inmobiliaria que actualmente se dedica a la

construcción de habitaciones familiares para el programa “MI

VIVIENDA” cuenta con una planilla de obreros que en promedio

Page 75: Estadisticas y Probabilidades 1

75

ganan un salario semanal de S/ 500; ante la urgencia de entregar

las obras dentro del plazo de fecha de vencimiento del contrato, decide

contratar con urgencia una décima parte más de obreros respecto a su

planilla actual, pagándoles un salario semanal de S/ 400; la federación

de trabajadores de Construcción Civil, presenta un pliego de reclamos

ante el Ministerio de Trabajo y logra que a los trabajadores antiguos se

les incremente el salario en un 15% más de la actual, más una

bonificación de S/ 50 adicionales por riesgo de trabajo, en tanto que a

los recientemente incorporados se les bonifique con un 5% más sobre

su salario actual y de S/ 10 de bonificación adicional por riesgo de

trabajo; estime el promedio de sueldos actuales del conjunto de

obreros, dados estos incrementos. R: S/627,27

3.46. En el mercado informático pueden conseguirse computadoras

personales (PC) nuevas y repotenciadas de los modelos Pentium II, III,

IV, cuyos precios dependen de su configuración, variando entre los US

$ 200 y $ 1 200 por unidad; en la siguiente tabla se muestra el

comportamiento de su distribución de ventas, según se pudo

confeccionar con las datos obtenidos: Precio de PC

US $ Cantidad

PC Vendida Frecuencia

Relativa Frec. Abs.

Acumulada Frec. Rel.

Acumulada

0,0500

80 0,2500

245

0,2500

Complete la tabla de distribución de frecuencias y determine: a)

Histograma de distribución de frecuencias y su respectiva ojiva b)

Precio promedio de venta de una PC c) Precio medio de una PC d)

¿Qué porcentaje de ventas representan precios por encima de los $

450 e) ¿Qué precio de venta de una PC aparece con mayor

frecuencia? f) ¿Puede considerarse que la curva de distribución de

frecuencias de estas ventas sigue una distribución simétrica?

3.47. Un grupo de clientes de una distribuidora de materiales de

construcción, presentan quejas ante la gerencia, indicando que el

cemento que les están vendiendo no cuenta con el peso reglamentario

de los 42 kilos por bolsa; la gerencia les manifiesta que efectivamente

estos pesos no venían exactamente en los pesos indicados, dado que

podrían fluctuar más o menos de este peso y que esta no era muy

significativa dado que al final el cliente siempre saldría beneficiado;

Page 76: Estadisticas y Probabilidades 1

76

con la finalidad de corroborar esta afirmación los clientes toman

al azar un determinado número de bolsas de este material y obtienen

los siguientes valores: Peso promedio 41,446 kilos, desviación

estándar 0,953 kilos y suma de los cuadrados de los pesos de cada

bolsa es de 22 342,62; ¿cuántas bolsas de cemento fueron pesados?

3.48. En una obra de construcción se contrata cuatro albañiles a quienes

se les pagará las siguientes remuneraciones por hora de trabajo: Al

primero se le pagará S/ 6,10, al segundo S/ 6,50, al tercero S/ 6,70, y al

cuarto S/ 7,20; determine: a) El promedio de remuneraciones b) Si

la jornada laboral normal es de 48 horas, pasado el cual se le abonará

un 10% por hora extra, calcule el promedio semanal del grupo si las

horas trabajadas por cada uno de ellos fue el siguiente: El primero

laboró 41 horas, el segundo solo laboró 36 horas, el tercero laboró 47

horas y el cuarto 48 horas.

3.49. En una empresa metal mecánica la experiencia laboral de sus

trabajadores, compuesta por obreros y empleados han sido tabulados

de acuerdo a la siguiente tabla: Tiempo de permanencia del personal obrero y empleado en la

empresa XXXX.

Grupos de acuerdo a tiempo

de permanencia, en años

Número de

trabajadores

0 – 4 7

4 – 8 10

8 – 12 16

12 – 16 25

16 – 20 11

20 – 24 6

24 – 28 3

a) Construya un histograma de frecuencias y encuentre una curva de

tendencia teórica que explique el comportamiento de antigüedad de

estos trabajadores b) Si se toma una muestra al azar de un grupo de

25 trabajadores, ¿qué proporción de ellos tendrán más de 20 años de

experiencia laboral en la empresa? c) Determine sus medidas de

tendencia central y sus medidas de variabilidad explicando sus

principales características d) Si se estima que menos del 40% de los

trabajadores cuentan con menos de 13 años de antigüedad en la

empresa, ¿cuántos trabajadores estarán comprendidos dentro del

grupo?

Page 77: Estadisticas y Probabilidades 1

77

3.50. En una reunión social habían 50 ingenieros químicos e

informáticos quienes comentaban sobre sus ingresos mensuales; de

este modo se determinó que los primeros percibían un sueldo

promedio de S/ 4 000, mientras que los segundos percibían un sueldo

promedio de S/ 4 500. Si el promedio general de sueldos del grupo

fue de S/ 4 400, determine el número de ingenieros por grupo.

3.51. En una determinada ciudad del país eventualmente se registran las

temperaturas a fin de conocer su comportamiento, el registro se hizo en

grados Faherenheit °F y estos fueron los siguientes: 65, 54, 67, 49, 52,

54, 51, 63, 65, 44, 48, 60, 67 y 65; determine el promedio de la

temperatura en grados Celsius °C, sabiendo que °C =

5

9

32F, el

valor de la mediana y la temperatura que se registró con mayor

frecuencia.

3.52. Queriendo conocer la forma cómo se distribuyen los ingresos

mensuales de los trabajadores pertenecientes al sector privado, se

hace un muestreo en las principales ciudades del país,

encontrándose que éstos percibían entre los S/ 600 y S/ 3 750; si el

número total de trabajadores entrevistados fue de 415, construya

una tabla de frecuencias, partiendo de las informaciones

proporcionadas, como lo mostrado en el siguiente: Tabla de ingresos mensuales de los trabajadores, en S/, de acuerdo a las

informaciones proporcionadas

Número Remuneraciones

mensuales en S/

Número de

trabajadores

1 15

2 k

3 2,4k

4 80

5 1,4k

6 60

7 0,4k

a) Explique el comportamiento de su curva de frecuencias.

b) Remuneración media.

c) Mayores remuneraciones percibidas por los trabajadores.

Page 78: Estadisticas y Probabilidades 1

78

d) Desviación cuartílica.

e) Percentiles 20 y 40.

f) Si el gobierno decreta un aumento general de S/ 80 a todos

los trabajadores, ¿en qué medida cambiarán todas las

medidas determinadas en los parágrafos anteriores? 3.53. La unidad de logística de una empresa está por recibir un lote de

tarjetas madres para ensamblar sus PC; se presentan dos proveedores

ofertando estas tarjetas; el Jefe de Planta antes de otorgar la buena pro,

solicita información sobre la vida útil de estas tarjetas a cada uno de

estos proveedores, quienes les adjuntan los siguientes datos: Vida útil de las

tarjetas madre en

horas

N° de tarjetas

de proveedor A

N° de tarjetas

de proveedor B

Menos de 550 1 3

550 a 650 8 8

650 a 750 18 12

750 a 850 40 16

850 a 950 26 35

950 a 1 050 132 42

1 050 a 1 150 245 167

1 150 a 1 250 343 542

1 250 a 1 350 476 256

1 350 a 1 450 564 528

Más de 1 450 78 124

El Jefe de Planta encarga evaluar estos datos a su experto en estadística

, debiendo presentar los siguientes reportes: a) Promedio y desviación

estándar para cada una de las tarjetas madre b) Desviación cuartílica de

cada una las tarjetas c) Curva de distribución de las dos tarjetas d)

Proveedor a quien deberá ordenarse la provisión de estas tarjetas,

indicando las razones de su elección d) Explicando las características

de los índices de asimetría para este grupo de observaciones e) ¿Cuál de

los proveedores presenta mayor uniformidad en las características de su

producto?