7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 1/68
••••••••••••••••••••••••••• • •••••••••••••••••••••••••••••
capítulo
Proporcionar una comprensión de lascaracterísticas o propiedades de losdatos numéricos (tendencia central,
variación, forma) y sus mediciones
descriptivas de resumencorrespondientes, como una ayuda
para el análisis e interpretaciónde datos.
OBJETIVO DEL
CAPíTULO
Resumen
y descripciónde los datosnumé.ricos
- ,
!,
103
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 2/68
m Introducción: Lo que sigue
En los capítulos anteriores aprendimos cómo recolectar y presentar datos numéri-
cos tanto en formato tabular como en formato gráfico. Ahora bien, ¿cómo le
sacamos sentido a tal información? Por ejemplo, ¿qué nos dicen los datos de la
Encuesta sobre la sat isfacción de los empleados de Industrias Kalosha de la tabla
2.3 (páginas 33-40)? ¿Cómo puede la B&LCorporation, la compañía de consultoría
sobre beneficios a empleados, usar finalmente estos resultados para desarrollar unpaquete de beneficios para los empleados? Aunque la recolección y la posterior
presentación de los datos son dos componentes esenciales del tema de la estadís
tica descriptiva, éstos no cuentan toda la historia. Un buen análisis de datos no sólo
implíca lapresentación (es decir, la graficación) de los datos numéricos recolectados
y la observación (es decir, el estudio) de lo que los datos tratan de transmitir, sino
que también implica el cómputo (es decir, la caracterización o resumen) de las características clave y la descripción (es decir, el análisis) de los hallazgos. En este capí
tulo, examinaremos estos últimos aspectos: el resumen, descripción y, finalmente,
la interpretación de los datos.Con el fin de presentar las ideas importantes del capítulo, podemos ver en el dia
grama de resumen del capítulo de la página 160 que existen tres características o
propiedades esenciales de los datos numéricos: la tendencia central, la variación y la
forma. Elobjetivo de este capítulo es proporcionar una comprensión de estas características o propiedades de los datos numéricos y sus mediciones descriptivas de
resumen correspondientes, como una ayuda para el análisis e interpretación de datos.Después de concluir este capítulo, usted debe poder:
1. Comprender la propiedad de la tendencia central.
2. Interpretar las diferencias entre las diversas mediciones de tendencia
cent ral corno la media, la mediana, la moda, el alcance medio y el
eje medio.
3. Comprender la diferencia entre la tendencia central y la tendencia
no central.
4. Comprender la propiedad de la variación.
S. Interpretar las diferencias entre las diversas medidas de variación
como el alcance, el alcance intercuartil, la varianza, la desviaciónestándar y el coeficiente de variación.
6. Comprender el papel y el uso de las reglas de Bienaymé-Chebyshev yreglas empíricas.
7. Comprender la propiedad de la forma.
8. Apreciar el valor de las técnicas de análisis de datos exploratorio: los
resúmenes de cinco números y las gráficas de caja y bigotes.
9. Saber cómo aproximar mediciones descriptivas de resumen de una
distribución de frecuencia, polígono u ojiva.
10. Apreciar el valor de paquetes de software estadístico para calcular lasmediciones descriptivas de resumen.
11. Aprender a distinguir entre las mediciones descriptivas de resumen
adecuadas e inadecuadas que se reportan en los periódicos y revistas,
así como las cuestiones éticas implícadas.
m Exploración de los datos
Con elfin de introducir las ideas importantes de este capítulo, regresemos a nuestroanalista investigador de la compañía de servicios de asesoría colegial quien (en elcapítulo 3) deseaba estudiar las colegiaturas cobradas a residentes fuera del estado
104 Capítulo 4 Resumen y descripción de los datos numéricos
,L-':,l ! ~ { ~-------------_.......
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 3/68
Exploración de los datos
Observamos que las seis escuelas (registradas en el orden en que fueron selec-cionadas) se presentan junto con sus colegiaturas (en miles de dólares) cobradas a
residentes fuera del estado. ¿Qué puede aprenderse de estos datos que ayude anuestro analista investigador en su evaluación? Basándonos en esta muestra,observamos lo siguiente:
por colegios y universidades de diferentes regiones del país. En particular, se selec-c ionaron tres estados para su inmediata evaluación: Texas, Carolina del Norte yPennsylvania. Suponga, con propósitos exploratorios, que nuestro analista investi-gador debe empezar seleccionando una muestra aleatoria de seis escuelas del listadode poblaciones de 90 colegios y universidades del estado de Pennsylvania (véaseConjunto de datos especiales 1 del apéndice O de las páginas 04-05).
lOS
10.34.98.911.76.37.7
C o l e g i a t ~ r a (en $000)scuelade Pennsylvania
University of Pittsburgh
East Stroudsburg University
Geneva CollegeDrexel UniversityCalifornia Univ. of Pa.Slippery Rock University
1. Los datos están en forma sin procesar. Esto es, los datos recolectadosparecen estar en un orden aleatorio sin un patrón aparente respecto a lamanera en que se enumeran las observaciones individuales.
2. Cada una de las colegiaturas ocurre sólo una vez. Esdecir, ninguna deellas se observa con más frecuencia que cualquier otra.
3. La extensión de las colegiaturas varía entre 4.9 y 11.7 miles de dólares.4. No parece haber ninguna colegiatura inusual o extraordinaria en estamuestra. Arregladas en orden numérico (es decir la clasificación
ordenada), estas colegiaturas (en miles de dólares) son 4.9,6.3,7.7,8.9,
10.3, 11.7. (Si las colegiaturas, en miles de dólares,hubieran
sido 4.9,6.3, 7.7, 8.9, 10.3 Y28.0, entonces 28.0 miles de dólares se hubieraconsiderado una observación extrema o externa.)
Sinuestro analista investigador nos pidiera examinar los datos y presentar un
breve resumen de nuestros hallazgos, entonces lo úni co que básicamente
podríamos esperar hacer, sin más entrenamiento estadístico formal, serían comen
tarios similares a los cuatro anteriores. Sin embargo, al hacer tales comentarios,hemos analizado e interpretado lo que los datos tratan de transmitir. Un análisis esobjetivo; debemos estar de acuerdo con estos resultados. Por otra parte, una inter-pretación es subjetiva;podemos formar diferentes conclusiones al interpretar nues-tros resultados analíticos. De lo anterior, los puntos 2 a 4 se basan en el análisis,mientras que el punto 1 es una interpretación. Con respecto a esta última, no se
hizo ninguna prueba analítica formal (véase la prueba de corridas del capítulo 12),simplemente es nuestra conjetura que no existe ningún patrón de la secuencia
de datos recolectados. Además, nuestra conjetura parecería apropiada si la mues-tra de seis escuelas se extrajo de manera aleatoria e independiente del lis tado depoblación usando los métodos de encuesta descritos en el capítulo 2. Ésefue el casoaquí.
Ahora veamos cómo podemos aumentar nuestra comprensión de lo que losdatos nos dicen al examinar de manera más formal tres propiedades de los datosnuméricos.
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 4/68
106 Capítulo 4
DI Propiedades de los datos numéricos
Las tres mejores propiedades que describe una serie numérica de datos son
1. Tendencia central2. Variación
3. Forma
En cualquier análisis y/o intepretación puede usarse una variedad de medi-
ciones descriptivas que representan las propiedades de tendencia central, variacióny forma para extraer y resumir las principales características de la serie de datos. Si
estas mediciones descriptivas de resumen se calculan a part ir de una muestra dedatos, se denominan estadísticas; si se calculan a part ir de una población completa
de datos, se denominan parámetros. Puesto que los estadísticos generalmente toman
muestras en vez de usar poblaciones enteras, nuestro principal énfasis en este textoestá puesto en las estadísticas más que en los parámetros.
m Mediciones de la tendencia central
La mayor par te de las series de datos muest ran una clara tendencia a agruparse
alrededor de un cierto punto central. Así pues, dada cualquier serie de datos par-ticular, por lo general es posible seleccionar algún valor o promedio típico para
describir toda la serie de datos. Estevalor descriptivo típico es una medición de ten-dencia central o de ubicación.
Cinco tipos de promedios a menudo usados como mediciones de tendenciacentral son la media aritmética, la mediana, la moda, el rango medio y el ejemedio.
4 .4 . I La media aritmética
Lamedia aritmética (también llamada lamedia) es el promedio! o medición de
tendencia central de uso más común. Secalcula sumando todas las observacionesde una serie de datos y luego dividiendo el tota l entre el número de elementos
involucrados.
• Introducción de la notación algebraica Por lo tanto, para una muestraque contiene una serie de n observaciones X ,X r ••• r X ! la media aritmética (dadapor el símbolo X, denominado "X barra") p Ú e d ~ escribirse como
X = X! + X 2 + .oo + X n
n
Para simplificar la notación y por comodidad se usa convencionalmente el término
(que significa la sumatoria de todos losvalores X) siempre que deseemos sumar unaserie de observaciones. Esto es, 1
Resumen y descripción de los datos numéricos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 5/68
!X ; =: XI + X 2 + ... + X"i = 1
Lamedia aritmética para esta muestra se calcula como
(4.1)
n
n = tamaño de la muestra
X = iésima observación de la variable aleatoria Xi
x =media aritmética de la muestra
n
IX; =sumatoria de todos los valores X¡de la muestrai = J (véase el apéndice B)
donde
n
IX ¡
X ¡ =1 10.3 + 4.9 + 8.9 + 11.7 + 6.3 + 7.7 = 8.30miles de dólares;
n 6
Aquí observamos que la media se calcula como 8.3 miles de dólares aun
cuando ninguna escuela en particular de la muest ra tenía realmente esa cole
giatura. Además, vemos de la escala de puntos de la figura 4.1 en la página 108que para esta serie de datos tres observaciones son menores que la media y tres son
mayores. La media actúa como punto de equilibrio de tal forma que las observa
ciones menores compensan aquellas que son mayores.Observe que el cálculo de la media se basa en todas las observaciones (X
J, X
z' ... ,
X ) de la serie de datos. Ninguna otra medición de tendencia central comúnmente
usada posee esta característica. Puesto que su cálculo se basa en cada observación,la media aritmética se ve afectada en gran medida por cualquier valor extremo. En
estos casos, la media aritmética presenta una representación distorsionada de lo
que los datos están transmitiendo; así pues, la media no sería elmejor promedio a
usarse para describir o resumir esta serie de datos.
Las reglas relativas a la notación de sumatoria se presentan en el apéndice Ben
las páginas B1-B5. Usando esta notación de sumatoria, la media aritmética de lamuestra puede expresarse de manera más simple como
Para la muestra de nuestro analista investigador, las colegiaturas cobradas a resi
dentes fuera del estado (en miles de dólares) son
X =10.3 en University of PittsburghJ
X = 4.9 en East Stroudsburg University2
X3= 8.9 en Geneva College
X = 11.7 en Drexel University4
X = 6.3 en California Univ. of Pa.s
X = 7.7 en Slippery Rack University6
Mediciones de la tendencia central 107
: 1I
11
I
1'1',:,11, di¡¡I[inJIi:!I',;
!{:¡¡,i,II,'::,;;1.Jl4,J
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 6/68
Para continuar demostrando las características de la media, suponga que nues-tro investigador toma una muestra aleatoria de n = 6 escuelas del marco depoblación de 60 en el estado de Texas y otra muestra aleatoria de n = 6 escuelas dell istado de 45 del estado de Carolina del Norte. Las colegiaturas cobradas a resi-dentes fuera del estado (en miles de dólares) se reportan deja siguiente manera:
Figura 4.1Escuela de puntos que representa las
colegiaturas (en $000) en seis escuelas
de Pennsylvania.
o O O O O O! I
t i! I
4 6 10 12
X=8.3
:1']
loa Capítulo 4
Escuela de Texas Colegiatura (en $000)
Concordia Lutheran College 6.4
Southern Methodist University 12.0Texas A& M University 4.9Lubbock Christian University 6.4
Rice University . 8.5Trinity University 11.6
Escuela de Carolina del Norte Colegiatura (en $000)
Methodist College 8.3Warren Wilson College 8.7
Campbell University 7.6Belmont Abbey College 8.3
Catawba College 9.0North Carolina State Uníversity 7.9
Las escalas de puntos respectivas se muestran en las figuras 4.2 y 4.3.Observe que la colegiatura media para cada una de estas muestras también es
8.3 miles de dólares. No obstante, como se observa en las figuras 4.2 y 4.3, las dosmuestras aquí extraídas tienen características claramente distintas, respecto a laotra y respecto a la muestra de seis escuelas de Pennsylvanía descrita en la figura4.1. Por ejemplo , t res de las seis escuelas de Texas tienen colegiaturas bastante
dis tintas de las de la Trini ty Univers ity y de la Southern Methodist Uníversity,
Para esta muestra , la media aritmética presenta una representación algo distor-sionada de lo que los datos están transmitiendo y puede que no sea el mejor
promedio a usarse.Por otra parte, para la muestra de las escuelas de Carolina del Norte y la mues-
tra de las escuelas de Pennsylvania, la media es la medición descriptiva apropiadapara caracterizar y sumar las series de datos respectivas porque no están presentesobservaciones externas.
De hecho, los datos de Carolina del Norte son bastante homogéneos. Dos de las
seis escuelas de esta muestra tienen colegiaturas equivalentes a la media; además,de las figuras 4.1 a 4.3, es claro que las colegiaturas cobradas por estas seis escuelasde Carolina del Norte contienen la mínima cantidad de dispersión o variabilidadentre las tres muestras. Asimismo, también se observa que los datos de colegiaturasde cada una de las muestras de Pennsylvanía y Carolina del Norte poseen lapropiedad de simetría, mientras que no ocurre así con los datos de colegiaturas deTexas. (Las propiedades de variación y forma se abordarán más adelante en las sec-ciones 4.5 y 4.6.)
Resumen y descripción de los datos numéricos
I . J . . ~
__ ,. .4 " ' ~ : ~ ~ l .
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 7/68
4.4.2 La mediana
n+ l
2
109ediciones de la tendencia central
7.7.31.7.9.90.3
oo o o 00
I ,
». I I4 6 10 12
Figura 4.1
X=8.3Escala de puntos que representa lascolegiaturas (en $000) en seis
escuelas de Texas.
O00000
I I
l \I I
4 6 10 12
Figura 4 .3
X=8.3Escala de puntos que representa. lascolegiaturas (en $000) en seis
escuelas de Carolina de l Norte.
Regla 2 Si el tamaño de la muestra es un número par, entonces el punto
de posicionamiento cae entre las dos observaciones medias de la
clasificación ordenada. La mediana es el promedio de los valores numéricos
correspondientes a estas dos observaciones medias.
Regla I Si el tamaño de la muestra es un número impar, la mediana se
representa mediante el valor numérico correspondiente al punto de
posicionamiento, la observación ordenada es (n + 1)/2.
• Muest ra de tamaño uniforme Para la muestra de nuestro investigador
de seis escuelas de Pennsylvania, los datos sin procesar (en miles de dólares) fueron
para encontrar el lugar de la clasificación ordenada que corresponde al valor de la
mediana. Se sigue una de dos reglas:
La mediana es el valor medio de una secuencia ordenada de datos. Si no hayempates, la mitad de las observaciones serán menores y la otra mitad serán ma-
yores. La mediana no se ve afectada por ninguna observación extrema de una seriede datos. Por tanto, siempre que esté presente una observación extrema es apro-piado usar la mediana en vez de la media para describir una serie de datos.
Para calcular la mediana de una serie de datos recolectados en su forma sin
procesar, primero debemos poner los datos en una clasificación ordenada. Despuésusamos la fórmula delpunto deposicionamiento
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 8/68
La clasificación ordenada se vuelve
4.9
Obsevación
ordenada
6.3
2
10.3
5
11.7
6
Mediana =8.30 miles de dólares
Para estos datos, el punto de posicionamiento es (n + 1)/2 = (6 + 1)/2 = 3.5. Por t';consiguiente, la mediana se obtiene promediando la tercera y la cuarta observa
ciones ordenadas:
7.7 + 8.9 = 8.30 miles de dólares2
Como puede verse en la clasificación ordenada, la mediana no se ve afectada
por observaciones extremas. Sin importar si la colegiatura mayor es 11.7 miles de
dólares, 21.7 miles de dólares o 31.7 miles de dólares, la mediana sigue siendo 8.3miles de dólares.
• Muestra de tamaño no uniforme Si la muestra hubiera tenido unnúmero impar, lamediana estaría representada simplemente por el valor numéricodado a la observación (n": 1)/2 de la clasificación ordenada. Por tanto; en la siguiente
clasificación ordenada de n = 5 colegiaturas de estudiantes GMAf, la mediana es elvalor de la tercera observación ordenada [esdecir, (5+ 1)/2], 590:
500 570 590 600 690
l'Mediana
Observación tordenada 2 3 4 5
• Empates en los datos Alcalcular la mediana, ignoramos el hecho de que
puede haber valores empatados en los datos. Suponga, por ejemplo, que la siguiente serie de datos representa los sueldos de inicio (en miles de dólares) de una mues
tra de n = 7 estudiantes de comercio recientemente graduados de su colegio:
La clasificación ordenada se vuelve
22.6 22.6 23.7
l'Mediana
t3 4 5
Observación
ordenada
24.1
19.8
22.6
21.5
2
27.0 19.8 21.5 23.7
24.1
6
22.6
27.0
7
~ _ .. HM· · +-h.. .· · ' - . - -L .__... t •. • - •. -
110 Capítulo 4
Para esta muestra de tamaño impar, el punto de posicionamiento de lamediana esla (11 + 1)/2 = 4a observación ordenada. Así, lamediana es 22.6 miles de dólares, elvalor medio de la secuencia ordenada, aun cuando la tercera observación ordenadasea también 22.6 miles de dólares.
• Características de la media Para resumir, el cálculo del valor de la mediana se ve afectado por el número de observaciones, no por la magnitud de
Resumen y descripción de los datos numéricos
.""';, .
:1:'
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 9/68
4.4.3 Lamoda
cualquier extremo. Cualquier observación seleccionada aleatoriamente tiene la
misma probabilidad de exceder la mediana como de ser excedida por ésta.
vemos que no hay moda. Ninguna de las colegiaturas fue la "más típica".Observe que hay una diferencia entre ninguna moda y una moda de O,como se
ilustra en la siguiente clasificación ordenada de temperaturas de mediodía (OF) enDuluth durante la primera semana de enero:
11.70.3.9.7.3.9
Algunas veces, al resumir o describir una serie de datos, la moda se usa como una
medición de tendencia central. La moda es el valor de una serie de datos que
aparece con más frecuencia. Se obtiene Iácilrnente de Lüid d d ~ i f I c a c i ó n ordenada.Adiferencia de la media aritmética, la moda no se ve afectada por la ocurrencia decualesquier valores extremos. Sin embargo, la moda no se usa para propósitos más
que descriptivos porque es más variable de muestra a muestra que otras medicionesde tendencia central.
Usando la clasificación ordenada de las colegiaturas cobradas en una muestra _
de seis escuelas de Pennsylvania
Clasificación ordenada
(Duluth, Minnesota) _4 ° _2° _1° _1 ° 0° 0° 0°
Moda = 0°
Además, una serie de datos puede t ener más de una moda, como se ilustra en la
siguiente clasificación ordenada de temperaturas de mediodía (OF) en Richmond
durante la primera semana de enero:
Mediciones de la tendencia central I I I
4.4.4 El rango medio
EnRichmond vemos que hubo dos modas, 28° y 43°.Estos datos se describen como
bimodales.
(4.2)
43'3°1 °5°
2
28°
X menores + Xmllyores
28°
Rango medio
Clasificación ordenada
(Richmond, Virginia) 21 °
El rango medio es el promedio de las observaciones menores y mayores de una
serie de datos. Esto puede escribirse como
Usando la clasificación ordenada de colegiaturas cobradas de lamuestra de nuestro
analista investigador de seis escuelas de Pennsylvania:
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 10/68
4.9 6.3 7.7 8.9 10.3 11.7
el rango medio se calcula a partir de la ecuación (4.2) como
4.4.5 El ejemedio
El rango medio a menudo es usado como una medición de resumen tanto
po r analistas financieros como por reporteros meteorológicos, puesto que puede
proporcionar una medición adecuada, rápida y simple para caracterizar toda una
serie de datos, sea ésta una serie de precios de acciones diarias al cierre durante todo
un año o una serie de lecturas registradas de temperatura por horas durante todo un
día.
Al tratar con datos como los precios de acciones diarias al cierre o lecturas de
temperatura po r horas, no es probable que ocurra un valor extremo. No obstante,
en la mayoría de las aplicaciones, a pesar de su s impl ic idad , el rango medio debe
usarse con precaución. Dado que involucra sólo las observaciones menores y ma
yores de una serie de datos, el rango medio se distorsiona como una medición deresumen de tendencia central si está presente una observación externa. En tales
situaciones, el rango medio es inapropiado; una medición de resumen de alguna
manera similar en formato al rango medio que siempre es apropiada porque no se
ve afectada por externas es el ejemedio.
X mmOrt:5 + Xml/yores
8.30 miles de dólares
2
4.9 + 11.7
2
Rango medio
El eje medio es el promedio del primery tercer cuartiles de una serie de datos. Es
decir,
Eje medio (4.3)
donde ~ =primer cuartil
es = tercer cuartil
Es una medición de resumen usada para zanjar problemas potenciales introduci-.
dos por los valores extremos de los datos.
112 Capítulo 4
• Cuartiles: Mediciones de ubicación "no central" Además de las
mediciones de tendencia central, también existen algunas mediciones úti les de
ubicación "no central" que se emplean particularmente al resumir o descr ibir las
propiedades de grandes series de datos numérícos." Las mediciones de este tipo más
ampliamente usadas son los cuartiles.
Mientras que la mediana es un valor que divide la clasificación ordenada a la
mitad (50.0% de las observaciones son menores y 50.0% de las observaciones son
mayores), los cuartiles son mediciones descriptivas que dividen los datos ordena
dos en cuatro cuartos.
Resumen y descripción de los datos numéricos
Ii
···.... cW' . @ue " s o , ; **
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 11/68
Mediciones de la tendencia central
.Por tanto, ~ puede aproximarse como 6.30 miles de dólares.
En consecuencia, ~ puede aproximarse como 10.30 miles de dólares.Regresando a la ecuación (4.3), ahora podemos calcular el eje medio como
113
1.75ta. _ 2da. observación clasificada
Q¡ = n + 1 observación clasificada4
6 + 1
4
valor correspondiente a n + 1 observación clasificada4
3(n + 1)valor correspondiente a observación clasificada
4=
~ =
3(n + 1)Q3 = 4 observación clasificada
~ = mediana, el valor correspondiente a 2(n + 1) = n + 1 observación clasificada4 2
Elprimer cuartil, Q , es un valor tal que 25.0% de las observaciones son1
menores y 75.0% de las observaciones son mayores.
El segundo cuartil, Q , es la mediana, 50.0% de las observaciones son2
menores y 50.0% de las observaciones son mayores.
El tercer cuartil, Q , es un valor tal que 75.0% de las observaciones sonmenores y 25.0 fYo de fas observaciones son mayores.
Para aproximar los cuartíles, se usan las siguientes fórmulas de punto de posi-
cionamiento:
3(6 + 1)= 5.25ta.;: 2da. observación clasificada
4
Lassiguientes reglas se usan para obtener los valores de cuartiles:
1. Siel punto de posicionamiento resultante es un entero, se elige la
observación numérica particular correspondiente a ese punto deposicionamiento para el cuartil.
2. Siel punto de posicionamiento resultante está a la mitad del camino
entre dos enteros, se selecciona el promedio de sus valores
correspondientes.3. Sie l punto de posicionamiento resultante no es ni un entero ni un
valor a la mitad del camino entre dos enteros, se usa una regla simple
para aproximar el cuartil particular que consiste en redondear al puntode posicionamiento entero más cercano y seleccionar el valor
numérico de la observación correspondiente.
Para calcular nuestro eje medio [véase la ecuación (4.3)], primero necesitamos
calcular ~ y Q. Por ejemplo, de la observación clasificada de las colegiaturas
cobradas (en miles de dólares) a residentes fuera del estado en las seis escuelas dePennsylvania tenemos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 12/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 13/68
4.4
4.5
Q4.6
4.7
Suponga que, debido a un error, una serie de datos que contiene los cocientes
de precios-ingresos (PE)de nueve compañías negociadas en la Bolsa de Valores
estadounidense se registró como 13,15,14,17,13,16,15,16 Y61, donde el
último valor debería haber sido 16 en vez de 61. Demuestre cuánto se afectan
la media, la mediana y el rango medio por el error (es decir, calcule estas estadís
ticas para los conjuntos de datos "malos" y "buenos", y compare los resultadosde usar diferentes estimadores de tendencia central).
Un fabricante de baterías de linternas tomó una muestra de 13 baterías de la
producción de un día y las probó continuamente hasta que fallaron. Elnúmero de horas que fueran probcdas :u e
342,426,317,545,264,451,1049,
631,512,266,492,562,298
(a) Calcule la media, la mediana, el rango medio y el eje medio. Observando
la distribución de tiempos, ¿qué mediciones descriptivas parecen mejores
y cuáles parecen peores? (¡,Y por qué?)
(b) ¿De qué manera sería útil esta información para el fabricante? Analice.
En la sección 4.5.3 se establece que una propiedad importante de la media
aritmética es
n
¿(Xi -R) Oj = 1
(a) Usando las colegiaturas a residentes fuera del estado de la muest ra de seis
colegios y universidades de Texas (véase la página 108), verifique que se
cumple esta propiedad.
(b) Usando las colegiaturas a residentes fuera del estado de la muestra de seiscolegios y universidades de Carolina del Norte (véase la página 108),
verifique que se cumple esta propiedad.
Los siguientes datos representan los precios (sin receptores de césped) de una
muestra de 15 segadoras mecánicas de bolsa lateral de un alcance de
20 pulgadas:
Marca y modelo
Sears Craftsman 38023Cub Cadet 074RWhite 072RSears Craftsman 38033Sears Craftsman 38045Lawn Chief 50-HMastercut 5020-20Atlas 20 2011 (Winston)RallyA103 CRMurray 20203Sears Companion 38004Sycamore 20-4000
Lawn Chief 60-HWheeler WE20Wheeler WB20
Fuente: Copyright 1990 porConsumers Union of Uníted States,Inc.. Yonkers, N.Y. 10703. Adaptadocon permiso de Consurner Repoits,Junio 1990. pág. 396.
Precio
$150245220200160130160130119
112
114
110
160150127
Mediciones de la tendencia central l iS
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 14/68
(a) ¿Cuál es el precio medio? ¿El precio mediano?
(b) ¿Cómo sería de utilidad esta información para una compañía a punto de
comercializar un nuevo modelo? Analice.(c) Si se incluyera una segadora adicional por error en esta muestra (es decir,
una unidad de bolsa posterior que contuviera un conducto de descarga ytuviera un precio total de $320), ¿cuál sería la media y la mediana?
(d) Analice las razones de las diferencias en sus respuestas de (a) y (c).
Los siguientes datos son las cantidades de calorías de una ración de 30 gramospara una muestra aleatoria de 10 tipos de galletas de chispas de chocolate
recién horneadas:
Q4. 8
Producto
Hillary Rodham Clinton'sOriginal Nestle Toll HouseMrs. FieldsStop & ShopDuncan HinesDavíd's
David's Chocolate ChunkGreat American Cookie CompanyPillsbury Oven Lovin'PilIsbury
Calorías
153152146
138130
146
149
138168
147
4.9
Fuente: Copyright 1993 por Consumers Union ofUnited States, lnc., Yonkers, N.Y.10703. Adaptadocon permiso de Consumer Reports, octubre de 1993,págs. 646-647.
(a) ¿Cuál es la cantidad media de calorías? ¿La cantidad mediana de calorías?(b) ¿Cómo sería de utilidad esta información para una compañía a punto de
comercializar una nueva galleta de chispas de chocolate recién horneada?
Analice.
Los siguientes datos son los precios de lista (en dólares) de una muestra
aleatoria de 17 cintas de audio de tipo IV (metal):
4.955.29
3.99
11.005.99
4.59
18.99
3.49
5.50
5.99
3.49
2.99
5.29
3.99
9.95
14.99
3.50
f.¡¡i#t'. p·é+ 'lI" did "'hi'-",· t , . . . . . .·
I 16 Capítulo 4
Fuente: Copyright 1993 por Consumers
Union of United States, Inc., Yonkers,N.Y.10703. Adaptado con permiso deConsumer Reports, enero de 1993,págs. 38-39.
(a) ¿Cuál es el precio medio? ¿El precio mediano?
(b) ,NiNf''''')- ¿Qué otra información desearía conocer antes de comprar una
de estas cintas? Prepare una lista de preguntas que le haría al vendedor.
• 4.10 Los siguientes datos representan la cantidad de fondos (en millones de $)
proporcionada por la Administración de Salud Mental, de Abuso de Drogas yde Alcohol a través de donativos a una muestra de 21 instituciones durante un 'año reciente:
Resumen y descripción de los datos numéricos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 15/68
Mediciones de la tendencia central 117
1,1,
14.9
14.1
6.813.17.6
13.2
5.111.98.57.15.15.06.2
5.53.83.4
3.52.84.115.9
5.7
2,
Cantidad invertida
(en millones $)
124,4,0,,,3,
Nombre de la institución
[ohns Hopkins UniversityUniversíty of California at San FranciscoUníversíty of Washington
Vale University
Stanford UniversityUníversíty of California at LosAngeles
Harvard Uníversíty
University of MichiganUníversity of PcnnsylvaniaColumbia University
Washington University at SI. LouisDuke UniversityUniversity of Minnesota
University of California at San DiegoUníversity of North Carolina
University of Wisconsin
University of RochesterYeshiva Uníversíty
University of Chicago
University of PittsburghCornell University
11.2,21.5,16.4,19.7,14.6,16.9,32.2, 18.2,
13.1,23.8,18.3,15.5,18.8,22.7,14.0
(a) ¿Cuál es la cantidad media de agua usada por familia? ¿Lamediana? ¿El
rango medio? ¿El eje medio?
(a) Organice los datos en una clasificación ordenada o diagrama de tal lo yhojas.
(b) Calcule la media, la mediana, el rango medio y el eje medio.
(e) Describa la propiedad de tendencia central para estos datos.
Durante los últimos diez días de junio, el tren "Shore Special" llegó tarde a su
destino en los siguientes tiempos (en minutos; un número negativo significa
que el tren llegó temprano ese número de minutos):
(a) Si usted fuera contratado por el ferrocarril como estadístico para
demostrar que el tren está proporcionando un buen servicio, ¿cuáles son
algunas de las mediciones de resumen que usaría para lograr esto?
(b) Si usted fuera contratado por una estación de televisión que estuviera
produciendo un documental para demostrar que el ferrocarril está
proporcionando un mal servicio, ¿Qué mediciones de resumen usaría?
(e) Si usted tratara de ser objet ivo y no parcial al aseverar el desempeño del
ferrocarril, ¿qué mediciones de resumen usaría? (Esta es la parte más dura,
porque no puede contestar esto sin hacer supuestos adicionales respecto a
los costos relativos de llegar tarde por diversas cantidades de tiempo.)
Con el fin de estimar cuánta agua se necesitará para abastecer la comunidad de
Falling Rack en la próxima década, el ayuntamiento pidió al administrador
municipal que averigüe cuánta agua usa una muestra de familias actualmente.
La muestra de 15 familias usó el siguiente número de galones (en miles) el
último año:
Fuente: U.S. Department oí Health and Human Services, PublieHealth Servlces.
4.12
Q 4.11
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 16/68
(b) Suponga que el ayuntamiento espera que dentro de diez años habrá
45 mil familias viviendo en Falling Rack. ¿Cuántos galones de agua por
año se necesitarán si la tasa de consumo por familia permanece igual?
(c) ¿De qué manera sería úti l la información proporcionada en (a) y (b) para
el ayuntamiento? Analice.
(d) ¿Por qué el ayuntamiento habría usado los datos de una encuesta en vez
de simplemente medir el consumo total de la c iudad? (Piense en el tipo de
usuarios que todavía no están incluidos en el proceso de estimación.)
Problemas intercapitulares de la sección 4.4
4.13
Q
4.14
• 4.15
Usando los registros mensuales de facturación de la compañía de libros por
correo (problema 3.2 de la página 58):
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio.
(b) Si estuvieran pendientes un total de 350 facturas, use la media para _
estimar la cantidad que se le debe a la compañía. (Sugerencia: Total = NX.)
(e) ,·r;¡N/.Jj.> Escriba un borrador del memorándum que el auditor deseará
enviar al presidente ejecutivo de la compañía de libros por correo respecto
a los resultados.
(d) ¿De qué manera será útil esta información al presidente ejecutivo?
Analice.
Usando los datos sobre la tasa de flu jo máximo de las regaderas (problema 3.3de la página 58):
(a) Calcule la media, la mediana, la moda, el rango medio y el eje medio.
(b) ,·tOíJiiJl.f.!.> Describa la propiedad de tendencia central para estos datos.
Usando los datos sobre cobros de servicios eléctricos y de gas (problema 3.12
de la página 66):
(a) Ca lcu le la med ia, la mediana, la moda, el rango medio y el eje medio.
(b) ,·r;¡jiil.f.!.> Describa la propiedad de tendencia central para estos datos.
4.5. I El rangoEl rango es la diferencia entre la mayor y la menor observación en una serie dedatos. Esto es,
m Mediciones de la variación
(4.4)maror - X meflorango
Una segunda propiedad importante que describe una serie de datos numéricos esla variación. La variación es la cant idad de dispersión o "propagación" en los
datos. Dos series de datos pueden diferir tanto en la tendencia central como en la
variación; o, como se muestra en las figuras 4.1 y 4.3, dos series de datos pueden
tener las mismas mediciones de tendencia central, pero diferir grandemente en tér
minos de variación. La serie de datos que se describe en la figura es mucho
menos variable que la descrita en la figura 4.1 (véanse las páginas 108 y 109).
Cinco mediciones de variación son el rango, el rango intercuartil, la varianza,
la desviación estándar y el coeficiente de variación.
Resumen y descr ipción de los datos numéricosapítulo 418
...
.,__"""" ' . , _ " """""" ' .•,,,,,,,,¡.. ........1'.... . . . - ~ __ , _ ._ ,'oo •
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 17/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 18/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 19/68
(4.7)
• Cálculo de 52 y de 5 Para calcular la varianza
1. Obtenernos la diferencia entre cada observación y la media
2. Elevarnos al cuadrado cada diferencia
3. Sumarnos los resultados cuadrados
4. Dividirnos la sumatoria entre n - 1
Para calcular la desviación estándar simplemente tornarnos la raíz cuadrada de la
varianza.
Para nuestra muestra de seis escuelas de Pennsylvanía, los datos sin procesar
(colegiaturas) (en miles de dólares) son
10.3 4.9 8.9 11.7 6.3 7.7
y X=8.30 miles de dólares.
La varianza de muestra se calcula corno
¡ = 1
y la desviación estándar se calcula corno
= 6.368 (en miles de dólares cuadrados)
121ediciones de la variación
I;(X; - X)'S = g = \1 í = 1 = f6368 = 2.52 miles de dólares
, n - 1
31.84
5
n - 1
(10.3 - 8.3)2+ (4.9 - 8.3)2+ oo. + (7.7- 8.3)2
6-1
• Obtención de 52 y de 5 Puesto que en los cálculos anteriores elevamos al
cuadrado las diferencias, ni la varianza ni la desviación estándar pueden ser negativas.
La única vez en que S2 y S podrían ser cero sería cuando no hubo variación alguna
en los datos, cuando cada observación de la muestra fuera exactamente igual. En
este inusual caso el alcance también sería cero.
Pero los datos numéricos son inherentemente variables, no constantes.Cualquier fenómeno de interés aleatorio que pudiéramos imaginar generalmente
torna una variedad de valores. Por ejemplo, los colegios y las universidades
cobran distintas colegiaturas a residentes fuera del estado, al igual que la gente
tiene distintos CI, ingresos, pesos, a lturas , edades, velocidades de pulso, etc.
Debido a que los datos numéricos varían de manera inherente resulta tan impor-
tante estudiar no sólo las mediciones (de tendencia central) que resumen los
datos, sino también las mediciones (o variación) que reflejan cómo están disper
sos los datos numéricos.
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 20/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 21/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 22/68
donde "I X¡2 = sumatoria de los cuadrados de las observaciones individuales;==1
nX2 = tamaño de muestra por el cuadrado de la media de muestra
"IX¡2 _nX2
j 1
"I (X¡ - X)2i ::: 1
n -1
(10.32+ 4.9
2+ ... + 7.7
2) - 6(8.3
2)
6 - 1
(106.09 + 24.01 + ... + 59.29) - 6(68.89)
5
Más aún, puesto que S2 (y S) nunca pueden ser negativas,
445.18 - 413.34
5
= 31.84 = 6.368 (en miles de dólares cuadrados)5 .
la sumatoria de cuadrados, siempre debe ser igualo exceder
S = 6.368 == 2.52 miles de dólares
Í,X¡2 - nX2
i = 1
- 2nX
Las fórmulas de calculadora, ecuaciones (4.8) Y(4.9), son idénticas a las fórmu
las de definición, ecuaciones (4.6) y (4.7). Puesto que los denominadores son
iguales, es fácil mostrar mediante la expansión y el uso de las reglas de sumatoria
(véase el apéndice B)que
y
4.5 .4 El coeficiente de variación
el tamaño de muestra por el cuadrado de la media de muestra.
Regresando a los datos de colegiaturas de Pennsylvania, la varianza y la
desviación estándar se vuelven a calcular usando las ecuaciones (4.8) y (4.9) de la
siguiente manera:
A diferencia de las mediciones previas que hemos estudiado, el coeficiente de
variación es un a medición relativa de variación. Se expresa como un porcentaje
antes que en términos de las unidades de los datos particulares.
Resumen y descripción de los datos numéricosapítulo 424
_
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 23/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 24/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 25/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 26/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 27/68
4.7.1 Resumen de cinco números
Un resumen de cinco números consiste en
xmenor
mediana xmayor
Resumen de cinco números y gráfica de caja y sesgos
! ¡,I i
.. _ . _ ~
119
11.70.3.3.3.9
Para nuest ros datos de colegiaturas de Pennsylvanía, el resumen de cinco
números es
Ahora podemos usar el resumen de cinco números para estudiar la forma de la
distribución. De las reglas anteriores resulta claro que los datos de colegiaturas para
nuestra muestra de seis escuelas de Pennsylvania son perfectamente simétricos.
4.7 .2 Gráfica de caja y sesgos
Combina tres mediciones de tendencia central (la mediana, el eje medio y el rango
medio) y dos mediciones de variación (el rango intercuartil y el rango) para darnos
una mejor idea de la forma de la distribución.Si los datos fueron perfectamente simétricos, lo siguiente se cumpliría:
1. Ladistancia de ~ a la mediana sería igual a la distancia de la mediana
aQ .
2. La distancia de X a Q sería igual a la distancia de Q a X .. . menor . 1 o" J mayor
3. La rnedíana, el eje medío y el rango medio senan todos Iguales. (Estas
mediciones también serían iguales a la media en los datos.)
Por otra parte, para distribuciones no simétricas, lo siguiente sería cierto:
l . En distribuciones sesgadas a la derecha la distancia de n a X~ mayor
excede en gran medida a la distancia de X a ~ .2. En distribuciones sesgadas a la derecha, med1'ana < eje medio < rango
medio.3. En distribuciones sesgadas a la izquierda la distancia de X a ~
excede en gran medida a la distancia de es aX . menor
4. En distribuciones sesgadas a la izquierda rango ñiedio < eje medio <
mediana.
En su forma más simple, una gráfica de caja y sesgos proporciona una repre-
sentación gráfica de los datos mediante su resumen de cinco números. Esta gráfica
se describe en la figura 4.7 de la página 130 para las colegiaturas de las seis escue-las de Pennsylvania.
Lalínea vertical trazada dentro de la caja representa la ubicación del valor de
la mediana en los datos. Observe además que la línea vertical al lado izquierdo de la
caja representa la ubicación de ~ y la l ínea vertical al lado derecho de la caja re-
presenta la ubicación de Por lo tanto, vemos que la caja contiene el 50% de las
observaciones de en medio de la dis tr ibución. El 25% infer ior de los datos estánrepresentados por una línea punteada (es decir, un sesgo) que conecta el lado
izquierdo de la caja con la ubicación del valor menor, X . De manera similar, el
25% superior de los datos están representados por una líñea punteada (es decir, un
sesgo) que conecta el lado derecho de la caja con X .
Esta representación visual de las colegiaturas dé'Strita en la figura 4.7 indica laforma simétrica de los datos. No sólo observamos que la línea mediana vertical está
centrada en la caja, también vemos que los largos de los sesgos son claramente
iguales.
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 28/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 29/68
Cuando una serie de datos es perfectamente simétrica, como sería el caso en
los grupos (a), (d) y (e), el largo del sesgo izquierdo será igual al largo del sesgoderecho y la línea mediana dividirá la caja a la mitad. En la práctica, es poco proba-ble que observemos una serie de datos que sea perfectamente simétrica. Sinembargo, debemos poder establecer que nuestra serie de datos es aproximadamen-
te simétrica si las longitudes de los dos sesgos son casi iguales y la l ínea mediana
divide la caja casi a la mitad.
Por otra parte, cuando nuestra serie de datos está claramente sesgada a la
izquierda o a la derecha, como se presenta respectivamente en los grupos (b) y (c)de la figura 4.8, las longitudes de los sesgos pueden variar considerablemente y no
es probable que la línea mediana esté centrada en la caja. En el grupo (b), por ejem-plo, la naturaleza sesgada (es decir, distorsionada) de la serie de datos indica que
existe un fuerte agrupamiento de observaciones en el extremo superior de la escala(es decir, el lado derecho); 75% de todos los valores de datos se encuentran entre
el extremo izquierdo de la caja (Q) y el f inal del sesgo derecho (X al. En conse-cuencia, el largo del sesgo izquierdo contiene la distribución de sÓlo 25% de lasobservaciones, demostrando la distorsión de simetría en esta serie de datos.
Al observar una serie de datos sesgada a la derecha, como en el grupo (e) de lafigura 4.8, la concentración de puntos de datos estará en el extremo inferior de
la escala (es decir, el lado izquierdo de la gráfica de caja y sesgos). Aquí, 75% de todos
los valores de datos se e n c ~ e n t r a n entre el principio del sesgo i z q ~ i e r d o (Xj1Jen). y
el extremo derecho de la caja (Q), y el restante 25% de las observaciones estan dIS-
persas a lo largo del sesgo derecho en el extremo superior de la escala.
Problemas de la sección 4.7
4.37 Usandolosdatos sobre laduración de bateríasdel problema 4.5 de la página 115:(a) Enumere el resumen de cinco números.(b) Formela gráfica de caja y sesgosy describa la forma.(e) Compare su respuesta en (b) con la del problema 4.29 de la página 127.
Analice.
4.38 Usando los datos de los precios de segadoras(excluyendo la unidad de bolsa
posterior) del problema 4.7 de la página 115:(a) Enumere el resumen de cinco números.(b) Forme lagráfica de caja y sesgosy describa la forma.(e) Compare su respuesta en (b) con la del problema 4.30 de la página 128.
Analice.• 4.39 Usando los datos de las donaciones del problema 4.10 de la página 116:
(a) Enumere el resumen de cinco números.(b) Forme la gráfica de caja y sesgosy describala forma.(e) Compare su respuesta en (b) con la del problema 4.31 de la página 128.
Analice.4.40 Usando los datos de la "tardanza" del tren del problema 4.11 de la página 117;
(a) Enumere el resumen de cinco números.(b) Formela gráfica de cajay sesgos y describa la forma.(e) Compare su respuesta en (b) con la del problema 4.32 de la página 128.
Analice.4.41 Usando los datos del consumo de agua del problema 4.12 de la página 117:
(a) Enumere el resumen de cinco números.(b) Formela gráfica de caja y sesgosy describala forma.(e) Compara su respuesta en (b) con la del problema 4.33 de la página 128.
Analice.
Resumen de cinco números y gráfica de caja y sesgos 131
1:l.';
".....
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 30/68
Problemas intercapitulares de la sección 4.7
4.42 Usando los datos sobre la cantidad adeudada a la compañía de libros por
correo del problema 3.2 de la página 58:
(a) Enumere el resumen de cinco números.
(b) Forme la gráfica de caja y sesgos y describa la forma.
(e) Compare su respuesta en (b) con la del problema 4.34 de la página 128.
Analice.
4.43 Usando los datos sobre las tasas de flujo máximo de las regaderas del problema
:1.3 de la página 58:(a) Enumere el resumen de cinco números.
(b) Forme la gráfica de caja y sesgos y describa la forma.
(e) Compare su respuesta en (b) con la del problema 4.35 de la página 128.
Analice.
• 4.44 Usando los datos sobre los cobros de servicios de electricidad y gas del
problema 3.12 de la página 66:(a) Enumere el resumen de cinco números.
(b) Forme la gráfica de caja y sesgos y describa la forma.
(e) Compare su respuesta en (b) con la del problema 4.36 de la página 128.
Analice.
ID Cálculo de mediciones descriptivasde resumen de una población
En las secciones 4.4 a 4.7 examinamos diversas estadísticas que se uti lizan para
resumir o describir información numérica de una muestra. En particular, usamosestas estadísticas para describir las propiedades de tendencia central, variación yforma para los datos de colegiaturas obtenidos de la muestra de n = 6 escuelas de
Pennsylvania. Suponga, sin embargo, que nuestro analista investigador de la compañía de servicios de asesoría colegial ahora desea conducir una investigación más
a fondo de las colegiaturas cobradas (en miles de dólares) a residentes fuera delestado de los 90 colegios y universidades del estado de Pennsylvania (es decir, la
población). Las mediciones resultantes (es decir, los parámetros) calculadas a partir
de la población de N = 90 escuelas de Pennsylvania para resumir y describir laspropiedades de tendencia central, variación y forma podrían ser utilizadas pornuestra analista investigador para escribir un informe al gerente de comercia
lización de la compañía de servicios de asesoría colegial comparando y contrastando las diferencias en tales colegiaturas a lo largo de regiones de Estados Unidos.
4.8.1 Mediciones de la población de tendencia central
• La media de población Lamedia de población está dada por el sím-bolo Ilx ¡ la letra minúscula griega mu subíndice X. Esdecir,
- - - - - - - - - - - - _ . _ - - ~ . ~ _ .
132 Capítulo 4 Resumen y descripción de los datos numéricos
(4.11)
' . , ~ -
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 31/68
donde
4.8.1 Mediciones de población de variación
(4.12)
N
N
L(X¡-Jlx)2kl
= sumatoria de todas las diferencias entre los valores X y PI X
2O"X
N = tamaño de la población
X = iésimo valor de la variable aleatoria X¡
NL X¡= sumatoria de todos los valores X¡ de la población¡ =1
; 1
donde
y
N = tamaño de población
X = iésimo valor de la variable aleatoria Xn I
LX = sumatoria de todos los valores X. de la poblaciónj = 1
• El rango y el rango intercuartil de población Elrango y el rango inter-cuartil para una población de tamaño N se obtienen respectivamente como se
describe en las secciones 4.5.1 y 4.5.2 parauna
muestra detamaño n.
• La media, moda, rango medio y eje medio de población La media,
moda, rango medio y eje medio de población para una población de ti'lmi1ño N seobtienen respectivamente como se describió con anterioridad en las secciones4.4.2 a 4.4.5 para una muestra de tamaño n. Simplemente reemplazamos el sím-bolo n con N.
• La varianza y la desviación estándar de población La varianza de
pobladón está dada por el símbolo c:r, la letra minúscula griega sigma subíndiceX cuadrada, y la desviadón estándar de pobladón está dada por el símbolo( j . Esto es,x
Cálculo de mediciones descriptivas de resumen de una población
;=1
N
(4.13)
133
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 32/68
Observamos que las fórmulas para la varianza y la desviación estándar depoblación difieren de las de la muestra en que (n - 1) en el denominador de 52 y 5
[véanse ecuaciones (4.6) y (4.7)] se reemplaza por N en el denominador de ¿. y (J .x x
• El coeficiente de variación de población El c oeficien te de
variación de población, dado por el símbolo CV ,mide la dispersión en los
datos relativa él la media. Puede calcularse mediante pob
Los datos sin procesar de las colegiaturas cobradas (en mi les de dóla res) en los
N = 90 colegios y univers idades del estado de Pennsylvania se presentan en el
Conjunto de da tos especiales 1 del apéndice D de las páginas D4-D5. De estosdatos, se obtiene el siguiente diagrama de tallo y hojas revisado (figura 4.9):
(4.14)
donde ( J = desviación estándar en la poblaciónx
u = media aritmética en la poblaciónx
Resultados.8.3
Figura 4.9Diagrama de tallo y hojas
revisado de las colegiaturas
cobradas a residentes fuera de l
estado en 90 colegios y
universidades de Pennsylvania.Fuente: Conjunto de datos especiales1 del apéndice D, páginas D4-D5.
2 73
4 048999
5 056 011113
7 778 33344499 11333445566777710 00122223334667711 24456777912 3613 0235714 123915 24616 14417 017789918 39
19202122 3
114 Capítulo 4
Usando los datos sin procesar o los datos arreglados en el d iagrama de tal lo yhojas, se obtienen las siguientes mediciones de resumen:
Resumen y descripción de los datos numéricos
~ __ - - - ~ - - - -
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 33/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 34/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 35/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 36/68
4 .8 .6 Uso de la desviación estándar: La regla empírica
En la mayor parte de las series de datos, un a gran porción de las observaciones tien-
de n a agruparse de alguna manera cerca de la mediana. En las series de datos ses-gadas a la derecha este agrupamiento ocurre a la izquierda (es decir, debajo) de la
mediana y en series de datos sesgadas a la izquierda las observaciones tienden aagruparse a la derecha (es decir, arriba) de la mediana. En series de datos simétri-
cas, donde la mediana y la media so n iguales, las observaciones tienden a dis-tribuirse igualmente alrededor de estas mediciones de tendencia central. Cuando
el sesgado extremo no se presenta y tal agrupamiento se observa en un a serie de
datos, podemos usar la denominada regla empírica para examinar la propiedad
de variabilidad de datos y obtener un a mejor idea de lo que la desviación estándar
está midiendo.
a causa del pequeño tamaño de la mues tra y únicamente debido al azar, las cole-
giaturas cobradas po r los colegios y universidades seleccionadas so n bastantehomogéneas y no logran justificar el rango de las colegiaturas que existe en la
población entera de 90 escuelas. Esto se ilustra claramente en el diagrama de pun-
tos de la figura 4.11. Los datos de muestra no están sesgados a la derecha porqueninguna de las escuelas seleccionadas tuvo un a colegiatura para residentes fueradel estado (puntos claros) que estuviera entre el 30% de las más altas de la
población de escuelas.
• ••L . Jo ._ .1 u . ~ ,
2 4 6 12 14 16 18 20 ~lx= 10.89
Figura 4.11Escala de puntos qu e muestra las colegiaturas cobradas (e n $000) en 90 escuelas de Pennsylvania.
Nota: Figura 4.9.
La regla empírica establece que en la mayoría de las series de datos
encontraremos qu e aproximadamente dos de cada tres observaciones (es
decir, 67°¡b) están contenidas en un a distancia de un a desviación estándar
alrededor de la media y aproximadamente 90 a 95% de las observaciones
están contenidas en un a distancia de 2 desviaciones estándar alrededor de la
media.
Así pues, la desviación estándar, como un a medición de la variación promedio
alrededor de la media, nos ayuda a comprender cómo se distribuyen las observa-
ciones por encima y por debajo de la media y nos ayuda a enfocar y señalar obser-
vaciones inusuales (es decir, externas) al analizar un a serie de datos numéricos.
4 .8 .7 Uso de ladesviación estándar: La regla de BienayméChebyshev
Hace más de un siglo, los matemáticos Bienaymé y Chebyshev (referencia 4) exa-
minaron de manera independiente la propiedad de variabil idad de los datosalrededor de la medía." Encontraron que, sin importar cómo se distribuye un a serie
Resumen y descripción de los datos numéricosapítulo 438 tr- • - " " ' _ ~ - - - - - - L .'" .
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 37/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 38/68
interesante observar que aun cuando los datos de colegiaturas están sesgados a la
derecha en forma, los porcentajes de colegios y universidades con colegiaturas que
caen dentro de una o más desviaciones estándar alrededor de lamedia no son muy
distintos de lo que se esperaría si los datos se distribuyeran como una distribución
gaussiana de campana, simétrica.
Problemas de la sección 4.8
• 4.45 Dada la siguiente serie de datos para una población de tamaño N =10:
7 5 11 8 3 6 2 1 9 8
(a) Calcule la media, mediana, moda, rango medio y eje medio.
(b) Calcule el rango, rango intercuartil, varianza, desviación estándar y
coeficiente de variación.
(e) ¿Están sesgados estos datos? Sí es así, ¿cómo?
4.46 Dada la siguiente serie de datos para una población de tamaño N =10:
7 5 6 6 6 4 8 693
(a) Calcule la media, mediana, moda, rango medio y eje medio.
(b) Calcule el rango, rango intercuartil, varianza, desviación estándar y
coeficiente de variación.
(e) ¿Están sesgados estos datos? Sí es así, ¿cómo?
(d) Compare las mediciones de tendencia central con aquellas del problema4.45(a). Analice
(e) Compare las mediciones de variación con las del problema 4.4S(b). Analice
4.47 Los siguientes datos representan los recibos de impuestos de ventas
trimestrales (en $) presentados al administrador del municipio de Gmoserville
para el periodo que finaliza en marzo de 1994 por los 50 establecimientos de
negocios en esa localidad:
140 Capítulo 4
10.3 11.1 9.6 9.0 14.513.0 6.7 11.0 8.4 10.313.0 11.2 7.3 5.3 12.58.0 11.8 8.7 10.6 9.511.1 10.2 11.1 9.9 9.811.6 15.1 12.5 6.5 7.5
10.0 12.9 9.2 10.0 12.812.5 9.3 10.4 12.7 10.59.3 11.5 10.7 11.6 7.8
.;
10.5 7.6 10.1 8.9 8.6
(a) Organice los datos en una clasificación ordenada o diagrama de tal lo y
hojas.
(b) Calcule la media, mediana, moda, rango medio y eje medio para estapoblación.
(e) Calcule el rango, rango intercuartil, varianza, desviación estándar y
coeficiente de variación para esta población.
(d) Forme la gráfica de caja y sesgos y describa la forma de estos datos de
recibos de impuestos de ventas trimestrales.
(e) ¿Qué proporción de estos negocios tienen recibos de impuestos de ventastrimestrales
(1) dentro de ±1 desviación estándar de la media?(2) dentro de ±2 desviaciones estándar de la media?
(3) dentro de ±3 desviaciones estándar de la media?
(f) ¿Está sorprendido por los resultados de (e)? (Sugerencia: compare y
contraste sus resultados con lo que se esperaría basándose en la reglaempírica.)
(g) t . r ; d ' J l . t . , , ~ Ayude al administrador de este municipio escribiendo un
borrador del memorándum que será enviado al gobernador respecto a losrecibos recolectados.
Resumen y descripción de los datos numéricos
----.- --.,.....---...-_..........._---......,..-_....._
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 39/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 40/68
Figura 4.11Curva en forma de
campana.
MediaMedianaModa
RangomedioEjemedio
ro'
Figura 4.13Dos distribuciones normales de
campana simétricas.
AB
Figura 4.14Dos distribuciones normales de
campana simétricas que difieren
sólo en la tendencia central.
A
/ : ' = - - p ~ l í g o n oI : \: \: \: \
"-La figura 4.16 ilustra tres polígonos hipotét icos: el polígono A es una distri
bución normal de campana simétrica: el polígono L es sesgado a la izquierda o
negativo (puesto que la distorsión a la izquierda es ocasionada por valores extremadamente pequeños); y el polígono Res sesgado a la derecha o positivo (puesto que
la distorsión a la derecha es ocasionada por valores extremadamente grandes).Las posiciones relativas de las diversas mediciones de tendencia central (la
media, mediana , moda, rango medio y eje medio) en distr ibuciones sesgadas
pueden examinarse mejor en las figuras 4.17 y 4.18 de las páginas 143-144.
142 Capítulo 4 Resumen y descripción de los datos numéricos
9> a
r. , -........ ~ - - _ . _ _ - .....-.
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 41/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 42/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 43/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 44/68
2420810 12 14 16
Colegiaturas (en $000)
6
......--.. - ..,
,".,.".,.,,,
,•,,,.,..
,.,,4
100
90
80<fJCll 70;:Jo
60fJQ)
Q)
" 50Q)
'roe 40Q)
30a.
20
10
oo 2
Figura 4.22Ojiva de porcentaje de colegiaturas cobradas a residentes fuera del estado en 90 escuelas de
Pennsylvania.Fuente:Los datos fueron tomados de la tabla 4.3,
La mediana puede aproximarse fácilmente a partir de la ojiva de porcentajeilustrada en la figura 4.22. Esto es, ¿50% de las colegiaturas están por debajo de quécantidad? Para determinar esto, como se muest ra en la figura 4.23, se traza una
línea horizontal desde el punto de porcentaje acumulativo especificado (50.0)hasta que ésta interseca la curva "menor que". Lacolegiatura mediana se aproximaentonces bajando una perpendicular (una línea vertical) desde el punto de inter-sección hasta el eje horizontal. De la figura 4.23 observamos que la colegiaturamediana se aproxima como 10.5 miles de dólares.
La moda puede aproximarse a partir de una distribución de frecuenciaeligiendo el punto medio de la clase que contenga la mayor parte de las observa-ciones. Esta clase es la más típica o clase modal. Por tanto, para las 90 escuelas dePennsylvania (tabla 4.3), la clase modal contiene colegiaturas de 10.0 a 12.0 milesde dólares y la moda se aproxima como 11.0 miles de dólares.
El rango puede aproximarse a partir de una distribución de frecuencia prome-diando los extremos posibles, el límite superior del agrupamiento de la última clase(X ) Yel límite inferior del agrupamiento de la primera clase (X Para las
mayo . . 1 n
escuefas de Pennsylvanía, el rango medio es aproximadamente í l miles dedólares (es decir, el promedio de 2.0 y 24.0 miles de dólares).
Para aproximar los cuartiles se usa la ojiva de porcentaje (figura 4.22). Para ~ ,se traza una línea horizontal desde el punto de porcentaje acumulativo 25.0 hasta
que interseca la curva "menor que"; para~ ,
se traza una línea horizontal desde elpunto de porcentaje acumulativo 75.0. Los cuartiles se aproximan entonces ba-jando perpendiculares desde los puntos de intersección hasta el eje horizontal. Dela figura 4.23 observamos que la colegiatura del primer cuartil se aproxima como8.5 miles de dólares, mientras que la colegiatura del tercer cuartil se aproximacomo 13.3 miles de dólares.
Eleje medio puede aproximarse promediando los cuartiles. Para las escuelas dePennsylvania, el eje medio es aproximadamente 10.9 miles de dólares (es decir, elpromedio de 8.5 y 13.3 miles de dólares),
Resumen y descripción de los datos numéricosapítulo 446
-------__- _
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 45/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 46/68
Tabla 4.4 Una comparación de valores reales y aproximaciones
de datos agrupados.
desviación estándar se aproxima generalmente como 4.4 miles de dólares (es decir,un quinto del alcance). Además, el coeficiente de variación se aproxima generalmente como 37.4% (es decir, el cociente de la desviación estándar entre la media,
multiplicado por 100%).
Colegiaturas ($000) en 90 colegios yuniversidades de Pennsylvania obtenidas de
Datos (sin procesar) DatosMedición descriptiva no agrupados agrupados
11.75
10.5
11.0
2.0
24.0
13.0
8.5
13.310.9
22.0
4.8
19.36
4.4
37.4%
Sesgada a laderecha
10.89
10.2
Multimodal2.7
22.3
12.5
8.4
13.310.85
19.6
4.9
15.594
3.95
36.3%
Sesgada a laderecha
MediaMedianaModaXXm
t!tlO1
maror
Rango medio
Q¡
~Eje medioRangoRango intercuartilVarianzaDesviación estándarCoeficiente de variaciónForma
4.9.3
Comparación de mediciones descriptivas: Valoresreales y aproximaciones de datos agrupados
La tabla 4.4 presenta un resumen de las mediciones descriptivas reales obtenidas
de los datos sin procesar (véase Conjunto de datos especiales 1 del apéndice D de
las páginas D4-DS) y sus aproximaciones correspondientes obtenidas de la dis
tribución de frecuencia y ojiva de porcentaje (véase la tabla 4.3 de la página 145 yla figura 4 .22 de la página 146). Al examinar estos resultados se esclarecerá que las
interpretaciones tabular y gráfica, que son mucho menos complicadas, producen
buenas aproximaciones de los valores reales obtenidos a partir de los cá lculos de
datos no agrupados más laboriosos.
Problemas de la sección 4.9
4.49 Refiérase a los datos de recibos de impuestos de ventas trimestrales delproblema 4.47 de la página 140:
(a) Construya una distribución de frecuencia y una distribución deporcentaje.
(b) ,arme la distribución de porcentaje acumulativo.(e) Grafique la ojiva (polígono de porcentaje acumulativo).(d) Usesustablas en (a) y (b) Yel diagrama en (e):
(1) Aproximela media, mediana, moda, rango medio y eje medio paraesta población.
.,O!
" ..
148 Capítulo 4 Resumen y descripción de los datos numéricos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 47/68
(2) Aproxime el rango, rango intercuartil, desviación estándar y coeficientede variación para esta población.
(3) Describa la forma de los datos .
(e) H'iil'/1,J.j.) Compare y contraste sus aproximaciones en (d) con las delproblema 4.47(b) y (e). Analice.
• 4.50 Refiérase a los datos de donaciones del problema 4.10 de la pag 116:
(a) Construya una distribución de frecuencia y una distribución de
porcentaje.
(b) Forme la distribución de porcentaje acumulativo.
(e) Grafique la ojiva (polígono de porcentaje arumulativo).
(d) Use sus tablas en (a) y (b) Yel di agrama en (e);
(1) Aproxime la media, mediana, moda, rango medio y eje medio paraesta muestra.
(2) Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación para esta muestra.
(3) Describa la forma de los datos.
(e) H!iil?¡'¡'¡" Compare y contraste sus aproximaciones en (d) con las del
problema 4.10 (página 116),4.22 (página 126),4.31 (página 128) y 4.39
(página 131). Analice.
t Problemas intercapitulares de la sección 4.9
4.51 Refiérase a los datos sobre la cantidad adeudada a la compañía de libros por
correo del problema 3.2 de la página 58:
(a) Construya una distribución de frecuencia y una distribución de
porcentaje.
(b) Forme la distribución de porcentaje acumulativo.
(e) Grafique la ojiva (polígono de porcentaje acumulativo).
(d) Use sus tablas en (a) y (b) Yel d iagrama en (e):
(1) Aproxime la media, mediana, moda, rango medio y eje medio para
esta muestra.
(2) Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación para esta muestra.
(3) Describa la forma de los datos.
(e)t.f;ii?,,,.j., Compare
ycontraste
susaproximaciones
en (d)con
lasde los problemas 4.13 (página 118), 4.25 (página 126), 4.34 (página 128) y
4.42 (página 132). Analice.
4.52 Refiérase a los datos sob re las tasas de flujo máximo de las regaderas del
problema 3.3 de la página 58:
(a) Use sus tablas y d iagramas en los problemas 3.13 (página 66), 3.20
(página 70), 3.27 (página 73) y 3.35 (página 77):
(1) Aproxime la media, mediana, moda, rango medio y eje medio para
esta muestra.
(2) Aproxime el rango, rango íntercuartil, desviación estándar y
coeficiente de variación para esta muestra.
(3) Describa la forma de los datos.
(b) t.r;ii?/.].j,) Compare y contraste sus aproximaciones en (a) con las de los
problemas 4.14 (página 118),4.26 (página 127),4.35 (página 128) y 4.43
(página 132). Analice.4.53 Refiérase a los datos sobre los cobros de servicios de electricidad y gas del
problemas 3.12 de la página 66:
(a) Use sus tab las y diagramas en los problemas 3.12, 3.19 (página 70), 3.26
(página 73) y 3.34 (página 77):
(1) Aproxime la media, mediana, moda, rango medio y eje medio para
esta muestra.
Obtención de mediciones descriptivas de resumen de datos agrupados 149
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 48/68
_
ISO Capítulo 4
(2) Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación para esta muestra.
(3) Describa la forma de los datos.
(b) rNi1iJI."'." Compare y contraste sus aproximaciones en (a) con las de los
problemas 4.15 (página 118), 4.27 (página 127), 4.36 (página 128) y 4.44
(página 132). Analice.
4.54 Refiérase a los datos de incidencia de cáncer del problema 3.6 de la página 60:
(a) Use sus tablas y diagramas en los problemas 3.15 (página 66), 3.22
(página 70) y 3.29 (página 73) y 3.37(página 78):
(1) Aproxime la media, mediana. rnode. rango nlPQi(' y f'jf.' medio paraesta muestra.
(2) Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación para esta muestra.
(3) Describa la forma de los datos.
(b) '.(MM''''''' Compare y contraste sus aproximaciones en (a) con las delproblema 4.48 (página 141). Analice.
• 4.55 Refiérase a los datos de valores en libros del problema 3.5 de la página 60:
(a) Use sus tablas y diagramas en los problemas 3.14 (página 66),3.21
(página 70) y 3.28 (página 73) y 3.36 (página 78):
(1)Aproxime la media, mediana, moda, rango medio y eje medio para
esta muestra.
(2)Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación para esta muestra.
(3) Describa la forma de los datos.
(b) Use los datos del problema 3.5:(1)Aproxime la media, mediana, moda, rango medio y eje medio reales
para esta muestra.(2) Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación reales para esta muestra.
(3) Describa la forma de los datos.
(c) rNml."'.,. Compare y contraste sus aproximaciones en (a) con las de las
mediciones de resumen reales en (b). Analice.
mm USO de la computadora paraobtener mediciones descriptivasde resumen: La encuesta de
satisfacción de los empleados de
Industrias Kalosha
4.10.1 Introducción y visión general
Al trabajar con grandes series de datos, podemos usar la computadora para ayudarnosen nuestro análisis estadístico descriptivo. En esta sección, demostraremos
cómo varios paquetes de software estadístico pueden usarse para caracterizar yresumir datos numéricos. Apreciaremos la asistencia que la computadora puededarnos en la resolución de problemas estadísticos, particularmente aquellos queinvolucran grandes números de variables o grandes series de datos. (Véanse las referencias 6-9.) Para hacer esto, regresemos a la Encuesta sobre la satisfacción de losempleados de Industrias Kalosha que se desarrolló en el capítulo 2 y para la que se
inició un análisis estadístico descriptivo en la sección 3.8.2,
Resumen y descripción de los datos numéricos
,.,
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 49/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 50/68
Gráfica de caja y sesgos
100 1-
*
40 1-
I II I
10 1-I
400 casos.'
Figura 4.2S
Gráfica de caja y sesgos de salida de 5TATI5TIX.Nota: Existe mucha t1exibilidad entre los diversospaquetes de software estadístico con respecto al diseño ydespliegue de la gráfica de caja y sesgos. Como semuestra aquí, una gráfica de caja y sesgos obtenida porSTATISTlX se imprime verticalmente (con los valoresaltos hasta arriba de la escala) en vez de horizontalmente(con los valores altos del lado derecho de la escala).Además. observamos que los valores extremos y lasexternas potenciales se señalan por separado fuera de lossesgos de la gráfica.
RI 70
N
e
oME
*
*
IS 2 Capítulo 4
en la par te superior de la gráfica de caja y sesgos (figura 4.25) indica que el 25%superior de los ingresos personales de los empleados se encuentran en el amplio
alcance de 37.85 a 91.9 miles de dólares. No obstante, una mayoría sustancial de los
ingresos personales de los empleados (72.75%) cae entre 15.449 miles de dólares y43.661 miles de dólares (es decir, el intervalo formado desde X ± S). Además (del
resumen de cinco números), aunque los ingresos personales varían en valor de 10.1a 91.9 miles de dólares, la "propagación media" o alcance intercuartil va de 18.725a 37.85 miles de dólares.
Para responder la pregunta específica Bde Bud Conley, se requiere una evaluación de diferencias de género en los ingresos personales de los empleados detiempo completo, una clasificación de las respuestas numéricas en las dos categorías de género (hombre y mujer). Este proceso puede realizarse accesando uno
de los paquetes estadísticos. Una vez que se hace esto, para cada agrupamiento de
género se necesitarían tipos de salidas similares a los presentados en las figura 4.24y 4.25. Para resaltar esto, la figura 4.26 (página 153) presenta el conjunto de
mediciones descriptivas de resumen de los ingresos personales de los empleadosde tiempo completo hombres y mujeres, y la figura 4.27 (página 154) ilustra las gráficas de caja y sesgos correspondientes. La salida representada en estas figuras
respectivas se obtuvo accesando SAS y SPSS.
De las figuras 4.26 y 4.27, así como de los diagramas de tallo y hojas de la figura3.18 de la página 87, se observa que mientras las distribuciones de los ingresos personales de los empleados basados en el género están sesgados a la derecha, los
empleados de tiempo completo, hombres, de Industrias Kalosha tienen ingresospersonales sustancialmente más altos que las mujeres. Lasmedias, medianas y ejes
medios correspondientes indican cada una que, en promedio, los ingresos personales de los empleados hombres son de 9 a 10 dólares más. Además, respecto a lavariación, los ingresos personales de los empleados hombres son menos homogéneos que los de los empleados mujeres. Como se indica en las desviaciones están
dar, los rangos y los -rangos intercuarti les obtenidos de la figura 4.26, existesustancialmente más variación en los ingresos personales de los empleados hom-
bres que en los de mujeres. Sin embargo, tales diferencias en los ingresos personales de los dos grupos de género se disipan un tanto cuando se hace unacomparación de los coeficientes de variación. Para los empleados hombres la dispersión relativa de los ingresos personales alrededor de la media es de 45.3%; paralos empleados mujeres, es de 40.9%.
Resumen y descripción de los datos numéricos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 51/68
SEX=MALES - - - - - - - - - - - - - __
U n i va r i a t e Procedure
Vayiable=RINCOME
Moments Quan t i l e s (Def=5)
N 233 Sum Wgts 23 3 100% Max 91 .9 99% 78 .3Mean 33 .70687 Sum 7853.7 75% Q3 42 .7 95% 59 .3S td De v 15 .27374 Var iance 233.2872 50% Med 31 2 90% 52.8skewnes s 0 . 915475 Kur t .o s i s 0 .934922 25% Ql '::2 10% 16.1uss 318846 .2 c s s 54122 61 0% Min 10.2 5% 14 .5cv 45.31344 S td Mean 1 .000616 1% l a 5T:Mean=O 33 .68612 Pr:> ITI 0.0001 Range 81 .7
Num : o 233 Num :> o 23 3 Q3-Ql 20 .7
M!3ignl 116 . 5 Pr:>= IMI 0.0001 Mode 22.5
Sgr, Rank 13630 .5 Pr:>= S 0.0001
- - - - - - - - - - - - _. - - - - - - - - . - - - - - - - - - - - - - - - - . - - - - - - - - - - - - - - - - - _. - - _. SEX=FEMALES - - - - - - - - - - - - - -
U n i va r i a t e Procedure
Variable=RINCOME
Moments Quan t i l e s (Def=5)
Figura 4.26Mediciones de resumen de salida de 5A5.Nota:Como vemos de la salida bajo los encabezados de Moments (momentos) y Quantiles (cuantiles), SAS proporciona un extenso conjunto demediciones de resumen, algunas de las cuales todavía no hemos aprendido y otras que no veremos (véase la referencia 8). Lasmediciones deresumen de interés para nosotros se resaltan en blanco.
Bud Conley también estaba interesado en evaluar otras diferencias de género
potenciales con respecto a las horas trabajadas, la duración del empleo y el númerode promociones. Un análisis estadístico descriptivo basado en las respuestas a éstasy otras preguntas relativas a las variables numéricas de la Encuesta sobre la satisfacción de los empleados (véase Proyecto Encuesta/Base de datos) le hará tener unamejor comprensión de la composición de la fuerza de trabajo de tiempo completode Industrias Kalosha y le ayudará en sus deliberaciones con la B&L Corporationrespecto al desarrollo de un paquete de beneficios a empleados.
Uso de la computadora para obtener mediciones descriptivas de resumen 153
61.740 7
36 .1
14 211 910 3
99%95%90%10%5%1%
52 .7
11.4
15
62 .8
28 .1
21 .9
16 710 .1
RangeQ3-Q1Mode
100% Max75% Q350% Med25% QlC% Min
1673968.4
94.26488
2 .848284
15647 .97
0 .751306
0.0001
1670 .0001
0.0001
Sum WgtsSumVar i an c eKur t os i s
CSSS td MeanPr:> IT INum :> O
~ ~ ~ : I ~ I
16723 .76287
9 .70901
1.433697
109948 .6
40 8578931 .62877
16783 .5
7014
NMeanS td De...
Skewnessu ss
CV
T : ~ e a n = ONU11 A : O
M:s ign)
5g:1 Rank
Proyecto encuesta/Base de datos de la sección 4. 10
Lossiguientes problemasse refieren a los datos demuestra obtenidos del
cuestionario de la figura 2.6 de las páginas 28-29 y presentados en la tabla 2.3 delas páginas 33-40. Deben resolverse con la ayuda de U11 paquete de computadoradisponible.
Suponga que usted es contratado como asistente de investigación de BudConley, el vicepresidente de recursos humanos de Industrias Kalosha. Élle hadado una lista de preguntas (véanse los problemas 4.56 a 4.69) que necesitaresponder antes de su reunión con un representante de B&L Corporation, lacompañía consultora sobre beneficios a empleados que él ha contratado.
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 52/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 53/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 54/68
T1
universidades de Pennsylvania. En estos términos, sin conocer el contenido de este
capítulo, intentamos analizar e interpretar lo que los datos trataban de transmitir.Nuestro análisis fue objetivo; todos debimos concordar con nuestros limitados
hallazgos visuales: no había un valor de colegiatura típico; la propagación de lascolegiaturas variaba de 4.9 a 11.7 miles de dólares; y no había externas presentes
en los datos. Por otra parte, habiendo leído ahora el capítulo y conociendo diver-sas mediciones descriptivas de resumen y sus puntos fuertes y débiles, ¿cómo
podríamos mejorar nuestro análisis previamente objetivo? ¿No proporciona la
desviación es tándar más información sobre la propiedad de variación que el
alcance? ¿No deberíamos describir la serie de datos como simétrica en forma?Laobjetividad en el análisis de datos reporta las más apropiadas mediciones de
resumen para una serie de datos dada, aquellas que mejor satisfacen las suposi-
ciones sobre la serie de datos dada. En nuestro ejemplo, supusimos adecuaclamente
que los datos estaban en forma sin procesar, es decir, no había patrón de secuenciade los datos recolectados. Si esta suposición se hubiera violado, todavía podríamos
haber hecho comentarios descriptivos objetivos como aquí se indica, pero nohabríamos podido extraer inferencias sobre la población de colegios y universi-
dades del estado de Pennsylvania; tales inferencias dependen de la suposición deque las escuelas muestreadas se seleccionaron aleatoria e independientemente. Por
tanto, sólo a través del conocimiento y la conciencia puede tener lugar un buen
análisis de datos objetivo.
Por otra parte, nuestra interpretación de datos fue subjetiva; podríamos haberformado diversas conclusiones al interpretar nuestros hallazgos analíticos. Todosvemos el mundo desde diferentes perspectivas. El optimista ve un vaso cuyo volu-men contiene 50% de agua como "medio l leno"; el pesimista ve el mismo vasocomo "medio vacío". Algunos de nosotros veremos la clasificación ordenada decolegiaturas en miles de dólares (4.9, 6.3, 7.7,8.9, 10.3, 11.7) Yconcluiremos quelos residentes fuera del estado que asisten a las escuelas de Pennsylvania pagandemasiado; otros, que asisten a instituciones privadas más caras, verán la mismaserie de datos y concluirán que los residentes fuera del estado pagan demasiado
poco. Por consiguiente, puesto que la interpretación de datos es subjetiva, debehacerse de una manera justa, neutral y clara.
4.1 1.2 Prevención de errores en la representación:
Innecesarios adornos tabulares y basura gráfica
Con el fin de analizar e interpretar nuestros datos apropiadamente, primero debe-
mos construir tablas y diagramas apropiados como en el capítulo 3 y luego resumirlos resultados calculando las mediciones descriptivas adecuadas. Con demasiada
frecuencia, al hojear revistas y periódicos, encontramos que, para evitar la presen-tación aburrida de datos, las tablas y diagramas se adornan con diversos iconos y
símbolos para hacerlas atractivas a sus lectores. Desafortunadamente, el "reavivar"una tabla o diagrama a menudo oculta o distorsiona el mensaje pretendido que losdatos transmiten.
Como ejemplos de una buena y una mala presentación tabular, compare latabla 4.5 con la tabla 4.6 de las páginas 157 Y158, respectivamente. En la tabla 4.5,el adorno (es decir, las banderas que representan los;;íses particulares) de hecho
acrecienta la información que se está transmitiendo. Este no es el caso en la tabla4.6, donde los adornos extra innecesarios disminuyen la información que se estátransmitiendo.
Observe que en esta últ ima presentación el adorno (es decir, las barras hori-zontales) "intenta" producir una gráfica de barras horizontal de una tabla combi-
nando las calificaciones de verbos y matemáticas promedio. ¿Por qué? Dejemos
:
Resumen y descripción de los datos numéricosapítulo 4ses
- - - - - - - - - . . - ~ - - - - ~ ........_ . . . . . " . . . , - ~ - = - - - ~ ~ ~ - - - - ~ - . . , . , . - , - - - - .
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 55/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 56/68
Test Results
Tabla 4 .6 Presentación"inaprcplada"de califica.ciones 5ATpor estado.
Del.
Me.
Ky.
La.
Fla.
Ga.
111.
Ind.
u.s,
R.I.
S.C.
5.0.
Tex.
D.C.
Nevo
Ariz.
Kan.
Neb.
Iowa
Utah
VI.
N.H•
N.J.
N.M.N.Y•
N.C.
N.O•
Colo.
Ohlo
Okla.
Ore.
Pa.
Ark.
Calit.
Idaho
Miss.
Tenn.
Mlnn.
Mich.
Conn.
Mo,
Mont.
Mass.
Va.
Wash.
Hawail
Ala.
Alaska
W. Va.
Wls.
Wyo.
Sovrce Col/ege Bo,lId
Average S AT verbal andmath scores In 1993 A
number ot variables can
rnake state-by-statecornpansons cutrcutt The
tcp poss.blc score Ineachcalegcry IS 800
1VERBAL ! MATH
-.. - ..JL ._ 4 ; ~ 4 . ~48 0 tI14311111Kw
. 4 4 4 1 1 1 Em4 7 B ~' 4 1 S ~L 4 s 4 ~430.-ua
· ' ¡ ~ 9 . - m4 0 S ~4 1 6 ~; ¡ 9 9 ~4 0 1 ~4 6 5 ~, 47 5 ti'4 0 9 ~
1:%1
494 jl:1
47 6 1 ; )
48 1 ti'4 2 2 ~Md. : •• 4;.31 ~
42.7.-m
,469 fJ:I
19i148 1 tt ,
~ ~ 1 - 5 tf)45 9 1'147 9 "fi"' 4 3 2 ~4 4 2 ~
.. 1 9 ~47 8 t+1
416-.uJ
. 4 0 6 ~518 j:".. . ¡ ~ ~
. . , . . 4.82. ;fJl!
.. 4 ; 4 ; 1 . ~41 8 ¡¡¡¡¡¡¡w4.19.-eJ
396-m
50 2 i"1:'
48 6 j ' !
.413 .-:fI). ~ o o triP'4 2 6 ~4 2 5 ~' 4 3 5 ~4 3 9 ~4851' %i'4 6 3 ~
- . _ - ~ - - - - - - - - - - - - - - - - - - -
Fuente: The New York Tinies, agosto ]9 de 1993, pág. A16.
Resumen y descripción de los datos numéricosapítulo 4S S
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 57/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 58/68
Diagrama de resumen del capítulo 4.
Propiedades dedatos numéricos
l
I '1 I
TendenciaVariación Forma
central
- Media 1 -- Rango 1-- Gráfica decaja y bigotes
t - - Mediana 1 -- RangoIntercuartil ,
t--- Moda t - - Varianza
1 -- Rango medio 1-- Desviaciónestándar
t-- Eje medio 1--Coeficientede variación
'-o
Ao aqrupados Agrupados
)deatos
I 1 r r I
Datos sin Clasificación Diagrama de DistribuciónPolígono Ojiva
procesar ordenada tallos y hojas de frecuencia
160 Capítulo 4
!:I'm Resumen y descripción de datos
numéricos: Un repaso
Como se observa en el diagrama de resumen siguiente, este capítulo trató sobre el
resumen y descripción de datos. En la página 104 de la sección 4.1 se le dio una
lista que ponía énfasis en los puntos importantes a estudiarse en el capítulo. Revise
la lista ahora para ver si siente que tiene una comprensión de estos puntos clave. Para
estar seguro, usted debe poder responder las siguientes preguntas conceptuales:
1. ¿Qué debemos buscar al intentar caracterizar y describir laspropiedades de una serie de datos numéricos?
2. ¿Qué queremos decir con la propiedad de ubicación o tendencia
central?3. ¿Cuáles son las diferencias entre las diversas mediciones de
tendencia central como la media, mediana, moda, rango medio y ejemedio, y cuáles son las ventajas y desventajas de cada una?
Resumen y descripción de los datos numéricos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 59/68
Juntando todo
1,.
.,
.;
1
",¡ •
1')
I!nIl'¡'i61érminos clave
forma sin procesar105
gráfica de caja y sesgos 129
media 106
media aritmética 106
media de población 132
mediana 109
mediciones de resistencia 114
moda 111
promedio 106
propagación media 11 9
propiedades de los datos numéricos 106
Q1: primer cuartil 113Q2: sgundo cuartil 113
Q3: tercer cuartil 113
análisis de datos104
clase modal 146
cuartiles 112
coeficiente de variación 12 4
coeficiente de variación de población134
datos agrupados 141
datosno agrupados 141
desviación estándar 120
desviación estándar de población 133
ejemedio 112
escala de puntos 107
externa o valor extremo 105
forma 127
TÉRMINOS CLAVE
4. ¿Cuál es la diferencia entre mediciones de tendencia central y detendencia no central?
S. ¿Qué queremos decir con la propiedad de variación?
6. ¿Cuáles son las diferencias entre las diversas mediciones de variación
como el rango, rango intercuartil, varianza, desviación estándar y
coeficiente de variación, y cuáles son las ventajas y desventajas de
cada una?
7. ¿Cómo ayuda la regla de Bienayrné-Chebyshev y la empír ica a
explicar las formas en que las observaciones de una serie de datosnuméricos se agrupan, congregan y distribuyen?
8. ¿Qué queremos decir con la propiedad de forma?
9. ¿Por qué son tan útiles las técnicas de análisis de datos exploratorias
y la gráfica de caja y sesgos?
10. ¿Cómo podemos aproximar mediciones descriptivas de resumen a
partir de una distribución de frecuencia, un polígono o una ojiva?
11. ¿Cuáles son algunas de las cuestiones éticas pertinentes al distinguirentre el uso de mediciones descriptivas apropiadas e inapropiadas
reportadas en periódicos y revistas?
Verifique la lista de preguntas para ver si verdaderamente conoce las respues
tas y podría (1) explicar sus respuestas a alguien que no leyó este capítulo y (2) dar
referencia de lecturas o ejemplos específicos que apoyen su respuesta. Asimismo,vuelva a leer cualquiera de las secciones que pudieran haber parecido confusas para
ver si ahora tienen sentido.
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 60/68
rango 118
r ango intercuar ti l 119
rango medio 111
regla de Bienaymé-Chebyshev 139
regla empírica 1 38
resumen de cinco números 129
sesgo 127
sesgo a la derecha 127
sesgo a la izquierda 127
simetría 127
tendencia central o ubicación 106
variación o dispersión 118
varianza 120
varianza de población 133
107
)V24')0 '
;-s:36
. 2 S - ~ ·}2
78
%~ S - . -
.10' }ffFuente: Copyright 1992 por Consumers Union oí United States,Inc., Yonkers, N,Y. 10703. Adaptado con permiso de ConsumerReports, diciembre de 1992, págs, 780-781.
t H ¡ ¡ ¡ J 1 . z . ¡ . ~ Escriba una carta a un amigo resaltando lo que considera lascaracterísticas más interesantes o importantes de este capítulo.
Explique la diferencia entre una estadística y un parámetro.
Una serie de datos numéricos tiene tres propiedades principales. Defina estaspropiedades y dé ejemplos de cada una.
Los siguientes datos son los precios al por menor (en dólares) para una muestra aleatoria de 32 modelos telefónicos de cordón:
Manhattan$955 $1000 $985 $980 $940 $975 $965 $999 $1247 $1119BrooklynHeights$750 $775 $725 $705 $694 $725 $690 $745 $575 $800
(a) Analice completamente los datos.(b) tNd'i/.z.¡..,Escriba un artículo para un periódico que se distribuye entre
los consumidores para informarles sobre este tema.
4.77 Los siguientes datos son los precios de renta mensual para una muestra de 10apartamentos de estudio no amueblados en Manhattan y una muestra de 10apartamentos de estudio no amueblados en Brooklyn Heights:
4.73
4.74
4.75
4.76
(a) Para cada serie de datos calcule la media, mediana, eje medio, rango,rango intercuartil, desviación estándar y coeficiente de variación.
(b) ¿Qué puede decirse sobre los apartamentos de estudio no amueblados que
se rentan en Manhattan f ren te a los que se rentan en Brooklyn Heights?(c) t · t ; ¡ ¡ i J / , z · , . ~ ¿Cómo podría ser de utilidad esta información para un
individuo que desea cambiarse al área de Nueva York?Escriba un artículosobre esto para la columna de bienes raíces de su periódico local.
V 4,78 El artículo deGlenn Kramon "Persuadiendo al elefante de Stanford para que
baile" (The New York Times Sunday Business Section, noviembre 1] de 1990)implica que los costos del Centro Médico de Stanford se han incrementado
más que en las instituciones competidoras porque es más probable que elprimero atienda a indigentes, Medicare, Medicaid y pacientes más enfermos ycomplejos. Para ilustrar esto, se proporciona un diagrama que describe una
comparación de cobros promedio de hospitales en 1989-1990 por tresprocedimientos médicos (derivación coronaria, nacimiento simple e implante
de piel) en tres instituciones competidoras (El Camino, Sequoia y Stanford),
Problemas de repaso del capítulo
•
Resumen y descripción de los datos numéricosapítulo 4G2
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 61/68
lj. ~
163roblemas de repaso del capítulo
8.4
9.210.79.59.8
Injerto
10.6
10.1
8.57.59.3
Escuelas preparatorias
de l oeste medio
7.98.2
9.1
9.3
8.8
[ ; h ' ; T J ~ El Camino
O Sequoia
OStanford
9.6
9.111.2
10.5
9.9
8.9
9.3
9.710.4
10.0
N/A
Desviación coronaria Nacimiento simple
Escuelas preparatorias
de l nordeste
10.5
10.1
10.0
11.0
9.1\
Los costos de El Camino son el promedio de los cobros alias y bajos de un nacimientosimple con una estancia de dos días y un injerto con una estancia de nueve días.
Los costos de Sequoia son promedios del 50% medio de todos los cobrospor cada operación.
Los datos de Stanford son el costo promedio de todas las operaciones.
4.80
Su directora ejecutiva sabe que usted está tomando actualmente un curso de
estadística y lo llama para discutir el art ículo. Ledice que anoche, al sajó r de
una junta de directores de hospitales, uno de ellos mencionó que este
diagrama carece totalmente de sentido y le pid ió su opinión. Ella le pide queusted prepare su respuesta. Usted sonríe, toma aire y le contesta ...
4.79 Un colegio lleva a cabo un fonotón para recabar fondos para la construcción
de un Centro de Artes. Eldirector esperaba obtener medio millón de dólares
para este propósito. Los datos siguientes representan las cantidades prometidas
(en $000) por todos los exalumnos que fueron llamados durante las primeras
nueve noches de la campaña.
16, 18, 11,17,13,10,22,15,16(a) Calcule la media , mediana y desviación estándar.
(b) Describa la forma de esta ser ie de datos.(c) Estime la cantidad total prometida (en $000) por todos los exalumnos si
la campaña durara 30 noches. (Sugerencia: Total = N5(.)
(d) '·¡'iil'li.].f.> Escriba un memorándum al director resumiendo susresultados hasta la fecha y, si fuera necesario, ofreciéndole cualquier
recomendación necesaria.(e) ¿Cómo podría ayudar esta información al director? Analice.
Los datos siguientes representan las colegiaturas cobradas (en $ miles) en una
muestra de 15 escuelas preparatorias del nordeste y en una muestra de 15
escuelas preparatorias del medio oeste durante el año académico 1993-1994:
Lo que Cuesta el Cos to de la Sal ud
Una comparación de precios hospitalarios promedio en 1989-1990 en Californiapara varias operaciones. Los Hospitales Sequoia y El Camino son la principalcompetencia local del Centro Médico de Stanford.
Fuente: Centro Médico de Stanford, Hospital Sequoia y Hospital El Camino.
~O
O
50,000
40,000
<IJ 30,000ltl
:oO 20,000
10,000
O
L-.---__
.J
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 62/68
' · .- - ~ _
164 Capítulo 4
(a) Para cada serie de datos calcule la media, mediana, eje medio, rango,
rango intercuartil, desviación estándar y coeficiente de variación.
(b) Para cada serie de datos forme el diagrama de tal lo y hojas y la gráfica de
caja y sesgos.(c) Enumere el resumen de cinco números e interprete la forma de cada serie
de datos.
(d) Resuma sus resultados.
(e) t·to;iilJl.f.j.> Suponga que t iene un primo que le pide consejo respecto al
costo de asistir a una escuela preparatoria en el nordeste en comparación de
una del medio oeste. Escríbale una carta basándose en su resumen de (d).4.81 Wisconsin Power & Light estaba interesada en mejorar la eficiencia de los
sistemas de calefacción por gas domésticos y usted es contratado para
participar en la investigación de este problema. Para obtener una mejor
comprensión del problema, usted decide hacer un a encuesta sobre el consumo
actual de energía en hogares de una sola familia.
Lasiguiente distribución de frecuencia representa el consumo de energía
promedio (en BTU)por hogar unifamiliar durante un periodo de dos semanas
para una muestra aleatoria de 90 hogares a lo largo del estado de Wisconsin:
Consumo de energía
(BTU) Núm. de hogares
2.4 pero menos de 4.8 24.8 pero menos de 7.2 67.2 pero menos de 9.6 259.6 pero menos de 12.0 2912.0 pero menos de 14.4 1614.4 pero menos de 16.8 816.8 pero menos de 19.2 319.2 pero menos de 21.6 ~Total 90
(a) Forme las tablas y diagramas apropiados y analice completamente los
datos.
(b) t . r ; i I l J l . f . j . ~ Escriba un informe preliminar para el presidente ejecutivo.
Problema intercapitular
4.82 Refiérase a los datos del problema 3.8 (página 61) que representan la cantidad
de tiempo (en segundos) necesaria para llegar de Oa 60 mph durante una
prueba de carretera para una muestra de 22 modelos de automóviles alemanes
y una muestra de 30 modelos de automóviles japoneses:
(a) Usando sus tablas y diagramas de los problemas 3.17 (página 66), 3.24
(página 70), 3.31 (página 73) y 3.39 (página 78):
(1)Aproxime la media, mediana, moda, rango medio y eje medio para
cada muestra.
(2)Aproxime el rango, rango intercuartil, desviación estándar y
coeficiente de variación para cada muestra.
(3) Describa la forma de cada serie de datos.
(b) Usando sus datos del problema 3.8:
(1)Calcule la media, mediana, moda, rango medio y eje medio reales para
cada muestra.
(2)Calcule el rango, rango intercuartíl, desviación estándar y coeficiente
de variación reales para cada muestra.
(3) Describa la forma de cada serie de datos.
(c) t . r ; d f ) ¡ . f . j . ~ Compare y contraste sus aproximaciones en (a) con las
mediciones de resumen reales en (b). Analice.
(d) , . r ; d ' J ¡ " " ' ~ Escriba un artículo para una revista que trate sobre
automóviles resumiendo sus hallazgos.
Resumen y descripción de los datos numéricos
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 63/68
Proyectos de minicasos deaprendizaje colaborativo
Proyectos de minicasos de aprendizaje colaborativo
Nota: La e/ase debe dividirse engrupos de tres o cuatro estudiantes. Inicialmente seselecciona un estudiante paraqueseacoordinador delproyecto, otro estudiante esquien registra elproyecto y 1111 tercero esel cronometrador del proyecto. Para quecada
estudiante ganeexperiencia enel desarrollo del trabajo de equipo y en las habilidadesde liderazgo, después de cada proyecto debe haoer una rotacion deposicumes. Al prin-cipio de cada proyecto, los estudiantes deben trabajar silenciosa e individualmentedurante un corto periodo de tiempo especificado. U/la vezquecada estudiante hatenido la oportunidad de estudiar los asuntos y de reflejar SI/S posibles respuestas,elgrupo se reúne y se sigue con una discusián degrupo. Si todus losmiembros deungrupo están deacuerdo con las soluciones, el coordinador es responsable depresentarla solución delproyecto del equipo al instructor con las firmas de losestudiantes indi-cando tal acuerdo. Por otra parte, si 11/10 omás miembros del equipo noestán de
acuerdo con la solución ofrecida porlamayoría del equipo, una opinión deminoríapuede anexarse al proyecto presentado, con firma(s).
165
-----_._----------- ; ~
CL4.1 Refiérase a CL 3.1 de la página 101. Su grupo, la Corporación ,hasido contratado para ayudar al analista investigador de la compañía deservicios de asesoría colegial a terminar su informe respecto a las colegiaturascobradas a residentes fuera del estado por colegios y universidades endiferentes regiones del país. En particular, usando elConjunto de datosespeciales 1 del apéndice O de las páginas 04-0S respecto a las colegiaturascobradas a residentes fuera del estado en los 60 colegios y universidades delestado de Texas, 4S instituciones de Carolina del Norte y 90 escuelas dePennsylvanía, la Corporación está preparada para:(a) Delinear cómo procederán los miembros del grupo con sus tareas
(b) Obtener diversas mediciones descriptivas de resumen para cada una de
estas poblaciones.
(e) Escribir y presentar un resumen ejecutivo, comparando y contrastando los
resultados a lo largo de los tres estados.
(h) Preparar y ofrecer una presentación oral de diez minutos al gerente de
comercialización.
Refiérase a CL 3.2 de la página 101. Su grupo, la Corporación , hasido contratado por el editor de la sección de comida de una popular revistafamiliar para estudiar el costo y características nutricionales de los cereales listos para comerse. Habiendo preparado las tablas y diagramas apropiados (véaseCL 3.2), la Corporación está preparada para arn piiar su análisispreliminar. Provisto del Conjunto de datos especiales 2 del apéndice O de laspáginas 06-07 que muestra información útil sobre 84 de estos cereales:(a) Delinee cómo procederán los miembros del grupo con sus tareas.
(b) Obtenga diversas mediciones descriptivas de resumen sobre costo, peso,
calorías y azúcar (en gramos por ración), desglosadas por el tipo de cereal.
(e) Escriba y presente un resumen ejecutivo describiendo los resultados.
(d) Prepare y ofrezca una presentación oral de diez minutos al editor de
comida de la revista.
Refiérase a CL 3.3 de la página 102. Su grupo, la Corporación , hasido contratado por el director de comercialización de un fabricante deconocidas fragancias de hombres y mujeres para estudiar las características defragancias actualmente disponibles. Los resultados de los esfuerzos de su grupodeben permitir al fabricante tomar decisiones de precios respecto a una nuevalínea de productos cuya distribución está planeada para la siguiente temporadade vacaciones. Habiendo preparado las tablas y diagramas apropiados (véaseCL 3.3), la Corporación está preparada para ampliar su análisispreliminar. Provisto del Conjunto de datos especiales 3 del apéndice O de laspáginas 08-09 que muestra información útil sobre el costo por onza de 83 deestas fragancias:
CL4.3
CL4.2
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 64/68
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 65/68
Características nutricionales de 47 sopas enlatadas diferentes.
Marca Producto Tipo Costo Calorías GrasaCaloríasde grasa Sodio
Estudio de caso B -Estudio sobre nutrición en la cafetería universitaria
Notas: Por producto: C N ~ f i d e o s de pollo, v-vegeraíes.I'etomatepor tipo: C C ~ e n l a t a d a / c o n d e n s a d a , C R ~ e n l a t a d a , lista para servirse,DC=deshidratada/cocinada, Dledeshidratada/lnstantánea
Costo en centavos, calorías por ración de 8 onzasCalorías por ración de 8 onzasGrasa en gramos por ración de 8 onzasCalorías como porcentaje de grasa por ración de 8 onzasNivel de sodio en miligramos por ración de 8 onzas
Fuente: Copyright 1993 por Consurners Uníon of Uníted States, Inc., Yonkers,N.Y. 10703. Adaptado con permiso de Consurner Reports,
noviembre de 1993, págs. 698-699.
_ . _ J
167
880730870970
460
700970
960700840840780840790800860
8009001190890
81047018065
580
670680800600940680
540880
640830
280480160
670
410710630700630710300740
3024304223
23
3841
18303043
301516
26
33
26
2614
3023
1129
1922
16
23
9
2412
19308
20
6
10
1020209
9
O9
9
12
O
2
2
2
8
2
289
2
2
2
9
2
1
2
3
4
2
3
1
4
2
1
4
2
3
2
31
2
1
32
1
2
11
1
2
2
1
1
O
1
1
1
O
607560
17080
80190200
1006060
19060
601101051107010565
12080
8012595
125
1101201057575140
6011090
SS90909090100
100
80
100
1007590
.35
.66
.18
.33
.77
.21
.09
.11
.26
.17
.19
.09
.19
.76
.54
.74
.96
.12
.48
.36
.74
.70
.97
.80
.78
.83
.53
.53
.71
.46
.44
.73
.34
.53
.23
.92
.55
.94
.15
.20
.13
.14
.16
.15
.18
.87
.28
CC
CR
CC
DICR
DCDC
DC
DC
CCCCDC
CCCR
DC
CR
CR
DC
DI
DI
CRCR
CR
CR
CR
CR
CR
CR
CR
CR
CR
CR
CCCR
CCCR
CR
CR
CCCC
CCCC
CCCC
CCCR
CC
CN
CN
CN
CN
CN
CNCN
CN
CN
CN
CN
CN
CN
CN
CN
CN
CN
CN
CN
CN
CNCN
CN
CN
CN
V
V
VV
V
V
V
V
V
V
V
V
V
T
T
T
T
T
T
T
T
T
Carnpbell's Homestyle
Progresso
Carnpbell's
Nissin Cup O'Noodles
Progresso Healthy Class,
Lipton Soup MixCarnpbell's Ramen Noodle
Nissin Tip Ramen
Carnpbell's Soup Mix
Pathrnark
ShopRite
Maruchan Ramen
Lady Lee
Weight Watchers
Knorr Chicken Flavor
Carnpbell's Home Cookin '
Hain
Mrs. Grass Noodle Soup
Carnpbell's Cup Instant
Lipton Cup-A-Soup Instant
Carnpbell's Chunky ClassicCampbell's Healt. Request
Prítikin Chicken Soup
Carnpbell's Low Sodium
Healthy Choice
Hain Vegetarian
Carnpbell's Home Cookin'
Carnpbell's Chunky
Healthy Choice Garden
Progresso Tomato
Progresso Vegetable
Healthy Choice Tomato
Carnpbell's Homestyle
Campbell's Home Cookin'
Campbell's Made With Beef
Health Valley Fat-Free
Carnpbell's Healt . Request
Pritikin
Carnpbell's
Campbell's Healt. Request
ShopRite
Kroger
Lady Lee
Pathmark
Vons
Health Valley Org.
Carnpbell's Italian
;
.!
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 66/68
Resumen y descripción de los datos numéricos
Referencias
Notas finales
1. Aunque la palabra promedio se refiere a cualquier mediciónde resumen de tendencia cen tra l, se usa más a menudo
como sinónimo de la media .
2. Estas mediciones se denominan cuantiles. Algunos de loscuantiles más ampliamente usados son los deciles (que dividen los datos ordenados en décimos) y los percentiles (quedividen los datos ordenados en centécimos). Para mayor
información sobre estas mediciones, véase la referencia 1.
3. Usando las reglas de sumatorias del apéndice B, hacemos lasiguiente demostración:
basándose en el tipo de sopa, enlatada/condensada, enla tada y listapara servirse,deshidratada/cocinadao deshidratada/instantánea.
(d) Hacer recomendaciones en vista desus resultados.En dos semanas debe hacer una
exposición oral de diez minutos frente ala doctora Foxe y la señora Neller y pre
sentar un informe escrito, anexandotodas las tablas y diagramas. Además, sele ha pedido esbozar una encuesta delgrupo de estudiantes, con preguntas referentes a los gustos y aversiones de lostipos de sopas y diversas comidas rápidas. Sabiendo que sus resultados seránde gran valor para sus compañeros, sedispone a realizar este proyecto.
4. Laregla de Bienaymé-Chebyshev puede aplicarse sólo a distancias mayores de ±1 desviación estándar alrededor de lamedia.
5. Aquí Il ± 30- produce el intervalo -0.96 a 22.74 miles dedólares; sin embargo, una colegiatura negativa no tiene sentidoy registramos el intervalo como Oa 22.74 miles de dólares.
6. Observaremos en la sección 8.3 que el alcance "práctico" dedatos normalmente distribuidos es seis distancias dedesviación estándar. Por consiguiente, la desviación estándar
es aproximadamente un sexto del rango. Además, para una
serie de datos que está normalmente distribuida, el rango
intercuartil es 1.33 distancias de desviación estándar. Portanto, la desviación estándar es aproximadamente trescuartos del alcance intercuartil. Con una serie de datos que
está aproximadamente distribuida en forma normal, elpromedio de estas dos aproximaciones proporcionaría una
estimación más cercana de la desviación estándar.
7. De la tabla 4.5, si lo deseáramos, podríamos calcular, filapor fila de cada un o de los indicadores económicos dados,diversas mediciones descriptivas de resumen a lo largo delos países enumerados.
8. El sarcasmo es atribuido con más frecuencia a BenjaminDisraeli (1804-1881), dos veces primer ministro de Inglaterra.Sin embargo, un informe reciente (Woerner, D., "Who ReallySaid It?" Chance, vol. 6 (otoño de 1993), pág. 37 indica que talvez lo haya dicho antes alguna otra persona.
7. Norusis, M., SPSS Guide to Data Anaivsis [ot SPSS-X withAdditional Instructions [orSPSS/PC+ (Chicago, IL: SPSSInc.,1986).
8. SAS User'sGuide VersiOll6 (Raleigh, NC: SAS lnstítute, 1988).9. STATISTIX VersiOIl 4.0 (Tallahassee, FL: AnalyticalSoftware, Inc., 1992).
10. Tukey, J., Exploratory Data AI/alysis (Reading, MA:Addíson-Wesley, 1977).
11. Vellernan, P.E , YD. C. Hoaglín, Applications, Basics, andComputing of Exploratorv Data Analysis (Boston, MA:Duxbury Press, 1981).
---------_._---_._. ----_....._--_.---- oo---
Usted decide:(a) Emprender una evaluación descrip
tiva completa de todas las variablesnuméricas (costo en centavos, calorías por ración de 8 onzas, grasa engramos por ración de 8 onzas, calorías como porcentaje de grasa por
ración de 8 onzas y nivel de sodio enmiligramos por ración de 8 onzas).
(b) Realizar una evaluación similarcomparando y contrastando cadauna de estas variables numéricasbasándose en si el producto es una
sopa de pollo de fideos, vegetal ode tomate.
(c) Realizar una evaluación similarcomparando y contrastando cadauna de estas variables numéricas
11
L(X; - X) Oi = 1
n n
LXi LX Oi 1 i -= 1
11
LX; - nX Oj = 1
n n
LXi LXi Oí = 1 i = 1
Capítulo 468
1. Croxton, E, D. Cowden, y S. Klein, Applied General Statistics,3a. ed. (Englewood Cliffs, N]: Prentice-Hall, 1967).
2. Ehrenberg, A. S. e, "Rudiments of Numeracy," iournatof
the Royal Statistical Society, Series A, vol. 140 (1977), págs.277-297.
3. Huff, D., How to Líe w ith Statistics (Nueva York: W. W.Norton, 1954).
4. Kendall , M. G., YA. Stuart, tt« Advanced Theory ofStatistics, vol. I (Londres: Charles W. Griffin, 1958).
5. Kimble, G. A., How to Use (andMisuse)Statistics(Englewood Cliffs, N]: Prentíce-Hall, 1978).
6. MINITAB Reference Manual Release 8 (State College, PA:MINITAB, Inc., 1992).
--......-----------------
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 67/68
D-S Apéndice D
m Conjunto especial de datos 3
Éstees un archivo que contiene los datos correspondientes a una muestra de n = 83fragancias. Para utilizar este archivo, tome en cuenta lo siguiente:
• sexo (M=mujer y H =hombre, con valores de código de 1 y 2, respectiva-mente).• Tipo de fragancia (P=perfume, C =colonia, O =otro;
con valores de código de 1, 2 Y3, respectivamente),• Costo en dólares por hora.• Intensidad de la fragancia(MF =muy fuerte, F=fuerte, Me=mediana y Li =ligera;los respectivos valores de código son 1, 2, 3,4)
Fragrancia Sexo Tipo Costo Intensidad
Gio M P 300 FCaboehard M P 175 F"Delícious" M P 190 FChanel No. 5 M C 19 FObsession M P 180 FSublime M P 250 MFVivid M P 230 FChanel No. 5 M O 32 FDune M P 185 FNinja M C 8 FSafari M C 19 Li
Soft Musk M C 7 Me360 M P 200 FTresor M P 220 Li
Venzia M P 320 MFCoco M P 215 FOpium M O 30 MF
Osear de la Renta M P 200 LiVolupte M P 220 MeWild Heart M C 9 F"An Impression of Chanel # 5" M C 4 MeChanel No. 5 M P 215 FChloe M P 170 Li
Mesmerize M C 9 MeObsession M C 21 Li
Aliage Sport Fragranee M C 12 MeChanelNo.5 M O 19 Li
Passion M P 185 FCharlie M C 8 FRealm Women M O 29 MFShalimar M P 205 MF
Conjunto especial de datos
> . - : ~ ; ! ~ t t
~ á. t . ~ ~ ; . ,: : ~ . "
: ~ ; ~", .",:. . , ~ " ; ' ..
-J..
.:.,.
;
j
7/28/2019 Metodos cuantitativos sesion 4
http://slidepdf.com/reader/full/metodos-cuantitativos-sesion-4 68/68