Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

download Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

of 50

Transcript of Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    1/50

    Objetivos

    Contenido del captulo

    c a p t u l o

    Mostrar la diferencia entremuestras y poblaciones

    Convertir los datos sin procesaren informacin til

    Construir y utilizar datosordenados

    Construir y utilizar distribucio-nes de frecuencias

    Representar grficamentedistribuciones de frecuencias

    con histogramas, polgonosy ojivas

    Utilizar distribuciones defrecuencias para tomardecisiones

    2.1 Cmo podemos ordenar los

    datos? 82.2 Ejemplos de datos sin procesar

    11

    2.3 Ordenamiento de datos enarreglos de datos y distribucio-nes de frecuencias 12

    2.4 Construccin de unadistribucin de frecuencias 20

    2.5 Representacin grfica dedistribuciones de frecuencias29

    Estadstica en el trabajo 42

    Ejercicio de base de datoscomputacional 43

    Trminos introducidos enel captulo 2 45

    Ecuaciones introducidas enel captulo 2 46

    Ejercicios de repaso 46

    22AGRUPACIN Y

    PRESENTACIN

    DE DATOS PARA

    EXPRESAR SIGNIFICADOSTABLAS Y GRFICAS

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    2/50

    Los datos son colecciones de cualquier cantidad de observaciones relacionadas. Podemos recopilarel nmero de telfonos que diferentes empleados instalan en un da dado o el nmero de telfonosque instala un trabajador dado durante un da en un periodo de varios das, y podemos llamar datosa estos resultados. Una coleccin de datos se conoce como conjunto de datos; una sola observacines un dato puntual.

    2.1 Cmo podemos ordenar los datos?Para que los datos sean tiles, necesitamos organizar nuestras observaciones de modo que podamosdistinguir patrones y llegar a conclusiones lgicas. Este captulo presenta las tcnicas tabular y grfi-ca para organizacin de datos; en el captulo 3 mostraremos cmo usar nmeros para describir datos.

    Recoleccin de datosLos especialistas en estadstica seleccionan sus observaciones de manera que todos los grupos rele-vantes estn representados en los datos. Para determinar el mercado potencial de un nuevo produc-to, por ejemplo, los analistas podran estudiar cien consumidores de cierta rea geogrfica. Dichosanalistas deben tener la certeza de que este grupo incluya personas que representan distintas varia-bles como nivel de ingresos, raza, nivel educativo y vecindario.

    Los datos pueden provenir de observaciones reales o de registros elaborados con otros propsi-tos. Por ejemplo, con fines de facturacin e informes mdicos, un hospital registra el nmero depacientes que utilizan los servicios de rayos X. Esta informacin puede organizarse para producirdatos que los especialistas en estadstica puedan describir e interpretar.

    Los datos pueden ayudar a los responsables de tomar decisiones a hacer suposiciones razonadasacerca de las causas y, por tanto, de los efectos probables de ciertas caractersticas en situaciones da-das. El conocimiento de tendencias derivado de la experiencia previa puede, tambin, permitir a losciudadanos conscientes anticipar resultados posibles y actuar en consecuencia. Una investigacin demercado puede revelar que determinado producto es preferido por amas de casa de origen afroame-ricano de las comunidades suburbanas, con ingresos y educacin promedios. Los textos publicitariosdel producto debern, por tanto, estar dirigidos a esta audiencia. Y si los registros del hospital mues-

    Use los datos delpasado para tomar

    decisiones del futuro

    Encuentre datos a

    partir de observacio-

    nes o de registros

    Represente todos

    los grupos

    Algunas definiciones

    El gerente de produccin de la Dalmon Carpet Company esresponsable de la fabricacin de alfombras en ms de 500 telares.Para no tener que medir la produccin diaria (en yardas) de cada

    telar, toma una muestra de 30 telares cada da, con lo que llega a unaconclusin respecto a la produccin promedio de alfombras de las 500mquinas. La tabla que se presenta ms adelante exhibe la produccinde cada uno de los 30 telares de la muestra. Estas cantidades son losdatos sin procesar a partir de los cuales el director de produccin puede

    sacar conclusiones acerca de la toda la poblacin de telares en sudesempeo del da anterior.

    Produccin en yardas de 30 telares para alfombra

    Mediante los mtodos introducidos en este captulo, podemos ayudaal director de produccin a llegar a la conclusin correcta.

    16.2 15.4 16.0 16.6 15.9 15.8 16.0 16.8 16.9 16.8

    15.7 16.4 15.2 15.8 15.9 16.1 15.6 15.9 15.6 16.0

    16.4 15.8 15.7 16.2 15.6 15.9 16.3 16.3 16.0 16.3

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    3/50

    tran que un nmero mayor de pacientes ha utilizado el aparato de rayos X en junio que endepartamento de personal del hospital deber determinar si esto sucedi slo ese ao o esvo de una tendencia y, tal vez, debera ajustar su programa de contratacin y asignacin dnes de acuerdo con la informacin.

    Cuando los datos se ordenan de manera compacta y til, los responsables de tomar dpueden obtener informacin confiable sobre el entorno y usarla para tomar decisiones intEn la actualidad, las computadoras permiten a los especialistas en estadstica recolectarvolmenes de observaciones y comprimirlas en tablas, grficas y cifras instantneamente.formas compactas y tiles, pero son confiables? Recuerde que los datos producidos por untadora son tan precisos como los datos que entraron en ella. Como dicen los prograBEBS! o basura entra, basura sale!. Los administradores deben tener mucho cuidadorarse que los datos empleados estn basados en suposiciones e interpretaciones correctas.depositar nuestra confianza en cualquier conjunto de datos interpretados, vengan de una cora o no, pngalos a prueba mediante las siguientes preguntas:

    1. De dnde vienen los datos? La fuente es tendenciosa?, es decir, es posible que ers en proporcionar datos que conduzcan a cierta conclusin ms que a otras?

    2. Los datos apoyan o contradicen otras evidencias que se tienen?3. Hace falta alguna evidencia cuya ausencia podra ocasionar que se llegue a una conc

    ferente?4. Cuntas observaciones se tienen? Representan a todos los grupos que se desea estu5. La conclusin es lgica? Se ha llegado a conclusiones que los datos no confirman?

    Estudie las respuestas que d a estas preguntas. Vale la pena usar los datos o debemos recabar ms informacin antes de actuar? Si el hospital se queda corto de personal porquepocos tcnicos para operar las instalaciones de rayos X, quiere decir que su administradordatos insuficientes. Si la agencia de publicidad dirigi su propaganda slo a las amas de cmericanas de los suburbios cuando pudo haber triplicado sus ventas al incluir tambin a amblancas, quiere decir que tambin en este caso hubo confianza en datos insuficientes. En asos, probar los datos disponibles podra haber ayudado a los administradores a tomar mejsiones.

    El efecto de emplear datos incompletos o tendenciosos puede ilustrarse con el siguiente

    una asociacin nacional de lneas de transporte afirma, en un comercial, que el 75% de touno utiliza se transporta en camin. Esta afirmacin podra conducir a creer que automvicarriles, aeroplanos, barcos y otras formas de transporte slo trasladan el 25% de lo que uEs fcil llegar a tal conclusin, pero sta no es completamente ilustrativa. En la afirmactoma en cuenta la cuestin del conteo doble. Qu pasa cuando algo es llevado hasta su cferrocarril y luego en camin hasta su casa? O cmo se considera la paquetera si se tpor correo areo y luego en motocicleta? Cuando se resuelve la cuestin del conteo doble tante complicado de manejar), resulta que los camiones transportan una proporcin muchobienes que la afirmada por los transportistas. Aunque los camiones estn involucrados en de una proporcin relativamente alta de lo que utilizamos, el ferrocarril y los barcos llevannes a lo largo de ms kilmetros.

    Diferencia entre muestras y poblacionesLos expertos en estadstica recogen datos de una muestra y utilizan esta informacin paraferencias sobre la poblacin que representa esa muestra. As, una poblacin es un todo y utra es una fraccin o segmento de ese todo.

    Se estudiarn las muestras para poder describir las poblaciones. El hospital del ejemplotudiar un grupo pequeo y representativo de los registros de rayos X, en lugar de examinarde los registros de los ltimos 50 aos. La Gallup Poll puede entrevistar una muestra de s

    Funcin de las

    muestras

    Definicin de mues-

    tra y poblacin

    Ejemplo de conteo

    doble

    Pruebas para datos

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    4/50

    estadounidenses adultos con el fin de predecir la opinin de todos los adultos que viven enUnidos.

    El estudio de una muestra es ms sencillo que el de la poblacin completa, cuesta menmenos tiempo. A menudo, probar la resistencia de una parte de avin implica destruirla; ecuencia, es deseable probar la menor cantidad de partes. En algunas ocasiones, la prueba imriesgo humano; el uso de muestras disminuye ese riesgo a un nivel aceptable. Por ltimo, sbado que incluso el examen de una poblacin entera deja pasar algunos elementos defectutanto, en algunos casos, el muestreo puede elevarel nivel de calidad. Si usted se pregunta cde suceder esto, piense en lo cansado y poco animoso que estara si tuviera que observar d

    continua miles y miles de productos en una banda continua.Unapoblacin es un conjunto de todos los elementos que estamos estudiando, acerca dles intentamos sacar conclusiones. Debemos definir esa poblacin de modo que quede clarcierto elemento pertenece o no a la poblacin. Para el estudio de mercado mencionado, la ppuede estar constituida por todas las mujeres residentes dentro de un radio de 25 kilmetrostro en la ciudad de Cincinnati, que tengan un ingreso familiar anual entre $20,000 y $45,00cursado por lo menos 11 aos de educacin formal. Una mujer que viva en el centro de Ccon ingresos familiares de $25,000 y estudios universitarios completos podra ser parte dblacin, mientras que una mujer residente de San Francisco, o que tenga ingresos fam$7,000 o con cinco aos de estudios profesionales, no se considerara miembro de nuestra p

    Una muestra es una coleccin de algunos elementos de la poblacin, no de todos. La p

    de nuestra investigacin de mercado son todas las mujeres que cumplen con los requisitores. Cualquier grupo de mujeres que cumpla con tales requisitos puede constituir una muespre y cuando el grupo sea una fraccin de la poblacin completa. Una porcin grande de rframbuesas con slo algunas migajas de corteza es una muestra de tarta, pero no es una mpresentativa debido a que las proporciones de los ingredientes no son las mismas en la muen el todo.

    Una muestra representativa contiene las caractersticas relevantes de la poblacin en laproporciones en que estn incluidas en tal poblacin. Si la poblacin de mujeres del ejemtercio de afroamericanas, entonces una muestra representativa en trminos de raza tendrun tercio de afroamericanas. En el captulo 6 se analizan con ms detalle los mtodos especra realizar muestreos.

    Bsqueda de un patrn significativo en los datosLos datos pueden organizarse de muchas maneras. Podemos, simplemente recolectarlos nerlos en orden. O, si las observaciones estn hechas con nmeros, podemos hacer una lidatos puntuales de menor a mayor segn su valor numrico. Pero si los datos consisten endores especializados (como carpinteros, albailes o soldadores) de una construccin, o en ltos tipos de automviles que ensamblan todos los fabricantes, o en los diferentes colores defabricados por una empresa dada, debemos organizarlos de manera distinta. Necesitaremotar los datos puntuales en orden alfabtico o mediante algn principio de organizacin. Ucomn de organizar los datos consiste en dividirlos en categoras o clases parecidas y luegel nmero de observaciones que quedan dentro de cada categora. Este mtodo produce ubucin de frecuencias, que se estudiar ms adelante, en este mismo captulo.

    Organizar los datos tiene como fin permitirnos ver rpidamente algunas de las caracterlos datos recogidos. Buscamos cosas como el alcance (los valores mayor y menor), patronetes, alrededor de qu valores tienden a agruparse los datos, qu valores aparecen con mscia, etc. Cuanta ms informacin de este tipo podamos obtener de una muestra, mejor entenla poblacin de la cual proviene, y mejor ser nuestra toma de decisiones.

    Por qu debemos

    organizar los datos?

    Los datos pueden

    organizarse de

    muchas maneras

    Necesidad de

    una muestrarepresentativa

    Funcin de las

    poblaciones

    Ventajas de las

    muestras

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    5/50

    Ejercicios 2.1

    Aplicaciones

    2-1 Cuando se les pregunta qu medicamento tomaran si estuvieran en una isla abandonada y slo pudieelegir un analgsico, la mayora de los mdicos prefiere Bayer, en lugar de Tylenol, Bufferin o Advil. lleg a esta conclusin a partir de una muestra o de una poblacin?

    2-2 El 25% de los automviles vendidos en Estados Unidos en 1992 fue armado en Japn. Se lleg a econclusin a partir de una muestra o de una poblacin?

    2-3 Hace poco, una fbrica de aparatos electrnicos introdujo al mercado un nuevo amplificador, y en laranta se indica que se han vendido 10,000 de esos amplificadores. El presidente de la empresa, bastapreocupado despus de recibir tres cartas de quejas con respecto a los nuevos amplificadores, informgerente de produccin que se implantaran costosas medidas de control para asegurar que los defectoaparecieran de nuevo. Haga un comentario sobre la reaccin del gerente desde la perspectiva de las cipruebas para datos que se dieron en la pgina 9.

    2-4 Alemania permanecer siempre dividida, afirm Walter Ulbricht despus de la construccin del MuroBerln en 1961. Sin embargo, hacia finales de 1969, el gobierno de Alemania del Este empez a permel libre trnsito entre la parte oriental y la occidental, y veinte aos despus,el muro fue destruido por cpleto. Mencione algunas razones por las cuales Ulbricht hizo una prediccin incorrecta.

    2-5 Analice los datos dados en el problema planteado al inicio del captulo en trminos de las cinco pruepara datos dados en la pgina 9.

    2.2 Ejemplos de datos sin procesarLa informacin obtenida, antes de ser organizada y analizada, se conoce como datos sin proceSon sin procesar puesto que an no han sido manejados mediante un mtodo estadstico.

    Los datos de los telares proporcionados al inicio del captulo son un ejemplo de datos sin proceConsideremos un segundo ejemplo. Suponga que el personal de admisin de una universidad, preopado por el xito de los estudiantes que escogen para ser admitidos, desea comparar el desempeolos estudiantes universitarios con otros logros, como calificaciones en el nivel anterior, resudos de exmenes y actividades extracurriculares. En lugar de estudiar a todos los alumnos de tolos aos, el personal puede tomar una muestra de la poblacin de estudiantes en un periodo dadestudiar slo ese grupo, para llegar a conclusiones sobre qu caractersticas parecen predecir el xPor ejemplo, puede comparar las calificaciones del nivel educativo anterior con el promedio de cficaciones universitarias de los estudiantes de la muestra. El personal puede sumar las calificacioy dividir el resultado entre el nmero total de ellas para obtener un promedio, o media, para cadatudiante. En la tabla 2-1 se presentan tabulados estos datos sin procesar: 20 pares de calificaciopromedio en el bachillerato y en la universidad.

    Cuando se disea un puente, los ingenieros deben determinar la tensin que un material dadigamos el concreto, puede soportar. En lugar de probar cada pulgada cbica de concreto paraterminar su capacidad de resistencia, los ingenieros toman una muestra, la prueban y llegan conclusin sobre qu tanta tensin, en promedio, puede resistir ese tipo de concreto. En la tabla se presentan los datos sin procesar obtenidos de una muestra de 40 bloques de concreto que se uzarn para construir un puente.

    Problema de

    construccin

    de un puente

    Problema que

    enfrenta el personal

    de admisin

    Promedios de califica-ciones en bachilleratoy universidad de 20estudiantes universita-rios del ltimo ao

    Tabla 2-1 Bach. Univ. Bach. Univ. Bach. Univ. Bach. Un

    3.6 2.5 3.5 3.6 3.4 3.6 2.2 2.2.6 2.7 3.5 3.8 2.9 3.0 3.4 3.2.7 2.2 2.2 3.5 3.9 4.0 3.6 3.3.7 3.2 3.9 3.7 3.2 3.5 2.6 1.4.0 3.8 4.0 3.9 2.1 2.5 2.4 3.

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    6/50

    Los datos no necesariamente son informa-cin; tener ms datos no necesariamenteproduce mejores decisiones. La meta esresumir y presentar los datos de manera

    til para apoyar la toma de decisiones efectiva y gil. La ra-zn por la que los datos deben organizarse es ver si existeun patrn en ellos, patrones como el valor ms grande y el

    ms pequeo, o el valor alrededor del cual parecen agrupar-se. Si los datos provienen de una muestra, se suponen re-presentativos de la poblacin de la que se tomaron. Todoslos buenos estadsticos (y usuarios de datos) reconocen queusar datos sesgados o incompletos conduce a malas deci-siones.

    Presin en libras porpulgada cuadradaque puede resistir elconcreto

    Tabla 2-2

    Muestra de laproduccin diaria de30 telares para alfombra(en yardas)

    Tabla 2-3

    SUGERENCIAS

    Y

    SUPOSICIONES

    2500.2 2497.8 2496.9 2500.8 2491.6 2503.7 2501.3 2500.02500.8 2502.5 2503.2 2496.9 2495.3 2497.1 2499.7 2505.02490.5 2504.1 2508.2 2500.8 2502.2 2508.1 2493.8 2497.82499.2 2498.3 2496.7 2490.4 2493.4 2500.7 2502.0 2502.52506.4 2499.9 2508.4 2502.3 2491.3 2509.5 2498.4 2498.1

    Ejercicios 2.2

    Aplicaciones

    2-6 Observe los datos de la tabla 2-1. Por qu los datos necesitan organizarse ms? Puede usted llegar a unaconclusin partiendo de los datos tal como se presentan?

    2-7 El gerente de mercadotecnia de una compaa grande recibe un informe mensual de las ventas de uno delos productos de la compaa. El informe consiste en una lista de las ventas del producto por estado du-rante el mes anterior. Es ste un ejemplo de datos sin procesar?

    2-8 El gerente de produccin de una compaa grande recibe un informe mensual de su departamento de con-trol de calidad. El informe presenta el ndice de rechazo de la lnea de produccin (nmero de rechazospor cada 100 unidades producidas), la mquina que ocasiona el mayor nmero de productos defectuososy el costo promedio de reparacin de las unidades rechazadas. Es ste un ejemplo de datos sin procesar?

    2.3 Ordenamiento de datos en arreglos dedatos y distribuciones de frecuenciasUna ordenacin de datos es una de las formas ms sencillas de presentarlos: organiza los valores enorden ascendente o descendente. En la tabla 2-3 repetimos los datos de la produccin de alfombrasdel problema presentado al inicio del captulo, y en la tabla 2-4 reordenamos los nmeros en un or-den ascendente.

    La ordenacin de datos ofrece varias ventajas con respecto a los datos sin procesar:

    1. Podemos identificar los valores mayor y menor rpidamente. En el ejemplo de las alfom-bras, los datos van de las 15.2 a las 16.9 yardas.

    Ventajas de la

    ordenacin de datos

    Definicin de orde-

    nacin de datos

    16.2 15.8 15.8 15.8 16.3 15.615.7 16.0 16.2 16.1 16.8 16.016.4 15.2 15.9 15.9 15.9 16.815.4 15.7 15.9 16.0 16.3 16.016.4 16.6 15.6 15.6 16.9 16.3

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    7/50

    2. Es fcil dividir los datos en secciones. En la tabla 2-4, los primeros 15 valores (la mrior de los datos) estn entre 15.2 y 16.0 yardas, y los ltimos 15 (la mitad superior) en

    16.9 yardas. De manera similar, el tercio ms bajo de los datos est entre 15.2 y 15.8 ytercio de en medio est entre 15.9 y 16.2 yardas, y el tercio ms alto entre 16.2 y 16.3. Podemos ver si algunos valores aparecen ms de una vez en el arreglo. Los valore

    quedan juntos. En la tabla 2-4 se muestra que nueve niveles ocurren ms de una vez ctoma una muestra de 30 telares.

    4. Podemos observar la distancia entre valores sucesivos de los datos. En la tabla 216.8 son valores sucesivos. La distancia entre ellos es de 0.2 yardas (16.8 16.6).

    A pesar de las ventajas, en algunas ocasiones un ordenamiento de datos no resulta til. una lista de todos los valores, es una forma incmoda de mostrar grandes cantidades de dale ser necesario comprimir la informacin sin que pierda su utilidad para la interpretacin de decisiones. Cmo podemos hacerlo?

    Una mejor forma de organizar datos:la distribucin de frecuenciasUna manera de compactar datos es mediante una tabla de frecuencias o distribucin de frePara entender la diferencia entre sta y el ordenamiento de datos, tome como ejemplo las expromedio (en das) para 20 tiendas de autoservicio:

    Las distribuciones de

    frecuencias permiten

    manejar ms datos

    Desventajas de la

    ordenacin de datos

    Ordenamiento de losdatos de la produccindiaria de 30 telares paraalfombra (en yardas)

    Tabla 2-4

    15.2 15.7 15.9 16.0 16.2 16.415.4 15.7 15.9 16.0 16.3 16.615.6 15.8 15.9 16.0 16.3 16.815.6 15.8 15.9 16.1 16.3 16.815.6 15.8 16.0 16.2 16.4 16.9

    Ordenamiento de datospara las existencias pro-

    medio (en das) para 20tiendas de autoservicio

    Tabla 2-5

    2.0 3.8 4.1 4.7 5.53.4 4.0 4.2 4.8 5.53.4 4.1 4.3 4.9 5.53.8 4.1 4.7 4.9 5.5

    Distribucin defrecuencias para lasexistencias promedio(en das) en 20 tiendasde autoservicio(6 clases)

    Tabla 2-6 Clase (grupo de valores Frecuencia (nmero d

    parecidos de datos puntuales) observaciones que hay en ca

    2.0 a 2.5 12.6 a 3.1 03.2 a 3.7 23.8 a 4.3 84.4 a 4.9 55.0 a 5.5 4

    En las tablas 2-5 y 2-6, hemos tomado los mismos datos concernientes a las existenciadio y los hemos organizado, primero, como un arreglo ascendente y luego como una distribfrecuencias. Para obtener la tabla 2-6 tuvimos que dividir los datos en grupos de valores pDespus registramos el nmero de datos puntuales que caen en cada grupo. Observe que algo de informacin al construir la distribucin de frecuencias. Ya no podemos saber, porque el valor 5.5 aparece cuatro veces y que el valor 5.1 no aparece. Sin embargo, ganamoscin acerca delpatrn de existencias promedio. En la tabla 2-6, podemos ver que las existenmedio caen con ms frecuencia en el intervalo de 3.8 a 4.3 das. No es usual encontrar ex

    Pierden algo de

    informacin

    Pero se obtiene otro

    tipo de informacin

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    8/50

    promedio en el intervalo de 2.0 a 2.5 das o en el que va de 2.6 a 3.1 das. Las existencias entre 4.4 y 4.9 das y entre 5.0 y 5.5 das no son las que prevalecen, pero ocurren con mscia que algunas otras. As pues, las distribuciones de frecuencias sacrifican algunos detallesofrecen nuevas perspectivas sobre los patrones de los datos.

    Una distribucin de frecuencias es una tabla en la que organizamos los datos en clasesen grupos de valores que describen una caracterstica de los datos. El inventario promedcaracterstica de las 20 tiendas de autoservicio. En la tabla 2-5, esta caracterstica tiene oncdiferentes. Pero estos mismos datos podran dividirse en cualquier nmero de clases. En la por ejemplo, utilizamos seis. Podramos comprimir todava ms los datos y utilizar slo d

    menores que 3.8 y mayores o iguales que 3.8. O podramos aumentar el nmero de clasesdo intervalos ms pequeos, como se hace en la tabla 2-7.Una distribucin de frecuencias muestra el nmero de observaciones del conjunto de d

    caen en cada una de las clases. Si se puede determinar la frecuencia con la que se presentalores en cada clase de un conjunto de datos, se puede construir una distribucin de frecuen

    Definicin de distribucin de frecuencias relativasHasta aqu hemos considerado la frecuencia con que aparecen los valores en cada clase comero total de datos puntuales u observaciones que caen en cada clase. Podemos expresar lacia de cada valor tambin como unafraccin o unporcentaje del nmero total de observac

    frecuencia de un inventario promedio de 4.4 a 4.9 das, por ejemplo, es 5 en la tabla 2-6, pen la tabla 2-8. Para obtener este valor de 0.25, dividimos la frecuencia de esa clase (5) enmero total de observaciones del conjunto de datos (20). La respuesta se puede expresar cfraccin (5/20), un nmero decimal (0.25) o un porcentaje (25%). En una distribucin de frerelativas se presentan las frecuencias en trminos de fracciones o porcentajes.

    Observe, en la tabla 2-8, que la suma de todas las frecuencias relativas es igual a 1.00,Esto se debe a que una distribucin de frecuencias relativas da una correspondencia de ccon su fraccin o porcentaje del total de los datos. Por consiguiente, las clases que aparecenquier distribucin de frecuencias, sean relativas o simples, son completamente incluyentes. datos caen en una u otra categora. Note tambin que las clases de la tabla 2-8 son mutuamcluyentes, es decir, ningn dato puntual cae en ms de una categora. En la tabla 2-9 se il

    concepto mediante la comparacin de clases mutuamente excluyentes con clases que se tEn las distribuciones de frecuencias no existen clases que se traslapen.

    Las clases son

    completamente

    incluyentes

    Son mutuamente

    excluyentes

    Caractersticas de las

    distribuciones de fre-

    cuencias relativas

    Por qu se le cono-

    ce como distribucin

    de frecuencias?

    Funcin de las clases

    en una distribucin

    de frecuencias

    Distribucin defrecuencias para lasexistencias promedio(en das) en 20 tiendasde autoservicio(12 clases)

    Tabla 2-7 Clase Frecuencia Clase Frecuencia

    2.0 a 2.2 1 3.8 a 4.0 32.3 a 2.5 0 4.1 a 4.3 52.6 a 2.8 0 4.4 a 4.6 02.9 a 3.1 0 4.7 a 4.9 53.2 a 3.4 2 5.0 a 5.2 03.5 a 3.7 0 5.3 a 5.5 4

    Distribucin defrecuencias relativasdel inventario promedio(en das) para 20 tiendasde autoservicio

    Tabla 2-8 Frecuencia relativa:

    Clase Frecuencia fraccin de observaciones en cad

    2.0 a 2.5 1 0.05

    2.6 a 3.1 0 0.003.2 a 3.7 2 0.103.8 a 4.3 8 0.404.4 a 4.9 5 0.255.0 a 5.5 4 0.20

    20

    1.00

    (suma de frecuencias r

    de todas las clases)

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    9/50

    Distribucin Distribucin

    Clase de frecuencias frecuencias rel

    ocupacional (1) (1) 100

    Actor 5 0.05

    Banquero 8 0.08

    Empresario 22 0.22

    Qumico 7 0.07

    Mdico 10 0.10

    Agente de seguros 6 0.06Periodista 2 0.02

    Abogado 14 0.14

    Maestro 9 0.09

    Otros 17 0.17

    100

    1.00

    Hasta ahora, las clases han consistido en nmeros y describen algn atributo cuantitat

    elementos de la muestra. Podemos, tambin, clasificar la informacin de acuerdo con cara

    cualitativas, como raza, religin y sexo, que no entran de manera natural en categoras n

    Igual que las clases de atributos cuantitativos, stas deben ser completamente incluyentes

    mente excluyentes. En la tabla 2-10 se muestra cmo construir distribuciones de frecuenciao absolutas y distribuciones de frecuencias relativas usando el atributo cualitativo de ocup

    Aunque en la tabla 2-10 no se enumeran todas las ocupaciones de los graduados de

    College, sigue siendo completamente incluyente. Por qu? La clase otros cubre a todas

    vaciones que no entran en las categoras mencionadas. Utilizaremos algo parecido siempre

    tra lista no incluya especficamente todas las posibilidades. Por ejemplo, si la caracterst

    presentarse durante cualquier mes del ao, una lista completa debera incluir 12 categora

    deseamos enumerar slo los ocho primeros meses, de enero a agosto, podemos utilizar e

    otros para referirnos a las observaciones correspondientes a los restantes cuatro meses, se

    octubre, noviembre y diciembre. Aunque nuestra lista no incluye especficamente todas la

    dades, sigue siendo completamente incluyente. La categora otros se conoce como clase

    mo abierto cuando permite que el extremo inferior o el superior de una clasificacin cuanest limitado. La ltima clase de la tabla 2-11 (72 o ms) es de extremo abierto.

    Clases de extremo

    abierto para listas

    que no son

    exhaustivas

    Clases de datos

    cualitativos

    Clases mutuamenteexcluyentes y clasesque se traslapan

    Tabla 2-9

    Ocupacin de losintegrantes de unamuestra de 100graduados del CentralCollege

    Tabla 2-10

    Mutuamente excluyentes 1 a 4 5 a 8 9 a 12

    No mutuamente excluyentes 1 a 4 3 a 6 5 a 80

    Edades de los habitantesdel condado de Bunder

    Tabla 2-11 Clase: edad Frecuencia Frecuenci

    (1) (2) (2) 8

    Nacimiento a 7 8,873 0.0

    8 a 15 9,246 0.1

    16 a 23 12,060 0.1

    24 a 31 11,949 0.1

    32 a 39 9,853 0.1

    40 a 47 8,439 0.0

    48 a 55 8,267 0.0

    56 a 63 7,430 0.0

    64 a 71 7,283 0.0

    72 o ms 6,192 0.0

    89,592 1.0

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    10/50

    Ejercicios 2.3

    Ejercicios de autoevaluacin

    EA 2-1 Las edades de los 50 integrantes de un programa de servicio social del gobierno son:

    83 51 66 61 82 65 54 56 92 6065 87 68 64 51 70 75 66 74 6844 55 78 69 98 67 82 77 79 6238 88 76 99 84 47 60 42 66 7491 71 83 80 68 65 51 56 73 55

    Use estos datos para construir las distribuciones de frecuencia relativa con 7 y 13 intervalos iguales. Lapoltica del estado para los programas de servicio social requiere que alrededor de 50% de los participan-tes tengan ms de 50 aos.a) Cumple el programa con la poltica?b) La distribucin de frecuencias relativas de 13 intervalos ayuda a responder el inciso a) mejor que la

    distribucin de 7 intervalos?c) Suponga que el director de servicios sociales desea saber la proporcin de participantes en el progra-

    ma que tienen entre 45 y 50 aos de edad. A partir de cul distribucin de frecuencias relativas, de 7o de 13 intervalos, puede estimar mejor la respuesta?

    EA 2-2 Use los datos de la tabla 2-1 para elaborar un ordenamiento de mayor a menor del promedio general enbachillerato. Despus haga un ordenamiento de mayor a menor del promedio general en la universidad.

    A partir de los dos ordenamientos, qu puede concluir que no poda a partir de los datos originales?

    Aplicaciones

    2-9 Los talleres Transmissions Fix-It registran el nmero de comprobantes de servicio extendidos el mes an-terior en cada una de sus 20 sucursales de la forma siguiente:

    Los esquemas de clasificacin pueden ser tanto cuantitativos como cualitativosy tanto discretoscomo continuos. Las clases discretas son entidades separadas que no pasan de una clase a la siguien-te sin que haya un rompimiento. Clases como el nmero de nios de cada familia, el nmero de ca-miones de una compaa de transportistas o las ocupaciones de los graduados del Central Collegeson discretas. Los datos discretos son aquellos que pueden tomar slo un nmero limitado de valo-res o un nmero infinito numerable de valores. Los graduados del Central College pueden clasifi-carse como doctores o qumicos, pero no como algo intermedio. El precio de cierre de las accionesde AT&T puede ser 391/2 o 397/8 (pero no 39.43), o su equipo de bsquetbol favorito puede ganar por5 o 27 puntos (pero no por 17.6 puntos).

    Los datos continuos pasan de una clase a otra sin que haya un rompimiento. Implican medicio-

    nes numricas como el peso de las latas de tomates, la presin sobre el concreto o las calificacionesde bachillerato de los estudiantes del ltimo ao en la universidad, por ejemplo. Los datos continuospueden expresarse con nmeros fraccionarios o con enteros.

    Clases continuas

    Clases discretas

    Existen muchas maneras de presentar da-tos. Para empezar, puede elaborar unordenamiento de datos de manera des-cendente o ascendente. Mostrar cuntas

    veces aparece un valor usando una distribucin de frecuen-

    cias es an ms efectivo; convertir estas frecuencias en de-cimales (que se conocen como frecuencias relativas) puedeayudar todava ms. Sugerencia: debe recordar que las va-riables discretas son cosas que se pueden contar y las varia-bles continuas aparecen en algn punto de una escala.

    SUGERENCIAS

    Y

    SUPOSICIONES

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    11/50

    823 648 321 634 752669 427 555 904 586722 360 468 847 641217 588 349 308 766

    La compaa tiene la creencia de que una sucursal no puede mantenerse financieramente con475 servicios mensuales. Es tambin poltica de la compaa otorgar una bonificacin econmrente de la sucursal que genere ms de 725 servicios mensuales. Ordene los datos de la tablacuntas sucursales no pueden mantenerse y cuntas recibirn bonificacin.

    2-10 Utilice los datos de la empresa Transmissions Fix-It del ejercicio 2-9. La vicepresidente financompaa ha establecido lo que llama una lista de observacin de sucursales que contiene las

    cuya actividad en cuanto a servicios prestados es lo suficientemente baja como para que la caspreste atencin especial. Esta categora incluye a las sucursales cuya actividad est entre 550 vicios mensuales. Cuntos talleres debern estar en dicha lista si nos basamos en la actividad dterior?

    2-11 El nmero de horas que les toma a los mecnicos retirar, reparar y reinstalar una transmisinlos talleres de Transmissions Fix-It, durante un da de la semana anterior, se registra de la manera

    4.3 2.7 3.8 2.2 3.43.1 4.5 2.6 5.5 3.26.6 2.0 4.4 2.1 3.36.3 6.7 5.9 4.1 3.7

    A partir de estos datos, elabore una distribucin de frecuencias con intervalos de una hora. Aclusiones puede llegar acerca de la productividad de los mecnicos si toma en cuenta la distri

    frecuencias? Si el gerente de la Transmissions Fix-It cree que ms de 6.0 horas es evidencia de peo insatisfactorio, de qu magnitud es el problema del desempeo de los mecnicos en esparticular?

    2-12 El comisionado de transporte del condado de Orange est preocupado por la velocidad a la quductores manejan en un tramo de la carretera principal. Los datos de velocidad de 45 conductosiguientes:

    15 32 45 46 42 39 68 47 1831 48 49 56 52 39 48 69 6144 42 38 52 55 58 62 58 4856 58 48 47 52 37 64 29 5538 29 62 49 69 18 61 55 49

    Use estos datos para elaborar distribuciones de frecuencias relativas con 5 y 11 intervalos igual

    partamento de Transporte informa que, a nivel nacional, no ms de 10% de los conductores exceda) Se comportan los conductores del condado de Orange de acuerdo con las afirmaciones ddel Departamento de Transporte acerca de los patrones de manejo?

    b) Qu distribucin us para responder el inciso a)?c) El Departamento de Transporte ha determinado que la velocidad ms segura para esta carret

    de 36 y menos de 59 mph. Qu proporcin de conductores maneja dentro de este intervdistribucin ayuda a responder a esta pregunta?

    2-13 Ordene los datos de la tabla 2-2, en un arreglo de mayor a menor.a) Suponga que la ley estatal requiere que los puentes de concreto puedan soportar al me

    lb/pulg2. Cuntas muestras no pasarn esta prueba?b) Cuntas muestras podran soportar una presin de al menos 2,497 lb/pulg2 pero no una

    lb/pulg2?

    c) Si examina con cuidado el arreglo, se dar cuenta de que algunas muestras pueden soportdes iguales de presin. Proporcione una lista de tales presiones y el nmero de muestras qsoportar cada cantidad de presin.

    2-14 Un estudio reciente sobre los hbitos de los consumidores de televisin por cable en Estados Uporcion los siguientes datos:

    Nmero de horas que ven

    Nmero de canales comprados televisin por semana

    25 14

    18 16Contina

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    12/50

    Nmero de horas que ven

    Nmero de canales comprados televisin por semana

    42 1296 628 13

    43 1639 929 717 1984 476 822 13

    104 6

    Ordene los datos. Qu conclusin puede deducir de estos datos? 2-15 La agencia de proteccin ambiental estadounidense tom muestras de agua de 12 ros y arroyo

    sembocan en el lago Erie. Las muestras se probaron en los laboratorios de la agencia y clasificala cantidad de contaminantes slidos suspendidos en cada muestra. Los resultados de la prueba setabla siguiente:

    Muestra 1 2 3 4 5 Contaminantes (ppm) 37.2 51.7 68.4 54.2 49.9

    Muestra 7 8 9 10 11 Contaminantes (ppm) 39.8 52.7 60.0 46.1 38.5

    a) Ordene los datos en un arreglo descendente.b) Determine el nmero de muestras con un contenido de contaminantes entre 30.0 y 39.9, 40

    50.0 y 59.9 y entre 60.0 y 69.9.c) Si 45.0 es el nmero que utiliza la agencia de proteccin ambiental para indicar una contamina

    siva, cuntas muestras sern clasificadas como excesivamente contaminadas?d) Cul es la distancia ms grande entre dos muestras consecutivas cualesquiera?

    2-16 Suponga que el personal de admisiones al que nos referimos al analizar la tabla 2-1 de la pginaexaminar la relacin entre la diferencial de un estudiante que realiza el examen de admisin (lcia entre el resultado real del examen y el esperado segn el promedio general del nivel anteriorpersin de los promedios generales del estudiante en el bachillerato y la universidad (la difereel promedio general de la universidad y el del nivel anterior). El personal de admisiones utilizasiguientes:

    Prom. bach. Prom. univ. Resultado examen Prom. bach. Prom. univ. Resultado ex

    3.6 2.5 1,100 3.4 3.6 1,1802.6 2.7 940 2.9 3.0 1,010

    2.7 2.2 950 3.9 4.0 1,3303.7 3.2 1,160 3.2 3.5 1,1504.0 3.8 1,340 2.1 2.5 9403.5 3.6 1,180 2.2 2.8 9603.5 3.8 1,250 3.4 3.4 1,170

    2.2 3.5 1,040 3.6 3.0 1,1003.9 3.7 1,310 2.6 1.9 8604.0 3.9 1,330 2.4 3.2 1,070

    Adems, el personal de admisiones ha recibido la siguiente informacin del servicio de pruebavas:

    Prom. bach. Resultado examen Prom. bach. Resultado examen

    4.0 1,340 2.9 1,0203.9 1,310 2.8 1,0003.8 1,280 2.7 9803.7 1,250 2.6 960

    Contina

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    13/50

    Prom. bach. Resultado examen Prom. bach. Resultado examen

    3.6 1,220 2.5 940

    3.5 1,190 2.4 9203.4 1,160 2.3 9103.3 1,130 2.2 9003.2 1,100 2.1 8803.1 1,070 2.0 8603.0 1,040

    a) Ordene estos datos en un arreglo descendente de las dispersiones. (Considere positivo un ael promedio general de universidad respecto al de bachillerato y como negativo el caso concluya con cada dispersin la diferencial de admisin correspondiente. (Considere negativotado de admisin que est por debajo del esperado y positivo uno que est por arriba.)

    b) Cul es la dispersin ms comn?c) Para la dispersin del inciso b), cul es la diferencial de admisin ms comn?d) A qu conclusiones llega, partiendo del anlisis que ha hecho?

    Soluciones a los ejercicios de autoevaluacin

    EA 2-1 7 intervalos 13 intervalos

    Frecuencia Frecuencia Frec

    Clase relativa Clase relativa Clase re

    30-39 0.02 35-39 0.02 70-74

    40-49 0.06 40-44 0.04 75-79 50-59 0.16 45-49 0.02 80-84 60-69 0.32 50-54 0.08 85-89 70-79 0.20 55-59 0.08 90-94 80-89 0.16 60-64 0.10 95-99 90-99 0.08 65-69 0.22

    1.00

    a) Como se puede saber a partir de cualquiera de las distribuciones, cerca de 90% de los patiene ms de 50 aos, por lo que el programa no cumple la poltica.

    b) En este caso, es igualmente sencillo usar las dos.c) La distribucin de 13 intervalos da una mejor estimacin porque tiene una clase de 45-49

    que la distribucin de 7 intervalos agrupa todas las observaciones entre 40 y 49.EA 2-2 Ordenamiento de datos segn el promedio general de bachillerato:

    Prom. bach. Prom. univ. Prom. bach. Prom. univ.

    4.0 3.9 3.4 3.44.0 3.8 3.2 3.5

    3.9 4.0 2.9 3.03.9 3.7 2.7 2.23.7 3.2 2.6 2.73.6 3.0 2.6 1.93.6 2.5 2.4 3.2

    3.5 3.8 2.2 3.53.5 3.6 2.2 2.83.4 3.6 2.1 2.5

    Ordenamiento de datos segn el promedio general en la universidad:

    Prom. bach. Prom. univ. Prom. bach. Prom. univ.

    4.0 3.9 3.2 3.73.9 4.0 3.2 2.4

    Contina

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    14/50

    Ancho de un intervalo de clase

    [2-1]

    Valor unitario siguiente despus Valor ms pequeodel valor ms grande de los datos de los datos

    Nmero total de intervalos de claseAncho de los

    intervalos de clase

    Prom. bach. Prom. univ. Prom. bach. Prom. univ.

    3.8 4.0 3.0 3.63.8 3.5 3.0 2.93.7 3.9 2.8 2.23.6 3.5 2.7 2.63.6 3.4 2.5 3.63.5 3.2 2.5 2.13.5 2.2 2.2 2.73.4 3.4 1.9 2.6

    De estos ordenamientos se puede ver que los promedios generales altos en un nivel tienden

    a relacionarse con promedios generales altos en el otro, aunque hay algunas excepciones.

    2.4 Construccin de una distribucinde frecuencias

    Ahora que ya hemos aprendido a dividir una muestra en clases, podemos tomar los datos sin proce-sar y construir una distribucin de frecuencias. Para resolver el problema de los telares para alfom-bra de la primera pgina del captulo, siga estos tres pasos:

    1. Decida el tipo y nmero de clases para dividir los datos. En este caso, ya hemos escogidoclasificar los datos de acuerdo con la medida cuantitativa del nmero de yardas producidas, msque con respecto a un atributo cualitativo como color o estampado. En seguida, necesitamos decidircuntas clases distintas usar y el alcance que cada clase debe cubrir. El rango total debe dividir-se entre clases iguales; esto es, el ancho del intervalo, tomado desde el principio de una clasehasta el principio de la siguiente, debe ser el mismo para todas. Si escogemos un ancho de 0.5yardas para cada clase de la distribucin, las clases sern las que se muestran en la tabla 2-12.

    Si las clases fueran desiguales y el ancho de los intervalos variara de una clase a otra, tendra-mos una distribucin mucho ms difcil de interpretar que una con intervalos iguales. Imaginelo difcil que sera interpretar los datos de la tabla 2-13!

    El nmero de clases depende del nmero de datos puntuales y del alcance de los datos reco-lectados. Cuantos ms datos puntuales se tengan o ms grande sea el rango, ms clases se nece-sitarn para dividir los datos. Desde luego, si solamente tenemos 10 datos puntuales, no tendra

    sentido plantear 10 clases. Como regla general, los estadsticos rara vez utilizan menos de seis yms de 15 clases.Debido a que necesitamos hacer los intervalos de clase de igual tamao, el nmero de clases

    determina el ancho de cada clase. Para hallar el ancho de los intervalos podemos utilizar estaecuacin:

    Determine el ancho

    de los intervalos de

    clase

    Use de 6 a 15 clases

    Problemas con clases

    desiguales

    Divida el rango

    total de los datos

    en clases deigual tamao

    Clasifique los datos

    Produccin diaria de unamuestra de 30 telarespara alfombras conintervalos de clase de0.5 yardas

    Tabla 2-12 Clase en yardas Frecuencia

    15.1-15.5 215.6-16.0 1616.1-16.5 816.6-17.0 4

    30

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    15/50

    Clase Frecuencia

    15.2-15.4 2

    15.5-15.7 5

    15.8-16.0 11

    16.1-16.3 6

    16.4-16.6 3

    16.7-16.9 3

    30

    Debemos utilizar el siguiente valor de las mismas unidades, ya que estamos midie

    tervalo entre el primer valor de una clase y el primer valor de la siguiente. En nuestr

    de los telares, el ltimo valor es 16.9, de modo que el siguiente valor es 17.0. Como es

    lizando seis clases en este ejemplo, el ancho de cada clase ser:

    0.3 yd ancho de los intervalos de clase

    El paso 1 est completo. Hemos decidido clasificar los datos segn las mediciones c

    vas de cuntas yardas de alfombra fueron producidas. Definimos seis clases para cubri

    de 15.2 a 16.9 y, como resultado de ello, utilizamos 0.3 yardas como el ancho de nuestr

    los de clase.

    2. Clasifique los datos puntuales en clases y cuente el nmero de observaciones qu

    cada una. Hicimos esto en la tabla 2-14. Cada dato puntual entra al menos en una clase

    dato puntual entra en ms de una clase. En consecuencia, nuestras clases son comp

    incluyentes y mutuamente excluyentes. Observe que el lmite inferior de la primera cla

    ponde al dato puntual menor de la muestra, y que el lmite superior de la ltima clase c

    de al de dato puntual mayor.

    3. Ilustre los datos en un diagrama. (Vea la figura 2-1.)

    Estos tres pasos nos permiten organizar los datos en forma tanto tabular como grfic

    caso, nuestra informacin se muestra en la tabla 2-14 y en la figura 2-1. Estas dos distribu

    frecuencias omiten algunos de los detalles contenidos en los datos sin procesar de la tabla

    nos facilitan la observacin de los patrones contenidos en ellos. Por ejemplo, una caracter

    via es que la clase 15.8-16.0 contiene el mayor nmero de elementos; mientras que la 15.2-

    tiene el menor.

    Construya las clases

    y cuente las

    frecuencias

    Examine los

    resultados

    1.8

    6

    17.0 15.2

    6

    Valor unitario siguiente despus del valor

    ms grande de los datos Valor ms pequeo de los datos

    Nmero total de intervalos de clase

    Produccin diaria de unamuestra de 30 telarespara alfombra utilizandointervalos de clasedesiguales

    Tabla 2-13 Clase Ancho de intervalos de clase Fr

    15.1-15.5 15.6 15.1 0.5

    15.6-15.8 15.9 15.6 0.3

    15.9-16.1 16.2 15.9 0.3

    16.2-16.5 16.6 16.2 0.4

    16.6-16.9 17.0 16.6 0.4

    Produccin diaria de unamuestra de 30 telarespara alfombra conintervalos de clase de0.3 yardas

    Tabla 2-14

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    16/50

    Observe, en la figura 2-1, que las frecuencias de las clases con ancho de 0.3 yardas sisecuencia regular: el nmero de datos puntuales empieza con dos para la primera clase,hasta cinco en la segunda, alcanza 11 en la tercera clase, disminuye a seis y luego cae la quinta y sexta clases. Tendremos que, cuanto ms ancho sea el intervalo de clase, ms suaprogresin. Sin embargo, si las clases son demasiado anchas, podemos perder mucha infoal grado de que la grfica carezca de significado. Por ejemplo, si compactamos la figura 2-mos slo dos categoras, oscurecemos el patrn. Esto se hace evidente en la figura 2-2.

    Uso de la computadora para construir distribucionesde frecuenciasA lo largo del presente texto, usaremos ejemplos sencillos para ilustrar cmo realizar mucde anlisis estadsticos. Con tales ejemplos, usted puede aprender qu tipo de clculos deEsperamos que tambin sea capaz de entender los conceptos que hay detrs de los clculos,que pueda apreciar por qu algunos clculos en particular son los apropiados. Sin embargoce la cuestin de hacer los clculos de forma manual es tedioso, cansado y proclive al error.muchos problemas reales tienen tal cantidad de datos que no es posible hacer los clculos

    Por esta razn, casi todos los anlisis estadsticos reales se hacen con ayuda de computadorprepara los datos que introducir a la mquina e interpreta los resultados y decide las accionedas, pero la computadora realiza todos los clculos numricos. Existen muchos paquetes deampliamente utilizados para hacer anlisis estadsticos. Entre otros, estn Minitab, SAS, Ex

    y SYSTAT.* Pero emplearemos Minitab, SPS y Excel para ilustrar los resultados tpicos que pEl apndice 10 contiene los datos de calificaciones de los 199 estudiantes que usaron edurante 2002. En la figura 2-3 se us Minitab para crear una distribucin de frecuencias deficaciones totales sin procesar de los estudiantes del curso. Los valores de la columna TOson los puntos medios o marcas de clase. Con frecuencia tambin son de inters las distrde frecuencias bivariadas, en las que los datos se clasifican de acuerdo con dos atributos dEn la figura 2-4 se ilustra una distribucin que muestra las calificaciones con letras en las

    Uso de los datos

    de calificaciones

    Paquetes de software

    para anlisis

    estadsticos

    Los clculos

    manuales son

    tediosos

    Detecte lastendencias

    FIGURA 2-1

    Distribucin de frecuencia de los niveles de produccin de una muestra de 30telares para alfombra con intervalos de clase de 0.3 yardas

    14

    12

    10

    8

    6

    4

    2

    15.2-15.4 15.5-15.7 15.8-16.0

    Nivel de produccin en yardas

    Frecuencia

    16.1-16.3 16.4-16.6 16.7-16.9

    2 5 11 6 3 3

    FIGURA 2-2

    Distribucin de frecuencias de los niveles de pde una muestra de 30 telares para alfombra cintervalos de clase de una yarda

    20

    2

    4

    6

    8

    10

    12

    14

    16

    18

    15.1-16.0 16.1-17.0

    Nivel de produccin en yardas

    Frecuencia

    18 12

    *Minitab es marca registrada de Minitab, Inc., University Park, Pa. SAS es marca registrada de SAS Institute, InC. SPSS es marca registrada de SPSS, Inc., Chicago, Ill. SYSTAT es marca registrada de SYSTAT, Inc. Evanstoes marca registrada de Microsoft.

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    17/50

    Resumen estadstico para variables discretas

    FIGURA 2-3

    Distribucin defrecuenciasde calificacionestotales sinprocesar obtenidacon Minitab

    TOTPOR10 Cuenta Porcentaje Ctaacum Pctacum

    FIGURA 2-4Distribucin defrecuenciasbivariada obtenidacon Minitab quemuestra lascalificaciones encada seccin

    Estadsticas tabuladas

    RENGLONES: CALIFNUM COLUMNAS: SECCIN

    CONTENIDO DE CELDAS --CUENTA% DE TABLA

    TODO

    ciones de la clase. La variable CALIFNUM tiene valores de 0 a 9, que corresponden a la

    ciones con letras F, D, C, C , C, B,B ,B+,A y A.El apndice 11 contiene los datos correspondientes a las ganancias del ltimo trimestr

    de 224 compaas, los cuales fueron publicados en The Wall Street Journal durante la semana de febrero de 1990. La figura 2-5 ilustra la distribucin de frecuencias obtenida conde las ganancias del ltimo trimestre de 1989. La variable Q489 representa las ganancias dtrimestre de 1989, en cifras redondeadas a dlares.

    Debido a que las compaas incluidas en la New York Stock Exchange (Bolsa de Valoreva York) (3) tienden a tener caractersticas financieras diferentes a las enumeradas en la AStock Exchange (Bolsa de Valores Estadounidense) (2), y debido tambin a que stas, a su

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    18/50

    FIGURA 2-6

    Distribucin defrecuenciasbivariadasobtenida conMinitab en dondese muestran losingresos de cadatransaccin

    Resumen estadstico para variables discretas

    FIGURA 2-5

    Distribucin defrecuenciasobtenida conMinitab de lascalificaciones delltimo trimestre

    de 1989

    Q489 Cuenta Porcentaje Ctaacum Pctacum

    distintas a las de las compaas enumeradas en al contado (1), tambin utilizamos MYSproducir la distribucin bivariada de los mismos datos en la figura 2-6.

    Estadsticas tabuladas

    RENGLONES: Q489 COLUMNAS: TRANSACCIN

    CONTENIDO DE LAS CELDAS --

    CUENTA% DE RENGLN% DE COLUMNA% DE TABLA

    TODO

    TODO

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    19/50

    Es necesario ser extremadamente cuida-

    dosos al elegir las clases cuando se elabora

    una distribucin de frecuencias, incluso

    cuando un programa de computacin de-

    fine las clases. Por ejemplo, un programa de cmputo pue-

    de clasificar las respuestas a un estudio de mercado de

    acuerdo con la edad del consumidor: 15-19, 20-24, 25-29,

    y as sucesivamente. Pero si el producto bajo estudio es

    dirigido a estudiantes universitarios, tendra ms senti

    agrupar los datos en las categoras: 18, 19-22 y 23 o m

    yores. No pierda de vista que el uso de una computado

    para efectuar clculos estadsticos no sustituye al sentid

    comn.

    SUGERENCIAS

    Y

    SUPOSICIONES

    Ejercicios 2-4

    Ejercicios de autoevaluacin

    EA 2-3 La compaa High Performance Bicycle Products de Chapel Hill, Carolina del Norte, hizo un mues

    de sus registros de embarque para cierto da con los siguientes resultados:

    Tiempo entre la recepcin de una orden y su entrega (en das)

    4 12 8 14 11 6 7 13 13 11

    11 20 5 19 10 15 24 7 29 6

    Construya una distribucin de frecuencias para estos datos y una distribucin de frecuencias relativas.

    intervalos de 6 das.

    a) Qu puede asegurar acerca de la efectividad del procesamiento de pedidos a partir de la distribu

    de frecuencias?

    b) Si la compaa desea asegurar que la mitad de sus entregas se hagan en 10 das o menos, puede

    terminar, a partir de la distribucin de frecuencias, si han logrado esta meta?

    c) Qu puede hacer con los datos si tiene una distribucin de frecuencias relativas, que es difcil lo

    con slo una distribucin de frecuencias?

    EA 2-4 El seor Franks, un ingeniero de seguridad de Mars Point Nuclear Power Generating Station, elabor

    tabla de la temperatura pico del reactor cada da durante el ltimo ao y prepar la siguiente distribu

    de frecuencias:

    Temperaturas en C Frecuencia

    Menos de 500 4

    501-510 7

    511-520 32

    521-530 59

    530-540 82

    550-560 65

    561-570 33

    571-580 28

    580-590 27

    591-600 23

    Total 360

    Enumere y explique los errores que pueda encontrar en la distribucin del seor Franks.

    Aplicaciones

    2-17 La Universal Burger est preocupada por la cantidad de desperdicio que genera, por lo que obtuvo

    muestra del desperdicio de hamburguesas desde el ao pasado con los siguientes resultados:

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    20/50

    Nmero de hamburguesas descartadas durante un turno

    2 16 4 12 19 29 24 7 1922 14 8 24 31 18 20 16 6

    Construya una distribucin de frecuencias y una distribucin de frecuencias relativas para estos dlice intervalos de 5 hamburguesas.a) Una de las metas de Universal Burger es que al menos 75% de los turnos tengan no ms d

    burguesas desperdiciadas. Puede determinar a partir de la distribucin de frecuencia si se meta?

    b) Qu porcentaje de turnos tienen desperdicios de 21 hamburguesas o menos? Qu distribpara determinar su respuesta?

    2-18 Remtase a la tabla 2-2 y construya una distribucin de frecuencias relativas usando intervallb/pulg2. Qu se puede concluir a partir de esta distribucin?

    2-19 La Oficina de Estadstica Laboral ha definido una muestra de 30 comunidades de todo Estadoscompil los precios de productos bsicos en cada comunidad al principio y al final del mes de agel fin de encontrar cunto ha variado aproximadamente el ndice de Precios al Consumidor (IConsumer Price Index) durante ese mes. Los cambios porcentuales en los precios para las 30 cdes son:

    0.7 0.4 0.3 0.2 0.1 0.1 0.3 0.7 0.0 0.40.1 0.5 0.2 0.3 1.0 0.3 0.0 0.2 0.5 0.10.5 0.3 0.1 0.5 0.4 0.0 0.2 0.3 0.5 0.4

    a) Ordene los datos en un arreglo ascendente.b) Utilizando las siguientes cuatro clases de igual tamao, construya una distribucin de fre

    0.5 a 0.2, 0.1 a 0.2, 0.3 a 0.6 y 0.7 a 1.0.c) Cuntas comunidades tienen precios que no han cambiado o que se han incrementado en

    1.0%?d) Son estos datos continuos o discretos?

    2-20 Sarah Anne Ralpp, presidenta de Baggit, Inc., acaba de obtener algunos datos sin procesar de utigacin de mercado que su compaa hizo recientemente. La investigacin se llev a cabo paranar la efectividad del nuevo lema publicitario de la empresa, Cuando termine con todo, emblra determinar el efecto del lema sobre las ventas de los empaques Emblselo para comida, se in

    20 personas respecto a cuntos empaques compraba mensualmente antes de conocer el lema puy cuntos compra despus que ste se utiliz en una campaa. Los resultados fueron los siguie

    Antes/Despus Antes/Despus Antes/Despus Antes/Despus

    4 3 2 1 5 6 8 104 6 6 9 2 7 1 31 5 6 7 6 8 4 33 7 5 8 8 4 5 75 5 3 6 3 5 2 2

    a) Construya las distribuciones de frecuencias simples y relativas para las respuestas dadas a

    lizando como clases los intervalos 1 a 2, 3 a 4, 5 a 6, 7 a 8 y 9 a 10.b) Haga lo mismo que en el inciso anterior para los datos de despus.c) Mencione la razn fundamental por la cual tiene sentido utilizar las mismas clases para am

    de respuestas, antes y despus.d) Para cada pareja de respuestas antes/despus, reste la respuesta antes de la respuesta

    para obtener el nmero que llamaremos cambio (ejemplo: 3 4 1), y construya ambuciones de frecuencias, simples y relativas, para la categora cambio, utilizando las cla

    4, 3 a 2, 1 a 0, 1 a 2, 3 a 4 y 5 a 6.e) Con base en su anlisis, establezca si el nuevo lema publicitario ha contribuido a las ventas

    una o dos razones que sustenten su conclusin. 2-21 A continuacin presentamos las edades de 30 personas que compraron grabadoras de video en

    de msica Symphony durante la semana pasada:

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    21/50

    26 37 40 18 14 45 32 68 31 37

    20 32 15 27 46 44 62 58 30 42

    22 26 44 41 34 55 50 63 29 22

    a) A partir de una observacin de los datos como se presentan, a qu conclusiones puede lleg

    mente acerca del mercado de Symphony?

    b) Construya una clasificacin cerrada de seis categoras. Esta clasificacin le permite llegar a a

    clusin adicional sobre el mercado de Symphony?

    2-22 Utilice los datos del ejercicio 2-21.

    a) Construya una clasificacin de extremo abierto de cinco categoras. Esta clasificacin le p

    gar a alguna otra conclusin acerca del mercado de Symphony?

    b) Construya ahora una distribucin de frecuencias relativas que corresponda a la clasificacimo abierto de cinco categoras. Esta distribucin le proporciona a Symphony informacin

    til acerca de su mercado? Por qu?

    2-23 John Lyon, dueo de la tienda de alimentos Fowlers de Chapel Hill, Carolina del Norte, tiene

    das las compras que le hicieron sus clientes durante la semana anterior en la siguiente distribuc

    cuencias:

    Cant. gastada Frecuencia

    0.00- 0.99 1,050

    1.00- 3.99 1,240

    4.00- 6.99 1,300

    7.00- 9.99 1,460

    10.00-12.99 1,900

    13.00-15.99 1,050

    16.00-18.99 1,150

    19.00-21.99 980

    22.00-24.99 830

    25.00-27.99 780

    28.00-30.99 760

    31.00-33.99 720

    34.00-36.99 610

    37.00-39.99 420

    40.00-42.99 280

    43.00-45.99 100

    46.00-48.99 90

    John dice que es incmodo tener 17 intervalos, cada uno definido por dos nmeros. Puede us

    cmo simplificar la clasificacin de los datos sin perder demasiado su valor?

    2-24 A continuacin puede ver los puntos medios de los intervalos de una distribucin de frecuenc

    presenta el tiempo en minutos que tardaron los miembros del equipo de atletismo de una univ

    recorrer ocho kilmetros a campo traviesa.

    25 35 45

    a) Dira que el entrenador puede obtener informacin suficiente a partir de estos puntos m

    ayudar al equipo?

    b) Si la respuesta al inciso anterior es no, cuntos intervalos pareceran los apropiados?

    2-25 Barney Mason examin la cantidad de desperdicio de papas fritas (en libras) durante los ltimo

    en Universal Burger y cre la siguiente distribucin de frecuencias:Desperdicio de papas fritas en libras Frecuencia

    0.0- 3.9 37

    4.0- 7.9 46

    8.0-11.9 23

    12.0-16.9 27

    17.0-25.9 7

    26.0-40.9 0

    180

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    22/50

    Enumere y explique los errores que pueda encontrar en la distribucin de Barney. 2-26 Construya una clasificacin discreta y cerrada para las posibles respuestas a la pregunta acerca

    do civil en una solicitud de empleo. Construya tambin una clasificacin discreta y de extremde tres categoras para las mismas respuestas.

    2-27 Las listas de la bolsa de valores por lo general contienen el nombre de la compaa, las ofertas inferior, el precio de cierre y el cambio con respecto al precio de cierre del da anterior. A conpresentamos un ejemplo:

    Nombre Oferta superior Oferta inferior Cierre Cambio

    Sistemas asociados 1112 1078 11

    1412

    Se trata de una distribucin: a) de todos los valores de la Bolsa de Valores de Nueva York por b) por precios al cierre de un da determinado y c) por cambios en los precios de un da dado?

    La distribucin es1) cuantitativa o cualitativa?2) continua o discreta?3) de extremo abierto o cerrado?

    Respondera de manera diferente al inciso c) si el cambio fuera expresado slo como maynor o sin cambio?

    2-28 Los niveles de ruido en decibeles de un avin que despega del aeropuerto del condado de Westchron redondeados al decibel ms cercano y agrupados en una distribucin de frecuencias con intertienen puntos medios entre 100 y 130. Por debajo de los 100 decibeles no se consideran altosque cualquier nivel por arriba de los 140 decibeles resulta casi ensordecedor. Los miembros de zacin Residentes de un barrio ms tranquilo estn recabando datos para su pleito contra el to, esta distribucin es adecuada para sus propsitos?

    2-29 Utilice los datos del ejercicio 2-28. Si el abogado defensor del aeropuerto est recogiendo datos paracin para irse a juicio, tomar los datos del punto medio (o marca de clase) de los intervalocicio 2-28 como favorables para sus objetivos?

    2-30 El presidente de Ocean Airlines intenta hacer una estimacin de cunto se tardar el DepartaAeronutica Civil (DAC) en decidir acerca de la solicitud de la compaa sobre una nueva ruta enlotte y Nashville. Los asesores del presidente han organizado los siguientes tiempos de espera licitudes formuladas durante el ao anterior. Los datos se expresan en das, desde la fecha de lahasta la respuesta del DAC.

    34 40 23 28 31 40 25 33 47 3244 34 38 31 33 42 26 35 27 31

    29 40 31 30 34 31 38 35 37 33

    24 44 37 39 32 36 34 36 41 39

    29 22 28 44 51 31 44 28 47 31

    a) Construya una distribucin de frecuencias utilizando diez intervalos cerrados, igualmente esQu intervalo contiene el mayor nmero de datos puntuales?

    b) Construya una distribucin de frecuencias utilizando cinco intervalos cerrados, igualmentdos. Qu intervalo contiene el mayor nmero de datos puntuales?

    c) Si el presidente de la Ocean Airlines tiene una distribucin de frecuencias relativas, ya seapara b), le ayudar sta para estimar la respuesta que necesita?

    2-31 Con el propsito de hacer una evaluacin de desempeo y un ajuste de cuotas, Ralph Williams epeccionando las ventas de automviles de sus 40 vendedores. En un periodo de un mes, tuvieguientes ventas de automviles:

    7 8 5 10 9 10 5 12 8 6

    10 11 6 5 10 11 10 5 9 13

    8 12 8 8 10 15 7 6 8 8

    5 6 9 7 14 8 7 5 5 14

    a) Con base en la frecuencia, cules seran las marcas de clase (puntos medios de los interseadas?

    b) Construya distribuciones de frecuencias y de frecuencias relativas con el mayor nmero pmarcas de clase. Haga los intervalos igualmente espaciados y con un ancho de al menos dos auto

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    23/50

    c) Si las ventas menores de siete automviles por mes se consideran como un desempeo incul de los dos incisos, a) o b), es de mayor utilidad para identificar al grupo insatisfactordedores?

    2-32 Kesslers Ice Cream Delight intenta mantener los 55 sabores diferentes de helado en existencuna de sus sucursales. El director de investigacin de mercado de la compaa sugiere que mamejor registro para cada tienda es la clave para evitar quedarse sin existencias. Don Martin, doperaciones, recolecta datos redondeados al medio galn ms cercano sobre la cantidad diariade cada sabor que se vende. Nunca se venden ms de 20 galones de un solo sabor al da.a) La clasificacin con respecto a los sabores es discreta o continua? Abierta o cerrada?b) La clasificacin con respecto a la cantidad de helado es discreta o continua? Abierta o

    c) Son los datos cuantitativos o cualitativos?d) Qu le sugerira a Don Martin para generar mejores datos para llevar a cabo una investmercado?

    2-33 Doug Atkinson es dueo y recogedor de boletos de un trasbordador que transporta pasajeros y les desde Long Island hasta Connecticut. Doug tiene datos que indican el nmero de personas mviles que han utilizado el trasbordador durante los dos ltimos meses. Por ejemplo,

    3 de julio Nmero de pasajeros 173 Nmero de automviles 32

    podra ser la informacin tpica registrada durante un da. Doug ha establecido seis clases iguapaciadas para registrar el nmero diario de pasajeros y las marcas de clase son 84.5, 104.5, 124164.5 y 184.5. Las seis clases igualmente espaciadas que construy Doug para el nmero diarimviles tienen marcas de clase de 26.5, 34.5, 42.5, 50.5, 58.5 y 66.5. (Las marcas de clase son medios de los intervalos.)

    a) Cules son los lmites inferior y superior de las clases para el nmero de pasajeros?b) Cules son los lmites inferior y superior de las clases para el nmero de automviles?

    Soluciones a los ejercicios de autoevaluacin

    EA 2-3 Clase 1-6 7-12 13-18 19-24 25-Frecuencia 4 8 4 3 1Frecuencia relativa 0.20 0.40 0.20 0.15 0.a) Suponiendo que la compaa abre 6 das a la semana, se ve que 80% de las rdenes se ent

    semanas o menos.b) Se puede decir que slo entre 20 y 60% de las entregas se hacen en 10 das o menos, de m

    la distribucin no genera suficiente informacin para determinar si la meta se cumple.

    c) Una distribucin de frecuencias relativas permite presentar frecuencias como fracciones ojes.

    EA 2-4 La distribucin no contiene todos los datos. El valor 500C no aparece, tampoco los puntos e549C, inclusive. Adems, la distribucin est cerrada a la derecha, lo que elimina todos los dares de 600C. Estas omisiones pueden explicar el hecho de que el nmero total de observacion360, en lugar de 365 como podra esperarse del conjunto de datos coleccionados durante un ano es absolutamente necesario que la distribucin est abierta a la derecha, en especial si no sron valores mayores que 600C. Sin embargo, para que est completa, la distribucin debe ser cel intervalo seleccionado, aun cuando no haya datos en algunos intervalos.) Por ltimo, las clasno son mutuamente excluyentes. Los puntos 530C y 580C estn contenidos en ms de un intcrear un conjunto continuo de clasificaciones, debe tenerse cuidado de evitar este error.

    2.5 Representacin grfica de distribucionesde frecuencias

    Las figuras 2-1 y 2-2 son un avance de lo que estudiaremos a continuacin: cmo presenttribuciones de frecuencias de manera grfica. Las grficas proporcionan datos en un diagradimensiones. En el eje horizontal podemos mostrar los valores de la variable (la caracterestamos midiendo), como la produccin de alfombras en yardas. En el eje vertical sealamcuencias de las clases mostradas en el eje horizontal. De esta forma, la altura de las barras d

    Identificacin de

    los ejes horizontal

    y vertical

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    24/50

    2-1 mide el nmero de observaciones que hay en cada clase sealada en el eje horizontal. Lcas de distribuciones de frecuencias y de distribuciones de frecuencias relativas son tilesque resaltan y aclaran los patrones que no se pueden distinguir fcilmente en las tablas. Aatencin del que las observa hacia los patrones existentes en los datos. Las grficas tambia resolver problemas relacionados a las distribuciones de frecuencias; nos permiten estimavalores con slo una mirada y proporcionan una verificacin visual sobre la precisin de nuluciones.

    HistogramasLas figuras 2-1 y 2-2 son dos ejemplos de histogramas. Un histograma consiste en una sertngulos, cuyo ancho es proporcional al rango de los valores que se encuentran dentro de uy cuya altura es proporcional al nmero de elementos que caen dentro de la clase. Si lempleadas en la distribucin de frecuencias son del mismo ancho, entonces las barras verthistograma tambin tienen el mismo ancho. La altura de la barra correspondiente a cada clasenta el nmero de observaciones de la clase. Como consecuencia, el rea contenida en cadgulo (base por altura) ocupa un porcentaje del rea total de todos los rectngulos la cual es frecuencia absoluta de esa clase correspondiente respecto a todas las observaciones hecha

    Un histograma que utiliza las frecuencias relativas de los datos puntuales de cada unclases, en lugar de usar el nmero real de puntos, se conoce como histograma de frecuenci

    vas. Este tipo de histograma tiene la misma forma que un histograma de frecuencias absolutruido a partir del mismo conjunto de datos. Esto es as debido a que en ambos, el tamade cada rectngulo es la frecuencia de esa clase comparada con el nmero total de observa

    Recuerde que la frecuencia relativa de cualquier clase es el nmero de observaciones qen la clase, dividido entre el nmero total de observaciones hechas. La suma de todas las frerelativas de cualquier conjunto de datos debe ser igual a 1.0. Con esto en mente, podemosel histograma de la figura 2-1 en un histograma de frecuencias relativas como el presentadgura 2-7. Observe que la nica diferencia entre stos es el lado izquierdo de la escala del cal. Mientras que la escala vertical del histograma de la figura 2-1 representa el nmero abobservaciones de cada clase, la escala del histograma de la figura 2-7 es el nmero de obsede cada clase tomadas como unafraccin del nmero total de observaciones.

    Poder presentar los datos en trminos de la frecuencia relativa de las observaciones, mtrminos de la frecuencia absoluta, es de gran utilidad, ya que mientras los nmeros absolden sufrir cambios (si probamos ms telares, por ejemplo), la relacin entre las clases permtable. El 20% de todos los telares puede entrar en la clase 16.1-16.3 yardas, ya sea que p30 o 300 telares. Resulta fcil comparar los datos de muestras de diferentes tamaos cuandmos histogramas de frecuencias relativas.

    Ventajas del histo-

    grama de frecuencias

    relativas

    Funcin de un

    histograma de

    frecuencias relativas

    Descripcin de los

    histogramas

    Funcin de las

    grficas

    FIGURA 2-7

    Distribucin defrecuenciasrelativas de losniveles deproduccin de unamuestra de 30telares paraalfombrautilizandointervalos de clasede 0.3 yardas

    0.40

    0.30

    0.20

    0.10

    15.2-15.4 15.5-15.7 15.8-16.0 16.1-16.3 16.4-16.6 16.7-16.9

    Nivel de produccin en yardas

    Frecuenciarelativa

    0.07 0.17 0.37 0.20 0.10 0.10

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    25/50

    Polgonos de frecuenciasAunque se utilizan menos, los polgonos de frecuencias son otra forma de representar grfdistribuciones tanto de frecuencias como de frecuencias relativas. Para construir un polgoncuencias sealamos stas en el eje vertical y los valores de la variable que estamos midieeje horizontal, del mismo modo en que se hizo con el histograma. A continuacin, graficafrecuencia de clase trazando un punto sobre su punto medio y conectamos los puntos sucesultantes con una lnea recta para formar un polgono (una figura con muchos lados).

    La figura 2-8 representa un polgono de frecuencias construido a partir de los datos d2-14. Si compara esta figura con la 2-1, notar que se han agregado dos clases, una en cada

    de la escala de valores observados. stas contienen cero observaciones, pero permiten qugono llegue al eje horizontal en ambos extremos de la distribucin.

    De qu manera podemos convertir un polgono de frecuencias en un histograma? Un de frecuencias es slo una lnea que conecta los puntos medios de todas las barras de un hisPor consiguiente, podemos reproducir el histograma mediante el trazado de lneas verticalos lmites de clase (sealados en el eje horizontal) y, luego, conectando esas lneas con rezontales a la altura de los puntos medios del polgono. En la figura 2-9 hicimos esto con lnteadas.

    Un polgono de frecuencias que utiliza frecuencias relativas de datos puntuales en cada uclases, en lugar del nmero real de puntos, se conoce comopolgono de frecuencias relatipolgono tiene la misma forma que el polgono de frecuencias construido a partir del mism

    to de datos, pero con una escala diferente en los valores del eje vertical. En lugar del nmluto de observaciones, la escala representa el nmero de observaciones de cada clase excomo una fraccin del total de observaciones.

    Los histogramas y los polgonos de frecuencias son similares. Por qu necesitamos amventajas de los histogramas son:

    1. Los rectngulos muestran cada clase de la distribucin por separado.2. El rea de cada rectngulo, en relacin con el resto, muestra la proporcin del nmer

    observaciones que se encuentran en esa clase.

    Ventajas del

    histograma

    Construccin de un

    polgono de frecuen-

    cias relativas

    Conversin de un

    polgono de

    frecuencias en un

    histograma

    Aada dos clases

    Utilice los puntos

    medios en el eje

    horizontal

    FIGURA 2-8

    Polgono defrecuencias delnivel deproduccin de unamuestra de 30telares paraalfombrautilizandointervalos de clasede 0.3 yardas

    2

    4

    6

    8

    1012

    14

    15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1

    Nivel de produccin en yardas

    recuenca

    FIGURA 2-9

    Histogramatrazado a partirde los puntos delpolgono defrecuencias dela figura 2-8

    2

    4

    6

    8

    10

    12

    14

    15.0 15.3 15.6 15.9 16.2 16.5 16.8 17.1

    Nivel de produccin en yardas

    recuenca

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    26/50

    Los polgonos, por su parte, tambin poseen ciertas ventajas.

    1. El polgono de frecuencias es ms sencillo que su histograma correspondiente.2. Bosqueja con ms claridad un perfil del patrn de los datos.3. El polgono se vuelve cada vez ms suave y parecido a una curva conforme aumen

    nmero de clases y el nmero de observaciones.

    Un polgono como el que acabamos de describir, suavizado mediante el aumento de cldatos puntuales, se conoce como curva de frecuencias. En la figura 2-10, hemos utilizadoplo de los telares para alfombra, pero en esta ocasin aumentamos el nmero de observacio

    y el nmero de clases a 10. Note que conectamos los puntos con lneas curvas para tener uximacin de la manera en que se vera el polgono si tuviramos un gran nmero de datos pe intervalos de clase muy pequeos.

    OjivasUna distribucin de frecuencias acumuladas nos permite ver cuntas observaciones estn ma de ciertos valores, en lugar de hacer un mero registro del nmero de elementos que hde los intervalos. Por ejemplo, si deseamos saber cuntos telares tejen menos de 17.0 yardmos utilizar una tabla que registre las frecuencias acumuladas menores que de nuestracomo se presenta en la tabla 2-15.

    La grfica de una distribucin de frecuencias acumuladas se conoce como ojiva. En2-11 se muestra la ojiva de la distribucin de frecuencias de la tabla 2-15. Los puntos repreen la grfica indican el nmero de telares que tienen una produccin menor que el nmero mostrado en el eje horizontal. Note que el lmite inferior de las clases de la tabla se convielmite superior de la distribucin acumulada de la ojiva.

    Una ojivamenor que

    Definicin de

    distribucin

    de frecuencias

    acumuladas

    Creacin de una

    curva de frecuencia

    Ventajas de los

    polgonos

    FIGURA 2-10

    Curva defrecuencias de losniveles deproduccin de unamuestra de 300telares paraalfombrautilizandointervalos de0.2 yardas

    4

    8

    12

    16

    20

    24

    28

    32

    36

    40

    44

    48

    52

    56

    60

    14.8 15.0 15.2 15.4 15.6 15.8 16.0 16.416.2 16.6 16.8 17.0

    Nivel de produccin en yardas

    recuenca

    Distribucin defrecuencias menoresque acumulada de losniveles de produccin de

    una muestra de30 telares para alfombra

    Tabla 2-15 Clase Frecuencia acumulada

    Menos que 15.2 0Menos que 15.5 2Menos que 15.8 7

    Menos que 16.1 18Menos que 16.4 24Menos que 16.7 27

    Menos que 17.0 30

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    27/50

    En algunas ocasiones, la informacin que utilizamos se presenta en trminos de fracumuladas mayores que. La ojiva adecuada para tal informacin tendra una inclinacabajo y hacia la derecha, en lugar de tener una hacia arriba y a la derecha, como en la figu

    Podemos construir una ojiva de una distribucin de frecuencias relativas de la misma mque trazamos la ojiva de una distribucin de frecuencias absolutas de la figura 2-11. Slo

    cambio: la escala en el eje vertical. Como en la figura 2-7, esta escala debe sealar lafranmero total de observaciones que caen dentro de cada clase.Para construir una ojiva acumulada menor que en trminos de frecuencias relativas,

    remitirnos a una distribucin de frecuencias relativas (como la de la figura 2-7) y construirutilizando los datos (como la tabla 2-16). Luego podemos convertir las cifras de dicha tabojiva (como en la figura 2-12). Observe que las figuras 2-11 y 2-12 son equivalentes y difen la escala del eje vertical.

    Ojivas de frecuencias

    relativas

    FIGURA 2-11

    Ojiva menorque de la

    distribucin deniveles deproduccin de unamuestra de 30telares paraalfombra

    3

    6

    9

    12

    15

    18

    21

    24

    27

    30

    33

    15.2Menor que 15.5 15.8 16.1 16.4 16.7 17.0

    Nivel de produccin en yardas

    Nm

    eroacumuladodetelaresdelamuestra

    Distribucin defrecuencias relativasacumuladas de losniveles de produccinde una muestra de 30telares para alfombra

    Tabla 2-16 Clase Frecuencia acumulada Frecuencia relativa a

    Menor que 15.2 0 0.00Menor que 15.5 2 0.07Menor que 15.8 7 0.23Menor que 16.1 18 0.60Menor que 16.4 24 0.80Menor que 16.7 27 0.90Menor que 17.0 30 1.00

    FIGURA 2-12

    Ojiva menorque de la distri-bucin de losniveles de pro-duccin de unamuestra de 30telares paraalfombrautilizandofrecuenciasrelativas

    1.00

    0.90

    0.80

    0.70

    0.60

    0.50

    0.40

    0.30

    0.20

    0.10

    15.2Menor que 15.5 15.8 16.1 16.4 16.7 17.0

    Nivel de produccin en yardas

    Frecuenciarelativaacumulada

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    28/50

    Suponga que ahora trazamos una lnea recta perpendicular al eje vertical en la marca 0intersecar a la ojiva (como en la figura 2-13). De esta manera, es posible leer un valor aprde 16.0 del nivel de produccin del decimoquinto telar de un arreglo de 30.

    As pues, hemos regresado a la primera organizacin de datos estudiada en el presenteA partir del ordenamiento de datos podemos construir distribuciones de frecuencias; a pardistribuciones de frecuencias podemos construir distribuciones de frecuencias acumuladasa partir de stas podemos trazar una ojiva. Y con base en esta ojiva podemos aproximar loprovenientes del arreglo de datos. Sin embargo, en general no es posible recobrar los datoles exactos a partir de ninguna de las representaciones grficas analizadas.

    Uso de la computadora para graficar distribuciones de frecuenciasProduzcamos algunos histogramas a partir de los datos de calificaciones presentados en el 10. La figura 2-14 proporciona un histograma de los promedios totales sin procesar de los tes. Observe que ste tiene barras en posicin horizontal en lugar de las barras verticales

    hasta ahora. Adems, a la derecha de las barras, SPSS proporciona las frecuencias absolut

    Uso de SPSS para

    producir histogramas

    Aproximacin del

    arreglo de datos

    FIGURA 2-13

    Ojiva menorque de ladistribucinde los niveles deproduccin de unamuestra de 30telares para

    alfombra, endonde se indicael valor medioaproximado delarreglo de datosoriginal

    15.2Menor que

    Valor aproximado deldecimoquinto telar = 16.0

    15.5 15.8 16.1 16.4 16.7 17.0

    Nivel de produccin en yardas

    Frecuenciarelativaacumulada

    1.00

    0.90

    0.80

    0.70

    0.60

    0.50

    0.40

    0.30

    0.20

    0.10

    FIGURA 2-14

    Histograma ydistribucinde frecuencias depromedios totalessin procesar,obtenidos conSPSS

    5

    15

    25

    35

    45

    55

    65

    75

    85

    95

    Totaldepuntosme

    dios

    Calificaciones de estadstica en los negociosHistograma

    9

    1

    1

    2

    27

    26

    0 10 20 30 40 50 60 70

    68

    65

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    29/50

    FIGURA 2-15

    Histograma ydistribucin defrecuencias paralas calificaciones

    de Estadstica parala administracin,obtenidos conMinitab

    Histograma de caracteresHistograma de TOTAL N = 199Cada * representa 2 observaciones

    Punto medio Cuenta5.0 015.0 025.0 1 *35.0 1 *45.0 9 *****55.0 27 ************65.0 68 ******************************75.0 65 *****************************85.0 26 ***********95.0 2 *

    FIGURA 2-16Histograma SPSSde calificacionesque muestra altipo de instructor

    45

    40

    35

    30

    25

    20

    15

    10

    5

    0

    Calificaciones de estadstica en los negocios

    Frecuenciasabsolutas

    SPSSHistograma

    TA= Asistente

    PROF = Profes

    A A B B B+ C C C+ D F

    lativas y las acumuladas menores que (tanto absolutas como relativas). La figura 2-15 muessin en Minitab.

    En la figura 2-4 observamos una distribucin de frecuencias bivariada. Tambin podehistogramas que contengan informacin acerca de dos variables. La figura 2-16 es un hiSPSS vertical de las calificaciones con letras en el que cada barra est dividida en dos segmmuestran la fraccin de estudiantes que obtuvieron esa calificacin y que estaban en secc

    partidas por profesores y ayudantes de profesor (denotadas por P y T en las barras). La fies la versin de Minitab de las calificaciones, en la cual se emplean dos histogramas de CA(vea la figura 2-4) dividida en INSTRNUM = 1, ayudantes de profesor, e INSTRUM = 2,

    En la figura 2-18 se us Minitab para producir un histograma de las ganancias del ltimtre de 1989 de las 224 compaas listadas en el apndice 11. La figura 2-19 presenta histogMinitab separados para las compaas 111 OTC, 38 ASE y 75 NYSE del conjunto de dato

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    30/50

    FIGURA 2-18

    Histogramaobtenido con

    Minitab para lasganancias delltimo trimestrede 1989

    FIGURA 2-17

    Versin Minitab delos histogramasde calificaciones

    Histograma de CALIFNUM INSTRNUM = 1 N = 89

    Punto medio Cuenta

    Histograma de CALIFNUM INSTRNUM = 2 N = 110

    Punto medio Cuenta

    Histograma de caracteres

    Histograma de caracteres

    Histograma de UT89 N = 224Cada * representa 5 observaciones

    Punto medio Cuenta

    Quien haya dicho una imagen vale milpalabras entenda de manera intuitiva loque se ha expuesto en esta seccin. Alusar mtodos grficos para presentar

    datos se tiene una percepcin rpida de los patrones y lastendencias, y de qu proporcin de los datos est arriba o

    abajo de cierto valor. Advertencia: algunas publicimprimen representaciones grficas de datos (histode manera confusa usando un eje vertical que no llero. Tenga cuidado con ellas pues las diferencias ppueden parecer grandes y el patrn que se observllevar a conclusiones equivocadas.

    SUGERENCIAS

    Y

    SUPOSICIONES

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    31/50

    FIGURA2

    -19

    HistogramasM

    initabseparadosportransaccinparalas

    gananciasdelltimotrimestrede1989

    Histograma

    de

    caracteres

    Histograma

    de

    UT

    89

    TRANSFERENCIA

    =

    1

    N

    =

    111

    TRANSFERENCIA

    =

    2

    N

    =

    38

    TRANSFERENCIA

    =

    3

    N

    =7

    5

    Ca

    da

    *

    representa

    2

    observac

    iones

    Punto

    me

    dio

    Cuenta

    Cuenta

    Cuenta

  • 7/31/2019 Aacap 2 Agrupacion y Presentacion de Datos Para Expresar Significados, Tablas y Graficas

    32/50

    Ejercicios 2.5

    Ejercicios de autoevaluacinEA 2-5 Se presenta una distribucin de frecuencias del peso de 150 personas que usaron las canastillas para su-

    bir a esquiar cierto da. Construya un histograma con estos datos.

    Clase Frecuencia Clase Frecuencia

    75- 89 10 150-164 2390-104 11 165-179 9

    105-119 23 180-194 9120-134 26 195-209 6135-149 31 210-224 2

    a) Qu puede observar en este histograma acerca de los datos que no era aparente en la distribucin defrecuencias?

    b) Si la capacidad de cada canastilla es dos personas y no ms de 400 libras de peso total seguro, qupuede hacer el operador para maximizar la capacidad de personas en las canastillas sin exceder la ca-pacidad de peso seguro de una canastilla? Los datos apoyan su propuesta?

    EA 2-6 El Central Carolina Hospital tiene los siguientes datos que representan el peso en libras de 200 bebs pre-maturos al momento de su nacimiento.

    Clase Frecuencia Clase Frecuencia

    0.5-0.9 10 2.5-2.9 291.0-1.4 19 3.0-3.4 341.5-1.9 24 3.5-3.9 402.0-2.4 27 4.0-4.4 17

    Construya una ojiva que le ayude a responder las siguientes preguntas:a) Cul es el valor medio aproximado en el conjunto de datos original?b) Si los bebs prematuros de menos de 3.0 libras se mantienen en una incubadora durante varios das

    como precaucin, cul es el porcentaje aproximado de bebs prematuros en el Carolina que necesi-tarn una incubadora?

    Aplicaciones

    2-34 La siguiente distribucin de frecuencias representa la duracin de llamadas telefnicas efectuadas por 175

    personas durante el fin de semana del Da del Trabajo. Construya un histograma para estos datos.Duracin en minutos Frecuencia

    1- 7 458-14 32

    15-21 3422-28 2229-35 1636-42 1243-49 950-56 5

    a) Describa la forma general del histograma. Puede observarse un patrn?b) Suponga que todas las personas hacan llamadas desde una habitacin con 10 telfonos y que cada

    persona saba a qu clase de tiempo pertenecera la llamada. Sugiera un orden para que todas las lla-madas terminen tan rpido como sea posible.

    c) Afecta el orden a la duracin de las llamadas terminadas? 2-35 Golden Acres es una asociacin de propietarios de casas que opera un parque para casas mviles en las

    afueras de Orlando, Florida, donde los retirados tienen sus casas de invierno. Adems de la renta de lote