Estad y Prob_5a_01

download Estad y Prob_5a_01

of 40

Transcript of Estad y Prob_5a_01

  • 7/24/2019 Estad y Prob_5a_01

    1/40

    Objetivos

    Al finalizar la unidad, el alumno:

    explicar el concepto de estadstica y otros relacio- nados (muestra, poblacin, estadstico, parmetro,

    etctera) describir las diferentes tcnicas para seleccionar una

    muestra calcular las principales medidas centrales y de dis- persin de un conjunto de datos no agrupados, ya

    sea muestrales o poblacionales dado un gran conjunto de datos, uti lizar y construir

    las clases de frecuencia y sus grficos para analizar ladistribucin de dichos datos

    Estadstica descriptiva

    UNIDAD

    1

  • 7/24/2019 Estad y Prob_5a_01

    2/40

  • 7/24/2019 Estad y Prob_5a_01

    3/40

    Introduccin

    Alo largo de su existencia el ser humano ha llevado a cabo anlisis de una gran cantidaddedatoso informacin, referentes a los problemas o actividades de sus comunidades. Porejemplo, desde comienzos de la civilizacin se hacan representaciones grficas y otrossmbolos en pieles, rocas, palos de madera y paredes de cuevas para contar el nmerode personas, animales o cosas. Hacia el ao 3000 a. C., los babilonios usaban pequeastabli llas de arcill a para recopilar datos sobre la produccin agrcola y los gnerosvendidos o cambiados mediante el trueque. Mucho antes de construir las pirmides, losegipcios analizaban los datos de la poblacin y la renta del pas.

    Otro ejemplo de recopilacin y anlisis de datos es el del imperio romano, cuyoprimer gobierno, al verse en la necesidad de mantener control sobre sus esclavos y riquezas,recopil datos sobre la poblacin, superficie y renta de todos los territorios bajo su control.

    Siguiendo con la historia de la recopilacin de datos, a mediados del primermilenio, por el gran crecimiento de las poblaciones y para poder tener control sobre stas,se comenzaron a efectuar censos poblacionales, como los de la Edad Media en Europa.Por ejemplo, los reyes caloringios1Pipino el Brevey Carlomagno ordenaron hacer estudiosminuciosos de las propiedades de la Iglesia en los aos 758 y 762, respectivamente.

    Conforme pasaba el t iempo, la recopilacin y anli sis de datos comenzaban a tenerotro fin adems de los censos y conocimiento de diferentes propiedades. Por ejemplo, enInglaterra a principios del siglo XVI se realiz el registro de nacimientos y defunciones, conel cual en 1662 apareci el primer estudio de datos poblacionales, ti tuladoObservationsontheLondon Billsof Mortality(Comentarios sobre las partidas de defuncin en Londres).

    Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en Alemania,realizado en 1691, fue uti lizado por el astrnomo ingls Edmund Halley como base parala primera tabla de mortalidad. En el siglo XIX, con la generalizacin del mtodo cientficopara estudiar todos los fenmenos de las ciencias naturales y sociales, los investigadoresaceptaron la necesidad de reducir la informacin a valores numricos para evitar laambigedad de las descripciones verbales.

    1.1 Estadstica

    Como se explic, el ser humano tuvo la necesidad de crear una ciencia que redujera lainformacin a valores numricos para la mejor interpretacin de los fenmenos; se lellam estadstica.

    La estadstica es una rama de las matemticas aplicadas que proporciona mtodos para reunir,

    organizar, analizar e interpretar informacin, y usarla para obtener diversas conclusiones que

    ayuden a tomar decisiones en la solucin de problemas y en el diseo de experimentos.

    Definicin 1.1

    1 Carolingia tambin llamada Carlovingia, fue una dinasta de reyes francos que gobernaron un vasto terri-tor io de Europa Occidental desde el siglo VII hasta el siglo Xd. C.; su nombre fue tomado de su ms renombradomiembro, Carlomagno.

  • 7/24/2019 Estad y Prob_5a_01

    4/40

    20

    Actualmente la estadstica es un mtodo efectivo paradescribir con precisin los valoresde datoseconmicos, polticos, sociales, psicolgicos,biolgicoso fsicos, y una herramienta para

    relacionar y analizar dichos datos. Por esta razn, la estadstica se divide en diferentesramas, entre las ms aplicadas y que analizaremos estn la estadstica descriptivay lainferencial.

    La primera de ellas se aborda en la presente unidad y ser descri ta ms adelante,mientras que la segunda ser estudiada en las unidades 9 y 10. Por ahora se vern dosconceptos fundamentales en el estudio de la estadstica.

    1.2 Poblacin y muestra

    La materia prima de la estadstica son los conjuntos de nmeros obtenidos al contaromedirelementos. Por tanto, al recopilar datos estadsticos se debe tener especial cuidado

    para garanti zar que la informacin sea completay correcta; de este modo, el primer pasoes determinar qu informacin y en qu cantidad se ha de reunir. Por ejemplo, en uncenso es importante obtener el nmero de habitantes de forma completa y exacta; dela misma manera, cuando un fsico quiere contar el nmero de colisiones por segundoentre las molculas de un gas, debe empezar por determinar con precisin la naturalezade los objetos a contar. Dado que la naturaleza de los fenmenos en estudio es muyvari ada, es necesario proporcionar una serie de definiciones referentes a los conjuntos dedatos que se han de estudiar.

    La poblacin es el conjunto que incluye el total de elementos o datos cuyo conocimiento es de

    inters particular.

    Cada uno de los elementos que intervienen en la definicin de poblacin es unindividuou objeto; se denominaron de esta manera, ya que originalmente el campo deactuacin de la estadstica fue el demogrfico.

    Dado que la informacin disponible consta frecuentemente de una porcin osubconjunto de la poblacin, introducimos un segundo concepto, el de muestrade unapoblacin.

    La muestraes cualquier subconjunto de la poblacin.

    1. Si el conjunto de datos de intersest constituido por todos lospromediosde un grupode estudiantesde licenciatura de una universidad, cada uno de los estudiantes serun individuo estadstico, mientras que el conjunto de todos estos estudiantes serla poblacin y una muestra podra ser el conjunto de todos los estudiantes del tercercuatrimestre de ingeniera.

    2. Si el conjunto de datos de inters est constituido por todos lospromediosde losgruposde licenciatura, cada uno de los grupos ser un individuo estadstico, mientras que elconjunto de todos estos grupos ser la poblacin y una muestra podra ser el conjuntode todos los grupos del tercer cuatrimestre de ingeniera.

    Definicin 1.2

    Definicin 1.3

    Ejemplo 1

  • 7/24/2019 Estad y Prob_5a_01

    5/40

    21

    3. Si se est estudiando el resultado de ciertos experimentos qumicos, cada uno deesos experimentos ser un individuo estadstico y el conjunto de todos los posibles

    experimentos en esas condiciones ser la poblacin, mientras que una muestra podraser un conjunto de resultados experimentales posibles en ciertas condiciones.

    Ms adelante se ver que el problema de muestreo no es tan simple, porque esteconcepto tiene mayor importancia dentro de la estadstica inferencial; se profundizaren l en su momento.

    1.2.1 Caracteres y variables estadsticas

    Cuando se defini el concepto poblacin, se mencionaron sus elementos, tambinllamados individuos; adems, en el ejemplo 1 se observ que stos pueden ser descri tos

    por una o varias de sus propiedades o caractersticas.

    El caracter de un elemento, individuo u objeto es cualquier caracterstica por medio de la cual se

    1. Si los individuos son personas, el sexo, el estado civil, el nmero de hermanoso suestatura son caracteres.2. Si el individuo es una reaccin qumica, el tiempo de reaccin, lacantidad deproductoobtenidoo si ste escidoo bsico, son caracteres que pueden analizarse.

    Un caracter es cuantitativosi es posible medirlo numricamente o cualitativo sino admite medicin. Por ejemplo, el nmero de hermanos y la estatura son caracterescuantitativos, mientras que el sexo y el estado civil son caracteres cualitativos.

    Los distintos valores que puede tomar un caracter cuantitativo configuran unavariableestadstica. Las variables estadsticas se clasifican en discretasy continuas.

    Una variable estadstica es discreta slo cuando permite valores aislados, como nmeros enteros.

    Por ejemplo, la variablenmero dehermanostoma los valores 0, 1, 2, 3, 4 y 5. Este tipode variables se caracterizan por obtenerse mediante un proceso de conteo(ver semejanzacon las variables aleatorias discretas en la unidad 5).

    Una variable estadstica es continua cuando admite todos los valores de un intervalo.

    Por ejemplo, la vari able estatura, en cierta poblacin estadstica, toma cualquiervalor en el intervalo 158-205 cm. Otro ms es la temperatura de una persona. Este tipo

    Definicin 1.4

    Ejemplo 2

    Definicin 1.5

    Definicin 1.6

  • 7/24/2019 Estad y Prob_5a_01

    6/40

    22

    de variables se caracteriza por obtenerse mediante mediciones (ver semejanzas con lasvari ables aleatorias continuas en la unidad 7).

    Las variable cualitativas pueden ser nominales si se trata de categorias (sexo, raza,etc.) y ordinales si implican orden (clase social, grado de preferencia).

    1.2.2 Estadstica descriptiva

    Como ya se dijo, la estadstica se divide en varias ramas, una de ellas es la estadsticadescriptiva. Despus de haber estudiado los conceptos de poblacin y muestra es posibledefinirla.

    La estadstica descriptivaes la parte de la estadstica que organiza, resume y analiza la totalidad

    de elementos de una poblacin o muestra.

    Su finalidad es obtener informacin, organizarla, resumirla y analizarla, lo necesariopara que pueda ser interpretada fcil y rpidamente y, por tanto, pueda utilizarseeficazmente.

    El proceso que sigue la estadstica descriptiva para el estudio de una cierta poblacino muestra consta de los siguientes pasos:

    1. Seleccin de caracteresfactibles de ser estudiados.2. Mediante encuesta o medicin, obtencin del valor de cada elemento en los

    caracteres seleccionados.3. Obtencin de nmeros que sintetizan los aspectos ms relevantes de una

    distribucin estadstica (ms adelante a dichos nmeros los llamaremos

    parmetrospara el caso de la poblacin y estadsticosen las muestras).4. Elaboracin de tablas de frecuencias, mediante la adecuada clasificacin de los

    individuos dentro de cada carcter (esto lo estudiaremos ms adelante en eltema Clases de frecuencias).

    5. Representacin grfica de los resultados (elaboracin de grficas estadsticas, alas que llamaremos histogramas).

    1.3 Tipos de muestreo

    Los especialistas en estadstica se enfrentan a un complejo problemacuando, por ejemplo,toman una muestra para un sondeo de opinin o una encuesta electoral; seleccionar una

    muestra capaz de representar con exactitud las preferencias del total de la poblacin noes tarea fcil, para tal efecto existen diferentes tipos de muestreo, los ms conocidos semencionan enseguida.

    Muestreo aleatorio simple

    Este tipo de muestreo se caracteriza porque cualquier elemento de la poblacin en estudiotiene la misma posibilidad de ser seleccionado.

    Definicin 1.7

  • 7/24/2019 Estad y Prob_5a_01

    7/40

    23

    Por ejemplo, de la poblacin estudiantil de una universidad se puede seleccionaruna muestra aleatoria de 50 estudiantes para aplicar una encuesta y obtener cierto tipo

    de informacin. En estos casos, existen distintos mtodos para respetar la aleatoriedad,el ms comn es asignarle un nmero diferente a cada estudiante y luego, con la ayudade una tabla de nmeros aleatorios, elegir un bloque de tamao 50 de sta y realizar lasentrevistas a los alumnos seleccionados.

    Muestreo estratificado

    En este tipo de muestreo se divide la poblacin en grupos que no se traslapen es decir,que no tengan elementos en comn y se procede a realizar un muestreo aleatorio simpleen cada uno de los grupos.

    Por ejemplo, la poblacin estudiantil de una universidad se puede dividir en gruposformados por diferentes especialidades (ingeniera industrial, ingeniera en sistemas,

    administracin, etc.) y despus de cada una de ellas se procede a seleccionar una muestraaleatoria para llevar a cabo una entrevista y obtener la informacin deseada.Adems de los dos tipos de muestreo mencionados, existe el muestreo sistemtico

    y el muestreo por conglomerados. El problema de muestreo es ms complejo de lo queparece; para un estudio ms detallado del tema, el estudiante puede consultar el libroElementos de muestreo, de Richard L. Scheaffer y Willi am Mendenhall, de Grupo EditorialIberoamrica.

    1.3.1 Uso de tablas de nmeros aleatorios

    Como se mencion, las muestras aleatorias se pueden obtener a partir de una tabla denmeros aleatorios. Se supone que se tiene una poblacin de mil individuos y se quiere

    hacer un muestreo de diez de ellos. En este caso, primero se asigna un nmero del 000al 999 a cada miembro de la poblacin y luego se elige de la tabla de nmeros aleatoriosun punto de arranque y se hace el recorrido hasta obtener el tamao de la muestra dediez. Debido a que el tamao de la poblacin es mil, de los nmeros que aparecen en latabla se consideran slo sus tres ltimas cifras. Por ejemplo, sean los siguientes nmerosaleatorios elegidos de una tabla.

    Al elegir sus tres ltimas cif ras se obtienen los nmeros que formarn la muestra:061, 897, 108, 542, 975, 093, 135, 818, 499 y 605. Despus se procede a seleccionar de lapoblacin a los individuos que les corresponden estos nmeros.

    De forma similar que en el caso de las mil personas, primero se asigna un nmeroa cada elemento de la poblacin desde 000 hasta 649 y posteriormente se elige un bloquede nmeros aleatorios donde las tres primeras cifras sean menores a 649.

    9173061

    0746897

    7392108

    0015542

    4757975

    0195093

    8122135

    7996818

    1321499

    0559605

  • 7/24/2019 Estad y Prob_5a_01

    8/40

    24

    1.4 Parmetros y estadsticos

    Los nmeros que sintetizan los aspectos ms relevantes de una distribucin estadsticapueden obtenerse tanto de una poblacin como de una muestra y por consiguiente debenclasificarse: los primeros, obtenidos de la poblacin, reciben el nombre deparmetrosy losobtenidos de una muestra se llaman estadsticoso estimadores.

    Los parmetros y estadsticos ms comunes de la estadstica descriptiva que seestudiarn en esta unidad se dividen, a su vez, en dos tipos:

    1.Medidascentrales:media, mediana, moda, media geomtrica, media armnica,media ponderada.

    2. Medidas de dispersin:rango, varianza, desviacin estndar, error estndar,coeficiente de variacin, percentiles, rango intercuarti l.

    1.5 Medidas centrales

    Si el conjunto de datos numricos de una muestra de tamao n(o poblacin de tamao N)es de la formax

    1, x

    2,. . ., x

    n(o para la poblacin x

    1, x

    2,. . ., x

    N), nos podemos preguntar por las

    caractersticas del conjunto de nmeros que son de inters. En est seccin se estudiarnlos mtodos para describir su localizacin y, en particular, el centro de los datos.

    1.5.1 La media

    Cuando una persona tiene en sus manos un conjunto de datos para analizarlos,generalmente calcula, en primera instancia, un promedio de stos. Por ejemplo, dicha

    persona tiene las cantidades mensuales que ha ganado en los ltimos seis meses (10 800,9 700, 11 100, 8 950, 9 750 y 10 500) y desea conocer el valor que representa su salariopromedio. En este caso, obtendr su ingreso promedio al sumar las cantidades y dividirentre el nmero de meses que trabaj

    10 800 + 9 700 + 11 100 + 8 950 + 9 750 + 10 500= 10 133.33

    6

    El sueldo promedio es $10 133.33.

    Como el caso anterior, existe una infinidad de problemas o casos prcticos en losque de un conjunto de datos se quiere conocer un valor centralque refleje la influenciaque tiene cada uno de los datos en l. La medida cent ral ms propicia para tales fines se

    define a continuacin.

    x1, x

    2,..., x

    n, la media muestral(promedio aritmtico)

    o estadstico media del conjunto es el estadstico que representa el promedio de los datos

    simbolizado por x(xbarra), y se calcula

    xx x x

    n nxn i

    i

    n1 2

    1

    1

    Definicin 1.8

  • 7/24/2019 Estad y Prob_5a_01

    9/40

    25

    De forma similar se define el parmetro mediapara las poblacionesfinitas.

    Dado el conjunto de datos poblacionales x1, x

    2,. . ., x

    N, se llamamedia poblacional oparmetro

    media del conjunto al parmetro representado por (miu o mu), y se calcula

    x x x

    N NxN i

    i

    N1 2

    1

    1

    Un fabricante de pistones toma una muestra aleatoria de 20 de stos, para medir sudimetro interno promedio. Con la informacin que el fabricante obtuvo dada encentmetros, se calcula su dimetro medio

    Como se trata de una muestra, se calcula su estadstico

    x=1

    20[10.1 + 10.1 + 9.8 + 9.7 + 10.3 + 9.9 + 10 + 9.9 + 10.2 + 10.1 + 9.9 +

    9.9 + 10.1 + 10.3 + 9.8 + 9.7 + 9.9 + 10 + 10 + 9.8] = 9.975

    La media representa el valor promedio de todas las observaciones y por consiguientecada uno de los datos inf luye de igual manera en el resultado; en ocasiones, cuando setienen pocos datos que se alejan considerablemente del resto, el valor promedio encon-trado no refleja la realidad del caso.

    Se quiere calcular el sueldo promedio de los trabajadores de una fbrica, eligiendoaleatoriamente a diez de ellos, con las siguientes cantidades:

    Se calcula el sueldo promedio, y se tiene

    x=1

    10[2 000 + 2 200 + 2 500 + 2 200 + 1 800 + 25 000 + 2 400 + 2 300 + 2 800 + 2 400] = 4 560

    donde el estadstico no refleja la realidad de los datos, puesto que el sueldo de 25 000 esmucho mayor a los dems e inf luye considerablemente en el valor promedio.

    1.5.2 La mediana

    Por lo expuesto al final de la subseccin es necesario presentar otro t ipo demedida centralenla que valores muy extremosos, con respecto al resto, no tengan una inf luencia tan marcadacomo en la media. A dicha medida se le conoce, debido a su naturaleza, como mediana.

    La mediana de un conjunto de datos es el valor medio de los datos cuando stos se han ordenado

    en forma no decreciente en cuanto a su magnitud.

    Definicin 1.9

    Ejemplo 3

    10.1

    9.9

    10.1

    9.8

    10.0

    9.9

    9.9

    10.0

    10.2

    10.0

    9.8

    10.1

    10.1

    9.9

    9.7

    10.3

    10.3

    9.8

    9.9

    9.7

    Ejemplo 4

    Dato

    Sueldo 2 000 2 200 2 500 2 200 1 800 25 000 2 400 2 300 2 800 2 400

    x10x1 x2 x3 x4 x5 x6 x7 x8 x9

    Definicin 1.10

  • 7/24/2019 Estad y Prob_5a_01

    10/40

    26

    Clculo de la mediana

    Dado el conjunto de datos muestralesx1, x2,. . ., xn, lamediana muestraloestadstico medianadel conjunto se representa por x(xtilde) y se obtiene ordenando primero en forma nodecrecienteestos ndatos, los que se renombrarn segn su posicin por medio de ti ldesde la siguiente forma

    x x xn1 2

    Posteriormente se locali za el punto medio de los datos ordenados, con dos casos:

    1. Cuando la cantidad de observaciones es impar, el valor medio delordenamiento es el dato que se encuentre en la posicin (n+ 1)/ 2.

    2. Cuando la cantidad de datos es par, de tal manera que resultan dos datos

    medios localizados en las posiciones n/ 2 y n/ 2 + 1, la mediana se considera elpromedio de stos.

    Finalmente, se puede resumir el clculo de la mediana con las siguientes frmulas

    x

    x

    x x

    n

    n n

    , cuando la cantidad de datos es impar12

    2 2

    , cuando la cantidad de datos es par1

    2

    De forma similar se define el parmetro mediana.Dado el conjunto de datos poblacionales x

    1, x

    2,. . ., x

    N, la mediana poblacionalo

    parmetro medianadel conjunto es el parmetro representando por , y se calcula

    x

    x x

    N

    N N

    ,cuando la cantidad de datos es impar12

    2 2

    cuando la cantidad de datos es par1

    2,

    Dado el conjunto muestral de datos del ejemplo anterior, referente al sueldo promedio,se calcula su mediana.

    La siguiente tabla muestra el conjunto de los diez datos

    Ordenando los sueldos de menor a mayor y renombrndolos se obtiene

    Dato

    Sueldo 2 000 2 200 2 500 2 200 1 800 25 000 2 400 2 300 2 800 2 400

    x10x1 x2 x3 x4 x5 x6 x7 x8 x9

    2 300

    Dato original

    Dato

    ordenado

    Sueldo 1 800 2 000 2 200 2 200 2 400 2 400 2 500 2 800 25 000

    x10x1 x2 x3x4x5 x6x7x8

    x10x1~ ~~~~x2 x3 x4 x5 x6 x7 x8 x9

    x9

    ~ ~ ~~ ~

    Ejemplo 5

  • 7/24/2019 Estad y Prob_5a_01

    11/40

    27

    La cantidad de datos es diez y ste es un nmero par, por consiguiente la medianamuestralse encuentra con el promedio de los datos ordenados en las posiciones n/ 2 y

    n/ 2 + 1.Es decir, en las posiciones 10/2 = 5 y 10/ 2 + 1 = 6

    xx x5 6

    2

    2 300 2 400

    22 350

    En la mediana se puede observar que el valor $25 000, el cual sobresala conrespecto a todos los dems, a diferencia de la media, no influye en el resultado de lamediana. Puesto que si en lugar de $25 000 se elige $5 000 o $100 000, el sueldo mediode los diez trabajadores seguir siendo $2 350. Por lo cual se dice que la mediana es unamedida central insensiblede los datos.

    1.5.3 La moda

    Para algunos estudios es necesario encontrar el valor central de un conjunto de datos,en donde la medida de inters est basada en la repeticinde stos; por tanto, ningunade las dos medidas analizadas es conveniente en este caso. Debido a su naturaleza, a estamedida se le da el nombre de moday se define a continuacin.

    La moda de un conjunto de datos es el valor que se presenta en su distribucin con mayor

    frecuencia.

    Lamodase simboliza por Mopara las muestras y para las poblaciones.

    En la siguiente lista se muestran las calif icaciones de 20 exmenes delingstica.Secalculade lingstica. Secalculaingstica. Se calculala calificacin que ms se repite, es decir, la moda de la distribucin de las calificaciones.

    Despus del conteo de los datos, se tiene

    cinco datos con valor 5un dato con valor 6 y otro con valor 7

    tres datos con valor 8 seisdatos con valor 9

    cuatro datos con valor 10

    Por tanto, la moda es igual a 9; ya que es la calificacin de mayor frecuencia.

    Al calcular la moda es posible observar que es una medida completamente opuestaa la medianaen cuanto a su sensibilidad. Por ejemplo, si en el caso de las calificaciones unalumno con calificacin 9 hubiese obtenido 5, la moda cambiara a 5 (seran seis 5 y cinco9). As que con la sola alteracin de un dato cambia completamente la moda, por tanto,se dice que sta es sumamente sensible.

    Definicin 1.11

    Ejemplo 6

    5 8 9 9 8 10 9 5 10 5

    6 5 10 10 8 9 7 9 5 9

  • 7/24/2019 Estad y Prob_5a_01

    12/40

    28

    La moda tambin presenta los siguientes dos problemas:

    1. La moda puede no existir. Por ejemplo, se tienen las siguientes series de datos:

    6, 7, 34, 4, 8 6, 3, 8, 9, 3, 8, 6 y 9

    En ambas series de datos la frecuencia es la misma, es decir, no tienen moda.A los conjuntos de datos como los anteriores se les llama amodaleso sin moda.

    2. La moda puede no ser nica. Por ejemplo, se tiene la siguiente serie de datos

    6, 7, 9, 4, 8, 6, 6, 8, 9, 6, 8, 6, 9, 3, 9 y 9

    En esta serie estn los valores 6 y 9 como los de mayor frecuencia, ambos

    se repiten cinco veces. Al conjunto de datos que tiene ms de una moda se le l lamamultimodal; bimodalsi son dos modas, y trimodalsi son tres, etctera.

    1.5.4 Otros valores medios

    Ya se han analizado los tres valores cent rales ms conocidos y utilizados en la estadsticadescriptiva. El primero de ellos fue el definido en la seccin 1.5.1 como una mediaaritmtica, sin embargo, existen distribuciones de datos para las cuales esta medida no esmuy propicia, por lo que se definen y utilizan otro tipo de medidas centrales, la medianay la moda. A continuacin se vern otros tipos de promedios que son de utilidad en laestadstica descriptiva.

    Valor geomtrico o media geomtrica

    La media geomtrica de los datos x1, x

    2,. . ., x

    nse simboliza por MGy est definida como

    la raz n-sima del producto de las nmediciones.

    MG x x x nn

    1 2

    Se calcula la media geomtrica de 20 cali ficaciones de exmenes psicolgicos

    MG 5 8 9 9 8 10 9 5 10 5 6 5 10 10 8 9 7 9 5 9 7 544686820 .

    De la definicin de media geomtrica se deduce que sta no se puede aplicar cuandoalgn dato valeceroo la cantidad de datos es par y existe una cantidad impar negativa.

    5 8 9 9 8 10 9 5 10 5

    6 5 10 10 8 9 7 9 5 9

    Ejemplo 7

    Observacin

  • 7/24/2019 Estad y Prob_5a_01

    13/40

    29

    Valor medio armnico o media armnica

    La media armnicade los datos x1, x2,. . ., xnse simboliza por MA y est definida como elrecproco de la media aritmtica de los recprocos.

    MA

    n x n x x x

    n

    x x xii

    n

    n n

    1

    1 1

    1

    1 1 1 1 1 1 1

    1 1 2 1 2

    La principal aplicacin de sta es promediar las vari aciones respecto del t iempo, esdecir, cuando la misma distancia serecorre a diferentestiempos.

    Si se viaja de una ciudad a otra recorriendo los primeros 100 km a 80 kmph, los siguientes100 km a 100 kmph y finalmente otros 100 km a 120 kmph, se calcula la velocidad mediautilizando la mediaarmnica y se compara con las medias aritmtica y geomtrica.

    MA1

    1

    3

    1

    80

    1

    100

    1

    120

    97 2973.

    x1

    380 100 120

    300

    3100

    MG 80 100 120 98 64853 .

    Para tomar la decisin de qu media parece la ms correcta, se calcula la velocidadpromedio

    Velocidad promediodistancia total recorrida

    tiempo total

    La distancia total recorrida es igual a 100 + 100 + 100 = 300 km.

    El tiempo total de recorrido es100

    80

    100

    100

    100

    1203 0833. h.

    Ahora se compara con la distancia total real recorrida las distancias que recorrerael automvil con cada una de las velocidades promedio calculadas

    Media aritmtica: 3.0833 100 = 308.33 kmMedia geomtrica: 3.0833 98.6485 = 304.166 km

    Media armnica: 3.0833 97.2973 =300 km

    (Ntese que el mejor resultado se obtiene con la media armnica).

    Ejemplo 8

    Observacin

  • 7/24/2019 Estad y Prob_5a_01

    14/40

    30

    Valor medio ponderado o media ponderada

    Para los casos en que cada dato tiene una importancia relativaen su distribucin la cualse denomina peso, la media correspondiente ms apropiada se obtiene sumando losproductos de cada dato por su peso, llamando a dicha medida media ponderada.

    En un conjunto de datos x1, x

    2,. . ., x

    nse llama pesoso ponderaciones respectivas de estos

    datos a las cantidades w1, w

    2,. . ., w

    nque cumplen

    a) wi [ ]0,1 , para todo valor de ib) w

    1+ w

    2+ . . . + w

    n=1

    La media ponderadadel conjunto de datos x1, x

    2,. . ., x

    n, con pesos respectivos w

    1,

    w2,. . ., w

    n, se simboliza por MPy se calcula con la siguiente frmula:

    MP w x i ii

    n

    1

    Se calcula la calificacin promedio de un estudiante. La calificacin est ponderada de lasiguiente forma: 10% tareas, 40% del primer examen bimestral y 50% del examen final.Las calificaciones del estudiante son 8, 9 y 4, respectivamente.

    La calificacin est ponderada, por tanto

    MP = 0.1 8 + 0.4 9 + 0.5 4 = 6.4

    En el caso de poblaciones, los parmetros correspondientes se calculan con las mismasformulas cambiando npor N.

    Al analizar un conjunto de datos surge una duda: tener las medidas cent rales essuficiente para conocer su distribucin?Despus de estudiar la siguiente seccin estoquedar claro.

    Ejercicio 1

    1. Calcula la media, mediana y moda del siguiente conjunto de datos

    2. Calcula la media y mediana de los tiempos de llegada de seis aviones que aterrizanen un aeropuerto. Los tiempos (en minutos) son

    3.5 4.2 2.9 3.8 4.0 2.8

    Definicin 1.12

    Ejemplo 9

    Nota

    145 150 165 155 155 145 150

    140 145 150 160 175 150 160

  • 7/24/2019 Estad y Prob_5a_01

    15/40

    31

    3. Calcula la media geomtrica del conjunto de datos del ejercicio anterior. 4. Calcula la media armnica del viaje redondo que realiza un chofer de una lnea de

    camiones cuya ruta es de 520 km, si de ida lo recorri por una autopista a 101 kmphy de regreso por otra a velocidad promedio de 75 kmph.

    5. En una muestra de 100 pistones se encontr que 55 tenan un dimetro internode 10.5 cm, 25 de 10.0 y el restante de 10.75. Utiliza las frecuencias relativas de lospistones para calcular la media ponderada de su dimetro interno.

    1.6 Medidas de dispersin

    Para un anlisis ms completo de la distribucin de los datos, el estudio de sus medidascentrales no es suficiente, puesto que en diferentes conjuntos de datos puede habermedidas centrales iguales, por tanto, no se tendra conocimiento de la forma de su

    distribucin.Por ejemplo, se tienen dos conjunto de datos, uno contiene los valores 20, 12, 15,16, 13 y 14, y el segundo 5, 0, 50, 17, 8 y 10; se calcula su media.

    Como se puede verificar en ambos casos se obtiene 15. Pero si se representan losvalores en una recta, es notable que las observaciones del segundo conjunto tienen unadistribucin (variacin) mucho mayor.

    Por tanto, es necesario realizar un estudio de la distribucin de los datos conrespecto a su valor central, es decir, se necesita un valor que indique una medida paracomparar las dispersiones de datos entre diferentes conjuntos; estas medidas son valoresdedispersino variabilidaddel conjunto de datos.

    1.6.1 Rango

    Es el primer valor que nos muestra cmo estn distribuidos (dispersos) los datos. El rangode las observaciones est simbol izado por rpara la muestra y Rpara la poblacin.

    El rango es una medida de variacin de los datos que lo nico que muestra es el tamaoo longitud del intervalo en el que los datos se encuentran distribuidos y es:

    El rango es igual a el valor mayor menos el valor menor de los datos.

    Definicin 1.13

  • 7/24/2019 Estad y Prob_5a_01

    16/40

    32

    Por ejemplo, para los datos muestrales de los dos conjuntosde datos anteriores

    en el primer conjunto su rango vale r1= 20 12 = 8, es decir, los datos de esteconjunto estn distribuidos a lo largo de un intervalo de longitud 8 en el segundo conjunto su rango vale, r

    2= 50 0 = 50, es decir, los datos de este

    conjunto estn distribuidos a lo largo de un intervalo de longitud 50

    Los elementos del segundo conjunto tienen una separacin mayor entre ellos, peroel resultado no muestra el comportamiento de los datos con respecto a su media.

    1.6.2 Varianza y desviacin estndar

    Otra medida de dispersin de los datos que est relacionada directamente con la media delconjunto es la varianza.

    Se llama varianza de un conjunto de datosal promediode los cuadrados de las desviaciones de

    cada uno de los datos con respecto a su valor medio.

    Si se tienen ndatos muestrales, x1, x

    2,. . ., x

    ncon valor medio igual a x, los cuadrados

    de las desviaciones de cada uno de los datos con respecto a su valor medio sern ( )x x12,

    ( )x x22, etctera.

    Al igual que en los valores medios, la varianza puede definirse con respecto a lamuestra o a la poblacin.

    Respecto a la muestra

    La varianza muestral o estadstico varianza del conjunto de datos x1, x

    2,. . ., x

    n, se representa

    pors2

    datos con respecto a x, y se calcula

    s2 21

    1nx xi

    i

    n

    ( )

    Sobre la definicin anterior podemos decir que denota la intencin de una medidavariacional de un conjunto de datos, slo que ms adelante (unidades 9 y 10) se ver quees conveniente definir el estadstico varianza dividiendo entre n 1 en lugar de n. Para

    distinguirlas, se les asignan nombres diferentes, los cuales se justificarn hasta la unidad9, cuando se analice el tema Estimadores puntuales. Mientras tanto se define

    La varianza sesgadacomo sn

    x xn ii

    n2 21

    1

    ( )

    Definicin 1.14

    Definicin 1.15

  • 7/24/2019 Estad y Prob_5a_01

    17/40

    33

    La varianza insesgadacomo s

    n

    x xn ii

    n

    1

    1

    2 21

    1

    ( )

    Pero, por qu dos definiciones diferentes en lugar de una?Porque la varianzasesgada refleja perfectamente el significado de una medida de dispersiny por consiguientetiene una gran aplicacin en el estudio de las probabilidades. Mientras que la varianzainsesgada, es ms propicia para los clculos estadsticos y se emplea generalmente paralas muestras.

    Respecto a la poblacin

    De forma simi lar para poblacionesfinitasse define el parmetro varianza poblacional,elcual est representado por 2.

    Dado el conjunto de datos poblacionales x1, x2,. . ., xn, con valor medio ,se definela varianza poblacional

    Varianza poblacional*

    2 21

    1Nxi

    i

    N

    ( )

    La varianza se calcula con los cuadrados de las desviaciones y, por tanto, no est enlas mismas unidades que los datos. Por consiguiente, se introduce una nueva medida dedispersin de la siguiente forma:

    Se llama desviacin estndarde un conjunto de datos a la raz cuadrada positiva de la varianza,es decir

    2o s s2

    Se calcula la varianza insesgada y la desviacin estndar de cada uno de los dos conjuntosde la seccin 1.6:

    Primer conjunto: 20, 12, 15, 16, 13 y 14. Anteriormente se encontr que x= 15.

    sn

    x xn ii

    n

    11

    2 2

    2 2 2

    1

    1

    16 1

    20 15 12 15 15 15

    ( )

    ( ) ( ) ( ) ( ) ( ) ( )16 15 13 15 14 15

    1

    525 9 0 1 4 1 8

    2 2 2

    La desviacin estndar essn 1

    = 8 2 8284. .

    Definicin 1.16

    Ejemplo 10

    *En las unidades 5 y 7 se presenta una definicin ms general, la cual se puede aplicar tanto a poblacionesfinit as como infini tas.

  • 7/24/2019 Estad y Prob_5a_01

    18/40

    34

    Segundo conjunto: 5, 0, 50, 17, 8 y 10. Anteriormente se encontr que x= 15.

    sn

    x xn ii

    n

    11

    2 2

    2 2 2

    11

    1

    6 15 15 0 15 50 15

    ( )

    ( ) ( ) ( ) (117 15 8 15 10 15

    1

    5100 225 1225 4 49 25 325

    2 2 2) ( ) ( )

    ..6

    La desviacin estndar essn 1

    = 325 6 18 0444. . .

    Clculo de las varianzas

    Para los clculos se acostumbra emplear otra representacin equivalente a la de varianza,determinada por las siguientes frmulas:

    Varianza sesgada sn

    x xn ii

    n2 2 21

    1

    Varianza insesgada sn

    xn

    nxn i

    i

    n

    11

    2 2 21

    1 1

    Se calcula la varianza insesgada para los conjuntos de datos del ejemplo 10, empleando

    las ltimas frmulas para la varianza, y se verifica que coincidan los resultados.

    Primer conjunto: 20, 12, 15, 16, 13 y 14.

    sn

    xn

    nxn i

    i

    n

    11

    2 2 2 2 2 2 2 2 21

    1 1

    1

    6 120 12 15 16 13 14

    6

    6 115

    1

    5400 144 225 256 169 196

    6

    5225 278 270

    2( )

    88

    Segundo conjunto: 5, 0, 50, 17, 8 y 10.

    sn

    xn

    nxn i

    i

    n

    11

    2 2 2 2 2 2 2 2 21

    1 1

    1

    6 15 0 50 17 8 10

    6

    6 115

    1

    525 0 2500 289 64 100

    6

    5225 595 6 270 325

    2( )

    . .66

    En los clculos anteriores se observa que en ambos casos coinciden los resultadoscon los del ejemplo 10.

    Ejemplo 11

  • 7/24/2019 Estad y Prob_5a_01

    19/40

    35

    Ejercicio 2

    1. Calcula el rango y la varianza insesgada del siguiente conjunto de datos:

    2. Calcula la desviacin estndar de los tiempos de llegada de ocho aviones queaterrizan en un aeropuerto. Los tiempos en minutos son 3.5, 4.2, 2.9, 3.8, 4.0 y 2.8.

    3. En los envases de leche, la cantidad de lquido no es siempre un lit ro, por lo que setoma una muestra de diez envases, y se obtienen los siguientes valores:

    0.95 1.01 0.97 0.95 1.0 0.97 0.95 1.01 0.95 0.98

    Calcula la varianza.

    1.7 Clases de frecuencia

    Hasta ahora se ha trabajado slo con muestras o poblaciones menores de 30 elementos,cuyos clculos no han sido tan laboriosos; pero qu pasa cuando la cantidad de datos esconsiderable o stos provienen de mediciones que hagan ms laborioso el clculo de susmedidas cent rales o de variacin. Adems de lo anterior, puede ser que slo necesitemos unresumen ms compacto del conjunto de datos o incluso tener una representacin grficadel comportamiento de su distribucin, por lo que siendo un conjunto con gran cantidadde datos (por ejemplo, 200) visualizarlos todos, para poder estudiar su distribucin, noes factible, por consiguiente, es necesario emplear alguna otra estrategia de anli sis.

    El problema mencionado se puede resolver fcilmente distribuyendo los datos pormedio de intervalos, lo que da origen a la siguiente definicin:

    Dado un conjunto de datos, se llama intervalos de claseo clases de frecuenciao simplemente

    clases a los intervalos que por parejas son ajenos o disjuntos y contienen todos los datos del

    conjunto.

    Una pareja de intervalos son disjuntos si no tienen elementos en comn. Conrespecto a la cantidad de intervalos de clase, se pide que no sea una cantidad excesivao insuficiente. No existe una regla determinantepara obtener la cantidad de intervaloscuando se tienen ndatos. Algunos especialistas en estadstica emplean el entero mscercano a la raz de n, otros el entero ms cercano a log(n), o bien la llamada regla de

    Sturges, en la cual se toma como el tamao de la muestra el entero ms cercano a3.3logn + 1 con ncantidad de datos correspondientes a las observaciones. Para efectosde este libro, se emplear una cantidad de intervalos que, dependiendo del valor de n, seencuentre ent re cinco y veinte.

    Con respecto a los intervalos de clase, no es un requisito que sean de igual longitud, sinembargo, aqu habr restriccin a clases de igual longitud.

    145 150 165 155 155 145 150

    140 145 150 160 175 150 160

    Definicin 1.17

    Nota

  • 7/24/2019 Estad y Prob_5a_01

    20/40

    36

    1.7.1 Construccin de clases de frecuencia

    Para la construccin de los intervalos de clase o clases de frecuencia existen di ferentestcnicas, al igual que en la eleccin de la cantidad de clases no existe un mtododeterminante o una frmula general. Lo nico que debe respetarse es:

    un mismo dato no debe de pertenecer a dos intervalos diferentes todos los datos deben de estar di stribuidos en los intervalos formados

    Aqu se construirn los intervalos de clase de un conjunto de datos {x1, x

    2,. . ., x

    n}, de

    acuerdo con los siguientes puntos:

    1. Se calcula el rango del conjunto de datos.2. Se divide el rango ent re la cantidad de clases o intervalos que queremos tener y

    el valor calculado ser la longitud decada una de stas en las que se distribuirn

    los datos.3. Para formar las clases o intervalosseconsideran cerrados los extremos izquierdos

    de los intervalos y los derechos se consideran abiertos, tomando a la ltimaclaseen ambos extremos cerrada.

    Dado un conjunto de datos donde el valor ms pequeo es 5 y el ms grande 75. Construyediez intervalos de clase para dicho conjunto de datos.

    El rango del conjunto es: r = 75 5 = 70. Como queremos tener diez intervalos declase dividimos el rango 70 entre diez y obtenemos siete. Este valor ser la longitud decada una de las clasesde frecuencia. Por tanto, las diez clases son

    [5,12), [12,19), [19,26), [26,33), [33,40), [40,47), [47,54), [54,61), [61,68), [68,75]

    Recurdese que un intervalo de la forma [26,33) indica que se consideran todos losvalores que estn entre 26 y 33, incluyendo el 26 y excluyendo el 33.

    1.7.2 Frecuencias relativas

    Empleamos la construccin de los intervalos de clase para estudiar de forma simplificadala distribucin de los datos, por tanto, despus de construir los intervalos de clase,contamos la cantidad de datos que caen en cada uno. A dicha cantidad se le llamafrecuencia de la claseo frecuencia declaseofrecuencia absolutay se simboliza por f

    i, donde i

    representa el nmero de la clase y

    fii

    n

    n 1

    Se llama frecuencia relativade una clase ial cociente de la cantidad de datos que se encuentranen sta con respecto del total de datos en el conjunto y se simboliza por

    ff

    nr

    i

    donden representa la cantidad total de datos.

    Ejemplo 12

    Definicin 1.18

  • 7/24/2019 Estad y Prob_5a_01

    21/40

    37

    Se consideran lascalificaciones (con escala de cero a 100) de 80 estudiantes en la materiafsica experimental, se distribuyen en sieteclasesde frecuenciasy se calculan las frecuencias

    relativasde las clases:

    Lo primero es construir las siete clases de frecuencia, encontrando el valor msgrande 100 y el ms pequeo 30, por tanto, el rango vale r= 100 30 = 70.

    Como se piden siete clases de frecuencias, se divide 70 ent re siete yel resultado esdiez. Es decir, la longitud de las clases de frecuencia ser de diez unidades.

    El primer intervalo es [30, 40), es decir, todos los datos que sean mayores o igualesa 30 pero menores a 40; los datos son 30, 38, 30, 30, 30, 35, 36 y 30, ocho en total.

    Este proceso de conteo se contina hasta llegar a la ltima clase.Al reali zar el conteo de elementos por clase se recomienda que los datos contados

    se marquen para evitar una equivocacin. Por ejemplo, despus del primer conteo la tablaqueda de la siguiente forma

    Finalmente, se calculan las frecuencias relativas por clase, dividiendo las frecuenciasentre la cantidad total de datos, en este caso 80, y se obtiene

    Ejemplo 13

    30 88 96 100 45 38 78 89 68 88

    68 100 100 68 69 79 98 94 30 46

    30 86 85 89 94 99 100 45 30 35

    36 76 78 81 80 40 67 58 89 58

    98 90 100 100 68 70 83 85 68 56

    30 67 78 98 100 86 69 79 52 45

    89 78 65 60 69 76 78 77 89 98

    99 91 100 48 68 84 67 69 46 79

    30 88 96 100 45 38 78 89 68 88

    68 100 100 68 69 79 98 94 30 46

    30 86 85 89 94 99 100 45 30 35

    36 76 78 81 80 40 67 58 89 58

    98 90 100 100 68 70 83 85 68 56

    30 67 78 98 100 86 69 79 52 45

    89 78 65 60 69 76 78 77 89 98

    99 91 100 48 68 84 67 69 46 79

  • 7/24/2019 Estad y Prob_5a_01

    22/40

    38

    Tanto en estadstica como en probabilidad tiene un inters particular la acumulacinde frecuencias, por lo que se definen dos nuevas medidas en las clases de frecuencia:

    frecuencia acumulada y la frecuencia relativa acumulada.

    Se llamafrecuencia acumuladaa la funcin que representa la suma de las frecuencias por clase,

    y se simboliza por Fi.

    Se llamafrecuencia relativa acumuladaa la funcin que representa la suma de las frecuencias

    relativas por clase y se simboliza porFr.

    Clculo de las frecuencias acumuladas

    Dado un conjunto con ndatos, se divide en mi ntervalos de clase con frecuenciasf1, f

    2, . . ., f

    m, tales que f

    1+ f

    2+ . . . + f

    m=n(cantidad total de datos).

    Bajo estas condiciones la frecuencia acumulada est dada por

    F x fii

    x xi

    ( ) 1

    Mientras que para el caso de la frecuencia relativa acumulada, las frecuenciasrelativas por clase son

    f

    n

    f

    n

    f

    nm1 2, ,..., ;

    se cumplef

    n

    f

    n

    f

    nm1 2 1 y, por tanto, se tiene

    Frecuencia relativa acumuladade una clase i es el cociente de la frecuencia acumulada de clase

    i entre la cantidad total de datos n, es decir

    FF

    nr

    i

    Debido a que en las frecuencias por clase noes de inters el valor de cada elementosino slo la cantidadde estos en la clase, se acostumbra realizar el conteo por medio delas barras como antiguamente se llevaba a cabo; es decir, se pone una barra vertical porelemento contado y cada vez que se llega a cuatro barras la quinta se coloca en diagonal.Por ejemplo, para contar ocho elementos:

    Definicin 1.19

    Definicin 1.20

  • 7/24/2019 Estad y Prob_5a_01

    23/40

    39

    Con esta forma de conteo se puede construir, a partir de la tabla 1.1, una tablasimilar que contenga las frecuencias acumuladas

    1.7.3 Media, mediana y moda en clases de frecuencia

    Al igual que se realiz con un conjunto de datos del cual se obtuvieron sus medidascentrales y de desviacin, stas se pueden obtener para las clases de frecuencia empleandolos puntos medios de las clases y sus frecuencias de clase.

    Sea kel nmero de clases, xiel punto medio de la i-sima clase yfila frecuencia de la i-simaclase, entonces el valor de la media aritmticase calcula con la frmula

    xf x

    ni i

    i

    k

    1

    Otro valor promedio importante es la mediana (Md), que divide la distribucin en

    dos reas iguales; numricamente se compara con la media aritmtica x.Se puede obtener el clculo de la mediana con la siguiente frmula:

    donde

    L = lmite inferior de clase mediana l = longitud del intervalo de clase medianaM L l

    nC

    fd

    2

    n

    2= mitad de las observaciones

    C = frecuencia acumulada anterior a la clase mediana f = frecuencia del intervalo de clase mediana

    Defini cin 1.21

  • 7/24/2019 Estad y Prob_5a_01

    24/40

    40

    La clase mediana es el intervalo que incluye la mitad de las observaciones; es posibledefini rla al calcular la f recuencia acumuladaF.

    Con los datos del ejemplo 13, se calcula la mediana Md.

    El intervalo de clase mediana es [70, 80), ya queF5= 46 incluye a la mitad de las obser-

    vacionesn/ 2 = 80/ 2 = 40; l= 80 70 = 10.

    M L l

    nC

    fd

    2 70 1040 34

    1270 10

    6

    12770 5 75

    El valor promedio moda(Mo), que se comparar con los valores numricos de la

    media ari tmtica xy la mediana Md, se calcula con la frmula:

    donde

    L= lmite inferior de la clase modal l = longitud del intervalo de clase modalM L l

    d

    d do

    1

    1 2

    d1= diferencia en frecuencia del intervalo de clase modal

    con el anterior

    d2= diferencia en frecuencia del intervalo de clase modal

    con el posterior

    La clase modal es el intervalo que tiene en su frecuencia el nmero mayor.

    Con los datos del ejemplo 13, se calcula el valor promedio moda(Mo).

    El intervalo de clase modal es [90, 100] ya que la mayor frecuencia est en F7=

    19 con

    L= 90, l = 10, d1= 19 15 = 4 y d

    2= 19 0 = 19.

    M L ld

    d do

    1

    1 2

    90 104

    19 490 10

    4

    2390 10(.. ) .

    .

    1739 90 1 739

    91 74 92

    1.7.4 Varianza en clases de frecuencia

    De forma similar a la media de clases de frecuencia se pueden definir las varianzas sesgadae insesgada de las clases de frecuencia.

    Si fiyx

    ison la frecuencia y el punto medio de la i-sima clase, respectivamente, y nes la suma

    de las frecuencias, entonces la varianza sesgadas2se calcula con la frmula

    sn

    f x xi ii

    k2 21

    1

    ( )

    Ejemplo 14

    Ejemplo 15

    Definicin 1.22

  • 7/24/2019 Estad y Prob_5a_01

    25/40

    41

    La varianza insesgadas2se calcula con la frmula

    s n f x xi i

    i

    k

    2 21

    1

    1 ( )

    Ladesviacin estndar por clasesde frecuenciaseguir siendo la raz cuadrada positivade la varianza correspondiente.

    La media y varianza por clases de frecuencia generalmente se emplean para observar ladistribucin de datos muestrales, pero en caso de querer defini r estas medidas para datospoblacionales se realiza de forma similar, sustituyendo lanpor N, xpor y spor , comose hizo en las secciones 1.5 y 1.6.

    Se calcula la varianza sesgada de las clases de frecuencia con los datos del ejemplo 13.Para realizar los clculos ms fcilmente se uti li zar la tabla 1.2, tan slo intro-a tabla 1.2, tan slo intro-tan slo intro-

    duciendo algunas columnas:

    La suma de la quinta columna dividida entre 80 corresponde al valor promedio dela media ari tmtica.

    x5 770

    8072 125 72.

    Por la definicin de varianza sesgada se tiene

    s21

    8030 640 382 984 383( ) .

    Mientras que la desviacin estndar correspondiente es

    s s2 383 19 57.

    Definicin 1.23

    Nota

    Ejemplo 16

  • 7/24/2019 Estad y Prob_5a_01

    26/40

    42

    Ejercicio 3

    1. En la siguiente tabla se dan los tiempos de llegada en minutos de 60 aviones a unaeropuerto.

    a) distribuye los datos en cinco clases de frecuencia b) calcula su media y varianza sesgada por medio de las clases anteriores

    2. Una mquina despachadora de refrescos de un centro comercial parece estar

    fallando, puesto que el encargado ha recibido varias quejas en la ltima semana; ldecide registrar la cantidad de contenido en 40 vasos despachados por dichamquina y dividirlos en tres clases de igual longitud, si 70% o ms de los refrescosdespachados se encuentra en la clase media, el encargado seguir trabajando con lamquina, en caso contrario la mandar reparar.Los valores (en mililitros) medidos son:

    a) divide los valores en tres clases de frecuencia de igual longitud, calcula susfrecuencias relativas e indica si el encargado tendr que reparar la mquina o no

    b) calcula la cantidad de lquido promedio que despacha la mquina, empleandolas clases de frecuencia del inciso anterior

    3. Si en el ejercicio anterior, adems de la consideracin del porcentaje, se toma encuenta la desviacin estndar de las clases de frecuencia, por medio del criterio la mquina se reparar en caso de que la desviacin estndar sea mayor a seis,determina si el fabricante, segn los datos observados, tendr que reparar lamquina. 4. Se estudi el tiempo de vida de 90 personas con SIDAy se anot su duracin enmeses, y se obtuvo

    Ordena en diez clases de frecuencia y calcula la media y varianza de los datos.

    2.6 3.9 4.5 4.0 3.7 3.2 5.7 4.3 3.8 3.6

    4.7 6.1 6.0 5.0 4.5 6.2 3.4 2.9 3.6 4.1

    2.5 2.8 3.2 3.1 4.6 5.2 6.1 4.5 4.1 3.8

    7.2 3.4 7.9 3.6 3.6 4.8 5.2 6.3 8.2 5.3

    3.9 4.6 4.5 5.7 4.8 6.9 6.3 2.6 2.5 6.8

    8.0 5.6 3.9 4.6 4.8 5.9 6.2 3.2 4.5 5.0

    34.0 28.5 18.0 34.9 25.8 16.9 15.8 19.0 11.5 25.9 38.9 34.0 16.8 27.8 26.5

    24.6 22.8 16.8 39.0 42.0 48.0 34.8 33.0 23.9 27.5 35.8 36.9 26.7 26.8 34.7

    35.9 25.8 24.8 45.8 18.9 35.8 35.8 46.9 36.8 35.9 52.0 33.6 24.8 25.9 26.826.8 29.4 37.8 35.9 10.8 25.8 35.8 26.8 25.7 26.9 27.9 38.5 35.8 30.2 28.6

    33.1 34.7 45.9 56.8 45.8 25.8 50.2 42.9 46.8 48.9 47.5 48.2 42.5 40.8 27.9

    24.8 46.8 40.7 18.9 22.0 29.5 31.9 48.2 34.8 47.2 27.0 39.8 45.8 40.4 38.2

    245.6 236.9 240.7 235.9 247.8 246.5 230.8 250.6 248.0 247.4

    238.6 240.0 246.9 258.9 245.6 248.5 246.8 245.6 247.8 256.0

    243.0 243.3 240.6 250.2 249.6 243.8 246.9 247.8 243.0 246.4

    230.5 228.9 235.7 248.9 248.9 245.7 240.8 246.8 246.2 250.0

  • 7/24/2019 Estad y Prob_5a_01

    27/40

    43

    1.8 Grficas

    Las grficas a las que se hace referencia en estadstica descriptiva deben mostrar ladistribucin de las frecuencias o frecuencias acumuladas del conjunto de datos, con locual se podr entender e interpretar fcilmente su comportamiento.

    Por tanto, es necesario introducir un nuevo mtodo grfico para la interpretacinde datos, ent re los grficos ms comunes estn

    diagrama de barras polgono de frecuencias diagrama circular o de pastel

    1.8.1 Diagrama de barras

    Uno de los grficos que ms se emplean para representar un conjunto de datos es eldiagrama de barras, donde se grafican una serie de rectngulos sobre un sistema dereferencia. Cuando se construyen los rectngulos con sus bases sobre cada uno de losintervalos de clase y con sus alturas las frecuencias correspondientes de clase, el grficose llama histograma.

    Un histograma

    La construccin de histogramas comienza prcticamente igual que en las clases defrecuencia:

    1. Se construyen los intervalos de clase.2. Se encuentra el punto medio de cada intervalo de clase.3. En el plano cartesiano, en el eje de las abscisas, se distribuirn los puntos

    medios de las clases de frecuencia, mientras que en el eje de las ordenadasse distribuirn las frecuencias de los datos. Finalmente, se construye elhistograma graficando una barra por cada clase, y cuyo centro ser el puntomedio de sta, de tal manera que la altura de la barra es la frecuencia o fre-cuencia relativa y la base de los rectngulos est definida por los lmites decada clase.

    Para facili tar la construccin de un histograma es recomendable emplear slo

    intervalos de clase de igual longitud, ya que en dado caso las frecuencias de las clases segrafican de manera proporcional a las alturas de los rectngulos y adems es mucho msfcil comparar las diferencias entre frecuencias cuando los rectngulos tienen la misma base.

    Se construye un histograma para las clases de frecuencia y la frecuencia acumulada delejemplo 13.

    Defini cin 1.24

    Ejemplo 17

  • 7/24/2019 Estad y Prob_5a_01

    28/40

    44

    Empleando la tabla 1.2:

    Se grafican los puntos medios de los intervalos (tercera columna) y se trazan losrectngulos con sus bases iguales a la longitud de la clase y con las alturas correspon-dientes a su frecuencia, como se muestra en las siguientes figuras:

    Para las frecuencias relativas el histograma es el mismo, slo se divide cada frecuenciaentre el total de datos.

    Modelos de distribucin de datos

    Los histogramas no slo nos ayudan a ubicar el cent ro y visualizar la variabilidad de los

    datos, sino tambin la forma en que se distribuyen; por tanto, los podemos clasificar en

    simtricos sesgados hacia la izquierda o la derecha multimodales

    0

    4

    87

    12

    19

    15

    25 35 45 55 65 75 85 95 105

    158

    3419

    46

    80

    61

    f

    a)

    025 35 45 55 65 75 85 95 105

    F(x)

    b)

    Nota

  • 7/24/2019 Estad y Prob_5a_01

    29/40

    45

    Histogramassimtricos

    Presentan la distribucin en forma de campana, es decir, la mitad izquierda es una imagenreflejada de la mitad derecha. Como muestra la figura 1.2a, se cumple x=Md=M

    o.

    Histogramassesgados

    Presentan una distribucin en la que alguna de las colas est ms alargada en comparacincon la otra. Se llaman sesgados a la derechao positivamente sesgadossi la cola derecha es laque est ms alargada. Como lo muestra la figura 1.2b, se cumple M

    o< M

    d< x. Se les

    llama sesgadosa la izquierdao negativamentecuando la cola izquierda es la ms alargada.Como lo muestra la figura 1.2c, se cumple x

  • 7/24/2019 Estad y Prob_5a_01

    30/40

    46

    1.8.2 Polgono de frecuencias

    En ciertas reas de estudio se requiere que las representaciones grficas de la distribucinde las frecuencias de datos sean hechas por lneas en lugar de barras. Por ejemplo, alrealizar un estudio sobre los pronsticos de algn evento se visuali za mejor la distribucinde sus frecuencias y sus tendencias si se unen sus puntos medios con segmentos recti lneosen lugar de trazar barras.

    Un polgono de frecuencias

    uniendo por lneas los puntos medios de cada intervalo, dondexies el punto medio de clase i y f

    isu frecuencia. Debido a su forma tambin se le suele llamar .

    Construccin de un grfico poligonal

    1. Se crean los intervalos de clase.2. Se encuentra el punto medio de cada intervalo de clase.3. En el plano cartesiano, en el eje de las abscisas, se distribuirn los puntos

    medios de las clases de frecuencia, mientras que en el eje de las ordenadas sedistribuirn las frecuencias de los datos. Finalmente, se construye el grficopoligonal uniendo los puntos obtenidos.

    Se construye un polgono de frecuencias para las clases del ejemplo 13. Por medio de latabla 1.4, si se grafican los puntos obtenidos de la tercera y la cuarta columnas:

    Los polgonos de frecuencia se emplean frecuentemente en el estudio de lasseries

    de tiempo, pues es comn querer conocer la tendencia de la distribucin de los datoscon respecto al tiempo. Adems, en ciertas situaciones, cuando se quieren comparar lasdistribuciones de dos o ms conjuntos de datos, es mejor hacerlo por medio de los polgonosde frecuencias que mediante las barras, puesto que los primeros se pueden sobreponer yrealizar una observacin mucho mejor, lo que no es aplicable con los histogramas.

    Definicin 1.25

    Ejemplo 19

    f

    12

    4

    78

    0

    19

    15

    35 45 55 65 75 85 95

  • 7/24/2019 Estad y Prob_5a_01

    31/40

    47

    A los polgonos de frecuencia que se elaboran con las frecuencias acumuladas o las frecuencias

    relativas acumuladas se les llama ojivas.

    Se construye la ojiva para las frecuencias relativas acumuladas del ejemplo 13.

    1.8.3 Diagrama circular o de pastel

    Otro tipo de representacin grfica de la distribucin de datos muy empleado, cuandose quieren ilustrar las proporciones de los datos de tal forma que llamen la atencin, sonlos diagramascirculares.

    Un diagrama circular

    frecuencias relativas del conjunto de datos. Por su forma tambin se le suele llamardiagrama de pastel.

    Construccin de un diagrama circular

    1. Se crean los intervalos de clase.2. Se calculan las frecuencias relativas por clase.3. A partir del centro de un crculo se trazan sectores proporcionales al rea que

    representen la frecuencia relativa por clase.

    Se construye un diagrama circular que represente la distribucin por clases de frecuenciasrelativas para las estaturas (en centmetros) de la siguiente muestra de 50 personas.

    Definicin 1.26

    0.4250

    0.1875

    1

    0

    0.2375

    0.10

    0.7625

    0.5750

    1 2 3 4 5 6 7

    Definicin 1.28

    Ejemplo 21

    Ejemplo 20

  • 7/24/2019 Estad y Prob_5a_01

    32/40

    48

    Como son 50 datos y se van a distribuir en siete clases, primero se calcula el rangodel conjunto r= 186.4 158.4 = 28

    Se quieren obtenersieteclases, por tanto, se divide el rango 28 entre siete y el resultadoes cuatro. Este valor ser la longitud de cada una de las clasesdefrecuencia. Es decir

    [158.4,162.4), [162.4,166.4), [166.4,170.4), [170.4,174.4),[174.4,178.4), [178.4,182.4), [182.4,186.4)

    Para obtener el rea que representa la frecuencia relativa en el digrama circular, semultipl ica la frecuencia relativa por 360.

    Con el avance de la informtica y la creacin de software, han aumentado lasrepresentaciones grficas para las distribuciones de los datos; en esta unidad slo se hanilustrado algunas de ellas. A continuacin se mencionan otros tipos de diagramas:

    anillos superficies cotizaciones cilndricas cnicas piramidales

    Todasstas se pueden encontrar en software estadstico para computadora.

    12

    24%

    9

    18%

    2

    4%2

    4%

    5

    10%

    8

    16%

    12

    24%

    a)

    24%

    18%4%4%10%

    16%

    24%

    b)

    Intervalo

    i

    Clase

    iConteo

    Frecuencia

    relativa

    Frecuencia

    f i

    1 [158.4, 162.4)

    [162.4, 166.4)

    [166.4, 170.4)

    [170.4, 174.4)

    [174.4, 178.4)

    [178.4, 182.4)

    [182.4, 186.4]

    2

    2

    3

    4

    5

    6

    7

    0.04

    0.10

    0.16

    0.24

    0.24

    0.18

    0.042

    9

    12

    12

    8

    5

  • 7/24/2019 Estad y Prob_5a_01

    33/40

    49

    Ejercicio 4

    1. Con los datos del ejercicio 3, numeral 1, traza los grficos de barras y poligonal paralas frecuencias sealadas.

    2. Con los datos del ejercicio 3, numeral 2, construye un diagrama de pastel querepresente las proporciones mencionadas.

    Ejercicios propuestos

    1. Calcula la media, mediana, moda y varianza insesgada del siguiente conjunto de datos

    2. Calcula las frecuencias relativas de los datos del ejercicio anterior. 3. Calcula la media geomtrica del conjunto de datos del ejercicio 1. 4. Calcula la media geomtrica de las edades (en aos) de ocho personas: 20, 23, 24,

    22, 19, 22, 25 y 27. 5. Calcula la media armnica del viaje redondo que realiz una persona de Mxico a

    Quertaro (210 km), si de ida lo recorri a una velocidad de 130 kmph y de regresoa 110 kmph.

    6. Si una persona viaj 400 km en cuatro tramos de 100 km cada uno, con velocidadesde 100, 130, 90 y 110 kmph, respectivamente, calcula con base en la media armnicala velocidad media con la que realiz el viaje.

    7. Los siguientes datos muestran los dimetros internos en centmetros de 20 pistones,calcula su dimetro interno medio y su desviacin estndar.

    8. Ciertos fabricantes de llantas quieren saber la duracin promedio de su productosegn el uso de diferentes conductores, para lo cual se toma una muestra aleatoriade 100 de sus compradores, los cuales reportaron la duracin de sus llantas en miles dekilmetros

    Con estos datos, calcula la duracin promedio de las llantas y su varianzainsesgada, dividiendo el conjunto de datos en diez clases de frecuencias.

    18 19 18 16 11 10 26 18

    20 22 24 19 18 11 16 20

    12.1 11.9 12.2 11.7 11.9 12.4 12.1 12.0 11.6 11.9

    13.0 12.8 11.8 12.4 12.3 11.9 12.2 11.9 12.1 12.2

    55.3 59.5 60.0 48.6 59.1 63.5 56.3 55.0 53.7 52.8

    50.5 56.7 60.8 67.6 68.0 64.4 58.0 49.9 65.4 47.9

    45.2 68.1 56.5 50.5 51.2 55.9 61.8 73.0 65.3 60.0

    56.6 57.3 49.9 69.5 50.2 52.1 56.7 56.2 52.9 55.0

    49.8 51.4 56.8 60.1 56.7 55.9 55.2 65.0 54.8 50.2

    56.7 67.0 58.8 57.9 49.9 50.6 58.6 54.8 53.8 52.0

    52.8 51.9 61.0 62.5 64.2 67.1 59.9 58.1 56.7 54.0

    56.3 53.9 52.0 52.9 51.9 56.0 58.1 52.0 57.0 56.1

    49.9 61.0 62.5 51.8 50.1 50.8 60.2 57.8 53.2 51.8

    60.1 60.9 56.8 48.0 58.9 57.6 59.7 60.7 63.6 65.3

  • 7/24/2019 Estad y Prob_5a_01

    34/40

    50

    9. Con base en los datos del ejercicio anterior t raza un histograma para las clases defrecuencias encontradas.

    10. Haciendo uso de las frmulas respectivas, encuentra la mediana y la moda de laduracin de las llantas del ejercicio 8 y compralas con la media encontrada. Obtntambin el tipo de modelo asociado.

    11. En la siguiente tabla se muestran los errores tipogrficos por pgina que comete unasecretaria en 100 pginas.

    a) divide a los datos en ocho clases de frecuencia y calcula la media por clases b) calcula la varianza de clase

    12. Traza un histograma del ejercicio anterior.13. La siguiente lista muestra las calificaciones de los alumnos de dos grupos de 30

    alumnos, cada uno. Determina la calificacin promedio por grupo, su varianzainsesgada y qu grupo t iene calificaciones ms homogneas.

    Autoevaluacin

    Indica la respuesta correcta.

    1. La Bolsa Mexicana de Valores ha tenido diferentes alzas y bajas en puntosporcentuales durante la primer quincena de junio de 2000

    0 2 3 2 1 5 2 1 6 3

    1 5 6 2 3 2 2 2 4 5

    5 3 2 6 7 1 3 7 2 3

    4 4 5 8 1 3 4 7 3 8

    0 5 3 2 4 4 6 7 8

    9 2 4 6 2 3 4 7 6 4

    5 4 6 7 7 2 1 3 8 2

    4 5 6 2 7 2 5 5 1 8

    3 4 7 8 2 8 1 3 4 4

    3 5 6 2 4 2 6 8 1 7

    10

    8 8 3 5 10 9 4 7 1 3

    8 9 7 7 7 2 3 8 8 9

    7 8 4 5 6 6 10 6 3 8

    Grupo 1

    10 10 8 0 0 2 8 4 1 4

    8 5 2 10 10 10 9 8 9 2

    3 3 1 1 2 4 8 6 3 8

    Grupo 2

  • 7/24/2019 Estad y Prob_5a_01

    35/40

    51

    Calcula el porcentaje medio obtenido en dicha quincena

    a) 3.8 b) 15 c) 1.5 d) 0.38

    2. Los precios del barri l de petrleo crudo exportado por Mxico durante 16 das delao 2000 fueron

    Considerando estos precios, calcula la desviacin estndar muestral de la

    variabilidad de los precios en esos 16 das

    a) 1.3456 b) 0.6237 c) 0.3053 d) 0.4672

    3. Calcula la moda de los precios del petrleo del ejercicio anterior

    a) 31.5 b) 32.0 c) 32.5 d) 31.0

    4. Calcula la media de los precios del petrleo del ejercicio 2. Asimismo, calculamediana, moda y media geomtrica de dichos precios y determina cul de estasmedidas es ms prxima al valor medio

    a) mediana b) moda c) media geomtrica

    5. Un chofer de una lnea de camiones viaj 1 000 km en cuatro tramos de 250 kmcada uno, con velocidades de 90, 80, 95 y 85 kmph, respectivamente. Calcula, conbase en la media armnica, la velocidad media con la que realiz el viaje

    a) 87.14 kmph b) 89.4 kmph c) 85 kmph d) 87.5 kmph

    31.5 31.0 32.0 32.5 32.5

    32.0 31.5 31.0 30.9 31.8

    31.2 30.5 31.5

    30.6 32.0 32.0

  • 7/24/2019 Estad y Prob_5a_01

    36/40

    52

    6. Los siguientesdatos muestran los sueldos de 90 personaselegidasaleatoriamente.Los siguientes datos muestran los sueldos de 90 personas elegidas aleatoriamente.Ordena los datos en diez clases de frecuencia de igual longitud y calcula media

    aritmtica x, medianaMdy modaMo

    La distribucin es

    a) sesgada a la derecha b) simtrica c) sesgada a la izquierda d) bimodal

    7. Calcula la desviacin estndar del ejercicio anterior

    a) 23.45 b) 18.93 c) 12.16 d) 15.34

    8. En la siguiente lista se muestran las calificaciones de los alumnos, de cuatro muestrasde diez alumnos, cada una. Por medio de su varianza insesgada, determina qumuestra result ms homognea en sus calificaciones.

    a) muestra 1 b)muestra 2 c)muestra 3

    d)muestra 4

    9. Indica cul de los siguientes incisos define mejor el concepto de estadsticadescriptiva

    a) parte de la estadstica que sirve para obtener inferencias de la poblacin a partirde los datos muestralesb) parte dela estadsticaque sirve para llevar acabo losdiseosde experimentosyarte de la estadstica que sirve para llevar a cabo los diseos de experimentos y

    poder tomar una decisinc) partedela estadsticaquesirve para describir la totalidad deelementosdeunaparte de la estadstica que sirve para describir la totalidad de elementos de una

    poblacin o muestrad) partedelaestadsticaquesirveparaestimar losparmetrosdeunapoblacin conparte de la estadstica que sirve para estimar los parmetros de una poblacin con

    base en un muestreo aleatorio

    8 5 2 10 10 9 4 7 1 3

    1 2 4 8 6 10 10 8 8 97 8 4 5 6 10 9 8 9 2

    10 10 9 8 9 2 8 4 8 6

    Muestra 1

    Muestra 2Muestra 3

    Muestra 4

  • 7/24/2019 Estad y Prob_5a_01

    37/40

    53

    Respuestas de los ejercicios

    Ejercicio 1

    1. media = 153.214; mediana = 150; moda = 150

    2. media = 3.533; mediana= 3.65media = 3.533; mediana = 3.65

    3. 3.4923.492

    4. 86.0886.08

    5. 10.42510.425

    Ejercicio 2

    1. rango = 35; varianza = 86.95

    2. 0.57850.5785

    3. 0.000630.00063

    Ejercicio 3

    1. a) [2.50, 3.64), [3.64, 4.78), [4.78, 5.92), [5.92, 7.06), [7.06, 8.20]

    b) media 4.704; varianza 1.922

    2.a) [228.9, 238.9), [238.9, 248.9), [248.9, 258.9]; frecuencias relativas: f

    1= 0.175,

    f2= 0.625, f

    3= 0.200; se tendr que reparar la mquina

    b) 244.15

    3. desviacin estndar = 6.12; se tendr que reparar la mquina

    4. [10.8, 15.4), [15.4, 20.0), [20.0, 24.6), [24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),, [15.4, 20.0), [20.0, 24.6), [24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),[15.4, 20.0), [20.0, 24.6), [24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),, [20.0, 24.6), [24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),[20.0, 24.6), [24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),, [24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),[24.6, 29.2), [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),, [29.2, 33.8), [33.8, 38.4), [38.4, 43.0),[29.2, 33.8), [33.8, 38.4), [38.4, 43.0),, [33.8, 38.4), [38.4, 43.0),[33.8, 38.4), [38.4, 43.0),, [38.4, 43.0),[38.4, 43.0),,

    [43.0, 47.6), [47.6, 52.2), [52.2,56.8]; media = 33.14; varianzasesgada=91.84, [47.6, 52.2), [52.2,56.8]; media =33.14; varianzasesgada=91.84[47.6, 52.2), [52.2,56.8]; media = 33.14; varianzasesgada=91.84, [52.2, 56.8];media =33.14; varianzasesgada=91.84[52.2, 56.8]; media=33.14; varianzasesgada=91.84; media = 33.14; varianza sesgada = 91.84

  • 7/24/2019 Estad y Prob_5a_01

    38/40

    54

    Ejercicio 4

    1.

    2.

    Respuestas de los ejercicios propuestos

    1. media = 17.875; mediana = 18; moda = 18; varianza insesgada = 19.7167

    2.

    3. media geomtrica = 17.3014

    4. media geomtrica = 22.6196

    5. media armnica = 119.1667

    6. media armnica = 105.5567

    7. media = 12.12; desviacin estndar = 0.3443

    8. rango = 28; longitud de clase = 2.8. Las clases y sus puntos medios se muestran enla tabla. Media= 56.212; varianzainsesgada= 61.263Media = 56.212; varianza insesgada = 61.263

    0

    4

    8

    12

    16

    20

    3.07 4.21 5.35 6.49 7.630

    4

    8

    12

    16

    20

    3.07 4.21 5.35 6.49 7.63

    10 11 16 18 19 20 22 24 26Frecuencia

    Valor116

    216

    216

    216

    216

    116

    116

    116

    416

  • 7/24/2019 Estad y Prob_5a_01

    39/40

    55

    9.

    10. mediana = 56.7; modelo asociado asimtrico posit ivo

    11. rango = 10; longitud de clase = 1.25. Las clases y sus puntos medios se muestran enla tabla. Media= 4.225; varianzainsesgada= 5.564Media = 4.225; varianza insesgada = 5.564

    1 146.4[45.0, 47.8)

    2

    3

    4

    5

    6

    7

    8

    9

    10

    6

    4

    1

    7

    14

    23

    14

    17

    13[47.8, 50.6)

    [50.6, 53.4)

    [53.4, 56.2)

    [56.2, 59.0)

    [59.0, 61.8)

    [61.8, 64.6)

    [64.6, 67.4)

    [67.4, 70.2)

    [70.2, 73.0]

    66.0

    68.8

    71.6

    63.2

    60.4

    57.6

    54.8

    52.0

    49.2

    0

    5

    10

    15

    20

    25

    46.4 49.2 52 54.8 57.6 60.4 63.2 66 68.8 71.6

  • 7/24/2019 Estad y Prob_5a_01

    40/40

    56

    12.

    13. grupo 1: media = 6.3 y varianza insesgada = 6.1896 grupo 2: media = 5.3 y varianza insesgada = 12.355 el grupo ms homogneo fue el 1

    Respuestas de la autoevaluacin

    1. d)

    2. b)

    3. b)

    4. c)

    5. a)

    6. a)

    7. d)

    8. c)

    9. c)

    02

    810

    15

    1921

    1411

    0.625 1.875 3.125 4.375 5.625 6.875 8.125 9.375