Estadistica Descriptiva

22

Transcript of Estadistica Descriptiva

  • Estadstica Descriptiva

    Por: SUREZ AZPUR, Fredy Rafael

    Abril de 2013

    1. Preliminares

    1.1. Terminologa estadstica

    Estadstica: Es la ciencia que proporciona un conjunto e mtodos que se utilizan para recolectar, resumir, clasicar e interpretar

    el comportamiento de los datos con respecto a una caracterstica materia de estudio o investigacin. En primera instancia

    se encarga de obtener informacin, describirla y luego utiliza esta informacin para predecir algo respecto a la fuente de

    informacin

    La estadstica descriptiva: Es el conjunto de mtodos que implican la recoleccin, presentacin y caracterizacin de un

    conjunto de datos a n de describir en forma apropiada las diversas caractersticas de sta, es decir, un estudio estadstico

    se considera descriptivo cuando solo se analiza y describe los datos.

    Es una gran parte de la estadstica que se dedica a analizar y representar los datos. Este anlisis es muy bsico. Aunque

    hay tendencia a generalizar a toda la poblacin, las primeras conclusiones obtenidas tras un anlisis descriptivo, es un

    estudio calculando una serie de medidas de tendencia central, para ver en qu medida los datos se agrupan o dispersan

    en torno a un valor central. FUENTE http://es.wikipedia.org/

    Estadstica inferencial: Luego de describir, el segundo aspecto de la denicin de la estadstica es: predecir algo con respecto

    a la fuente de informacin, es lo que constituye la estadstica inferencia que es el conjunto de tcnicas que posibilitan la

    generalizacin o toma de decisiones en base a una informacin parcial obtenida mediante tcnicas descriptivas.

    Poblacin: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten informacin sobre el fenmeno que

    se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la poblacin ser el total de las viviendas

    de dicha ciudad.

    Muestra: Subconjunto que seleccionamos de la poblacin. As, si se estudia el precio de la vivienda de una ciudad, lo normal

    ser no recoger informacin sobre todas las viviendas de la ciudad (sera una labor muy compleja), sino que se suele

    seleccionar un subgrupo (muestra) que se entienda que es sucientemente representativo. El proceso y/o tcnica de

    obtencin de la muestra a partir de la poblacin se denomina muestreo.

    Unidad de anlisis: Cualquier elemento que porte informacin sobre el fenmeno que se estudia. As, si estudiamos la altura

    de los nios de una clase, cada alumno es una unidad de anlisis; si estudiamos el precio de la vivienda, cada vivienda es

    una unidad de anlisis.

    Variable: Es una caracterstica que puede tomar varios valores. Las variables son caractersticas observables, susceptibles a

    tomar distintos valores o ser expresados en varias categoras. Variable es un aspecto especco de la realidad referido a la

    unidad de anlisis y que puede ser susceptible a ser medido o cuanticado, adquiere un valor determinado en cada unidad

    de anlisis

    Dato: Es el valor o respuesta que adquiere la variable en cada unidad de anlisis. Dato es el resultado de la observacin,

    entrevista o recopilacin en general, ellos son la materia prima de la estadstica

    Clasicacin de las variables

    Segn la naturaleza:

    1. Variables cualitativas: Cuando expresan una cualidad, caracterstica o atributo, tiene carcter cualitativo, sus datos se

    expresan mediante una palabra y no es numrico, por ejemplo Estado civil, colores, lugar de nacimiento, profesin, etc;

    stas se clasican a su vez en:

    1

  • Estadstica Descriptiva

    a) Variable nominal: Aquellas que establecen la distincin de los elementos en categoras sin implicar el orden entre ellas

    b) Variable ordinal: son aquellas que agrupan a los individuos en categoras ordenadas, para establecer relaciones compar-

    ativas, por ejemplo clasicar personas por su habito de fumar (no fumadores, fumadores leves, fumadores moderados,

    fumadores severos) o clasicar a un grupo de individuos de acuerdo a su grado de instruccin (analfabeto, primaria,

    secundaria, superior).

    2. Variables cuantitativas: Cuando el valor de la variable se expresa por una cantidad, es de carcter numrico, el dato puede

    resultar de la operacin de medir o contar, stas se clasican a su vez en:

    a) Variable discreta: Cuando el valor de la variable resulta de la operacin de contar, su valor esta expresado por nmeros

    enteros positivos.

    b) Variable continua: Cuando la variable es susceptible a medirse, su valor se obtiene por medicin o comparacin con

    una unidad o patrn de medida, pueden tener su valor dentro de un rango o recorrido, por tanto su valor se expresa

    por un nmero real.

    Segn el nmero de variables:

    1. Variables unidimensionales,

    2. Variables bidimensionales,

    3. Variables Multidimensionales,

    Segn la escala de medicin:

    1. Variables nominales

    2. Variables ordinales

    3. Variables de intervalo

    4. Variables de razn o proporcin

    Segn la relacin entre variables:

    1. Variables dependientes

    2. Variables independientes

    Elementos de una variable

    a) Nombre o denominacin de la variable,

    b) Denicin o conceptualizacin de la variable,

    c) Un conjunto de categoras o niveles, que es denida por el investigador. Las categoras no son nicas, lo mnimo es dos

    categoras y depende de los objetivos de investigacin,

    d) Procedimiento para la obtencin de los datos y categorizar o agrupar las unidades de anlisis,

    e) Algunas medidas de resumen.

    Etapas de la investigacin estadstica

    1. Planeamiento o preparacin: Seleccin y determinacin de la poblacin o muestra y las caractersticas contenidas que se

    desean estudiar. En el caso de que se desee tomar una muestra, es necesario determinar el tamao de la misma y el tipo

    de muestreo a realizar (probabilstico o no probabilstico).

    2. Obtencin de los datos. Esta puede ser realizada mediante la observacin directa de los elementos, la aplicacin de

    encuestas y entrevistas, y la realizacin de experimentos.

    3. Clasicacin, tabulacin y organizacin de los datos. La clasicacin incluye el tratamiento de los datos considerados

    anmalos que pueden en un momento dado, falsear un anlisis de los indicadores estadsticos. La tabulacin implica el

    resumen de los datos en tablas y grcos estadsticos.

    4. Anlisis descriptivo de los datos. El anlisis se complementa con la obtencin de indicadores estadsticos como las medidas:

    de tendencia central, dispersin, posicin y forma.

    5. Anlisis inferencial de los datos. Se aplican tcnicas de tratamiento de datos que involucran elementos probabilsticos que

    permiten inferir conclusiones de una muestra hacia la poblacin (opcional).

    6. Elaboracin de conclusiones. Se construye el informe nal.

    UNSCH 2 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    2. Presentacin de datos

    2.1. Tabla de distribucin de frecuencias sin intervalos.

    Sean x1; x2; ; xn las n observaciones (datos) correspondientes a una variable cuantitativa X. Si el nmero de valoresdiferentes que asumen estos datos es muy pequeo en relacin al nmero de datos, los agruparemos en una tabla de distribucin

    de frecuencias sin intervalos. Sean y1; y2; ; ym los valores diferentes que asumen estos datos donde y1 < y2 < < ym,entonces la tabla de distribucin de frecuencias sin intervalos ser:

    i yi ni Ni Ni hi Hi H

    i 100hi 100Hi 100H

    i

    1 y1 n1 N1 N1 h1 H1 H

    1 100h1 100H1 100H

    1

    2 y2 n2 N2 N2 h2 H2 H

    2 100h2 100H2 100H

    2

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    m ym nm Nm Nm hm Hm H

    m 100hm 100Hm 100H

    m

    n 1 100

    A continuacin denimos las expresiones que estn en la tabla anterior.

    Definicin 1 La frecuencia absoluta simple ni correspondiente al valor yi es el nmero de observaciones iguales a yi.

    Definicin 2 La frecuencia absoluta acumulada menor que Ni correspondiente al valor yi es el nmero de observaciones

    menores o iguales a yi.

    Definicin 3 La frecuencia absoluta acumulada mayor que Ni correspondiente al valor yi es el nmero de observaciones

    mayores o iguales a yi.

    Definicin 4 La frecuencia relativa simple hi correspondiente al valor yi es la proporcin, con respecto del total, del nmero

    de observaciones iguales a yi.

    Definicin 5 La frecuencia relativa acumulada menor que Hi correspondiente al valor yi es la proporcin, con respecto del

    total, del nmero de observaciones menores o iguales a yi.

    Definicin 6 La frecuencia relativa acumulada mayor que Hi correspondiente al valor yi es la proporcin, con respecto del

    total, del nmero de observaciones mayores o iguales a yi.

    Definicin 7 La frecuencia porcentual simple 100hi correspondiente al valor yi es el porcentaje de observaciones iguales a yi.

    Definicin 8 La frecuencia porcentual acumulada menor que 100Hi correspondiente al valor yi es el porcentaje de observa-

    ciones menores o iguales a yi.

    Definicin 9 La frecuencia porcentual acumulada mayor que 100Hi correspondiente al valor yi es el porcentaje de observa-

    ciones mayores o iguales a yi.

    Propiedades de las frecuencias:

    1. Para cada i = 1; 2; ;m: ni es un nmero entero y positivo pero inferior al nmero total de datos.2. Para cada i = 1; 2; ;m: Ni es un nmero entero y positivo.3. Para cada i = 1; 2; ;m: Ni es un nmero entero y positivo.4. Por denicin para cada i = 1; 2; ;m tenemos Ni = n1 + n2 + + ni, de donde

    N1 = n1,

    N2 = n1 + n2 = N1 + n2,

    N3 = n1 + n2 + n3 = N2 + n3,

    :.

    .

    .

    Nm = n1 + n2 + + nm = n.Por lo tanto: n1 = N1 < N2 < N3 < < Nm = n.

    UNSCH 3 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    5. Por denicin para cada i = 1; 2; ;m tenemos Ni = ni + ni+1 + + nm, de dondeN1 = n1 + n2 + + nm = n,N2 = n2 + n3 + + nm,N3 = n3 + n4 + + nm,:.

    .

    .

    Nm = nm.

    Por lo tanto: n = N1 > N2 > N

    3 > > Nm = nm.6. De la denicin resultan hi =

    nin, Hi =

    Niny Hi =

    Nin

    7. Para cada i = 1; 2; ;m: 0 < hi < 1, 0 < Hi 1, 0 < Hi 1.8. Por denicin para cada i = 1; 2; ;m tenemos Hi = h1 + h2 + + hi, de donde

    H1 = h1, H2 = h1 + h2, H3 = h1 + h2 + h3, , Hm = h1 + h2 + + hm = 1.Por lo tanto: h1 = H1 < H2 < H3 < < Hm = 1.9. Por denicin para cada i = 1; 2; ;m tenemos Hi = hi + hi+1 + + hm, de donde

    H1 = h1 + h2 + + hm = 1, H2 = h2 + h3 + + hm, H3 = h3 + h4 + + hm, , Hm = hm.Por lo tanto: 1 = H1 > H

    2 > H

    3 > > Hm = hm.10. Por denicin para cada i = 1; 2; ;m tenemos 100Hi = 100h1 + 100h2 + + 100hi, de donde

    100H1 = 100h1, 100H2 = 100h1 + 100h2, , 100Hm = 100h1 + 100h2 + + 100hm = 100.Por lo tanto: 100h1 = 100H1 < 100H2 < 100H3 < < 100Hm = 100.11. Por denicin para cada i = 1; 2; ;m tenemos 100Hi = 100hi + 100hi+1 + + 100hm, de donde

    100H1 = 100h1 + 100h2 + + 100hm = 100, 100H2 = 100h2 + 100h3 + + 100hm, , 100Hm = 100hm.Por lo tanto: 100 = 100H1 > 100H

    2 > 100H

    3 > > 100Hm = 100hm.

    Ejemplo 1 Sean los 50 datos correspondientes a una variable cuantitativa

    20 20 20 20 20 20 22 22 22 22

    22 22 22 23 23 23 23 23 23 23

    23 23 23 23 25 25 25 25 25 25

    25 25 25 25 25 25 25 27 27 27

    27 27 27 27 27 27 27 30 30 30

    Los valores diferentes de los datos son y1 = 20, y2 = 22, y3 = 23, y4 = 25, y5 = 27 y y6 = 30; agrupamos estos datos en una

    tabla de distribucin de frecuencias sin intervalos

    yi ni Ni Ni hi Hi H

    i 100hi 100Hi 100H

    i

    20 6 6 50 0.12 0.12 1 12 12 100

    22 7 13 44 0.14 0.26 0.88 14 26 88

    23 11 24 37 0.22 0.48 0.74 22 48 74

    25 13 37 26 0.26 0.74 0.52 26 74 52

    27 10 47 13 0.20 0.94 0.26 20 94 26

    30 3 50 3 0.06 1 0.06 6 100 6

    50 1 100

    Las frecuencias absolutas ni, Ni y Ni representan nmero de datos; las frecuencias relativas hi, Hi y H

    i representan proporcin

    de datos y las frecuencias porcentuales 100hi, 100Hi y 100Hi representan porcentaje de datos, interpretemos algunas de ellas

    1. n3 = 11: Signica que 11 datos son iguales a 23.

    2. n6 = 3: Signica que 3 datos son iguales a 30.

    3. n3 + n4 = 24: Signica que 24 datos son iguales como mnimo a 23 y como mximo a 25 (esto no signica que uno de

    ellos es igual a 24, menos, que la mitad son iguales a 23 y la otra mitad iguales a 25).

    4. N3 = 24: Signica que 24 datos son iguales como mnimo a 20 y como mximo 23.

    5. N3 = 37: Signica que 37 datos son iguales como mnimo a 23 y como mximo 30.

    6. h5 = 0;20 =1

    5: Signica que 1 de cada 5 datos son iguales a 27.

    UNSCH 4 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    7. h1 = 0;12 =3

    25: Signica que 3 de 25 datos son iguales a 20.

    8. H3 = 0;48 =12

    25: Signica que 12 de cada 25 datos son iguales como mnimo a 20 y como mximo a 23.

    9. H4 = 0;52 =13

    25: Signica que 13 de cada 25 datos son igules como mnimo a 25 y como mximo a 30.

    10. 100h5 = 20: Signica que el 20% de los datos son iguales a 27.

    11. 100h1 = 12: Signica que el 12% de los datos son iguales a 20.

    12. 100H3 = 48: Signica que el 48% de los datos son iguales como mnimo a 20 y como mximo a 23.

    13. 100H4 = 52: Signica que el 52% de los datos son iguales como mnimo a 25 y como mximo a 30.

    A continuacin presentamos los diagramas de barras o diagramas de bastones de las frecuencias simples correspondientes a la

    tabla anterior, si por ejemplo diseamos el diagrama de barras de las frecuencias absolutas simples, stas se disponen sobre

    el eje vertical (si dos frecuencias absolutas simples son iguales, solo se debe escribir una) y los valores diferentes de los datos

    sobre el eje horizontal, sobre cada valor que est en el eje horizonta dibujamos una barra vertical cuya altura debe ser igual a

    la frecuencia absoluta simple que le corresponde, tal como se aprecia en el siguiente diagrama sobre 20 una barra de altura 6,

    sobre 22 una barra de altura 7, sobre 27 una barra de altura 10, etc.

    0,06

    0,120,14

    0,20

    0,22

    0,26

    20 22 23 25 27 30

    DIAGRAMA DEBARRASDEFRECUENCIAS

    RELATIVASSIMPLES

    hi

    Proporcindedatos

    TITULO :(Debeserelmismosttulodelatabla)

    Valoresdiferentesdedatos

    3

    67

    10

    11

    13

    20 22 23 25 27 30

    DIAGRAMA DEBARRASDEFRECUENCIAS

    ABSOLUTASSIMPLES

    ni

    Nmerodedatos

    TITULO :(Debeserelmismosttulodelatabla)

    Valoresdiferentesdedatos

    20 22 23 25 27 30

    Valoresdiferentesdedatos

    0,06

    0,120,14

    0.20

    0,22

    0,26

    DIAGRAMA DEBARRASDEFRECUENCIAS

    PORCENTUALESSIMPLES

    100hi

    Porcentajededatos

    TITULO :(Debeserelmismosttulodelatabla)

    UNSCH 5 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    2.1.1. Tabla de distribucin de frecuencias para datos de variable cualitativa.

    Si los datos x1; x2; ; xn corresponden a una variable cualitativa X y los valores diferentes que asumen estos datos sonCaracterstica1, Caracterstica2, , Caractersticam; que no son nmeros entonces la tabla de distribucin de frecuencias ser:

    i Caractersticas ni hi 100hi%

    1 Caracterstica1 n1 h1 100h1

    2 Caracterstica2 n2 h2 100h2

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    m Caractersticam nm hm 100hm

    n 1 100%

    En este tipo de tablas no guran las frecuencias acumuladas pues no representan nada, y para elaborar su diagrama de barras

    de las frecuencias se procede del mismo modo que para variables cuantitativas.

    Ejemplo 2 Sean los datos correspondientes a las nacionalidades de los 40 participantes del Tercer Seminario Internacional de

    Fsica Cuntica

    P P P P P P B B B B

    B B B Br Br Br Br Br Br Br

    E E E E E E E E E F

    F F F F Ru Ru Ru Ru Ru Ru,

    donde P: Peruano, B: Boliviano, Br: Brasileo, E: Espaol, F: Francs y Ru: Ruso, la tabla de distribucin de frecuencias para

    estos datos es

    i Nacionalidad ni hi 100hi

    1 Peruano 6 0,150 15

    2 Boliviano 7 0,175 17,5

    3 Brasileo 7 0,175 17,5

    4 Espaol 9 0,225 22,5

    5 Francs 5 0,125 12,5

    6 Ruso 6 0,150 15

    40 1 100

    y los diagramas de barras de las frecuencias simples son

    DIAGRAMA DEBARRASDEFRECUENCIASRELATIVASSIMPLES

    hi

    Proporcindeparticipantes

    TITULO :ParticipantesdelTercerSeminarioInternacionaldeFsicaCunticasegnnacionalidades

    Nacionalidades

    Peru

    ano

    Boliv

    iano

    Bra

    sile

    o

    Espaol

    Fra

    nces

    Ruso

    0,225

    0,175

    0,125

    0,15

    DIAGRAMA DEBARRASDEFRECUENCIASABSOLUTASSIMPLES

    ni

    Nmerodeparticipantes

    TITULO :ParticipantesdelTercerSeminarioInternacionaldeFsicaCunticasegnnacionalidades

    Nacionalidades

    Peru

    ano

    Boliv

    iano

    Bra

    sile

    o

    Espaol

    Fra

    nces

    Ruso

    9

    7

    5

    6

    UNSCH 6 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    DIAGRAMA DEBARRASDEFRECUENCIASPORCENTUALESSIMPLES

    100hi

    Porcentajedeparticipantes

    TITULO :ParticipantesdelTercerSeminarioInternacionaldeFsicaCunticasegnnacionalidades

    Nacionalidades

    Peru

    ano

    Boliv

    iano

    Bra

    sile

    o

    Espaol

    Fra

    nces

    Ruso

    22,5

    17,5

    12,5

    15

    2.2. Tabla de distribucin de frecuencias con intervalos.

    Sean x1; x2; ; xn las n observaciones (datos) correspondientes a una variable cuantitativa X. Si el nmero de valoresdiferentes que asumen estos datos no es muy pequeo en relacin al nmero de datos, los agruparemos en una tabla de distribu-

    cin de frecuencias con intervalos (tambin llamados clases) todos ellos de la misma amplitud (longitud) y del tipo [y0i1; y0ii aexcepcin del primero y el ltimo que tendrn formas particulares de acuerdo a la ampliacin del recorrido de la variable. A

    continuacin presentamos los

    2.2.1. Pasos para la elaboracin de una tabla de distribucin de frecuencias con intervalos:

    1. Hallar el mnimo y mximo: El mnimo y mximo valor de los datos que son denidos respectivamente por:

    xmn

    = mnfx1; x2; ; xng y xmx

    = maxfx1; x2; ; xng:

    Es obvio que xmn

    < xmx

    , por tanto xmx

    xmn

    > 0

    2. Hallar el rango y su amplitud: El intervalo [xmn

    ;xmx

    ] es el rango o recorrido de la variable, y contiene a todos los

    datos; su longitud

    ` = xmx

    xmn

    es denominado amplitud del recorrido de la variable.

    3. Hallar la amplitud de cada intervalo: Sim representa el nmero de intervalos que tendra la tabla, entonces la amplitud

    de cada intervalo es c =`

    m

    4. Presentar los intervalos: El rango queda dividido en m intervalos y son

    [y00; y01i ; [y01; y02i ; ; [y0i1; y0ii ; ; [y0m1; y0m];

    donde y00 = xmn

    ; y01 = y00 + c; y

    02 = y

    01 + c; ; y0m = xmx

    y 0

    y 1

    y1

    y 2

    y2

    y i-1 y i

    yi

    y m-1

    y m

    ym

    Definicin 10 La marca de clase del intervalo [y0i1; y0ii es su punto medio yi = y

    0i1 + y

    0i

    2, representa a todos los datos que

    estn en esta clase y es utilizado para el clculo de algunos estadgrafos como la media aritmtica, desviacin tpica, etc.

    Luego de culminar con el paso 4, la tabla tendr la siguiente forma

    UNSCH 7 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    i [y0i1 y0ii yi ni Ni Ni hi Hi Hi 100hi 100Hi 100Hi1 [y00 y01i y1 n1 N1 N1 h1 H1 H1 100h1 100H1 100H12 [y01 y02i y2 n2 N2 N2 h2 H2 H2 100h2 100H2 100H2.

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    .

    m [y0m1 y0m] ym nm Nm Nm hm Hm Hm 100hm 100Hm 100Hmn 1 100

    A continuacin denimos las expresiones que estn en la tabla anterior.

    Definicin 11 La frecuencia absoluta simple ni correspondiente a la clase [y0i1 y0ii es el nmero de observaciones que estnen esta clase.

    Definicin 12 La frecuencia absoluta acumulada menor que Ni correspondiente a la clase [y0i1 y0ii es el nmero deobservaciones que estn en esta clase y las anteriores a ella.

    Definicin 13 La frecuencia absoluta acumulada mayor que Ni correspondiente a la clase [y0i1 y0ii es el nmero deobservaciones que estn en esta clase y las posteriores a ella.

    Definicin 14 La frecuencia relativa simple hi correspondiente a la clase [y0i1 y0ii es la proporcin, con respecto del total,del nmero de observaciones que estn en esta clase.

    Definicin 15 La frecuencia relativa acumulada menor que Hi correspondiente a la clase [y0i1 y0ii es la proporcin, conrespecto del total, del nmero de observaciones que estn en esta clase y las anteriores a ella.

    Definicin 16 La frecuencia relativa acumulada mayor que Hi correspondiente a la clase [y0i1 y0ii es la proporcin, conrespecto del total, del nmero de observaciones que estn en esta clase y las posteriores a ella.

    Definicin 17 La frecuencia porcentual simple 100hi correspondiente a la clase [y0i1 y0ii es el porcentaje de observacionesque estn en esta clase.

    Definicin 18 La frecuencia porcentual acumulada menor que 100Hi correspondiente a la clase [y0i1 y0ii es el porcentajede observaciones que estn en esta clase y las anteriores a ella.

    Definicin 19 La frecuencia porcentual acumulada mayor que 100Hi correspondiente a la clase [y0i1 y0ii es el porcentajede observaciones que estn en esta clase y las posteriores a ella.

    Observaciones:

    1. Las frecuencias cumplen las mismas propiedades de las frecuencias para tablas de distribucin sin intervalos.

    2. Una de las frecuencias absolutas simples puede ser igual a cero.

    3. Una observacin xi pertenece solo a un intervalo y no puede estar en dos a la vez.

    Como elegir el nmero de intervalos: El valor de m, que representa el nmero de intervalos, se puede determinar de varias

    maneras

    Un nmero entero arbitrario m tal que 5 m 16. Cuanto mayor sea el nmero de intervalos, los estadgrafos calculadosa partir de la tabla, son ms prximos al valor que se calculara si los datos no estuvieran agrupados.

    Un mtodo muy utilizado consiste en la aplicacin de la Regla de Sturges

    1

    : m = 1+3;3 log n, el valor de m no es siempre

    entero, entonces hay necesidad de elegir un entero ms prximo a este valor.

    De acuerdo a la clasicacin que requiera la variable o la forma en que se ha venido presentando la informacin

    Algunos utilizan un procedimiento, no muy recomendado, calculando m mediante la frmula m =pn.

    1

    La regla de Sturges, propuesta por Herbert Sturges en 1926, es una regla prctica acerca del nmero de clases que deben considerar al

    elaborarse un histograma. Este nmero viene dado por la siguiente expresin: m = 1 + log2N , donde N es el tamao de la muestra que

    puede pasarse a logaritmo base 10 de la siguiente forma m = 1 + 3;3 logN : El valor de m (nmero de clases) es comn redondearlo al

    entero ms cercano. FUENTE: http://es.wikipedia.org/

    UNSCH 8 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    2.2.2. Eleccin del nmero de intervalos con la Regla de Sturges:

    Si x1; x2; ; xn son los n datos de una variable cuantitativa1. Halle xmn

    y xmx

    , entonces ` = xmx

    xmn

    es la amplitud del rango de la variable

    2. Segn la Regla de Sturges el nmero de intervalos a considerarse se calcula con m = 1 + 3;3 log n, dado que este nmero no

    siempre resulta entero, elegimos como el nmero de intervalo a uno de los enteros prximos a m.

    a) Si m es redondeado por defecto a m0, entonces la amplitud de cada subintervalo ser c =`

    m0, este valor de c debe ser

    redondeado por exceso a c0, el valor ampliado de ` es `0 = c0m0 y el error de ampliacin es e = `0 `.b) Si m es redondeado por exceso a m0, entonces la amplitud de cada subintervalo ser c =

    `

    m0, este valor de c debe ser

    redondeado por exceso a c0, el valor ampliado de ` es `0 = c0m0 y el error de ampliacin es e = `0 `.c) Entonces elegimos como nmero de intervalos a aquel valor redondeado de m que genera el menor error de ampliacin;

    pero si en ambos casos tenemos el mismo error de ampliacin el nmero de intervalos ser el valor redondeado por

    exceso de m.

    3. Con los redondeos ampliamos los valores mximo y mnimo de los datos del siguiente modo

    Si e es impar x0mn

    = xmn

    e 12

    y x0mx

    = xmx

    +

    e+ 1

    2

    Si e es par x0mn

    = xmn

    e2y x0mx

    = xmx

    +e

    2

    Los intervalos que estarn en la tabla son

    hy00; y01i ; [y01; y02i ; ; [y0i1; y0ii ; ; [y0m1; y0mi; o [y00; y01i ; [y01; y02i ; ; [y0i1; y0ii ; ; [y0m1; y0mi;

    donde y00 = x0mn

    ; y01 = y00 + c; y

    02 = y

    01 + c; ; y0m = x0mx

    Ejemplo 3 Sean los datos x1; x2; ; xn con n = 200, xmn

    = 325 y xmx

    = 986.

    En este caso tenemos ` = 986 325 = 661, m = 1 + 3;3 log 200 = 8;59 : : :Si m0 = 8, entonces c =

    `

    m0=

    661

    8= 82;625, de donde c0 = 83. El rango ampliado es `0 = m0c0 = (8)(83) = 664 y el error

    de ampliacin es e = `0 ` = 664 661 = 3Si m0 = 9, entonces c =

    `

    m0=

    661

    9= 73;44 : : :, de donde c0 = 74. El rango ampliado es `0 = m0c0 = (9)(74) = 666 y el

    error de ampliacin es e = `0 ` = 666 661 = 5El redondeo por defecto m0 = 8 origina el menor error e = 3 lo cual indica que la tabla de distribucin tendr 8 intervalos todos

    ellos de amplitud 83, los valores ampliados del mximo y mnimo son

    x0mn

    = xmn

    e 12

    = 325

    3 12

    = 324 y x0mx

    = xmx

    +

    e+ 1

    2

    = 986 +

    3 + 1

    2

    = 988 y los intervalos sern

    h324 407i ; [407 490i ; [490 573i ; [573 656i ; [656 739i ; [739 822i ; [822 905i ; [905 988i

    Ejemplo 4 Sean los datos x1; x2; ; xn con n = 100, xmn

    = 325 y xmx

    = 725.

    En este caso tenemos ` = 725 325 = 400, m = 1 + 3;3 log 100 = 7;6Si m0 = 7, entonces c =

    `

    m0=

    400

    7= 57; 14 : : :, de donde c0 = 58. El rango ampliado es `0 = m0c0 = (7)(58) = 406 y el

    error de ampliacin es e = `0 ` = 406 400 = 6Si m0 = 8, entonces c =

    `

    m0=

    400

    8= 50, de donde c0 = 50. El rango ampliado es `0 = m0c0 = (8)(50) = 406 y el error de

    ampliacin es e = `0 ` = 400 400 = 0El redondeo por exceso m0 = 8 origina el menor error e = 0 lo cual indica que la tabla de distribucin tendr 8 intervalos todos

    ellos de amplitud 50, los valores ampliados del mximo y mnimo son

    x0mn

    = xmn

    e2= 325 0

    2= 325 y x0mx

    = xmx

    +e

    2= 725 +

    0

    2= 725 y los intervalos sern

    [325 375i ; [375 425i ; [425 475i ; [475 525i ; [525 575i ; [575 625i ; [625 675i ; [675 725]

    UNSCH 9 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    Ejemplo 5 Sean los datos x1; x2; ; xn con n = 80, xmn

    = 80 y xmx

    = 359.

    En este caso tenemos ` = 359 80 = 279, m = 1 + 3;3 log 80 = 7;28 : : :Si m0 = 7, entonces c =

    `

    m0=

    279

    7= 39;8 : : :, de donde c0 = 40. El rango ampliado es `0 = m0c0 = (7)(40) = 280 y el

    error de ampliacin es e = `0 ` = 280 279 = 1Si m0 = 8, entonces c =

    `

    m0=

    279

    8= 34;875, de donde c0 = 35. El rango ampliado es `0 = m0c0 = (8)(35) = 280 y el error

    de ampliacin es e = `0 ` = 280 279 = 1En ambos casos obtenemos el mismo error e = 1, elegimos la mayor cantidad de intervalos, lo cual indica que la tabla de

    distribucin tendr 8 intervalos todos ellos de amplitud 35, los valores ampliados del mximo y mnimo son

    x0mn

    = xmn

    e 12

    = 80

    1 12

    = 80 y x0mx

    = xmx

    +

    e+ 1

    2

    = 279 +

    1 + 1

    2

    = 360 y los intervalos sern

    [80 115i ; [115 150i ; [150 185i ; [185 220i ; [220 255i ; [255 290i ; [290 325i ; [325 360i

    2.3. Elaboracin de histogramas y polgonos de frecuencia

    En estadstica, un histograma es una representacin grca de una variable en forma de barras, donde la supercie de cada

    barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje

    horizontal los valores de las variables, normalmente sealando las clases y las marcas de clase. En trminos matemticos, puede

    ser denida como una funcin inyectiva (o mapeo) que acumula (cuenta) las observaciones que pertenecen a cada subintervalo

    de una particin. El histograma, como es tradicionalmente entendido, no es ms que la representacin grca de dicha funcin.

    Se utiliza cuando los datos de una variable se agrupan en intervalos

    Pasos para la elaboracin de histogramas de frecuencias En esta parte enunciamos los pasos para la elaboracin de

    histogramas para datos agrupados en una tabla de distribucin de frecuencia con intervalos todos ellos de la misma amplitud,

    cada uno de los tipos de frecuencia tienen su propio histograma, decir para una tabla en total son 9 histogramas

    1. Tener lista la tabla de distribucin de frecuencia con intervalos.

    2. Dibujar los ejes cartesianos, uno horizontal y el otro vertical.

    3. Sobre el eje horizontal representar todos los intervalos y sus respectivas marcas de clase que aparecen en la tabla. Estos

    tres primeros pasos son los mismos que se han de seguir cuando se elaboren los 9 histogramas que se va elaborar a partir

    de la tabla.

    4. Sobre el eje vertical representar las frecuencias (si por ejemplo se esta diseando el histograma de frecuencias absolutas

    simples ni entonces sobre el eje vertical sealamos los puntos que corresponden a estas frecuencias, si es que hubieran dos

    de ellas iguales en el grco solo se presenta una).

    5. Sobre cada intervalo dibujar un rectngulo cuyas altura debe ser igual a la frecuencia que le corresponde a dicho intervalo.

    Elaboracin de polgonos de frecuencias y ojivas

    1. Para histogramas de frecuencias simples: Ubicar los puntos medio de las bases superiores de cada rectngulo y unirlas

    consecutivamente con segmentos de recta obtenindose una poligonal, en el eje horizontal a la izquierda del mnimo ubicar

    el punto que est a la distancia c=2, luego unirla al primer punto de la poligonal anterior, nalmente en el eje horizontal

    a la derecha del mximo ubicar el punto que est a la distancia c=2, luego unirla al ltimo punto de la poligonal anterior

    obtenindose as el polgono de frecuencias

    2. Para histogramas de frecuencias acumuladas menor que: Ubicar los extremos derechos de las bases superiores de cada

    rectngulo, luego unirlas consecutivamente con segmentos de recta obtenindose una poligonal, nalmente en el eje

    horizontal ubicar el mnimo, luego unirla al primer punto de la poligonal anterior obtenindose as la ojiva menor que.

    3. Para histogramas de frecuencias acumuladas mayor que: Ubicar los extremos izquierdos de las bases superiores de cada

    rectngulo, luego unirlas consecutivamente con segmentos de recta obtenindose una poligonal, nalmente en el eje

    horizontal ubicar el mximo, luego unirla al ltimo punto de la poligonal anterior obtenindose as la ojiva mayor que.

    UNSCH 10 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    Ejemplo 6 La siguiente tabla corresponde a los salarios semanales en nuevos soles de todos los trabajadores de la constructora

    NEXT durante el ao 2011.

    Trabajadores de la constructora NEXT segn salarios semanales durante el ao 2011.

    i Salarios(S/.) yi ni Ni Ni hi Hi H

    i 100hi 100Hi 100H

    i

    1 [ 80 110i 95 5 5 50 0,10 0,10 1 10 10 1002 [110 140i 125 9 14 45 0,18 0,28 0,90 18 28 903 [140 170i 155 14 28 36 0,28 0,56 0,72 28 56 724 [170 200i 185 6 34 22 0,12 0,68 0,44 12 68 445 [200 230i 215 10 44 16 0,20 0,88 0,32 20 88 326 [230 260] 245 6 50 6 0,12 1 0,12 12 100 1250 1 100

    FUENTE: Ocina de personal de la constructora NEXT. .

    Vemos que la constructora NEXT posee 50 trabajadores, el salario mnimo y mximo es de 80 y 260 nuevos soles respectivamente.

    Las frecuencias ni, Ni y Ni representan nmero de trabajadores; hi, Hi y H

    i proporcin de trabajadores; 100hi, 100Hi y 100H

    i

    porcentaje de trabajadores, interpretemos algunas de ellas

    1. n3 = 14: Signica que 14 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/. 140 y

    menores a S/. 170.

    2. n4 + n5 = 16: Signica que 16 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/.

    170 y menores a S/. 230.

    3. N4 = 34: Signica que 34 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/. 80 y

    menores a S/. 200.

    4. N3 = 36: Signica que 36 trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales a S/. 140 y

    menores o iguales a S/. 260.

    5. h5 = 0; 20 =1

    5: Signica que 1 de cada 5 trabajadores de la constructora NEXT tienen salarios semanales mayores o

    iguales a S/. 200 y menores a S/. 230.

    6. H2 = 0; 28 =7

    25: Signica que 7 de cada 25 trabajadores de la constructora NEXT tienen salarios semanales mayores o

    iguales a S/. 80 y menores a S/. 140.

    7. H5 = 0; 32 =8

    25: Signica que 8 de cada 25 trabajadores de la constructora NEXT tienen salarios semanales mayores o

    iguales a S/. 200 y menores o iguales a S/. 260.

    8. 100h4 = 12: Signica que el 12% de los trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales

    a S/. 170 y menores a S/. 200.

    9. 100H3 = 56: Signica que el 56% de los trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales

    a S/. 80 y menores a S/. 170.

    10. 100H4 = 44: Signica que el 44% de los trabajadores de la constructora NEXT tienen salarios semanales mayores o iguales

    a S/. 170 y menores o iguales a S/. 260.

    A continuacin elaboramos los 9 histogramas que corresponden a la tabla anterior, en ellas adjuntamos los polgonos de fre-

    cuencias y las ojivas.

    UNSCH 11 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    14

    10

    9

    6

    5

    Nmerodetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIAS ABSOLUTASSIMPLES

    8011014017020023026065 275

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    Polgonodefrecuencias

    ni

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    34

    44

    50

    28

    14

    5

    Nmerodetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIAS ABSOLUTAS ACUMULADASMENORQUE

    80110140170200230260

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    OJIVA menorque

    Ni

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    36

    45

    50

    22

    16

    6

    Nmerodetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIAS ABSOLUTAS ACUMULADASMAYORQUE

    80110140170200230260

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    OJIVA mayorque

    N*i

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    0,28

    0,20

    0,18

    0,12

    0,10

    Proporcindetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIASRELATIVASSIMPLES

    8011014017020023026065 275

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    Polgonodefrecuencias

    hi

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    UNSCH 12 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    0,68

    0,88

    1

    0,56

    0,28

    0,10

    Proporcindetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIASRELATIVAS ACUMULADASMENORQUE

    80110140170200230260

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    OJIVA menorque

    Hi

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    0,72

    0,90

    1

    0,44

    0,32

    0,12

    Proporcindetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIASRELATIVAS ACUMULADASMAYORQUE

    80110140170200230260

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    OJIVA mayorque

    H*i

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    28

    20

    18

    12

    10

    Porcentajedetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIASPORCENTUALESSIMPLES

    8011014017020023026065 275

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    Polgonodefrecuencias

    100hi

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    68

    88

    100

    56

    28

    10

    Porcentajedetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIASPORCENTUALES ACUMULADASMENORQUE

    80110140170200230260

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    OJIVA menorque

    100Hi

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    72

    90

    100

    44

    32

    12

    Porcentajedetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIASPORCENTUALES ACUMULADASMAYORQUE

    80110140170200230260

    (S/.)

    TRABAJADORESDELA CONSTRUCTORA SEGNSALARIOSSEMANALESDURANTEEL AO2011

    NEXT

    OJIVA mayorque

    100H*i

    FUENTE: OficinadepersonaldelaconstructoraNEXT

    UNSCH 13 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    Distribuciones Simtricas: Una tabla de distribucin de frecuencias, con o sin intervalos, se dice que es simtrica con respecto

    a la frecuencia absoluta simple si ni = nmi+1 para cada i m2.

    Observaciones:

    1. Si una tabla de distribucin de frecuencias, con o sin intervalos, es simtrica con respecto a la frecuencia absoluta simple,

    entonces es simtrica con respecto a la frecuencia relativa simple y la frecuencia porcentual simple.

    2. Sea una tabla de distribucin de frecuencias, con o sin intervalos, con m = 7; para que sea simtrica con respecto a la

    frecuencia absoluta simple debe vericarse n1 = n7, n2 = n6 y n3 = n5.

    3. Sea una tabla de distribucin de frecuencias, con o sin intervalos, con m = 6; para que sea simtrica con respecto a la

    frecuencia absoluta simple debe vericarse n1 = n6, n2 = n5 y n3 = n4.

    4. Sea una tabla de distribucin de frecuencias, con o sin intervalos, con m = 9; para que sea simtrica con respecto a la

    frecuencia absoluta simple debe vericarse n1 = n9, n2 = n8, n3 = n7 y n4 = n6.

    5. Sea una tabla de distribucin de frecuencias, con o sin intervalos, con m = 8; para que sea simtrica con respecto a la

    frecuencia absoluta simple debe vericarse n1 = n8, n2 = n7, n3 = n6 y n4 = n5.

    Ejemplo 7 Presentamos algunas tablas de distribucin simtricas con respecto a sus frecuencias simples.

    i yi ni

    1 y1 n1

    2 y2 n2

    3 y3 n3 n1 = n7

    4 y4 n4 n2 = n6

    5 y5 n5 n3 = n5

    6 y6 n6

    7 y7 n7

    n

    DIAGRAMA DEBARRASDEFRECUENCIAS ABSOLUTASSIMPLES

    ni

    n1

    y y y y y y y1 2 3 4 5 6 7

    n n1 7=

    n2

    n n2 6=

    n3

    n n3 5=

    n4

    Nmero

    dedatos

    i [y0i1 y0ii yi ni1 [y00 y01i y1 n12 [y01 y02i y2 n23 [y02 y03i y3 n3 n1 = n74 [y03 y04i y4 n4 n2 = n65 [y04 y05i y5 n5 n3 = n56 [y05 y06i y6 n67 [y06 y07] y7 n7

    n

    HISTOORAMA DEFRECUENCIAS ABSOLUTASSIMPLES

    ni

    n1

    y y y y y y y y 0 1 2 3 4 5 6 7

    n n1 7=

    n2

    n n2 6=

    n3

    n n3 5=

    n4

    Nmero

    dedatos

    i yi ni

    1 y1 n1

    2 y2 n2

    3 y3 n3 n1 = n8

    4 y4 n4 n2 = n7

    5 y5 n5 n3 = n6

    6 y6 n6 n4 = n5

    7 y7 n7

    8 y8 n8

    n

    DIAGRAMA DEBARRASDEFRECUENCIAS ABSOLUTASSIMPLES

    ni

    n1

    y y y y y y y y1 2 3 4 5 6 7 8

    n n1 8=

    n2

    n n2 7=

    n3

    n n3 6=

    n n4 5=

    n4

    Nmero

    dedatos

    UNSCH 14 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    i [y0i1 y0ii yi ni1 [y00 y01i y1 n12 [y01 y02i y2 n23 [y02 y03i y3 n3 n1 = n84 [y03 y04i y4 n4 n2 = n75 [y04 y05i y5 n5 n3 = n66 [y05 y06i y6 n6 n4 = n57 [y06 y07i y7 n78 [y07 y08] y8 n8

    n

    n n1 8=

    n n2 7=

    n n3 6=

    n n4 5=

    HISTOGRAMA DEFRECUENCIAS ABSOLUTASSIMPLES

    ni

    n1

    y y y y y y y y y 0 1 2 3 4 5 6 7 8

    n3

    n2

    n4

    Nmero

    dedatos

    CUESTIONARIO

    1) Diga qu tipo de variable es cada una de las siguientes:

    a) Tiempo de servicio de los empleados de una empresa.

    b) Nmero de cheques girados diariamente por una empresa en un mes.

    c) Nmero de acciones comunes vendidas cada da en la bolsa de valores de Lima.

    d) Lugar de nacimiento de las personas que estudian en esta universidad.

    e) Nivel educativo de los habitantes del Per.

    f) Temperatura y humedad diaria de una ciudad.

    g) Edad, talla y masa de todos los integrantes de la seleccin peruana de futbol.

    h) Los salarios mensuales de los trabajadores de las empresas de una ciudad.

    i) Gasto mensual en alimentacin en un hogar durante un ao.

    j) Ocupacin de los padres y/o apoderados de los estudiantes de la I.E. Mariscal Cceres de Ayacucho.

    k) Grado de instruccin acadmica de los padres y/o apoderados de los estudiantes de la I.E. Mariscal Cceres de Ayacucho.

    l) Distrito de residencia de los trabajadores de una fbrica de la ciudad de Lima.

    m) Nacionalidad de los participantes en Londres 2012.

    n) Causas de Mortalidad en los ltimos 20 aos en una ciudad.

    2) Debido a la falta de personal de la empresa SMART, dedicada al servicio de mensajera, los trabajadores laboraron horas

    extras durante el ao 2010. El nmero de horas extras realizadas por 50 trabajadores de esta fueron:

    20 20 20 30 30 35 35 35 35 35 35 35 35 35 40 40 40 40 40 40

    40 40 50 50 50 50 50 50 50 50 50 55 55 55 55 55 55 55 60 60

    60 60 60 60 65 65 65 65 65 75

    a) Qu poblacin se ha considerado?. A qu variable corresponden los datos, seale el tipo?.

    b) Disee la tabla de distribucin de frecuencias sin intervalos de clase.

    c) Interprete algunos resultados obtenidos en la tabla de distribucin de frecuencias.

    d) Represente grcamente mediante un diagrama de barras, la distribucin obtenida en el item anterior

    3) A continuacin presentamos la cantidad de vehculos vendidos por todos los trabajadores de la importadora Nissan durante

    el verano 2012

    20 21 21 21 24 22 25 21 21 22 22 21 20 22 21 23 20 20 24 20

    24 23 24 25 22 26 25 23 23 23 25 24 25 21 21 26 26 24 26 20

    21 21 22 23 23 21 22 21 21 21

    a) Cul es la poblacin?, Cual es la muestra?.

    b) Cul es la variable?, De qu tipo es?.

    UNSCH 15 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    c) Construya una tabla de distribucin de frecuencias sin intervalos de clase.

    d) Represente grcamente mediante un diagrama de barras las frecuencias simples.

    e) Cuntos trabajadores vendieron 24 vehculos cada uno?.

    f) Cuntos trabajadores vendieron como mnimo 24 vehculos?.

    g) Cuntos trabajadores vendieron como mximo 24 vehculos?.

    h) Cuntos trabajadores vendieron como mnimo 22 y como mximo 25 vehculos?.

    i) Qu porcentaje de trabajadores vendieron 25 vehculos cada uno?.

    j) Qu porcentaje de trabajadores vendieron como mnimo 24 vehculos?.

    k) Qu porcentaje de trabajadores vendieron como mximo 23 vehculos?.

    l) Qu porcentaje de trabajadores vendieron como mnimo 21 y como mximo 24 vehculos?.

    4) Una fbrica de gaseosas proyecta lanzar al mercado un nuevo sabor. Se realiza un test de aceptacin de dicho sabor en una

    muestra de 40 nios, utilizando una escala de 10 puntos, para medir el grado de aceptacin. Los puntos obtenidos en los 40

    nios fueron

    3 6 8 7 4 5 5 6 6 7 6 7 3 8 7 6 5 4 6 7

    7 8 5 7 6 7 3 7 3 3 7 5 4 7 6 8 7 3 4 5

    La muestra estuvo compuesta por igual nmero de nios de ambos sexos de 5 a 12 aos de edad residentes en el barrio San

    Bernardo de la ciudad de Maracaibo.

    a) Cul es la poblacin?, Cul es la muestra?.

    b) Cul es la variable?, De qu tipo es?.

    c) Construya una tabla de distribucin de frecuencias.

    d) Cuntos nios calicaron con 4 puntos cada uno?.

    e) Cuntos nios calicaron con 5 puntos como mnimo?.

    f) Cuntos nios calicaron con 6 puntos como mximo?.

    g) Qu porcentaje de nios calicaron con 5 puntos como mximo?.

    h) Represente grcamente mediante un diagrama de barras las frecuencias simples.

    5) El Grupo Megatech-Ayacucho, importadora de computadoras, realiza un estudio sobre la preferencia de marcas de computa-

    doras porttiles de los docentes del Departamento Acadmico de Matemtica y Fsica, dicho estudio se realizo a un nmero

    determinado de docentes, obtenindose los siguientes datos

    Vaio Toshiba Samsung OTRAS Toshiba HP Samsung Vaio

    Toshiba Lenovo Vaio HP Apple Toshiba OTRAS HP

    Vaio Toshiba Lenovo Toshiba Acer Acer Acer OTRAS

    Toshiba Toshiba HP HP Samsung Acer Apple HP

    Lenovo Lenovo Toshiba Samsung Apple OTRAS Acer HP

    a) Cul es la poblacin?, Cul es la muestra?.

    b) Cul es la variable?, De qu tipo es?.

    c) Construya una tabla de distribucin de frecuencias.

    d) Represente grcamente mediante un diagrama de barras las frecuencias simples.

    6) Se realiza un estudio en la ciudad de Guayaquil a 150 familias de clase media, para conocer el tipo de aceite o manteca

    usados en la cocina. Los resultados son los siguientes: Maz, 14 hogares; Soya 65, hogares; Ajonjol, 21 hogares; Pescado, 10

    hogares; Manteca de cerdo, 21 hogares; Grasa de origen vegetal, 6 hogares; Oliva, 13 hogares.

    a) Cul es la poblacin?, Cul es la muestra?, Cul es la variable?, De qu tipo es?.

    b) Construya una tabla de distribucin de frecuencias.

    c) Represente grcamente mediante un diagrama de barras las frecuencias simples.

    UNSCH 16 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    7) Las nacionalidades de todos los participantes en el 1er Seminario Internacional de Fsica realizado en la UNI en el ao 2010

    son los siguientes:

    x1 = C, x2 = B, x3 = P , x4 = E, x5 = P , x6 = Pa

    x7 = P , x8 = V , x9 = C, x10 = B, x11 = P , x12 = Ch

    x13 = P , x14 = C, x15 = E, x16 = P , x17 = B, x18 = B

    x19 = V , x20 = Pa, x21 = Ch, x22 = B, x23 = P , x24 = C

    x25 = C, x26 = E, x27 = P , x28 = P , x29 = P , x30 = V

    x31 = P , x32 = V , x33 = Ch, x34 = C, x35 = P , x36 = V

    x37 = P , x38 = V , x39 = Ch, x40 = C,

    Donde:

    B: Boliviano C: Colombiano E: Ecuatoriano Pa: Paraguayo

    P: Peruano V: Venezolano Ch: Chileno

    Agrupe los datos en una tabla de distribucin de frecuencias, luego interprete todas las frecuencias.

    8) El seor Robles, al llegar a su vejez, decide adaptarse a los tiempos modernos, adquiriendo un telfono mvil. Transcurrido

    un mes, la compaa de telfonos le remite el siguiente detalle de las llamadas efectuadas durante ese periodo.

    duracin en minutos Llamadas a mviles Llamadas a jos Llamadas al extranjero

    < 00 10] 3 2 1< 10 20] 10 25 0< 20 30] 25 10 0El precio por llamadas a mviles es de 0.12 euros, a jos 0.15 euros y 0.8 euros al extranjero.

    a) Elabore la tabla de distribucin de frecuencias para llamadas a mviles y para llamadas a jos.

    b) Calcule el monto que pagar por todas las llamadas a telfonos jos.

    c) Calcule el monto que pagar por todas las llamadas a telfonos mviles.

    d) Cuntas llamadas a telfonos mviles son superiores a 15 minutos por llamada?.

    e) Cuntas llamadas a telfonos jos son inferiores a 18 minutos por llamada?.

    9) Los sueldos mensuales (en euros) de 60 empleados de la empresa Pirmide S.A. durante el ao 1998 son los siguientes:

    440 560 335 587 613 400 424 466 565 393

    453 650 407 376 470 560 321 500 528 526

    570 430 618 537 409 600 550 432 591 428

    440 340 558 460 560 607 382 667 512 492

    450 530 501 471 660 470 364 634 580 450

    574 500 462 380 518 480 625 507 645 382

    Agrupe los datos en una tabla de distribucin de frecuencias, calcule el nmero de clases empleando la Regla de Sturges,

    interprete todas las frecuencias

    10) Un nuevo hotel va a abrir sus puertas en Huamanga. Antes de decidir el precio de sus habitaciones, el gerente investiga los

    precios por habitacin de 40 hoteles de esta ciudad. Los datos obtenidos en dlares fueron:

    39 47 37 56 43 49 50 61 51 45 53 39 43 50 60 47 51 42 44 58

    33 43 41 58 44 48 63 43 53 45 40 54 39 47 33 45 47 42 45 48

    a) Cul es la poblacin objeto de estudio?.

    b) Qu variable estamos estudiando? Qu tipo de variable es?.

    c) Construya la tabla de frecuencias con intervalos de amplitud igual a 5 dlares.

    d) Cunto hoteles tienen un precio por habitacin entre 35,5 y 40,5 dlares?.

    e) Cunto hoteles tienen un precio por habitacin superior a 50,5 dlares?.

    f ) Qu porcentaje de hoteles tienen un precio por habitacin inferior a 45,5 dlares?.

    UNSCH 17 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    11) Suponiendo que se pierden todos los exmenes de estadstica, pero se recuerdan que las 120 notas tenan una distribucin

    simtrica con 7 intervalos de clase de igual amplitud. Adems en los archivo se encuentra la siguiente informacin:

    100h1% = 5%, 100h3% = 15%, 100H3 = 85%,

    7Xi=3

    yi = 400, y4 = 72.

    a) Reconstruya la tabla de distribucin de frecuencias.

    b) Si para aprobar el examen se necesita por lo menos 70 puntos, Cuntos desaprobaron aquel examen?

    12) La siguiente informacin se reere a las masas (en kg) de los 50 ingresantes a la EFP de Economa en el Examen de Admisin

    del 2008: m = 6, y01 = 41, y04 = 59, 100h2 = 10, 100H1 = 6, h4 = 0;30, N3 = 21, 100h5 = 22.

    a) Elabore su respectiva tabla de distribucin de frecuencias.

    b) Dibuje el histograma de frecuencias absolutas simples y el polgono de frecuencias.

    c) Dibuje el histograma de frecuencias absolutas acumuladas menor que y la ojiva.

    d) Dibuje el histograma de frecuencias absolutas acumuladas mayor que y la ojiva.

    e) Dibuje el histograma de frecuencias relativas simples y el polgono de frecuencias.

    f ) Dibuje el histograma de frecuencias relativas acumuladas menor que y la ojiva.

    g) Dibuje el histograma de frecuencias relativas acumuladas mayor que y la ojiva.

    h) Dibuje el histograma de frecuencias porcentuales simples y el polgono de frecuencias.

    i) Dibuje el histograma de frecuencias porcentuales acumuladas menor que y la ojiva.

    j ) Dibuje el histograma de frecuencias porcentuales acumuladas mayor que y la ojiva.

    13) El siguiente histograma incompleto se reere a los salarios semanales (en dlares) de todos los trabajadores de la empresa

    SONY

    8079

    76

    61

    44

    24

    11

    Nmerodetrabajadores

    Salariossemanales

    HISTOGRAMA DEFRECUENCIAS

    ABSOLUTAS ACUMULADAS

    90 105

    ($)

    a) A partir de ello Construya la tabla de distribucin de frecuencias, si los intervalos de clase tienen todas la misma

    amplitud.

    b) Calcule e interprete n4 + n5, n2 +N3 , 100H5%+ 100h6%.

    UNSCH 18 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    14) De un examen realizado a un grupo de alumnos, cuyas notas se han evaluado del 1 al 8, se ha obtenido la siguiente tabla de

    distribucin de frecuencias:

    Notas ni Ni Ni hi Hi H

    i 100hi 100Hi 100H

    i

    1 4 0,08

    2 4

    3 16 0,16

    4 7 0,14

    5 5 28

    6 38

    7 7 0,14

    8

    Se pide:

    a) Rellenar la tabla estadstica.

    b) Nmero de alumnos que se han examinado.

    c) Nmero de alumnos que han obtenido una nota superior a 3.

    d) Porcentaje de alumnos que han sacado una nota igual a 6.

    e) Porcentaje de alumnos que han obtenido una nota superior a 4.

    f ) Nmero de alumnos que han obtenido una nota superior a 2 e inferior a 5.

    15) Una fbrica empaqueta en lotes de 100 unidades los tornillos que produce. Se establece un plan de inspeccin por muestreo

    consistente en examinar, de cada lote, 20 tornillos elegidos al azar y rechazar el lote si de los 20 aparecen ms de 4 defectuosos;

    almacenar el lote como revisable si el nmero de defectuosos es menor que 5 pero mayor que 1, y aceptarlo en otro caso.

    Se inspeccionan 64 lotes y resulta el siguiente nmero de tornillos defectuosos de cada uno:

    1 2 4 3 2 0 9 2 0 2 0 0 4 3 0 2 0 1 6 5 2 0 0 1 0 3

    2 0 7 1 4 3 0 2 1 0 4 3 0 7 1 0 0 3 2 0 1 0 5 2 0 1

    0 7 4 0 2 9 4 3 0 1 3 2

    a) Construye la tabla de frecuencias absolutas, relativas y porcentuales del resultado de la inspeccin.

    b) Dibuja el diagrama de barras de frecuencias simples para los resultados de la inspeccin.

    Agrupa los resultados por lotes: Rechazados, revisables y aceptados y:

    c) Construye la tabla de frecuencias para los lotes.

    d) Determina la proporcin de lotes rechazados.

    e) Representa la distribucin de frecuencias mediante un diagrama.

    f ) Comenta las diferencias entre los resultados de los apartados b) y e).

    16) Las estaturas (en centmetros) de los socios de un club juvenil de Pker de Panam, son:

    153 123 129 132 147 138 137 134 131 147 138 128 134 148 125 139 146 145 148 135

    152 128 146 143 138 138 122 146 137 151 145 124 132 138 144 141 137 146 138 146

    152 136 160 159 157 150 160 142 148 130

    a) Agruparlas en una tabla de distribucin de frecuencias con 6 intervalos, luego elaborar los histogramas de frecuencia

    relativas.

    b) Qu porcentaje de jvenes tienen tallas superiores a 150cm?.

    c) Qu porcentaje de jvenes tienen tallas inferiores a 140cm?.

    17) Con los siguientes datos, correspondientes a los saldos (en miles de dlares) de cuentas pendientes

    77 70 65 62 53 78 41 48 74 63 34 38 69 79 76 55 59 69 78 75

    68 56 61 41 83 54 49 68 48 64 84 74 68 73 69 31 69 78 64 34

    Elabore la tabla de distribucin de frecuencia utilizando la regla de Sturges, luego determine c, y3, y5, H4 y N5.

    UNSCH 19 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    18) En una investigacin realizada a 800 empresas sobre valor de las ventas, en una quincena, se obtuvo la siguiente distribucin

    ventas($) Proporcin de empresas

    [18 28i 0,30[28 48i 0,25[48 98i 0,20[98 148i 0,15[148 198] 0,10se pide

    a) Elaborar una tabla de distribucin de frecuencia con 6 intervalos de igual amplitud.

    b) De la tabla anterior Cuntas empresas venden ms de 138mil dlares?

    c) Elabore los histogramas de frecuencia porcentuales a partir de la tabla hallada en a)

    19) Con los siguientes datos correspondientes al nmero de retrasos (en la maana) por parte de los empleados del Banco de la

    Nacin

    2 5 0 0 6 3 5 0 0 2 7 4 4 2 3 7 4 3 3 1

    3 2 3 2 4 2 2 3 1 3 2 0 0 1 4 2 2 0 3 5

    Se pide elaborar una tabla de frecuencias y los diagramas de frecuencia simples correspondientes.

    20) Segn la Asociacin de lucha contra la Bulimia y la Anorexia, las pautas culturales han determinado que la delgadez sea

    sinnimo de xito social. Muchos jvenes luchan para conseguir el fsico ideal motivados por modelos, artistas o por la

    publicidad comercial. Durante el mes de marzo del ao 2006, en el colegio Alcntara de la ciudad de Talca, despus de las

    vacaciones de verano, se observ con precaucin a 27 alumnos con sntomas de anorexia, registrndose los siguientes signos

    visibles:

    Dieta Severa Miedo a Engordar Hiperactividad Uso de Ropa Holgada Dieta Severa

    Miedo a Engordar Dieta Severa Uso de Ropa Holgada Dieta Severa Uso de Ropa Holgada

    Dieta Severa Dieta Severa Uso de Ropa Holgada Hiperactividad Uso de Laxantes

    Uso de Laxantes Dieta Severa Uso de Ropa Holgada Uso de Laxantes Hiperactividad

    Dieta Severa Uso de Laxantes Miedo a Engordar Uso de Laxantes Dieta Severa

    Uso de Ropa Holgada Hiperactividad

    a) Resuma la informacin anterior en una tabla de distribucin de frecuencias.

    b) Construya un grco adecuado para resumir la informacin anterior.

    21) La tabla muestra una distribucin de frecuencias de la duracin de 400 tubos de electricidad de radio comprobados en la

    L& M Tube Company.

    Duracin (horas) Nmero de tubos

    [300 400i 14[400 500i 46[500 600i 58[600 700i 76[700 800i 68[800 900i 62[900 1000i 48[1000 1100i 22[1100 1200i 6Completar la tabla para luego determinar:

    a) Lmite superior de la quinta clase.

    b) Lmite inferior de la octava clase.

    c) Marca de clase de la sptima clase.

    d) Tamao del intervalo de clase.

    e) Frecuencia de la cuarta clase.

    UNSCH 20 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    f ) Frecuencia relativa de la sexta clase.

    g) Porcentaje de tubos cuya duracin es menor a las 600 horas.

    h) Porcentaje de tubos cuya duracin es mayor o igual a 900 horas.

    i) Porcentaje de tubos cuya duracin es al menos de 500 horas pero menor de 1000 horas.

    j ) Construir un histograma y un polgono de frecuencias.

    k) Construir un histograma y un polgono de frecuencias relativas.

    l) Construir una ojiva porcentual.

    m) Estimar el porcentaje de tubos con duraciones de menos de 560 horas.

    n) Estimar el porcentaje de tubos con duraciones de 970 o ms horas.

    ) Estimar el porcentaje de tubos con duraciones entre 620 y 890 horas.

    22) En una empresa el personal (500 empleados) se distribuye de acuerdo con su actividad desarrollada en la misma, como se

    indica a continuacin en el siguiente diagrama de pastel:

    Profesional

    Tcnica

    Operario

    Ayudante

    Aseo2%

    10%

    70%

    10%

    8%

    A partir de esta informacin construya la tabla de distribucin de frecuencias y sus diagramas de barras correspondientes.

    23) Los datos que se muestran a continuacin, son los cargos (en dlares) por los servicios de electricidad, agua y gas durante

    el mes de julio del 2000 para una muestra de 50 apartamentos de 3 habitaciones en Caracas.

    96 171 202 178 147 102 153 197 127 82

    157 185 90 116 172 111 148 213 130 165

    141 149 206 175 123 128 144 168 109 167

    95 163 150 154 130 143 187 166 139 149

    108 119 183 151 114 135 191 137 129 158

    Elaborar:

    a) Una tabla de distribucin de frecuencias, hallando el nmero de clases con la regla de Sturges.

    b) Un histograma y un polgono de frecuencias.

    c) Un histograma porcentual.

    d) Una ojiva.

    Determinar:

    a) El porcentaje de apartamentos cuyo gasto no llega a 139 dlares.

    b) El porcentaje de apartamentos cuyo gasto es mayor o igual a 158 dlares.

    c) El porcentaje de apartamentos cuyo gasto es al menos de 120 dlares, pero menor de 196 dlares.

    d) El porcentaje de apartamentos con gastos menores de 135 dlares.

    e) El porcentaje de apartamentos con gastos de 186 dlares o ms.

    f ) El porcentaje de apartamentos con gastos entre 140 y 184 dlares.

    UNSCH 21 Digitado en LATE

    X por: Surez Azpur, Fredy R.

  • Estadstica Descriptiva

    24) En Beverage Digest se informa que, con base en las ventas de 1998, las 5 marcas de refrescos que ms se vendieron fueron

    Coke Classic, Diet Coke, Dr.Pepper, Pepsi Cola y Sprite. La lista siguiente proviene de una muestra de 50 compras de esas

    marcas fue:

    Coke Classic Dr.Pepper Sprite Coke Classic Pepsi Cola Pepsi Cola Sprite

    Diet Coke Diet Coke Coke Classic Diet Coke Coke Classic Coke Classic Diet Coke

    Pepsi Cola Pepsi Cola Diet Coke Coke Classic Coke Classic Pepsi Cola Coke Classic

    Diet Coke Pepsi Cola Coke Classic Diet Coke Coke Classic Pepsi Cola Pepsi Cola

    Coke Classic Coke Classic Coke Classic Coke Classic Pepsi Cola Coke Classic Dr.Pepper

    Coke Classic Dr.Pepper Sprite Sprite Coke Classic Pepsi Cola Dr.Pepper

    Sprite Pepsi Cola Pepsi Cola Pepsi Cola Coke Classic Diet Coke Coke Classic

    Dr.Pepper

    a) Construir la tabla de distribucin de frecuencias.

    b) Construir una grca de barras y un diagrama de pastel.

    c) Qu porcentaje de las ventas tienen Pepsi Cola y Coke Classic?

    25) La siguiente informacin se reere al tiempo, en minutos, que han utilizado los usuarios del Banco de la Nacin Sede

    Huamanga durante el 12 de mayo de 2011 para llevar a cabo una operacin bancaria en ventanilla (el tiempo se midi desde

    que el usuario llega al banco hasta realizar la operacin bancaria):

    y02 = 46, y05 = 70, N1 = 12, H6 = 1, h1 = 0;04, H4 = 0; 74, 100H5 = 90, n2 = 2n1, 100h4 = 30.

    (a) Con esa informacin complete la siguiente tabla.

    i tiempo(min) yi ni Ni Ni hi Hi H

    i 100hi 100Hi 100H

    i

    (b) Si la atencin en aquel banco se considera BUENA cuando la operacin bancaria dura como menos de 40 minutos,

    cuantas personas atendidas durante ese da calican la atencin bancaria comoMALA.

    (c) Calcule el porcentaje de personas cuya operacin bancaria duro como mnimo 50 minutos.

    (d) De cuantas personas la operacin bancaria duro ms de una hora.

    UNSCH 22 Digitado en LATE

    X por: Surez Azpur, Fredy R.