Fundamentos de La Estadistica

48
José Luis Quintero FUNDAMENTOS DE ESTADÍSTICA DESCRIPTIVA Distribución de Frecuencias Estadística Descriptiva Medidas de Tendencia Central Diagrama de Caja y Bigotes Universidad Católica Andrés Bello Ingeniería en Telecomunicaciones Serie: Probabilidad y Estadística Medidas de Localización Medidas de Dispersión

description

estadistica

Transcript of Fundamentos de La Estadistica

  • Jos Luis Quintero

    FUNDAMENTOS DE ESTADSTICA DESCRIPTIVA

    Distribucinde

    Frecuencias

    EstadsticaDescriptiva

    Medidas de Tendencia

    Central

    Diagrama de Caja yBigotes

    Universidad Catlica Andrs BelloIngeniera en TelecomunicacionesSerie: Probabilidad y Estadstica

    Medidas de

    Localizacin

    Medidas de

    Dispersin

  • Jos Luis Quintero

    FUNDAMENTOS DE ESTADSTICA DESCRIPTIVA

    Distribucinde

    Frecuencias

    Universidad Catlica Andrs BelloAsignatura: Probabilidades

    Caracas, Octubre 2013

    EstadsticaDescriptiva

    Medidas de

    Localizacin

    Medidas de

    Dispersin

    Medidas de Tendencia

    Central

    Diagrama de Caja yBigotes

  • Jos Luis Quintero

    ROBABILIDADES (ITEL-30205)

    Tema 1. Fundamentos de Estadstica Descriptiva

    Distribucin de frecuencias y medidas de localizacin

    Lo malo de escribir libros es que se nos va la vida en rehacerlos

    Alfonso Reyes

    El presente material ha tenido un proceso de actualizacin permanente, iniciado ya

    hace algunos aos. En cada una de ellas, se han incluido nuevos temas y ejercicios, con lo cual

    se ha venido enriqueciendo y mejorando su contenido, ajustndolo a las necesidades, para la

    formacin de profesionales y para estudiosos de la materia, que requieren de esta materia.

    En esta presentacin, se han mejorado sustancialmente aspectos tales como su

    diagramacin haciendo ms agradable y hbil la presentacin de los diferentes tpicos, adems

    en su contenido se han incluido, actualizado, revisado tanto los contenidos como los problemas

    de aplicacin a fin de atender a las necesidades y consultas exigidas por estudiantes,

    profesionales o personas que sin formacin acadmica requieren de su utilizacin.

    Jos Luis Quintero

    PROLOGO

  • Jos Luis Quintero

    ROBABILIDADES (ITEL-30205)

    Tema 1. Fundamentos de Estadstica Descriptiva

    Distribucin de frecuencias y medidas de localizacin

    Destacar la importancia del manejo estadstico descriptivo de un conjunto de datos Familiarizar al estudiante con la terminologa empleada en la organizacin y la descripcin de un conjunto de datos

    Construir ejemplos sencillos donde se refleje la organizacin de los datos en una tabla de distribucin de frecuencias

    Establecer diferencias entre las principales medidas de tendencia central Calcular los valores de las principales medidas de localizacin o de tendencia central tanto para el caso de agrupacin por valor o uso de clases discretas como para el caso de agrupacin por intervalos o uso de clases continuas

    Calcular percentiles, dciles y cuartiles para un conjunto de datos organizados en clases discretas y un conjunto de datos organizados en clases continuas

    Calcular el intervalo intercuartil para una muestra aleatoria Calcular los valores de las principales medidas de dispersin tanto para clases discretas como para clases continuas

    Construir ejemplos sencillos donde se refleje la importancia y la utilidad de las principales medidas de dispersin

    Construir un diagrama de caja y bigotes para una muestra dada Trabajar mediante problemas los fundamentos de la Estadstica Descriptiva

    OBJETIVOS A LOGRAR

  • Jos Luis Quintero

    ROBABILIDADES (ITEL-30205)

    Tema 1. Fundamentos de Estadstica Descriptiva

    Distribucin defrecuencias y medidas de localizacin

    1. Definiciones de inters

    1.1. Estadstica

    1.2. Estadstica Descriptiva

    1.3. Muestra aleatoria

    1.4. Mnimo valor de una muestra

    1.5. Mximo valor de una muestra

    1.6. Intervalo de una muestra

    1.7. Clase

    1.8. Histograma de una muestra

    2. Medidas de tendencia central

    2.1. Media de una muestra

    2.2. Mediana de una muestra

    2.3. Moda de una muestra

    3. Ejemplos ilustrativos para datos agrupados por valor o uso de clases discretas

    4. Ejemplos ilustrativos para datos agrupados por intervalos o uso de clases continuas

    5. Clculo de las medidas de tendencia central para datos agrupados por valor

    6. Clculo de las medidas de tendencia central para datos agrupados por intervalos

    7. Clculo de la media recortada al %

    7.1. Definicin

    7.2. Clculo de la media recortada

    7.3. Clculo para datos no agrupados

    7.4. Clculo para datos agrupados por valor o uso de clases discretas

    7.5. Clculo para datos agrupados por intervalos o uso de clases continuas

    8. Percentiles

    8.1. Definicin

    8.2. Clculo para datos agrupados por valor o uso de clases discretas

    8.3. Clculo para datos agrupados por intervalos o uso de clases continuas

    9. Intervalo intercuartil

    9.1. Definicin

    9.2. Clculo para datos agrupados por valor o uso de clases discretas

    9.3. Clculo para datos agrupados por intervalos o uso de clases continuas

    10. Definiciones de inters

    10.1. Varianza de una muestra

    10.2. Varianza corregida de una muestra

    10.3. Desviacin estndar de una muestra

    10.4. Desviacin estndar corregida de una muestra

    10.5. Coeficiente de variacin de una muestra

    1

    1

    1

    1

    1

    1

    1

    1

    1

    2

    2

    2

    2

    2

    4

    5

    6

    10

    10

    10

    11

    11

    12

    13

    13

    13

    14

    16

    16

    16

    16

    17

    17

    17

    17

    17

    17

    INDICE GENERAL

  • Jos Luis Quintero

    10.6. Sesgo de una muestra

    10.7. Curtosis de una muestra

    11. Clculo de las medidas de dispersin para datos agrupados por valor

    11.1. Varianza de la muestra

    11.2. Varianza corregida de la muestra

    11.3. Desviacin estndar de la muestra

    11.4. Desviacin estndar corregida de la muestra

    11.5. Coeficiente de variacin de la muestra

    11.6. Sesgo de la muestra

    11.7. Curtosis de la muestra

    12. Clculo de las medidas de dispersin para datos agrupados por intervalos

    12.1. Varianza de la muestra

    12.2. Varianza corregida de la muestra

    12.3. Desviacin estndar de la muestra

    12.4. Desviacin estndar corregida de la muestra

    12.5. Coeficiente de variacin de la muestra

    12.6. Sesgo de la muestra

    12.7. Curtosis de la muestra

    13. Diagrama de caja y bigotes

    13.1. Definicin

    13.2. Ejemplos ilustrativos

    14. Problemas resueltos

    15. Problemas propuestos

    17

    17

    18

    18

    18

    18

    18

    18

    18

    19

    20

    20

    20

    20

    21

    21

    21

    21

    22

    22

    23

    24

    31

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 1

    1. DEFINICIONES DE INTERS

    Observacin 1. Consideraciones

    acerca de la estadstica:

    Los orgenes de la estadstica,

    aunque no se sabe con exactitud

    cundo se comenz a utilizar,

    pueden estar ligados al antiguo

    Egipto como a los censos chinos

    que se realizaron hace unos

    4.000 aos, aproximadamente

    Sin duda, fueron los romanos,

    maestros de la organizacin

    poltica, quienes mejor supieron

    usar la estadstica. Cada cinco

    aos realizaban un censo de la

    poblacin, cuyos datos de

    nacimientos, defunciones y

    matrimonios eran esenciales para

    estudiar los avances del imperio;

    sin olvidar los recuentos de

    ganancias y las riquezas que

    dejaban las tierras Los datos a trabajar se agruparn

    por valor o en clases discretas o

    por intervalo o en clases

    continuas, considerando las

    caractersticas de los datos

    suministrados. En tal sentido, se

    justificar la mejor manera de

    agrupar los datos

    1.1. Estadstica. Es una rama de la matemtica

    que se encarga de estudiar mtodos cientficos

    para recoger, organizar, resumir y analizar

    datos, as como para sacar conclusiones

    vlidas y tomar decisiones razonables basadas

    en tal anlisis.

    1.2. Estadstica Descriptiva. Es la parte de la Estadstica que se encarga de reunir

    informacin cuantitativa concerniente a

    individuos, grupos, series de hechos, etc

    1.3. Muestra aleatoria. Grupo de resultados que

    se obtienen al repetir varias veces un

    experimento aleatorio, bajo las mismas

    condiciones.

    1.4. Mnimo valor de una muestra. El valor ms pequeo de una muestra.

    1.5. Mximo valor de una muestra. El valor ms

    grande de una muestra.

    1.6. Intervalo de una muestra. Diferencia entre

    el valor ms grande y el valor ms pequeo de

    una muestra.

    1.7. Clase. Es cada uno de los intervalos que se consiguen al realizar una particin dentro del

    conjunto de los nmeros reales.

    1.8. Histograma de una muestra. Es una representacin grfica en forma de barras de una muestra.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 2

    9

    9

    Ejemplo 1.

    Tabla de distribucin de frecuencias de la nota obtenida en un examen de Clculo

    Clase Dato (xi) fi Fi hi Hi

    1 2.8 1 1 0.0417 0.0417

    2 3.2 4 5 0.1667 0.2084

    3 3.9 3 8 0.1250 0.3334

    4 4.2 5 13 0.2082 0.5416

    5 5.0 4 17 0.1667 0.7083

    6 5.6 3 20 0.1250 0.8333

    7 6.0 4 24 0.1667 1.0000

    2. MEDIDAS DE TENDENCIA CENTRAL

    3. EJEMPLOS ILUSTRATIVOS PARA DATOS AGRUPADOS POR VALOR O USO DE CLASES DISCRETAS

    2.1. Media de una muestra. Promedio de los valores de la muestra.

    2.1. Mediana de una muestra. Valor que ocupa la

    posicin intermedia de la muestra ya ordenada

    previamente.

    2.3. Moda de una muestra. Es el valor del dato que ocurre con ms frecuencia.

    Observacin 2. Consideraciones

    acerca de las medidas de tendencia

    central:

    Tambin son llamadas medidas

    de localizacin

    La media se ve afectada por la

    presencia de valores extremos,

    perdiendo representatividad

    La media no necesariamente

    coincide con un dato muestral

    Por lo general, la mediana

    coincide con un dato muestral

    La moda puede usarse para datos

    cualitativos

    La moda pudiera no ser nica en

    una muestra

    La moda pierde representatividad

    en muestras multimodales

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 3

    Notacin de inters:

    fi = frecuencia absoluta , Fi = Frecuencia absoluta acumulada

    hi = frecuencia relativa , Hi = Frecuencia relativa acumulada

    Frmulas de inters:

    n = nmero de clases , N = nmero total de datos

    i

    i ii j i 1 i i i

    j 1

    f FF f F f , h , H , i 1,...,n

    N N

    =

    = = + = = =

    Ejemplo 2.

    Tabla de distribucin de frecuencias de la duracin en minutos de las llamadas

    telefnicas i(x ) entre las 9 a.m. y las 10 a.m. registradas en una central telefnica

    Clase Dato

    (xi)

    fi Fi hi Hi Clase Dato

    (xi)

    fi Fi hi Hi

    1 1 3 3 0.06 0.06 9 9 0 45 0.00 0.90

    2 2 7 10 0.14 0.20 10 10 1 46 0.02 0.92

    3 3 9 19 0.18 0.38 11 11 0 46 0.00 0.92

    4 4 10 29 0.20 0.58 12 12 2 48 0.04 0.96

    5 5 6 35 0.12 0.70 13 13 0 48 0.00 0.96

    6 6 4 39 0.08 0.78 14 14 0 48 0.00 0.96

    7 7 4 43 0.08 0.86 15 15 1 49 0.02 0.98

    8 8 2 45 0.04 0.90 16 16 1 50 0.02 1.00

    A continuacin la figura 1 visualiza el histograma para las frecuencias relativas:

    Figura 1. Histograma de frecuencias relativas para la duracin en minutos de las llamadas telefnicas

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 4

    Ejemplo 3.

    Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso

    del servicio telefnico i(x ) efectuado por los usuarios en un ao

    Clase

    Inicio

    Fin

    Marca

    de clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 1.465 1.497 1.481 4 4 0.08 0.08

    2 1.497 1.529 1.513 4 8 0.08 0.16

    3 1.529 1.561 1.545 15 23 0.30 0.46

    4 1.561 1.593 1.577 12 35 0.24 0.70

    5 1.593 1.625 1.609 9 44 0.18 0.88

    6 1.625 1.657 1.641 5 49 0.10 0.98

    7 1.657 1.689 1.673 1 50 0.02 1.00

    A continuacin la figura 2 visualiza el histograma para las frecuencias relativas:

    Figura 2. Histograma de frecuencias relativas para el pago anual del servicio telefnico

    4. EJEMPLOS ILUSTRATIVOS PARA DATOS AGRUPADOS POR INTERVALOS O USO DE CLASES CONTINUAS

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 5

    Ejemplo 4.

    Tabla de distribucin de frecuencias del pago en miles de bolvares (MBs.) del uso

    del servicio telefnico i(x ) efectuado por los usuarios en dos aos

    Clase

    Inicio

    Fin

    Marca

    de clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 3.62 3.70 3.66 2 2 0.02 0.02

    2 3.70 3.78 3.74 7 9 0.07 0.09

    3 3.78 3.86 3.82 11 20 0.11 0.20

    4 3.86 3.94 3.90 11 31 0.11 0.31

    5 3.94 4.02 3.98 23 54 0.23 0.54

    6 4.02 4.10 4.06 22 76 0.22 0.76

    7 4.10 4.18 4.14 15 91 0.15 0.91

    8 4.18 4.26 4.22 5 96 0.05 0.96

    9 4.26 4.34 4.30 3 99 0.03 0.99

    10 4.34 4.42 4.38 1 100 0.01 1.00

    5.1. Media de la muestra (M).

    Notacin:

    ix = dato que pertenece a la clase i

    fi = frecuencia del dato que pertenece a la clase i

    n = nmero de clases

    N = tamao de la muestra n

    i i

    i 1

    1M x f

    N=

    =

    Ejemplo de las calificaciones obtenidas:

    2.8 1 3.2 4 ... 5.6 3 6.0 4 109.1

    M 4.545824 24

    + + + + = = =

    Ejemplo de la duracin en minutos de las llamadas telefnicas:

    5. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS POR VALOR

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 6

    1 3 2 7 ... 15 1 16 1 247

    M 4.9450 50

    + + + + = = =

    5.2. Mediana de la muestra (Me).

    Notacin:

    ix = dato que ocupa la posicin i despus de estar ordenada la muestra

    N = tamao de la muestra

    i

    i i 1

    N 1x i si N es impar

    2Me

    x x Ni si N es par

    2 2+

    +=

    = +

    =

    Ejemplo de las calificaciones obtenidas:

    N 24= es par, por lo tanto i 12= y

    12 13x x 4.2 4.2Me 4.22 2

    + += = =

    Ejemplo de la duracin en minutos de las llamadas telefnicas:

    N 50= es par, por lo tanto i 25= y

    25 26x x 4 4Me 42 2

    + += = =

    5.3. Moda de la muestra (Mo).

    Ejemplo de las calificaciones obtenidas:

    El dato de mayor frecuencia (igual a 5) es 4.2, por lo tanto la moda de la muestra es 4.2.

    Ejemplo de la duracin en minutos de las llamadas telefnicas:

    El dato de mayor frecuencia (igual a 10) es 4, por lo tanto la moda de la muestra es 4.

    6.1. Media de la muestra (M).

    Notacin:

    6. CLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL PARA DATOS AGRUPADOS POR INTERVALOS

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 7

    ix = marca de clase que pertenece a la clase i

    fi = frecuencia de la clase i

    n = nmero de clases

    N = tamao de la muestra n

    i i

    i 1

    1M x f

    N=

    = .

    Usando la expresin anterior se tendr entonces una estimacin de la media de la

    muestra para datos agrupados por intervalos o uso de clases continuas.

    Ejemplo del pago del uso del servicio telefnico anual:

    1.481 4 1.513 4 ... 1.641 5 1.673 1 78.434

    M 1.5686850 50

    + + + + = = =

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    3.66 2 3.74 7 ... 4.30 3 4.38 1 399.76

    M 3.9976100 100

    + + + + = = =

    6.2. Mediana de la muestra (Me).

    En primer lugar se identifica la clase k donde se encuentra el dato que ocupa la

    posicin N/2. Esta clase es denominada clase medianal. Una vez ubicada la clase se procede

    a estimar la mediana de la muestra usando la expresin N

    k 12k k k

    k

    FMe LI (LS LI )

    f

    = +

    Notacin:

    kLI = Lmite inferior de la clase k (clase medianal)

    kLS = Lmite superior de la clase k (clase medianal)

    k 1F = Frecuencia absoluta acumulada de la clase anterior a la clase medianal

    kf = Frecuencia absoluta de la clase medianal

    Deduccin de la frmula de la mediana para datos agrupados por intervalos

    La frmula utilizada para la estimacin de la mediana se obtiene por interpolacin

    lineal, es decir se construye la recta que pasa por los puntos de coordenadas

    k 1 k k k(F ,LI ) y (F ,LS ) . Esta recta tiene la ecuacin

    k kk k 1

    k k 1

    LS LIy LI (x F )

    F F

    = +

    El punto de coordenadas N2( ,Me) es un punto de la recta de modo que

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 8

    N

    k 1k k 2Nk k 1 k k k2

    k k 1 k

    FLS LIMe LI ( F ) LI (LS LI )

    F F f

    = + = +

    Observacin. Se suponen que los datos dentro de la clase medianal estn equiespaciados y

    se usa interpolacin lineal para la estimacin de la mediana.

    Ejemplo del pago del uso del servicio telefnico anual:

    N= 50 por lo tanto N/2 = 25 y la clase medianal identificada es la clase 4:

    4 1.561 1.593 1.577 12 35 0.24 0.70

    Calculando ahora la estimacin para la mediana se tiene: 25 23 2

    Me 1.561 (1.593 1.561) 1.561 (0.032) 1.566312 12

    = + = + =

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    N = 100 por lo tanto N/2 = 50 y la clase medianal identificada es la clase 5:

    5 3.94 4.02 3.98 23 54 0.23 0.54

    Calculando ahora la estimacin para la mediana se tiene: 50 31 19

    Me 3.94 (4.02 3.94) 3.94 (0.08) 4.006123 23

    = + = + =

    6.3. Moda de la muestra (Mo).

    Deduccin de la frmula de la moda para datos agrupados por intervalos

    a. En primera instancia se identifica la clase con mayor frecuencia la cual se llamar clase

    modal. Esta clase pudiera no ser nica, y ese caso se estar en presencia de una muestra

    con distribucin de frecuencia multimodal.

    b. Una vez identificada la clase modal, la moda se estimar bajo la premisa de que ella

    estar ms prxima a la clase contigua con mayor frecuencia, de modo que la distancia

    entre la moda y las clases contiguas es inversamente proporcional a las frecuencias de

    esas clases. El clculo de esta estimacin ser de la forma kMo LI p= + , donde

    posteriormente se hablar del clculo de p.

    c. Si se denotan 1 k k 1d f f = y 2 k k 1d f f += , representarn las diferencias de la frecuencia

    de la clase modal y la frecuencia de la clase premodal y la de la frecuencia de la clase

    modal y la frecuencia de la clase postmodal respectivamente. Se deduce que a mayor

    frecuencia de la clase contigua, menor ser la diferencia respectiva.

    d. Suponga que el intervalo de la clase modal es dividido en dos partes: una de ellas de denota con p y la otra como k kLS LI p . Se establecer la relacin

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 9

    1

    k k 2

    dp

    LS LI p d=

    .

    CASO 1. 1 2d d<

    Aqui la clase premodal tiene una frecuencia absoluta mayor que la de la clase postmodal, de

    modo que se desea que la moda estimada est ms cerca de ella que de la clase postmodal.

    Trabajando la expresin anterior:

    1 1k k

    k k 2 2

    d dpp (LS LI p)

    LS LI p d d= =

    ,

    lo cual permite ver que p es menor que k kLS LI p y la moda estimada como kMo LI p= +

    estar ms cerca de la clase premodal que de la clase postmodal como se deseaba.

    CASO 2. 1 2d d=

    Aqui la clase premodal tiene una frecuencia absoluta igual que la de la clase postmodal, de

    modo que se desea que la moda estimada est equidistante de ambas clases. Trabajando la

    expresin anterior:

    k kk k

    k k

    LS LIp1 p (LS LI p) p

    LS LI p 2

    = = =

    ,

    lo cual permite ver que p es igual que k kLS LI p y la moda estimada como kMo LI p= + se

    ver de la forma

    k k k kk k

    LS LI LI LSMo LI p LI

    2 2

    += + = + =

    CASO 3. 1 2d d>

    Aqui la clase premodal tiene una frecuencia absoluta menor que la de la clase postmodal, de

    modo que se desea que la moda estimada est ms lejos de ella que de la clase postmodal.

    Trabajando la expresin anterior:

    1 1k k

    k k 2 2

    d dpp (LS LI p)

    LS LI p d d= =

    ,

    lo cual permite ver que p es mayor que k kLS LI p y la moda estimada como kMo LI p= +

    estar ms lejos de la clase premodal que de la clase postmodal como se deseaba.

    Visto todo lo anterior, despejando p se tiene

    1 11 2 1 k k k k

    k k 2 1 2

    d dpp(d d ) d (LS LI ) p (LS LI )

    LS LI p d d d= + = =

    +,

    calculando entonces la estimacin de la moda como

    1k k k

    1 2

    dMo LI (LS LI )

    d d= +

    +

    Ejemplo del pago del uso del servicio telefnico anual:

    La clase modal identificada es la clase 3.

    3 1.529 1.561 1.545 15 23 0.30 0.46

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 10

    Las clases premodal y postmodal sern respectivamente las clases 2 y 4.

    2 1.497 1.529 1.513 4 8 0.08 0.16

    4 1.561 1.593 1.577 12 35 0.24 0.70

    Calculando ahora la estimacin para la moda se tiene

    1k k k

    1 2

    d 15 4Mo LI (LS LI ) 1.529 (1.561 1.529) 1.5541

    d d 15 4 15 12

    = + = + + +

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    La clase modal identificada es la clase 5.

    5 3.94 4.02 3.98 23 54 0.23 0.54

    Las clases premodal y postmodal sern respectivamente las clases 4 y 6.

    4 3.86 3.94 3.90 11 31 0.11 0.31

    6 4.02 4.10 4.06 22 76 0.22 0.76

    Calculando ahora la estimacin para la moda se tiene

    1k k k

    1 2

    d (23 11)Mo LI (LS LI ) 3.94 (4.02 3.94) 4.0138

    d d (23 11) (23 22)

    = + = + =+ +

    7.2. Clculo de la media recortada:

    La notacin a se lee parte entera de a y asigna como resultado la aproximacin

    como truncamiento del nmero real a. La expresin

    N

    , [0,50)100

    determina la cantidad de datos que deben eliminarse de la muestra ordenada tanto

    inferiormente como superiormente. En tal sentido, la muestra recortada al % tiene como

    tamao

    7. CLCULO DE LA MEDIA RECORTADA AL %

    7.1. Definicin (Media recortada). Se define como el promedio de los datos que quedan al eliminar el % inferior y superior en la muestra ordenada.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 11

    N(1 ) N , con100

    = .

    7.3. Clculo para datos no agrupados:

    Despus de ordenarlos la media recortada al % se calcula como

    N(1 )

    rec( ) i

    i N 1

    1M x

    N(1 ) N

    = +

    =

    .

    7.4. Clculo para datos agrupados por valor o uso de clases discretas:

    n n n1 2

    rec( ) i i i i i i

    i 1 i n 1 i n 11 2

    1 M x f x f x fN(1 ) N

    = = + = +

    = + +

    ,

    donde

    if =nueva frecuencia absoluta de la clase i afectada despus de eliminar datos de la muestra

    aleatoria.

    Ejemplo de las calificaciones obtenidas:

    Se desea calcular la media recortada al 5% para los datos suministrados.

    Cantidad total de datos que deben eliminarse:

    24 52 2

    100

    =

    Tamao de la nueva muestra: 22

    Clculo de la nueva media: 0 3

    rec(5)

    2.8 3.2 4 ... 5.6 3 6.0 100.3M 4.5591

    22 22

    + + + + = =

    Observaciones.

    Las negritas se colocaron para indicar las frecuencias absolutas que fueron modificadas

    La eliminacin de los 2 datos no afecta significativamente a la media anterior (4.5458) al

    compararla con la nueva media (4.5591)

    Ejemplo de la duracin en minutos de las llamadas telefnicas:

    Se desea calcular la media recortada al 5% para los datos suministrados.

    Cantidad total de datos que deben eliminarse:

    50 52 4

    100

    =

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 12

    Tamao de la nueva muestra: 46

    Clculo de la nueva media: 1 0 0

    rec(5)

    1 2 7 ... 14 0 15 16 214M 4.65

    46 46

    + + + + + = =

    Observacin. Se puede notar la influencia de los 4 datos anteriores eliminados sobre la media anterior (4.94) al compararla con la nueva media (4.65)

    7.5. Clculo para datos agrupados por intervalos o uso de clases continuas: n n n1 2

    rec( ) i i i i i i

    i 1 i n 1 i n 11 2

    1 M x f x f x fN(1 ) N

    = = + = +

    = + +

    ,

    donde

    ix = marca de clase que pertenece a la clase i

    if = nueva frecuencia absoluta de la clase i afectada despus de eliminar datos de la muestra

    aleatoria.

    Ejemplo del pago del uso del servicio telefnico anual:

    Se desea calcular la media recortada al 5% para los datos suministrados.

    Cantidad total de datos que deben eliminarse:

    50 52 4

    100

    =

    Tamao de la nueva muestra: 46 2 4 0

    rec(5)

    1.481 1.513 4 ... 1.641 1.673 72.158M 1.56865

    46 46

    + + + + = =

    Observacin. Se puede notar la poca influencia de los 4 datos eliminados sobre la media anterior (1.56868) al compararla con la nueva media (1.56865)

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    Se desea calcular la media recortada al 5% para los datos suministrados.

    Cantidad total de datos que deben eliminarse:

    100 52 10

    100

    =

    Tamao de la nueva muestra: 90

    0 4 4 0 0rec(5)

    3.66 3.74 ... 4.22 4.30 4.38 359.72M 3.9969

    90 90

    + + + + + = = =

    Observacin. Se puede notar la poca influencia de los 10 datos eliminados sobre la media anterior (3.9976) al compararla con la nueva media (3.9969)

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 13

    9

    8.2. Clculo para datos agrupados por valor o uso de clases discretas:

    El percentil k-simo k(P ) ser igual a m 1x + , es

    decir k m 1P x += , siempre y cuando se verifique

    que

    km N m 1

    100< + , con m N .

    Ejemplo de las calificaciones obtenidas:

    Se desean encontrar los percentiles 25, 30

    y 75, es decir 25P , 30P y 75P respectivamente.

    Para 25P :

    25 6

    25m 24 m 1 m 6 m 1

    100

    m 5 P x 3.9

    < + < +

    = = =

    Para 30P :

    30 8

    30m 24 m 1 m 7.2 m 1 m 7 P x 3.9

    100< + < + = = =

    Para 75P :

    75 18

    75m 24 m 1 m 18 m 1 m 17 P x 5.6

    100< + < + = = =

    Ejemplo de la duracin en minutos de las llamadas telefnicas:

    Se desean encontrar los percentiles 25, 30 y 75, es decir 25P , 30P y 75P

    respectivamente.

    Para 25P :

    25 13

    25m 50 m 1 m 12.5 m 1 m 12 P x 3

    100< + < + = = =

    8. PERCENTILES

    8.1. Definicin (Percentil). El k-simo percentil de una muestra aleatoria se define como el valor que ocupa una posicin tal en la muestra ordenada que aproximadamente el k% de

    los datos es menor o igual que l.

    Observacin 3. Consideraciones

    acerca de las medidas de

    localizacin:

    El percentil k-simo tambin es

    llamado medida de localizacin

    La mediana es considerada como

    el percentil 50 es decir 50P Me=

    El cuartil k-simo k(Q ) es una

    medida de localizacin tal que

    1 25Q P= , 2 50Q P= , 3 75Q P= ,

    4 100Q P=

    El decil k-simo k(D ) es una

    medida de localizacin tal que:

    1 10 2 20 9 90D P , D P , ... , D P ,= = =

    10 100D P=

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 14

    Para 30P :

    30 15

    30m 50 m 1 m 15 m 1 m 14 P x 3

    100< + < + = = =

    Para 75P :

    75 38

    75m 50 m 1 m 37.5 m 1 m 37 P x 6

    100< + < + = = =

    8.3. Clculo para datos agrupados por intervalos o uso de clases continuas:

    El percentil k-simo k(P ) ser igual a m 1x + , es decir k m 1P x += , siempre y cuando se

    verifique que k

    m N m 1100

    < + , con m N .

    En primer lugar se identifica la clase j donde est el dato que ocupa la posicin

    encontrada anteriormente. Una vez ubicada la clase se procede a estimar el percentil k-

    simo de la muestra usando la expresin k

    j 1100k j j j

    j

    N FP LI (LS LI )

    f

    = +

    La frmula utilizada para la estimacin del percentil se obtiene tambin por

    interpolacin lineal, con el mismo basamento empleado para la frmula de estimacin de la

    mediana discutido anteriormente.

    Ejemplo del pago del uso del servicio telefnico anual:

    Se desean encontrar los percentiles 25, 30 y 75, es decir 25P , 30P y 75P

    respectivamente.

    Para 25P :

    25 13

    25m 50 m 1 m 12.5 m 1 m 12 P x

    100< + < + = =

    La clase donde se encuentra 25P es la clase 3:

    3 1.529 1.561 1.545 15 23 0.30 0.46

    Calculando ahora la estimacin para 25P se tiene:

    25100

    25

    50 8 4.5P 1.529 (1.561 1.529) 1.529 (0.032) 1.5386

    15 15

    = + = + =

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 15

    Para 30P :

    30 15

    30m 50 m 1 m 15 m 1 m 14 P x

    100< + < + = =

    La clase donde se encuentra 30P es la clase 3:

    3 1.529 1.561 1.545 15 23 0.30 0.46

    Calculando ahora la estimacin para 30P se tiene:

    30100

    30

    50 8 7P 1.529 (1.561 1.529) 1.529 (0.032) 1.5439

    15 15

    = + = + =

    Para 75P :

    75 38

    75m 50 m 1 m 37.5 m 1 m 37 P x

    100< + < + = =

    La clase donde se encuentra 75P es la clase 5:

    5 1.593 1.625 1.609 9 44 0.18 0.88

    Calculando ahora la estimacin para 75P se tiene:

    75100

    75

    50 35 2.5P 1.593 (1.625 1.593) 1.593 (0.032) 1.6019

    9 9

    = + = + =

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    Se desean encontrar los percentiles 25, 30 y 75, es decir 25P , 30P y 75P .

    Para 25P :

    25 25

    25m 100 m 1 m 25 m 1 m 24 P x

    100< + < + = =

    La clase donde se encuentra 25P es la clase 4:

    4 3.86 3.94 3.90 11 31 0.11 0.31

    Calculando ahora la estimacin para 25P se tiene:

    25100

    25

    100 20 5P 3.86 (3.94 3.86) 3.86 (0.08) 3.8964

    11 11

    = + = +

    Para 30P :

    30 30

    30m 100 m 1 m 30 m 1 m 29 P x

    100< + < + = =

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 16

    La clase donde se encuentra 30P es la clase 4:

    4 3.86 3.94 3.90 11 31 0.11 0.31

    Calculando ahora la estimacin para 30P se tiene:

    30100

    30

    100 20 10P 3.86 (3.94 3.86) 3.86 (0.08) 3.9327

    11 11

    = + = + =

    Para 75P :

    75 75

    75m 100 m 1 m 75 m 1 m 74 P x

    100< + < + = =

    La clase donde se encuentra 75P es la clase 6:

    6 4.02 4.10 4.06 22 76 0.22 0.76

    Calculando ahora la estimacin para 75P se tiene:

    75100

    75

    100 54 21P 4.02 (4.10 4.02) 4.02 (0.08) 4.0964

    22 22

    = + = + =

    9

    9.2. Clculo para datos agrupados por valor o uso de clases discretas:

    Intervalo intercuartil de la muestra Q(I ). Q 3 1I Q Q=

    Ejemplo de las calificaciones obtenidas: Q 3 1I Q Q 5 3.2 1.8= = =

    Ejemplo de la duracin en minutos de las llamadas telefnicas: Q 3 1I Q Q 6 3 3= = =

    9.3. Clculo para datos agrupados por intervalos o uso de clases continuas:

    Intervalo intercuartil de la muestra Q(I ). Q 3 1I Q Q=

    Ejemplo del pago del uso del servicio telefnico anual:

    9. INTERVALO INTERCUARTIL

    9.1. Definicin (Intervalo intercuartil). Es el intervalo de la muestra que resulta al considerar solamente aquellos datos que estn entre el primer cuartil y el tercero.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 17

    Q 3 1I Q Q 1.6019 1.5386 0.0633= = =

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    Q 3 1I Q Q 4.0964 3.8964 0.2= = =

    9

    10. DEFINICIONES DE INTERS

    10.1. Varianza de una muestra. Promedio

    aritmtico de los cuadrados de las diferencias

    de cada valor en la muestra y la media de la

    muestra.

    10.2. Varianza corregida de una muestra. Cociente que resulta de dividir la suma de los

    cuadrados de las diferencias de cada dato en

    la muestra y la media de la muestra, entre el

    nmero de datos menos uno.

    10.3. Desviacin estndar de una muestra. Es

    la raz cuadrada positiva de la varianza de la

    muestra.

    10.4. Desviacin estndar corregida de una muestra. Es la raz cuadrada positiva de la

    varianza corregida de la muestra.

    Observacin 4. Consideraciones acerca de las medidas de dispersin:

    Para conocer la varianza de la

    muestra, previamente se debe

    conocer la media de la muestra

    La justificacin de la frmula de

    la varianza corregida de la

    muestra se halla en el estudio de

    estimadores insesgados en

    Estadstica

    La desviacin estndar de la

    muestra posee las mismas

    unidades que tienen los datos de

    la muestra

    El coeficiente de variacin, el

    sesgo y la curtosis de la muestra

    son adimensionales, es decir, no

    poseen unidades

    El sesgo y la curtosis

    proporcionan informacin acerca

    de la forma de la distribucin de

    la muestra

    10.5. Coeficiente de variacin de una muestra. Es la relacin entre la desviacin estndar de

    la muestra y el valor absoluto de la media de

    la muestra.

    10.6. Sesgo de una muestra. Es la relacin entre

    el promedio aritmtico de las diferencias entre

    cada dato y la media de la muestra elevadas

    al cubo, y el cubo de la desviacin estndar.

    10.7. Curtosis de una muestra. Es la relacin entre el promedio aritmtico de las diferencias

    entre cada dato y la media de la muestra elevadas a la cuatro, y el cuadrado de la

    varianza de la muestra.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 18

    9

    11.1. Varianza de la muestra 2(S ) .

    Sean n = nmero de clases , N = tamao de la muestra

    Una frmula para su clculo: n

    2 2i i

    i 1

    1S f(x M)

    N=

    =

    Otra frmula para su clculo:

    n n n

    2 2 2 2 2 2i i i i i i i i i i

    i 1 i 1 i 1

    n n n n

    2 2 2 2 2 2 2i i i i i i i

    i 1 i 1 i 1 i 1

    1 1 1S f(x M) f (x 2xM M ) (fx 2fxM fM )

    N N N

    1 2 1 1fx fxM fM fx 2M M M M

    N N N N

    = = =

    = = = =

    = = + = +

    = + = + =

    11.2. Varianza corregida de la muestra 2c(S ) . n n

    2 2 2 2c i i i i

    i 1 i 1

    1 N 1 NS f(x M) . f (x M) .S

    N 1 N 1 N N 1= =

    = = =

    11.3. Desviacin estndar de la muestra (S). 2S S= +

    11.4. Desviacin estndar corregida de la muestra c(S ) .

    2c cS S= +

    11.5. Coeficiente de variacin de la muestra (CV).

    SCV

    M=

    11.6. Sesgo de la muestra (SE). n

    3i i3

    i 1

    1SE f(x M)

    NS=

    =

    11. CLCULO DE LAS MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS POR VALOR

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 19

    11.7. Curtosis de la muestra (K). n

    4i i4

    i 1

    1K f(x M)

    NS=

    =

    Ejemplo de las calificaciones obtenidas:

    Varianza de la muestra 2(S ) .

    n 7= , N 24= , M 4.5458=

    Primera forma para su clculo:

    2 2 2 2 21S (2.8 4.5458) 4(3.2 4.5458) ... 3(5.6 4.5458) 4(6 4.5458)24

    24.75961.0317

    24

    = + + + +

    = =

    Segunda forma para su clculo:

    2 2 2 2 2 2 21 520.71S (2.8) 4(3.2) ... 3(5.6) 4(6) (4.5458) (4.5458) 1.031724 24

    = + + + + = =

    Varianza corregida de la muestra 2c(S ) .

    2 2c

    N 24S .S 1.0317 1.0766

    N 1 23= =

    Desviacin estndar de la muestra (S). 2S S 1.0157= +

    Desviacin estndar corregida de la muestra c(S ) . 2S S 1.0376= +

    Coeficiente de variacin de la muestra (CV). S 1.0157

    CV 0.22344.5458M

    = =

    Sesgo de la muestra (SE). n

    3i i3 3

    i 1

    1 0.1047SE f(x M) 0.0042

    NS 24 (1.0157)=

    = = =

    Curtosis de la muestra (K).

    n

    4i i4 4

    i 1

    1 44.7672K f(x M) 1.7526

    NS 24 (1.0157)=

    = = =

    Ejemplo de la duracin en minutos de las llamadas telefnicas:

    Varianza de la muestra 2(S ) .

    n 16= , N 50= , M 4.94=

    Primera forma para su clculo:

    2 2 2 2 21 538.82S 3(1 4.94) 7(2 4.94) ... 1(15 4.94) 1(16 4.94) 10.776450 50

    = + + + + = =

    Segunda forma para su clculo:

    2 2 2 2 2 2 21 1759S 3(1) 7(2) ... 1(15) 1(16) (4.94) (4.94) 10.776450 50

    = + + + + = =

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 20

    Varianza corregida de la muestra 2c(S ) .

    2 2c

    N 50S .S 10.7764 10.9963

    N 1 49= = =

    Desviacin estndar de la muestra (S). 2S S 3.2827= + =

    Desviacin estndar corregida de la muestra c(S ) . 2

    c cS S 3.3161= + =

    Coeficiente de variacin de la muestra (CV). S 3.2827

    CV 0.66454.94M

    = =

    Sesgo de la muestra (SE). n

    3i i3 3

    i 1

    1 2866SE f(x M) 1.6204

    NS 50 (3.2827)=

    = = =

    Curtosis de la muestra (K).

    n

    4i i4 4

    i 1

    1 32463K f(x M) 5.5911

    NS 50 (3.2827)=

    = == =

    9

    12.1. Varianza de la muestra 2(S ) .

    Sean

    ix = marca de clase que pertenece a la clase i

    n = nmero de clases

    N = tamao de la muestra

    Una frmula para su clculo: n

    2 2i i

    i 1

    1S f(x M)

    N=

    = Otra frmula para su clculo: 2 2 2S M M=

    12.2. Varianza corregida de la muestra 2c(S ) .

    2 2c

    NS .S

    N 1=

    12.3. Desviacin estndar de la muestra (S). 2S S= +

    12. CLCULO DE LAS MEDIDAS DE DISPERSIN PARA DATOS AGRUPADOS POR INTERVALOS

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 21

    12.4. Desviacin estndar corregida de la muestra c(S ) . 2

    c cS S= +

    12.5. Coeficiente de variacin de la muestra (CV). S

    CVM

    =

    12.6. Sesgo de la muestra (SE).

    n

    3i i3

    i 1

    1SE f(x M)

    NS=

    =

    12.7. Curtosis de la muestra (K). n

    4i i4

    i 1

    1K f(x M)

    NS=

    =

    Ejemplo del pago del uso del servicio telefnico anual:

    Varianza de la muestra 2(S ) . n 7= , N 50=

    Primera forma de clculo:

    2 2 2 21S 4(1.481 1.56868) 4(1.513 1.56868) ... 1(1.673 1.56868) 0.002150

    = + + + =

    Segunda forma de clculo: 2 2 2 2S M M 2.4628 (1.56868) 0.0021= = =

    Varianza corregida de la muestra 2c(S ) .

    2 2c

    N 50S .S 0.0021 0.0021

    N 1 49= =

    Desviacin estndar de la muestra (S). 2S S 0.0458= + =

    Desviacin estndar corregida de la muestra c(S ) . 2

    c cS S 0.0458= + =

    Coeficiente de variacin de la muestra (CV). S 0.0458

    CV 0.02921.56868M

    = =

    Sesgo de la muestra (SE). n

    53

    i i3 3

    i 1

    1 3.7434 10SE f(x M) 0.0078

    NS 50 (0.0458)

    =

    = = =

    Curtosis de la muestra (K).

    n4

    4i i4 4

    i 1

    1 5.5862 10K f(x M) 2.5391

    NS 50 (0.0458)

    =

    = = =

    Ejemplo del pago del uso del servicio telefnico en dos aos:

    Varianza de la muestra 2(S ) . n 10= , N 100=

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 22

    Primera forma de clculo:

    2 2 2 21S 2(3.66 3.9976) 7(3.74 3.9976) ... 1(4.38 3.9976) 0.02209100

    = + + + =

    Segunda forma de clculo: 2 2 2 2S M M 16 (3.9976) 0.02= = =

    Varianza corregida de la muestra 2c(S ) .

    2 2c

    N 100S .S 0.02 0.0202

    N 1 99= =

    Desviacin estndar de la muestra (S). 2S S 0.1414= + =

    Desviacin estndar corregida de la muestra c(S ) . 2

    c cS S 0.1421= + =

    Coeficiente de variacin de la muestra (CV). S 0.1414

    CV 0.03543.9976M

    = =

    Sesgo de la muestra (SE). n

    3i i3 3

    i 1

    1 0.0260SE f(x M) 0.0920

    NS 100 (0.1414)=

    = = =

    Curtosis de la muestra (K).

    n

    4i i4 4

    i 1

    1 0.1340K f(x M) 3.3520

    NS 100 (0.1414)=

    = = =

    9

    La figura 3 revela toda la informacin que se puede representar en un diagrama de caja.

    Figura 3. Diagrama de caja y bigotes

    13. DIAGRAMA DE CAJA Y BIGOTES

    13.1. Definicin (Diagrama de caja y bigotes). Un diagrama de caja y bigotes busca

    representar los tres cuartiles y los valores mnimo y mximo de la muestra con la

    finalidad de definir la ubicacin de algunos valores de la muestra que no tienen un

    comportamiento tpico o esperado y perfectamente podran deberse a errores en la

    recoleccin y manipulacin de la muestra.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 23

    13.2. Ejemplos ilustrativos.

    Ejemplo 1. Suponga que de una muestra dada se tiene la siguiente informacin:

    1 2 3Q 9.586 , Q 10.1825 , Q 10.448= = =

    Construya el diagrama de caja y bigotes correspondiente.

    Solucin. Clculo del rango intercuartil: Q 3 1I Q Q 10.448 9.586 0.862= = =

    Clculo de la distancia Q1.5I 1.5 0.862 1.293= =

    Clculo de los lmites inferior y superior de los bigotes:

    Lmite inferior: i 1 Qa L Q 1.5I 9.586 1.293 8.293= = = =

    Lmite superior: s 3 Qd L Q 1.5I 10.448 1.293 11.741= = + = + =

    Finalmente el diagrama de caja y bigotes se visualiza en la figura 4.

    Figura 4. Diagrama de caja y bigotes del ejemplo

    Ejemplo 2. La figura 5 representa un diagrama de caja por cada mes que muestra los

    niveles de precipitacin de los ltimos 38 aos en la estacin de San Fernando de Apure.

    ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC

    010

    020

    030

    040

    050

    0

    DIAGRAMAS DE CAJA MESES DE SAN FERNANDO

    PREC

    IPIT

    ACI

    N (m

    m)

    Figura 5. Niveles de precipitacin por mes medidos en la estacin de San Fernando

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 24

    SOLUCIN.

    a. Obtenga el salario promedio del grupo de obreros

    SOLUCIN.

    1 1 2 2 3 3 4 4 5 5 6 6 7 7f x f x f x f x f x f x f xM60

    8 22 11 27 4 32 7 37 12 42 9 47 9 52 225537.583

    60 60

    + + + + + +=

    + + + + + + = =

    b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero

    igual o menor a 44.000 Bs

    SOLUCIN.

    2 3 4 5f f f f 11 4 7 12 34Porcentaje 100 100 100 56.67%60 60 60

    + + + + + += = =

    c. Calcule la moda SOLUCIN.

    Clase modal:

    Salario (Bs/sem)

    Punto medio

    Frecuencia absoluta

    Frecuencia absoluta acumulada

    Frecuencia relativa

    Frecuencia relativa acumulada

    [40,44] 42 12 42 12/60 42/60

    14. PROBLEMAS RESUELTOS

    PROBLEMA 1.

    Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario

    semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro

    adjunto.

    Salario

    (Bs/sem)

    Punto

    medio

    Frecuencia

    absoluta

    Frecuencia absoluta

    acumulada

    Frecuencia

    relativa

    Frecuencia relativa

    acumulada

    [20,24] 22 8 8 8/60 8/60

    [25,29] 27 11 19 11/60 19/60

    [30,34] 32 4 23 4/60 23/60

    [35,39] 37 7 30 7/60 30/60

    [40,44] 42 12 42 12/60 42/60

    [45,49] 47 9 51 9/60 51/60

    [50,54] 52 9 60 9/60 60/60

    a. Obtenga el salario promedio del grupo de obreros

    b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero igual o menor a 44.000 Bs

    c. Calcule la moda

    d. Calcule el recorrido intercuartil

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 25

    12 7 5 20 340

    Moda 40 4 40 4 40 42.512 7 12 9 8 8 8

    = + = + = + = = +

    d. Calcule el recorrido intercuartil SOLUCIN.

    25 6025 25 15100Clase P :14 15 14 15 15 P x< < =

    Salario (Bs/sem)

    Punto medio

    Frecuencia absoluta

    Frecuencia absoluta acumulada

    Frecuencia relativa

    Frecuencia relativa acumulada

    [25,29] 27 11 19 11/60 19/60

    25

    15 8 7 28 303P 25 4 25 4 25 27.55

    11 11 11 11

    = + = + = + =

    75 6075 75 45100Clase P : 44 45 44 45 45 P x< < =

    Salario (Bs/sem)

    Punto medio

    Frecuencia absoluta

    Frecuencia absoluta acumulada

    Frecuencia relativa

    Frecuencia relativa acumulada

    [45,49] 47 9 51 9/60 51/60

    75

    45 42 3 12 417P 45 4 45 4 45 46.33

    9 9 9 9

    = + = + = + =

    Finalmente

    Q 3 1 75 25I Q Q P P 46.33 27.55 18.78= = = =

    SOLUCIN. f3

    3 360h 0.1 0.1 f 6= = = .

    F33 360

    H 0.3 0.3 F 18= = = .

    3 2 3 2 2F F f 18 F 6 18 F 12= + = + = = . 4 3 4 4 4F F f 48 18 f 48 f 30= + = + = = .

    Clase medianal: clase 4 N

    324 4 4 4 4 4 4 4 4

    4

    F 30 18Me LI (LS LI ) 26 LI (LS LI ) 26 LI 0.4(LS LI )

    f 30

    = + = + = +

    Ubicando el percentil 80:

    80P : 80 4880

    m 60 m 1 m 47 P x 38100

    < + = = =

    PROBLEMA 2.

    60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.

    Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias: La mediana es 26

    El 20% de los datos es superior a 38 3H 0.3=

    3h 0.1=

    4F 48=

    11 5 62f f f= =

    Halle la distribucin de frecuencias.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 26

    El percentil 80 se ubica en la clase 4.

    80 803100 100

    80 4 4 4 4 4 44

    4 4 4

    60 F 60 18P LI (LS LI ) 38 LI (LS LI )

    f 30

    38 LI (LS LI )

    = + = +

    = +

    Resolviendo el sistema lineal:

    4 4 4 4 4 4

    4 4 4 4 4

    LI 0.4(LS LI ) 26 0.6LI 0.4LS 26 LI 18

    LI (LS LI ) 38 LS 38 LS 38

    + = + = =

    + = = =

    1 2 3 4 5 6 1 2 5 6 1 2 5 6

    1 2 5 6 1 2 1 2 1

    1 2 1 1 5

    f f f f f f 60 f f 6 30 f f 60 f f 36 f f 60

    f f f f 24 4f f 24 4f F f 24

    3f F 24 3f 12 f 4 f 4 f

    + + + + + = + + + + + = + + + + =

    + + + = + = + =

    + = = = = 6 8=

    Finalmente 1 2 2 2 2 1f f F f F f 12 4 8+ = = = =

    A continuacin se muestra la distribucin de frecuencias de los datos:

    Clase

    Inicio

    Fin

    Marca de

    clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 -42 -22 -32 4 4 4/60 4/60

    2 -22 -2 -12 8 12 8/60 12/60

    3 -2 18 8 6 18 6/60 18/60

    4 18 38 28 30 48 30/60 48/60

    5 38 58 48 4 52 4/60 52/60

    6 58 78 68 8 60 8/60 1

    SOLUCIN.

    Distribucin simtrica:

    1 2 3 4 5 6 1 2 3 3 2 1 1 2 3f f f f f f 300 f f f f f f 300 f f f 150+ + + + + = + + + + + = + + =

    Relaciones entre las frecuencias:

    2 1 3 1 1 1 1 1 6 2 5 3 4f 3f , f 2f f 3f 2f 150 f 25 f , f 75 f , f 50 f= = + + = = = = = = =

    Informacin de la mediana: Clase medianal: clase 3 N

    223 3 3 3 3 3 3

    3

    F 150 100Me LI (LS LI ) 25 LI (LS LI ) LS

    f 50

    = + = + =

    Informacin del percentil: Ubicacin:

    91.667P : 91.667 27591.667

    m 300 m 1 m 274 P x 35100

    < + = = =

    PROBLEMA 3. Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual

    amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:

    La mediana es 25

    El percentil 91.667 es 35

    2 1f 3f=

    3 1f 2f=

    Halle la distribucin de frecuencias.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 27

    El percentil 91.667 se ubica en la clase 5.

    491.667 5 5 5 5 5 5

    5

    5 5 5 5

    275 F 275 200P LI (LS LI ) 35 LI (LS LI )

    f 75

    35 LI (LS LI ) 35 LS

    = + = +

    = + =

    Amplitud (d) del intervalo de clase: 5 32d LS LS 35 25 10 d 5= = = =

    A continuacin se muestra la distribucin de frecuencias de los datos:

    Clase

    Inicio

    Fin

    Marca

    de clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 10 15 12.5 25 25 25/300 25/300

    2 15 20 17.5 75 100 75/300 100/300

    3 20 25 22.5 50 150 50/300 150/300

    4 25 30 27.5 50 200 50/300 200/300

    5 30 35 32.5 75 275 75/300 275/300

    6 35 40 37.5 25 300 25/300 1

    SOLUCIN.

    Informacin suministrada:

    4 6 1 5 3 4 5 6 2 1 6f 2f , f f , f 25 , f f f 19 , f 3f , LI 20= = = + + = = =

    Se sabe que

    1 2 3 4 5 6 1 1 1 1f f f f f f 60 f 3f 25 19 60 4f 16 f 4+ + + + + = + + + = = =

    Por lo tanto:

    2 5f 12 , f 4= = .

    Por otro lado

    4 5 6 6 6 4f f f 19 3f 4 19 f 5 f 10+ + = + = = =

    Hasta ahora se tiene la siguiente informacin:

    PROBLEMA 4.

    Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes

    al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de

    seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:

    a. en la cuarta clase se tiene el doble de datos que en la sexta clase b. las clases uno y cinco tienen igual nmero de datos

    c. la clase tres tiene la mayor cantidad de datos igual a 25

    d. la mediana de los datos es igual a 10.24 e. el extremo inferior de la clase 6 es 20

    f. por encima de la clase tres hay 19 datos

    g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno Construya la distribucin de frecuencias para esos datos.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 28

    Clase Inicio Fin fi Fi hi Hi

    1 a a d+ 4 4 4/60 4/60

    2 a d+ a 2d+ 12 16 12/60 16/60

    3 a 2d+ a 3d+ 25 41 25/60 41/60

    4 a 3d+ a 4d+ 10 51 10/60 51/60

    5 a 4d+ 20 4 55 4/60 55/60

    6 20 a 6d+ 5 60 5/60 1

    Informacin suministrada: mediana 10.24=

    Clase medianal: 3. Entonces N

    223 3 3

    3

    F 30 16mediana LI (LS LI ) a 2d d 10.24

    f 25

    64a d 10.24 25a 64d 256

    25

    = + = + + =

    + = + =

    Por otro lado se tiene que a 5d 20+ =

    Construyendo y resolviendo el sistema se obtiene

    25a 64d 256a 0,d 4

    a 5d 20

    + = = =

    + =

    Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:

    Clase Inicio Fin fi Fi hi Hi

    1 0 4 4 4 4/60 4/60

    2 4 8 12 16 12/60 16/60

    3 8 12 25 41 25/60 41/60

    4 12 16 10 51 10/60 51/60

    5 16 20 4 55 4/60 55/60

    6 20 24 5 60 5/60 1

    SOLUCIN.

    PROBLEMA 5. Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una

    distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las

    caractersticas siguientes: La diferencia entre el percentil 90 y el percentil 2 es 0.88

    Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio es

    de 0.5776 Kg La primera clase contiene el 5% de los datos La mediana es el lmite superior de la tercera clase La frecuencia acumulada absoluta de la segunda clase es 40 4 3F F 64 =

    6 55f 4f=

    Halle la distribucin de frecuencias de estos datos.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 29

    Informacin suministrada:

    90 2P P 0.88 = , 1f 10= , 3Me LS= , 2F 40= , 4 3F F 64 =

    Clculos

    2 1 2 2 2F 40 f f 40 10 f 40 f 30= + = + = =

    4 3 3 4 3 4F F 64 F f F 64 f 64 = + = =

    3 3 3 3 33 3

    100 40 100 40Me LS LI (LS LI ) 1 f 60

    f f

    = = + = =

    Ubicando el percentil 2 y el percentil 90:

    2P :

    2 4

    2m 200 m 1 m 3 P x

    100< + = =

    90P :

    90 180

    90m 200 m 1 m 179 P x

    100< + = =

    2 20100 100

    2 1 1 1 1 1 1 1 1 11

    200 F 200 0P LI (LS LI ) LI (LS LI ) LI 0.4(LS LI )

    f 10

    = + = + = +

    90 904100 100

    90 5 5 5 5 5 5 5 5 55

    200 F 200 164P LI (LS LI ) LI (LS LI ) LI 0.8(LS LI )

    f 20

    = + = + = +

    90 2 5 1 5 5 1 1P P (LI LI ) 0.8(LS LI ) 0.4(LS LI ) 4d 0.4d 0.88 d 0.2 = + = + = =

    5 5 5

    i i i i 2 3 4 5

    i 2 i 2 i 2

    1fx 0.5776 fx 98.192 30x 60x 64x 16x 98.192

    170

    15(2a d) 30(2a 3d) 32(2a 5d) 8(2a 7d) 98.192

    170a 3 18 32 11.2 98.19

    = = =

    = = + + + =

    + + + + + + + =

    + + + + =

    2 170a 64.2 98.192

    a 0.2

    + =

    Finalmente la tabla de distribucin de frecuencias de los datos se muestra a continuacin:

    Clase

    Inicio

    Fin

    Marca

    de clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 0.0 0.2 0.1 10 10 0.05 0.05

    2 0.2 0.4 0.3 30 40 0.15 0.20

    3 0.4 0.6 0.5 60 100 0.30 0.50

    4 0.6 0.8 0.7 64 164 0.32 0.82

    5 0.8 1.0 0.9 20 184 0.10 0.92

    6 1.0 1.2 1.1 16 200 0.08 1.00

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 30

    SOLUCIN.

    Codificacin de la informacin suministrada:

    50 1 2 3 5 6 7 6 2 3 5

    7 7 2 10 1 2 3 4 5 6 7

    Me P 20 ; f f f 10 ; f f f 25 ; f f f ; f 11

    f 6 ; f 2f ; P 10 ; f f f f f f f 50

    = = + + = + + = = + =

    = = = + + + + + + =

    Usando algunas de las anteriores relaciones se tiene que

    7 2 5 6 3 1 4f 6 f 3 ; f 11 f 8 f 5 f 2 f 15= = = = = = =

    Se tiene hasta ahora la siguiente distribucin de frecuencias:

    Clase

    Inicio

    Fin

    Marca de clase (xi)

    fi

    Fi

    hi

    Hi

    1 a a + d a + d/2 2 2 0.04 0.04

    2 a + d a + 2d a + d + d/2 3 5 0.06 0.10

    3 a + 2d a + 3d a + 2d + d/2 5 10 0.10 0.20

    4 a + 3d a + 4d a + 3d + d/2 15 25 0.30 0.50

    5 a + 4d a + 5d a + 4d + d/2 11 36 0.22 0.72

    6 a + 5d a + 6d a + 5d + d/2 8 44 0.16 0.88

    7 a + 6d a + 7d a + 6d + d/2 6 50 0.12 1.00

    De la distribucin anterior se observa que la clase medianal es la clase 4 y se puede inferir que 20

    es el lmite superior de la clase 4, por lo tanto se tiene que a 4d 20+ = . Por otro lado se puede

    inferir tambin que el percentil 10 est en la clase 2 y 10 es su lmite superior. Este hecho genera

    la ecuacin a 2d 10+ = . De las dos ecuaciones se tiene que a 0 ; d 5= = . Por lo tanto

    Clase Inicio Fin Marca de clase (xi) fi Fi Hi Hi

    1 0 5 2.5 2 2 0.04 0.04

    2 5 10 7.5 3 5 0.06 0.10

    3 10 15 12.5 5 10 0.10 0.20

    4 15 20 17.5 15 25 0.30 0.50

    5 20 25 22.5 11 36 0.22 0.72

    6 25 30 27.5 8 44 0.16 0.88

    7 30 35 32.5 6 50 0.12 1.00

    PROBLEMA 6.

    Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para

    automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin: La mediana de la vida til de las bateras es de 20 meses

    Las tres primeras clases contienen un total de 10 datos

    La mitad de los datos est en las tres ltimas clases

    La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6

    En la clase 5 hay 11 datos y en la clase 7 hay 6 datos

    7 2f 2f= y 10P 10=

    Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 31

    1. Coloque al lado de cada proposicin la letra V o F segn sea verdadera o falsa

    respectivamente.

    a. Los datos discretos slo se pueden expresar con nmeros enteros b. Un histograma es una serie de rectngulos, cada uno proporcional en ancho al nmero de

    elementos que caen dentro de una clase especfica de datos

    c. Todos los valores de los datos se toman en cuenta cuando se calcula la mediana del conjunto

    d. La desviacin estndar se mide en las mismas unidades que las observaciones del conjunto

    de datos

    2. Subraye la respuesta que considere correcta.

    a. Cul de las afirmaciones siguientes acerca de los rectngulos de un histograma es correcta?

    i. Los rectngulos tienen una altura proporcional al nmero de elementos de las clases

    ii. Por lo general existen cinco rectngulos en cada histograma iii. El rea de un rectngulo depende slo del nmero de elementos de la clase en

    comparacin con el nmero de elementos de todas las dems clases

    iv. Todas las anteriores b. Cul es la principal suposicin que se hace cuando se calcula la media de datos

    agrupados?

    i. Todos los valores son discretos ii. Cada valor de una clase es igual a su punto medio

    iii. Ningn valor se presenta ms de una vez

    iv. Cada clase contiene exactamente el mismo nmero de valores c. En cul de estos casos sera la moda ms til como indicador de la tendencia central?

    i. Cada valor de un conjunto de datos se presenta solamente una vez

    ii. Todos los valores de un conjunto de datos, excepto tres, se presentan slo una vez. Los tres valores se presentan 100 veces cada uno

    iii. Todos los valores de un conjunto de datos se presentan 100 veces cada uno

    iv. Todas las observaciones de un conjunto de datos tienen el mismo valor d. El cuadrado de la varianza de un conjunto de datos representa

    i. La desviacin estndar

    ii. La media iii. El alcance

    iv. Ninguna de las anteriores

    e. Por qu es necesario elevar al cuadrado las diferencias con respecto a la media cuando se calcula la varianza de la poblacin?

    i. Para que los valores extremos no afecten el clculo

    ii. Porque es posible que el tamao de la poblacin sea pequeo

    15. PROBLEMAS PROPUESTOS

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 32

    iii. Algunas de las diferencias sern positivas y otras negativas

    iv. Ninguna de las anteriores

    3. Halle la media y la mediana de los primeros n nmeros naturales.

    4. Halle la media y la mediana de los cuadrados de los primeros n nmeros naturales.

    5. Halle la varianza muestral y la varianza muestral corregida de los primeros n nmeros

    naturales.

    6. Se toma una muestra de 60 obreros de una fbrica y se quiere hacer un estudio del salario semanal (en miles de bolvares). Se obtuvo la siguiente informacin presentada en el cuadro

    adjunto.

    Salario

    (Bs/sem)

    Punto

    medio

    Frecuencia

    absoluta

    Frecuencia absoluta

    acumulada

    Frecuencia

    relativa

    Frecuencia relativa

    acumulada

    [20,24] 22 8 8 8/60 8/60

    [25,29] 27 11 19 11/60 19/60

    [30,34] 32 4 23 4/60 23/60

    [35,39] 37 7 30 7/60 30/60

    [40,44] 42 12 42 12/60 42/60

    [45,49] 47 9 51 9/60 51/60

    [50,54] 52 9 60 9/60 60/60

    a. Obtenga el salario promedio del grupo de obreros

    b. Determine el porcentaje de obreros que tienen salarios mayores o iguales a 25.000 Bs pero igual o menor a 44.000 Bs

    c. Calcule la moda

    d. Calcule el recorrido intercuartil

    7. 60 datos han sido agrupados en una distribucin de frecuencias de 6 clases de igual amplitud.

    Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias: La mediana es 26

    El 20% de los datos es superior a 38 3H 0.3=

    3h 0.1=

    4F 48=

    11 5 62f f f= =

    Halle la distribucin de frecuencias.

    8. Considere un lote de 300 muestras distribuidas en forma simtrica en seis intervalos de igual amplitud. Se dispone de la siguiente informacin acerca de esa distribucin de frecuencias:

    La mediana es 25

    El percentil 91.667 es 35

    2 1f 3f=

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 33

    3 1f 2f=

    Halle la distribucin de frecuencias.

    9. Para estudiar la cantidad de errores ortogrficos cometidos por un conjunto de 60 estudiantes

    al tomar un dictado, se organizaron los datos en una tabla de distribucin de frecuencias de

    seis clases de igual amplitud. De dicha distribucin solo se conoce la siguiente informacin:

    a. en la cuarta clase se tiene el doble de datos que en la sexta clase

    b. las clases uno y cinco tienen igual nmero de datos c. la clase tres tiene la mayor cantidad de datos igual a 25

    d. la mediana de los datos es igual a 10.24

    e. el extremo inferior de la clase 6 es 20 f. por encima de la clase tres hay 19 datos

    g. el nmero de datos de la clase dos triplica al nmero de datos de la clase uno

    Construya la distribucin de frecuencias para esos datos.

    10. Se tienen los datos correspondientes al peso (en Kg.) de 200 productos, organizados en una

    distribucin de frecuencias formada por 6 intervalos de clases de igual amplitud, con las

    caractersticas siguientes:

    La diferencia entre el percentil 90 y el percentil 2 es 0.88

    Si se elimina el 5% inferior de los datos y el 10% superior de los datos, el peso promedio

    es de 0.5776 Kg

    La primera clase contiene el 5% de los datos

    La mediana es el lmite superior de la tercera clase La frecuencia acumulada absoluta de la segunda clase es 40 4 3F F 64 =

    6 55f 4f=

    Halle la distribucin de frecuencias de estos datos.

    11. En un torneo de ftbol se conoce que el 15% de los jugadores ha anotado ms de 5 goles.

    Hay dos jugadores que se disputan el liderato del torneo con 8 goles. El 30% de los jugadores

    ha anotado 4 5 goles, sabiendo adems que la cantidad de jugadores es la misma para

    ambas categoras. La cuarta parte de los jugadores anot un gol y el nmero de jugadores

    que anot 2 goles es el doble del nmero que anot 3 goles. Por otro lado, se sabe que slo

    un jugador ha anotado 7 goles. Los datos anteriores son relativos a aquellos jugadores que

    anotaron al menos un gol y estos representan el 60% del total de 100 jugadores en el torneo.

    Obtenga la tabla de frecuencias para estos datos.

    12. Un complejo Sistema de Telecomunicaciones GSM est formado por 1000 nodos. El

    Departamento de Estadstica Operativa que monitorea al Sistema de Telecomunicaciones se

    encarg de recopilar las fallas que se presentaron en cada uno de los nodos durante un ao.

    Los datos obtenidos corresponden a aquellos nodos que presentaron al menos una falla, que

    representan el 90% del total de los nodos. Los resultados fueron los siguientes:

    El nmero de nodos que presentaron 2 fallas es el mismo que el cudruple del nmero de

    nodos que sufrieron 4 fallas

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 34

    Solo el 20% de los nodos han presentado ms de 5 fallas

    Una cuarta parte de los nodos han presentado 3 5 fallas

    Solo el 20% de los nodos present una falla

    El mismo nmero de nodos que presentaron 4 fallas tambin presentaron 7 fallas

    El 70% de los nodos presentaron menos de 5 fallas

    Slo 30 nodos presentaron un mximo de 8 fallas cada uno

    a. Halle la distribucin de frecuencias de los datos

    b. Calcule media, moda y mediana para la distribucin anterior

    13. En una liga de bisbol aficionado slo 30 bateadores batearon por encima de 300 puntos. Los

    1200 jugadores con turnos legales para ser tomados en cuenta han sido distribuidos en seis

    clases de igual ancho donde el percentil 97,5 coincide con el lmite superior de la clase cinco.

    Por otro lado, el tercer cuartil es 270 y coincide con el borde inferior de la clase cuatro. El

    nmero de jugadores en la primera clase es el triple del nmero en la tercera clase mientras

    que en la segunda clase hay el doble de jugadores que en la tercera. Finalmente, se conoce

    que el 14,5% de los jugadores pertenece a la cuarta clase. Halle la distribucin de

    frecuencias.

    14. Una prestigiosa compaa ha decidido contratar a una compaa de recursos humanos para

    que gestione la contratacin de varios ingenieros para el prximo proyecto que se va a licitar.

    Esta compaa de recursos humanos tiene las calificaciones de una prueba tcnica presentada

    por 800 ingenieros logrando distribuir en clases esta informacin. La informacin que se tiene

    es la siguiente:

    Las notas estn distribuidas en 7 clases de igual amplitud

    El 10% superior de las notas supera el valor 96

    La mitad de los datos est por debajo de 60

    La clase 4 es una clase modal y contiene el 30% de los datos

    Por encima de esa clase modal esta el 20% de las notas

    La primera y la ltima clase contienen cada una 80 datos

    La segunda clase contiene la tercera parte de los datos de la tercera clase

    El percentil 85 es 84 puntos

    a. Obtenga la tabla de distribucin de frecuencias b. Determine el rango intercuartlico

    15. Pensando en la seleccin de estudiantes para su ingreso al Sistema de Educacin Superior, se han escogido los 5000 mejores estudiantes de aquellos que solicitan estudiar la carrera de

    Ingeniera Elctrica. Para la escogencia de estos 5000 aspirantes se tom en cuenta el

    promedio de sus asignaturas cursadas y aprobadas en los primeros cuatro aos de estudios de

    educacin media. Se sabe que el promedio de notas de esta muestra de 5000 estudiantes es

    de 15.94. Los promedios de notas para estos 5000 estudiantes han sido distribuidos en 8

    clases de igual amplitud. De esta distribucin de frecuencias se conoce adems lo siguiente:

    El primer cuartil es 15 y coincide con el borde inferior de la quinta clase

    El percentil 90 es 18 y coincide con el borde superior de la sptima clase

    El nmero de datos en la clase 4 es igual a la suma de los datos de las clases 2 y 3

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 35

    Las clases 5 y 6 tienen cada una 4 veces el contenido de la primera clase

    La sptima clase tiene 1250 datos

    Obtenga la tabla de distribucin de frecuencias

    16. Una mquina produce tornillos cuya longitud nominal es de 10 cm de largo. Se considera que un tornillo est en especificaciones si su longitud difiere menos de 2 mm de la longitud

    nominal. La produccin de una hora correspondiente a 1500 tornillos, se ha distribuido en 7

    clases de igual amplitud, con las caractersticas siguientes:

    En las clases uno y siete hay igual cantidad de tornillos

    El total de tornillos por encima de la clase cinco excede al total de la clase dos por cinco

    En las dos primeras clases hay un total de 180 tornillos

    Hasta la clase seis hay 1450 tornillos acumulados

    El 37% de los tornillos cae en la cuarta clase

    El percentil 27,33, igual a 9,95 cm, coincide con el lmite superior de la clase tres

    La longitud promedio de los 1500 tornillos es de 10,033 cm

    a. Obtenga la tabla de distribucin de frecuencias

    b. Qu porcentaje de tornillos est en especificaciones?

    17. A continuacin se presentan unos diagramas de cajas para los datos de precipitacin por mes

    de la estacin meteorolgica de San Fernando en el estado Apure.

    ENE FEB MAR ABR MAY JUN JUL AGO SEP OCT NOV DIC

    010

    020

    030

    040

    050

    0

    DIAGRAMAS DE CAJA MESES DE SAN FERNANDO

    PREC

    IPIT

    ACI

    N (m

    m)

    Analice el siguiente grfico considerando los siguientes aspectos de inters: media aritmtica y

    mediana por mes, datos atpicos, rango intercuartlico y comportamiento de la precipitacin.

    18. Una empresa productora de antenas satelitales tiene tres mquinas dedicadas a la produccin de antenas cuyo radio de pantalla debe ser de 11 cm. Debido a desperfectos en las mquinas

    el radio de cada pantalla vara dificultando la calidad de las antenas producidas. Por esta

    razn, el Departamento de Control de Calidad de la empresa ha decidido tomar una muestra

    de 11 antenas de cada mquina para verificar su radio. La tabla siguiente presenta los

    resultados obtenidos de las muestras tomadas.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 36

    N de la muestra Mquina 1 Mquina 2 Mquina 3

    1 11,6 12,2 11,8

    2 11,2 11,7 11,2

    3 11,3 11,7 11,5

    4 11,8 12,0 11,5

    5 11,7 11,9 11,6

    6 11,0 11,5 11,2

    7 9,6 11,4 10,4

    8 10,1 11,4 10,2

    9 10,2 11,2 11,2

    10 9,5 11,4 10,7

    11 9,6 11,3 10,4

    Radios dados en centmetros

    Con base en los diagramas de caja y bigotes para las 3 mquinas, qu podra decir usted acerca

    de la calidad del lote de produccin analizado? Tome en cuenta localizacin y dispersin de la

    muestra en su respuesta.

    19. Se desea distribuir en 7 clases los datos de la vida til, medida en meses, de 50 bateras para

    automviles. Para ello se dispone de la siguiente informacin acerca de esa distribucin:

    La mediana de la vida til de las bateras es de 20 meses

    Las tres primeras clases contienen un total de 10 datos

    La mitad de los datos est en las tres ltimas clases

    La suma de los datos de las clases 2 y 3 es igual al nmero de datos de la clase 6

    En la clase 5 hay 11 datos y en la clase 7 hay 6 datos

    7 2f 2f= y 10P 10=

    Obtenga la distribucin de frecuencias de la vida til de las 50 bateras.

    20. Construya el diagrama de caja y bigotes para los datos del ejercicio anterior.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 37

    RESPUESTAS

    1. a. F b. F c. F d. V 2. a.i b.ii c.ii d.iv e.iii 3. n 1

    M Me2

    += =

    4.

    2

    2

    n 1n impar

    2(n 1)(2n 1)M , Me

    6 n 1 1n par

    2 4

    +

    + + = =

    + +

    5. 2

    2 2c

    n 1 n(n 1)S , S

    12 12

    += =

    6. a. 37.583 b. 56.67 c. 42.5 d. 18.78 7.

    Clase

    Inicio

    Fin

    Marca de

    clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 -42 -22 -32 4 4 4/60 4/60

    2 -22 -2 -12 8 12 8/60 12/60

    3 -2 18 8 6 18 6/60 18/60

    4 18 38 28 30 48 30/60 48/60

    5 38 58 48 4 52 4/60 52/60

    6 58 78 68 8 60 8/60 1 8.

    Clase

    Inicio

    Fin

    Marca

    de clase

    (xi)

    Fi

    Fi

    hi

    Hi

    1 10 15 12.5 25 25 25/300 25/300

    2 15 20 17.5 75 100 75/300 100/300

    3 20 25 22.5 50 150 50/300 150/300

    4 25 30 27.5 50 200 50/300 200/300

    5 30 35 32.5 75 275 75/300 275/300

    6 35 40 37.5 25 300 25/300 1 9.

    Clase Inicio Fin fi Fi hi Hi

    1 0 4 4 4 4/60 4/60

    2 4 8 12 16 12/60 16/60

    3 8 12 25 41 25/60 41/60

    4 12 16 10 51 10/60 51/60

    5 16 20 4 55 4/60 55/60

    6 20 24 5 60 5/60 1

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 38

    10.

    Clase

    Inicio

    Fin

    Marca

    de clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 0.0 0.2 0.1 10 10 0.05 0.05

    2 0.2 0.4 0.3 30 40 0.15 0.20

    3 0.4 0.6 0.5 60 100 0.30 0.50

    4 0.6 0.8 0.7 64 164 0.32 0.82

    5 0.8 1.0 0.9 20 184 0.10 0.92

    6 1.0 1.2 1.1 16 200 0.08 1.00 11.

    12.

    MEDIA = 3.31 MEDIANA = 3 MODA = 2

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 39

    13.

    14.

    RANGO INTERCUARTIL = 20 15.

  • Probabilidad y Estadstica Fundamentos de Estadstica Descriptiva

    Jos Luis Quintero 40

    16.

    PORCENTAJE EN ESPECIFICACIONES: 70%

    19.

    Clase

    Inicio

    Fin

    Marca de

    clase

    (xi)

    fi

    Fi

    hi

    Hi

    1 0 5 2.5 2 2 0.04 0.04

    2 5 10 7.5 3 5 0.06 0.10

    3 10 15 12.5 5 10 0.10 0.20

    4 15 20 17.5 15 25 0.30 0.50

    5 20 25 22.5 11 36 0.22 0.72

    6 25 30 27.5 8 44 0.16 0.88

    7 30 35 32.5 6 50 0.12 1.00

  • Jos Luis Quintero

    ROBABILIDADES (ITEL-30205)

    Tema 1. Fundamentos de Estadstica Descriptiva

    Distribucin defrecuencias y medidas de localizacin

    [1] CANAVOS, GEORGE. Probabilidad y Estadstica. Aplicaciones y Mtodos. Mc Graw Hill (1995)

    [2] DEVORE, JAY. Probabilidad y Estadstica para Ingeniera y Ciencias. Quinta edicin.

    Thomson Learning (2001)

    [3] DAZ, RAFAEL. Introduccin a la Probabilidad y a los Procesos Estocsticos en Ingeniera.

    Disponible en Mdulo 7 Universidad Catlica Andrs Bello (2011)

    [4] HINES, WILLIAM y MONTGOMERY, DOUGLAS. Probabilidad y Estadstica para Ingeniera. Tercera edicin. CECSA (1999)

    [5] LPEZ, RAFAEL. Clculo de Probabilidades e Inferencia Estadstica con tpicos de

    Econometra. Quinta edicin. Publicaciones UCAB (2009)

    [6] MARTNEZ, CIRO. Estadstica y Muestreo. Ecoe Ediciones (2003)

    [7] MEYER, PAUL. Probabilidad y Aplicaciones Estadsticas. Addison-Wesley Iberoamericana

    (1986)

    [8] MONTGOMERY, DOUGLAS y RUNGER, GEORGE. Probabilidad y Estadstica aplicadas a la Ingeniera. Mc Graw Hill (1998)

    [9] NIEVES, ANTONIO y DOMNGUEZ, FEDERICO. Probabilidad y Estadstica para Ingeniera.

    Un enfoque moderno. Mc Graw Hill (2010)

    [10] ORTEGA, JOAQUIN y WSCHEBOR, MARIO. Introduccin a la Probabilidad. Universidad

    Nacional Abierta (1993)

    [11] SPIEGEL, MURRAY; SCHILLER, JOHN y SRINIVASAN, ALU. Probabilidad y Estadstica. Segunda edicin. Serie Schaum (2001)

    [12] TRIOLA, MARIO. Probabilidad y Estadstica. Novena edicin. Pearson Addison Wesley

    (2004)

    [13] WACKERLY, DENNIS; MENDENHALL; WILLIAM y SCHEAFFER, RICHARD. Estadstica

    Matemtica con Aplicaciones. Sptima edicin. Cengage Learning Editores (2010)

    [14] WALPOLE, RONALD; MYERS, RAYMOND; MYERS, SHARON y YE, KEYING. Probabilidad y Estadstica para Ingeniera y Ciencias. Onceava edicin. Pearson (2012)

    BIBLIOGRAFA GENERAL

  • Jos Luis Quintero

    Ingeniero de Sistemas (I.U.P.F.A.N.) Magister Scientiarum enInvestigacin de Operaciones (U.C.V.) Doctor en Ciencias dela Computacin: rea de inters: Clculo Numrico yOptimizacin (U.C.V.). Postdoctor en Ciencias Gerenciales(U.N.E.F.A.). Actualmente se encuentra culminando el

    Fundamentos de Estadstica Descriptiva rene en unsolo material los puntos de inters de este segundo tema parael curso de Probabilidades que forma parte del conjunto deasignaturas del programa de estudios de Ingeniera deTelecomunicaciones. Aspectos de inters como organizacinde los datos en tablas de distribucin de frecuencias, medidasde tendencia central, medidas de localizacin, medidas de

    (U.N.E.F.A.). Actualmente se encuentra culminando elDoctorado en Ingeniera: rea de inters: Estadstica (U.S.B.).Investigador y profesor de pregrado y postgrado de la Facultadde Ingeniera de la Universidad Central de Venezuela. Profesorde la Escuela de Ingeniera de Telecomunicaciones de laUniversidad Catlica Andrs Bello.

    http://www.joseluisquintero.com/

    de tendencia central, medidas de localizacin, medidas dedispersin y diagramas de caja y bigotes forman parte delcontenido del tema. Se resuelven y proponen problemas adistintos niveles que buscan ilustran con situaciones sencillaslos aspectos tericos desarrollados en el tema. Determinadosgrficos estn generados con el programa MATLAB.

    El presente material se encuentra disponible para descargarde forma gratuita del sitio web