Primera Parte [Estadistica]

70
INTRODUCCION El proceso de apertura de mercados que vivimos en la actualidad, abre la posibilidad para que el país aumente sus montos de exportación, tanto para productos tradicionales, como no tradicionales. Pero a su vez, obliga a que las empresas ecuatorianas produzcan bienes con una calidad que les permita competir con productos similares en los mercados internacionales. Este proceso de globalización de la economía ha dado origen a un conjunto de documentos técnicos de referencia en el ámbito internacional que están siendo aplicados en las diferentes relaciones comerciales tanto a escala interna de los países, así como para la importación y exportación de productos. La competitividad es hoy una de las características sobresalientes dentro del mercado empresarial, ya no al nivel de países o regiones sino a escala mundial. Potencias, países, bloques, mercados unificados de Europa, Asia y América compiten ferozmente por controlar la economía. La competitividad en los años venideros continuará siendo la piedra angular para la supervivencia de las empresas. Las organizaciones no competitivas no tienen futuro y no pueden esperar sobrevivir en los próximos años. El ejecutivo de hoy no puede administrar como lo hacia años atrás, tiene que vivir forzosamente en el cambio, ya que estos son constantes y suceden cada vez con más velocidad. Las decisiones que se tomen hoy pueden no servir mañana, por lo que la resistencia al cambio es el gran enemigo de la empresa. - 1 -

Transcript of Primera Parte [Estadistica]

Page 1: Primera Parte [Estadistica]

INTRODUCCION

El proceso de apertura de mercados que vivimos en la actualidad, abre la posibilidad para que el país aumente sus montos de exportación, tanto para productos tradicionales, como no tradicionales. Pero a su vez, obliga a que las empresas ecuatorianas produzcan bienes con una calidad que les permita competir con productos similares en los mercados internacionales.

Este proceso de globalización de la economía ha dado origen a un conjunto de documentos técnicos de referencia en el ámbito internacional que están siendo aplicados en las diferentes relaciones comerciales tanto a escala interna de los países, así como para la importación y exportación de productos.

La competitividad es hoy una de las características sobresalientes dentro del mercado empresarial, ya no al nivel de países o regiones sino a escala mundial. Potencias, países, bloques, mercados unificados de Europa, Asia y América compiten ferozmente por controlar la economía.

La competitividad en los años venideros continuará siendo la piedra angular para la supervivencia de las empresas. Las organizaciones no competitivas no tienen futuro y no pueden esperar sobrevivir en los próximos años. El ejecutivo de hoy no puede administrar como lo hacia años atrás, tiene que vivir forzosamente en el cambio, ya que estos son constantes y suceden cada vez con más velocidad. Las decisiones que se tomen hoy pueden no servir mañana, por lo que la resistencia al cambio es el gran enemigo de la empresa.

La resistencia a los cambios que impone la competitividad pueden poner en peligro la vida de la empresa, dependiendo del tema que se trate puede ser un suicidio empresarial que la dirección responda “en esta empresa siempre hemos hecho así, y siempre nos ha ido bien; continuaremos así y punto” la resistencia al cambio es la gran fuerza negativa que se opone al progreso de la empresa y hay que dedicarle especial atención, pero ¿quienes deben trabajar en la sobrevivencia de la empresa?. ¿Los directivos?. Desde luego que ¡NO! Estos son temas de conciencia de grupo. Empresarios y trabajadores, empresarios y sindicatos, empresarios y ejecutivos, tienen por primera vez en la historia un objetivo común SOBREVIVIR.

El éxito empresarial en el futuro depende de la calidad de sus productos, no de la cantidad de los mismos, además el secreto del éxito esta en como se trate al recurso humano, los directivos se encuentran en la obligación de proporcionar elementos, herramientas e información para que todo trabajador pueda comprometerse con la política de la empresa sobre calidad y colaborar primero desde un punto de vista egoísta CONSERVAR SU EMPLEO Y LUEGO DESDE LA VISION COLECTIVA DE AYUDAR A TODOS SUS COMPAÑEROS para mantener el barco a flote, ya que si este se hunde no hay futuro para nadie.

- 1 -

Page 2: Primera Parte [Estadistica]

Los directivos y trabajadores deben comprender que en el actual sistema de economía abierta es necesario asegurar el futuro con una sólida formación del equipo humano. Las empresas e instituciones ecuatorianas requieren el cambio. Pero no se hace nada para concretarlo, no se da la suficiente importancia al más importante de todos los recursos, el recurso humano. Es necesario que los directivos inviertan en entrenamiento de personal, comprendiendo que no es un gasto impugno, sino una inversión.

Implantar un sistema de calidad con un directivo que pone resistencia al cambio en una empresa o institución no es una tarea fácil, más aún si desea únicamente por que está de moda hablar de Gerencia de Calidad, Sistemas de Calidad, Calidad Total, etc. Pero no se encuentra preparado para afrontar los retos de cambio, en estos casos una actitud muy típica es nombrar un responsable de calidad y decirle “usted encárguese de la calidad” para luego dejarle solo, sin apoyo, lo cual imposibilita que el sistema funcione. Lo mismo sucede cuando se contrata un consultor, y se cree que ya está todo solucionado por el único hecho de contratarle.

Para implantar un sistema de calidad y luego mantenerlo hay que contar desde un principio con todas las personas que componen la empresa. Antes de comenzar un programa de implantación de la calidad es necesario realizar un diagnóstico, para ver en primer lugar, que se esta haciendo en conformidad con las normas. Seguramente la empresa, sin darse cuenta cumple, con muchos de los requisitos de las normas, sencillamente por que la calidad es la aplicación de la lógica. Generalmente tanto productos como servicios ya están considerados bajo el enfoque de la calidad, de lo contrario, la empresa tal vez hoy en día ya no existiría.

El presente material ha sido elaborado con la finalidad de proporcionar a los estudiantes de la Escuela de Producción Metal Mecánica una guía sobre los principales tópicos del Control Estadístico de la Calidad. Se divide en dos partes: herramientas estadísticas básicas, utilizadas en el Control de la Calidad y Control Estadístico de la Calidad. Cumple con el Programa de estudios de la mencionada Escuela.

El autorJOSE GRANIZO

- 2 -

Page 3: Primera Parte [Estadistica]

INDICEPAGINA

INTRODUCCION 2

CAPITULO I

1.0 ESTADISTICA 71.1 POBLACION Y MUESTRA 71.2 VARIABLE 71.3 TOMA DE DATOS 81.4 DISTRIBUCION DE FRECUENCIAS 81.4.1 REGLA PARA LA FORMACION DE FRECUENCIAS 81.5 FRECUENCIA RELATIVA 111.6 FRECUENCIA ACUMULADA U OJIVA 111.7 FRECUENCIA RELATIVA ACUMULADA 121.8 FORMAS DE LOS HISTOGRAMAS 121.9 MEDIDAS DE TENDENCIA CENTRAL 141.9.1 MEDIA ARITMETICA O MEDIA 141.9.1.1 PROPIEDADES DE LA MEDIA ARITMETICA 141.9.2 MODA 151.9.3 MEDIANA 151.9.4 RELACION EMPIRICA ENTRE MEDIA, MEDIANA Y MODA 161.9.5 MEDIA GEOMETRICA 161.9.6 MEDIA ARMONICA 171.9.7 RELACION ENTRE MEDIAS ARITMETICA, GEOMETRICA Y

ARMONICA 171.9.8 RAIZ CUADRATICA MEDIA 171.9.9 CONCEPTO DE CUARTILES, DECILES Y PERCENTILES 171.10 MEDIDAS DE DISPERSION 191.10.1 DESVIACION MEDIA 191.10.2 DESVIACION ESTANDAR 191.10.3 VARIANZA 211.10.4 RELACIONES ENTRE LAS MEDIDAS DE DISPERSION 211.10.5 CORRECCION SHEPPARD PARA LA VARIANZA 221.10.6 PROPIEDADES DE LA DESVIACION ESTANDAR 221.10.7 COEFICIENTE DE VARIACION 24

CAPITULO II

2.0 TEORIA ELEMENTAL DE PROBABILIDADES 272.1 DEFINICION CLASICA DE LA PROBABILIDAD 272.2 DEFINICION DE PROBABILIDAD COMO

FRECUENCIA RELATIVA 272.3 ESPACIO MUESTRAL 282.4 PROBABILIDAD CONDICIONAL;

INDEPENDENCIA DE SUCESOS 28

- 3 -

Page 4: Primera Parte [Estadistica]

2.5 SUCESOS MUTUAMENTE EXCLUYENTES 292.6 SUCESOS NO EXCLUYENTES 302.7 SUCESOS COMPUESTOS 302.8 PERMUTACIONES Y COMBINACIONES 302.9 FORMULA DE LA PROBABILIDAD COMPLETA 342.10 FORMULA DE BAYES 342.11 DISTRIBUCION DE PROBABILIDAD DISCRETA 362.12 DISTRIBUCION DE PROBABILIDAD CONTINUA 372.13 ESPERANZA MATEMATICA 382.14 MOMENTOS, SESGO Y CURTOSIS 392.14.1 MOMENTOS 392.14.2 MOMENTO DE ORDEN r CON RESPECTO A LA MEDIAX 402.14.3 MOMENTO DE ORDEN r CON RESPECTO A UN PUNTO

CUALQUIERA A 402.15 RELACION ENTRE MOMENTOS 412.16 SESGO 422.17 CURTOSIS 42

CAPITULO III

3.0 DISTRIBUCIONES DE PROBABILIDADES 433.1 DISTRIBUCION NORMAL 443.1.1 CARACTERISTICAS DE LA CURVA NORMAL 453.1.2 PROPIEDADES DE LA DISTRIBUCION NORMAL 453.2 DISTRIBUCION BINOMIAL 473.2.1 PROPIEDADES DE LA DISTRIBUCION BINOMIAL 483.3 RELACIONES ENTRE DISTRIBUCIONES BINOMIAL Y

NORMAL 493.4 DISTRIBUCION EXPONENCIAL (LLAMADA DE POISSON). 493.4.1 USO DE LAS TABLAS DE POISSON 493.4.2 PROPIEDADES DE LA DISTRIBUCION DE POISSON 503.5 DISTRIBUCION HIPERGEOMETRICA 50

CAPITULO VI

FILOSOFIA DE LA GESTION DE CALIDAD

4.1 INTRODUCCION 534.1.1 MARCO CONCEPTUAL DEL CONTROL DE CALIDAD 534.2 CARACTERÍSTICAS DE CALIDAD 544.2.1 PARAMETROS EN QUE SE CLASIFICAN LAS CARACTERÍSTICAS

DE CALIDAD 544.2.1.1 CALIDAD DE DISEÑO 544.2.1.2 CALIDAD DE CONFORMIDAD 55

- 4 -

Page 5: Primera Parte [Estadistica]

4.3 LA GESTION DE LA CALIDAD 554.3.1 LA POLITICA DE LA CALIDAD 554.3.2 LOS OBJETIVOS DE LA CALIDAD 554.3.3 LOS SISTEMAS DE CALIDAD 564.3.4 EL CICLO DE LA CALIDAD 564.4 MANUAL DE CONTROL DE CALIDAD DE UNA EMPRESA 574.5 ORGANIZACION PARA LA CALIDAD 584.6 FUNCIONES BASICAS DEL DEPARTAMENTO DE CONTROL DE

CALIDAD 604.6.1 TAREAS PRINCIPALES DE UN DEPARTAMENTO DE CALIDAD 614.7 COSTOS DE CALIDAD 614.7.1 COSTOS DE PREVENCION 614.7.2 COSTOS DE VERIFICACION O EVALUACION 624.7.3 COSTOS POR FALLAS INTERNAS 624.7.4 COSTOS POR FALLAS EXTERNAS 634.8 CURVA DEL COSTO OPTIMO DE LA CALIDAD 634.9 PLANIFICACION DE LA CALIDAD 64

CAPITULO VI

CONTROL DE CALIDAD POR TABLAS DE MUESTREO

5.1 GENERALIDADES 665.2 INSPECCION EN CONTROL DE CALIDAD 665.2.1 FORMAS DE INSPECCION 665.2.2 GRADOS DE INSPECCION 675.3 RIGUROSIDAD DE LA INSPECCION 685.4 PLANES DE MUESTREO 685.4.1 MUESTREO POR ATRIBUTOS 695.4.2 MUESTREO POR VARIABLES 695.4.3 VENTAJAS DEL MUESTREO 695.4.4 DESVENTAJAS DEL MUESTREO 695.4.5 TIPOS DE MUESTREO 705.5 CLASIFICACION DE LOS DEFECTOS 705.6 NIVEL ACEPTABLE DE CALIDAD 715.6.1 INFORMACION NECESARIA PARA REALIZAR UN MUESTREO POR

ATRIBUTOS 715.6.2 APLICACION DEL MUESTREO SIMPLE 725.6.3 APLICACION DEL PLAN DE MUESTREO DOBLE 725.6.4 APLICACION DEL PLAN DE MUESTREO MULTIPLE 725.7 CURVA CARACTERISTICA DE OPERACION PARA UN

PLAN DE MUESTREO 745.7.1 RIESGO DEL PRODUCTOR 755.7.2 RIESGO DEL CONSUMIDOR 75

- 5 -

Page 6: Primera Parte [Estadistica]

CAPITULO VI

GRAFICOS DE CONTROL DE CALIDAD

6.1 GENERALIDADES 766.2 TIPOS DE GRAFICOS DE CONTROL 766.2.1 GRAFICOS DE CONTROL POR ATRIBUTOS 766.2.2 GRAFICOS DE CONTROL POR VARIABLES 766.3 CALCULO CON AJUSTES 786.4 GRAFICOS n.P 786.5 GRAFICO C 796.6 GRAFICO U 806.7 GRAFICOS DE DISTRIBUCION DE FRECUENCIAS 836.8 GRAFICOS (X R) 836.9 CAPACIDAD DEL PROCESO 86

BIBLIOGRAFIA 87

ANEXOS 88

- 6 -

Page 7: Primera Parte [Estadistica]

PRIMERA PARTE

ESTADISTICA BASICA

CAPITULO I

1.0 ESTADISTICA. Esta ciencia se encarga del estudio de los fenómenos aleatorios, su aspecto más importante es la obtención de conclusiones a partir de datos experimentales y toma de decisiones razonables a partir de los datos obtenidos, este proceso se conoce como Inferencia Estadística /1/.

Para su estudio y aplicación se divide en estadística descriptiva y en estadística de inferencia, que son complementarias. La estadística descriptiva se relaciona con la representación gráfica de lo que se tiene en números o en tablas, ayuda a visualizar más fácilmente lo expresado numéricamente. La estadística de inferencia se relaciona con los cálculos y aplicaciones de fórmulas matemáticas.

1.1 POBLACION Y MUESTRA. Población es el conjunto de acontecimientos que tienen características comunes entre sí, y virtualmente puede ser de carácter finito e infinito. Muestra es un subconjunto representativo de la población que se lo considera cuando por diversas razones, sobre todo económicas, no se puede trabajar con toda la población.

La inferencia estadística se basa sobre todo en la evidencia muestral, lo cual se denomina teoría del muestreo o enfoque clásico de la inferencia estadística. En estadística la inferencia es inductiva ya que se proyecta de lo específico (muestra) hacia lo general (población), por lo que siempre existirá la posibilidad de error, razón por la cual hace que esta sea una ciencia, separándolo del arte de simplemente adivinar. Procesado un evento matemáticamente existe una medida de confiabilidad, lo cual se expresa en términos probabilísticos.

1.2 VARIABLE. Es cualquier característica que, en una población o en una muestra, puede tomar distintos valores. Sus valores extremos se conoce como límites de una variable. Las variables pueden ser discretas y continuas.

Al trabajar con valores de una variable se debe definir claramente lo siguiente:

a) La población o la muestra que se desea estudiar.b) La variable que se va a medir de esa población o de esa muestra.

En estadística todo problema se caracteriza por los siguientes cuatro elementos/1/:

a) La población de interés y el procedimiento científico que se empleó para el muestreo la población.

b) La muestra y el análisis matemático de su información.

- 7 -

Page 8: Primera Parte [Estadistica]

c) Las inferencias estadísticas que resulten del análisis de la muestra.d) La probabilidad de que las inferencias sean correctas.

1.3 TOMA DE DATOS. Es la recopilación de datos numéricos, los cuales han sido ordenados. Al recoger datos se debe tomar en cuenta las siguientes precauciones:

a) Que los datos pertenezcan a una misma variable.b) Sean los más exactos y completos posibles.c) Estén tomados en condiciones normales de trabajo y por personal confiable.

Una vez que los datos han sido tomados se procede a su ordenación en sentido creciente o decreciente y la diferencia entre el mayor y el menor se denomina rango o recorrido.

1.4 DISTRIBUCION DE FRECUENCIAS. La distribución de frecuencias, junto con el histograma y las medidas de tendencia central y de dispersión, representan los métodos claves para resumir datos. La distribución de frecuencias permite presentar hechos, de tal forma que se pone de manifiesto la tendencia central y la dispersión a lo largo de la escala de medida. Para su construcción se requiere agrupar los datos en clases o categorías. El número de observaciones que pertenecen a cada clase se conoce como frecuencia de clase o categoría, mientras que el cociente de una frecuencia de clase con respecto al número total de observaciones se conoce como frecuencia relativa de esa clase o categoría. Las fronteras de las clases se denominan límites y su punto medio representa la marca de clase. La diferencia entre las fronteras de clase inferior y superior se denomina tamaño o anchura de un intervalo de clase. La media entre el límite superior de una clase y el límite inferior de la clase contigua se conoce como limite real o verdadero de clase. Al graficar las frecuencias de las clases contra sus respectivos intervalos en forma de rectángulos, obtenemos un histograma de frecuencias o distribución de frecuencias. Al unir las marcas de clase mediante una línea en la parte superior de los rectángulos obtenemos un polígono de frecuencias/2/.

1.4.1 REGLAS GENERALES PARA FORMAR DISTRIBUCIONES DEFRECUENCIAS

Contar el número de datos en la población o en la muestra a analizar.Calcular el rango (R) de los datos. Determinar el número de clases, celdas o

intervalos, tomando en cuenta que no puede ser menor de cinco ni mayor de veinte, dependiendo del número de observaciones. Se llamará Q a la cantidad de clases que tendrá la distribución de frecuencias. Se recomienda elegir los intervalos de modo que las marcas de clase coincidan con datos observados con la finalidad de disminuir el error de agrupamiento /3/. Matemáticamente se puede determinar el número de clases utilizando la fórmula empírica siguiente:

Q=1+3,32·log10(N) 1.1

donde N=f

- 8 -

Page 9: Primera Parte [Estadistica]

Dividir el rango en el número de intervalos de clase del mismo tamaño determinado anteriormente, en caso de no ser factible se utilizará intervalos de clase de distinto tamaño o intervalos de clase abiertos. El resultado obtenido se recomienda redondear y representa la anchura o longitud del intervalo para cada clase.

Construir las clases tomando en cuenta que los extremos de las mismas deben ser límites reales, por lo que tendrán un decimal más y terminaran en cinco.

Marcar cada observación dentro de la clase correspondiente y determinar la frecuencia de cada clase o categoría.

En las fuentes bibliográficas /3,4/ se analiza el siguiente ejemplo de aplicación.

En la Tabla 1 se muestran los “datos originales” de la medición de la resistencia eléctrica de 100 bobinas, construir una distribución de frecuencias, un histograma y un polígono de frecuencias, un histograma de frecuencias relativas, una ojiva y una ojiva porcentual.

Tabla 1 RESISTENCIA (EN OHMIOS) DE 100 BOBINAS

3,37 3,34 3,38 3,32 3,33 3,28 3,34 3,31 3,33 3,343,29 3,36 3,30 3,31 3,33 3,34 3,34 3,36 3,39 3,343,35 3,36 3,30 3,32 3,33 3,35 3,35 3,34 3,32 3,383,32 3,37 3,34 3,38 3,36 3,37 3,36 3,31 3,30 3,303,35 3,33 3,38 3,37 3,44 3,32 3,36 3,32 3,29 3,353,38 3,29 3,34 3,32 3,30 3,39 3,36 3,40 3,32 3,333,29 3,41 3,27 3,36 3,41 3,37 3,36 3,37 3,33 3,363,31 3,33 3,35 3,34 3,35 3,34 3,31 3,36 3,37 3,353,40 3,35 3,37 3,32 3,35 3,36 3,38 3,35 3,31 3,343,35 3,36 3,39 3,31 3,31 3,30 3,35 3,33 3,35 3,31

Max 3,40 3,41 3,39 3,38 3,44 3,39 3,38 3,40 3,39 3,38Min 3,29 3,33 3,37 3,31 3,30 3,28 3,31 3,31 3,29 3,30

MAX =3,44 MIN = 3,27

De acuerdo al cuadro el mayor de los datos tomados es 3,44 y el menor es 3,27 por lo que el rango o recorrido R = 0,17.

El siguiente paso consiste en ordenar en forma creciente los “datos originales.” Esta tabulación permite determinar la frecuencia de los datos de la variable.

La columna tabulación pone en evidencia la tendencia central y la dispersión de los valores. Mientras que la columna frecuencia acumulada indica el número de bobinas con resistencia igual o menor por debajo de un valor indicado.

La tabulación en la Tabla 2 muestra una gama de valores que van desde 3,27 hasta 3,44 en 17 intervalos de 0,01 ohmio cada uno. Se puede reducir el número de intervalos, agrupando los datos en seis clases o categorías. Al calcular el ancho de

- 9 -

Page 10: Primera Parte [Estadistica]

celda, clase o intervalo, mediante la formula 1.2 se obtiene un valor de 0,028 , redondeando este valor de acuerdo a las recomendaciones, tendremos 0,03 , que representa el valor de C.

1.2

En esta fórmula C representa la longitud o anchura del intervalo de clase, R el rango o recorrido y Q el número de clases o categorías.

Con la agrupación de datos en clases o categorías se simplifica su presentación y el estudio de la distribución, pero se pierden algunos detalles; no obstante se puede regresar a los valores originales de ser necesario.

Tabla 2 TABULACION DE DATOS

TABULACIONFRECUENCIA

FFRECUENCIA ACUMULADA

3,27 /3,28 /3,29 ///3,30 /////3,31 /////////3,32 /////////3,33 //////////3,34 ////////////3,35 //////////////3,36 /////////////3,37 ////////3,38 //////3,39 ////3,40 //3,41 //3,423,433,44 /

1135991012141386422--1

125101928385064778591959799--

100TOTAL f =100

Tabla 3 DISTRIBUCION DE FRECUENCIAS

Clases Límites de clase

Marca de clase X

Frecuencia de clase f

Frecuencia acumulada

Frecuencia relativa

Frecuencia relativa

acumulada123456

3,265 - 3,2953,295 – 3,3253,325 – 3,3553,355 – 3,3853,385 – 3,4153,415 – 3,445

3,283,313,343,373,403,43

523362781

528649199100

0,050,230,360,270,080,01

0,050,280,640,910,991,00

- 10 -

Page 11: Primera Parte [Estadistica]

Nótese que los límites de clase corresponden a límites reales o verdaderos debido a que poseen un decimal más que los datos reales y terminan en cinco. El histograma y el polígono de frecuencias (líneas punteadas), para los datos presentados en la Tabla 3, se representan a continuación.

Fig. 1. Histograma y polígono de frecuencias

De este gráfico se puede extraer las siguientes conclusiones:

a) Es un gráfico de fácil construcción e interpretación.b) Obtenemos una visión clara y rápida de la relación entre los valores de la

variable y sus frecuencias respectivas.

A más del histograma y el polígono de frecuencias que son las formas comunes de representar gráficamente una distribución de frecuencias, se utiliza también con este mismo propósito la nube de puntos y el diagrama de ordenadas.

1.5 FRECUENCIA RELATIVA. La frecuencia relativa de una clase o categoría se obtiene dividiendo la frecuencia de la clase por el total de frecuencias de todas las clases o categorías y se expresa generalmente como porcentaje. Su representación gráfica se realiza como en el caso anterior, con la diferencia que en el eje vertical se coloca los valores de la frecuencia relativa. El gráfico que se obtiene se denomina histograma de frecuencias relativas o hitograma porcentual, el cual se obtiene de una distribución de frecuencias relativas.

1.6 FRECUENCIA ACUMULADA U OJIVA. La frecuencia acumulada representa todas los valores de las frecuencias hasta la clase que se requiere analizar, así por ejemplo si hasta la cuarta clase de la Tabla 3 nos interesa conocer el valor de la frecuencia acumulada, tendremos 5+23+36+27 = 91 valor que expresa el número de bobinas que tienen una resistencia menor a 3,385 ohmios.

- 11 -

Page 12: Primera Parte [Estadistica]

La gráfica que representa las frecuencias acumuladas se conoce como polígono de frecuencias acumuladas u ojiva. Para los datos presentados en la Tabla 3 la ojiva se ilustra en la figura 2.

Fig. 2. Polígono de frecuencias acumuladas

1.7 FRECUENCIA RELATIVA ACUMULADA U OJIVA DE PORCENTAJES.

Fig. 3 (a) Histograma de frecuencias relativas (b) Ojiva de porcentajes

Conocida también como frecuencia porcentual acumulada, es la frecuencia total hasta la clase que nos interesa analizar y esta dividida por la frecuencia total, expresada en porcentaje. Su representación gráfica se realiza colocando en el eje vertical las frecuencias relativas acumuladas y como en los casos anteriores en el eje horizontal los límites de las clases como se observa en la figura 3b.

1.8 FORMAS DE LOS HISTOGRAMAS. Al construir diagramas de frecuencias e histogramas se puede observar que los mismos toman varias formas, siendo los principales los que se muestran en la figura 4.

- 12 -

0

0,1

0,2

0,3

0,4

Clases

Fre

cuen

cia

Rel

ativ

a

3,265 - 3,295 3,295 - 3,325 3,325 - 3,355

3,355 - 3,385 3,385 - 3,415 3,415 - 3,445

0

0,5

1

1,5

Clases

Fre

cuen

cia

Rel

ativ

aA

cum

ula

da

3,265 - 3,295 3,295 - 3,325 3,325 - 3,355

3,355 - 3,385 3,385 - 3,415 3,415 - 3,445

Page 13: Primera Parte [Estadistica]

Fig. 4. Tipos de curvas de frecuencias.

- 13 -

NormalBinomial Sesgo (-)

Binomial Sesgo (+) Exponencial (Poisson) descendente forma "L"

Exponencial (Poisson) ascendente forma "J"

Crecimiento normal

Forma de U (Parabólica) Bimodal

Multimodal

Page 14: Primera Parte [Estadistica]

1.9 MEDIDAS DE TENDENCIA CENTRAL En el cálculo estadístico existen dos medidas fundamentales que se utilizan para inferir sobre el comportamiento de los valores obtenidos de un proceso, y tiene que ver con su posición y su dispersión. En una distribución de frecuencias, estas medidas son de tendencia central y de dispersión. Las medidas de tendencia central son: la media aritmética, la mediana, la moda, la media geométrica y la media armónica.

1.9.1 LA MEDIA ARITMÉTICA. La media aritmética de las observaciones es el promedio aritmético de éstas y se denota por:

1.3

donde: X , X2, X3………XN son datos independientes. Para calcular la media en una distribución de frecuencias se utiliza la formula:

1.4

,donde: f1, f2……fK representan las frecuencias de las clases. X1, X2…XK representan las respectivas marcas de clase.

1.9.1.1 PROPIEDADES DE LA MEDIA ARITMETICA. Murray R. Spiegel en su obra /2/ pagina 62, dentro de las principales propiedades destaca las siguientes:1. Si conocemos la media aritmética de un conjunto de números, entonces la suma

de sus desviaciones respecto a su media es cero.2. La suma de los cuadrados de las desviaciones de un conjunto de números Xj

respecto de un cierto número a es mínima si y sólo si a =X3. Si f1 números tiene media m1, f2 números tiene media m2, ……fK números tiene

media mK, entonces la media de todos los números se puede representar atravez de la media aritmética ponderada de los números.

1.5

4. Si A es una supuesta media marca de clase cualquiera y si dj = Xj – A son las desviaciones de Xj respecto de A las ecuaciones 1.3 y 1.4 se convierten respectivamente, en:

1.6

- 14 -

Page 15: Primera Parte [Estadistica]

1.7

Los cálculos de la media aritmética con ayuda de las fórmulas 1.4 y 1.7 se llaman métodos largos y cortos respectivamente, Si los intervalos de clase tienen todos igual tamaño o longitud C, entonces la media aritmética puede calcularse por el método clave o de compilación.

1.8

donde

1.9.2 MODA. La moda es el valor de la variable que se presenta con mayor frecuencia. Se utiliza para distribuciones sumamente sesgadas, cuando aparecen dos picos o para eliminar el efecto de los valores extremos, en una serie de números la moda puede no existir o la serie puede ser bimodal, etc.

Para una distribución de frecuencias la moda se calcula a partir de la formula:

1.9

donde: L límite real inferior de la clase modal.1 exceso de la frecuencia modal sobre la de la clase inferior inmediata.2 exceso de la frecuencia modal sobre la de la clase superior inmediata.C tamaño o anchura del intervalo de clase.

En una curva de distribución de frecuencias la moda es el valor máximo correspondiente a la curva sobre el eje de las ordenadas.

1.9.3 MEDIANA. La mediana de una serie de números ordenados de acuerdo a su magnitud es el valor medio o la media de los números intermedios. Se usa para reducir el efecto de los valores extremos o para datos que se pueden ordenar pero que no se pueden medir económicamente como: olor, sabor, apariencia, etc. Para una distribución de frecuencias se utiliza la formula:

1.10

donde: L límite real inferior de la clase mediana.

- 15 -

Page 16: Primera Parte [Estadistica]

N número total de datos.1 suma de frecuencias de todas las clases, por debajo de la clase

mediana. f mediana frecuencia de la clase mediana.

c tamaño del intervalo de la clase mediana.

Para datos agrupados, la mediana es aquel valor que divide en dos partes iguales la distribución de frecuencia relativa.

Fig. 5. Relación entre distribuciones: a) Sesgada a la derechab) Sesgada a la izquierda. c) Normal.

1.9.4 RELACION EMPIRICA ENTRE MEDIA, MEDIANA Y MODA

En curvas de frecuencias unimodales, se tiene la siguiente relación empírica:

Media – moda = 3 (media – mediana)

Las posiciones relativas de la media, moda y mediana en curvas medianamente asimétricas se muestra en la Figura 5a y 5b, para curvas simétricas estos valores coinciden en el punto más alto de la curva.

1.9.5 MEDIA GEOMETRICA G. La media geométrica es la medida de tendencia central que nos sirve para identificar distribuciones de datos que no varían en forma aritmética, sino geométricamente, esta medida de tendencia central, se calcula por la fórmula:

1.11

donde: X1, X2, …, XN - números positivos independientes.

Para datos agrupados se utiliza la fórmula:

- 16 -

med

iana

mod

a

mod

a

med

iana

mod

a

X

med

iana

X

X

a b

c

Page 17: Primera Parte [Estadistica]

1.12

donde: XJ - marcas de clase.

1.9.6 MEDIA ARMONICA H. La media armónica de un conjunto de datos independientes es la reciproca de la media aritmética de los recíprocos de esos números. Se recomienda su uso para datos que se encuentran en función del tiempo. Matemáticamente se expresa así:

1.13

Para el calculo de la media armónica para datos agrupados se utiliza la formula:

1.14

donde: X1, X2, …, XN marcas de clase.f1, f2, …, fK frecuencias.

1.9.7 RELACION ENTRE MEDIAS: ARITMETICA, GEOMETRICA Y ARMONICA

La media armónica de datos independientes positivos, es menor o igual que la media geométrica y ésta es menor o igual que la media aritmética.

1.9.8 RAIZ CUADRATICA MEDIA. La raíz cuadrática media matemáticamente se define como la raíz cuadrada de la suma de los cuadrados de las observaciones, cuyo valor es dividido para el número total de ellas. Se recomienda su uso para funciones periódicas y en aplicaciones físicas. Está dada por la fórmula:

1.15

1.9.9 CONCEPTO DE CUARTILES, DECILES Y PERCENTILES. Los valores que permiten dividir a una serie de números ordenados en cuatro partes se denominan cuártiles y se representa Q1,Q2,Q3,Q4 llamándose primer cuártil, segundo cuártil, tercer cuártil, respectivamente. Q2 representa la mediana de la serie. Los valores de la serie que dividen a los datos en diez partes iguales se denominan déciles y se representa por D1, D2,…, D9, mientras que los valores que dividen en cien partes la serie se llaman percéntiles denotándose P1, P2,…, P99. El percéntil P50 coincide

- 17 -

Page 18: Primera Parte [Estadistica]

con la mediana de la serie y los percéntiles P25, P75 coinciden con el primer y tercer cuártil.

Las medidas de tendencia central proporcionan información acerca de un conjunto de datos pero no proporcionan ninguna información acerca de la variabilidad de las observaciones.

Ejemplo: Calcular la media aritmética por los métodos: largo, corto y clave, la moda, la mediana, la media geométrica para los datos presentados en la Tabla 3.

Tabla 4 CALCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL

dJ = XJ A f dJ f Log X f log X

d1 = -0,06d2 = -0,03d3 = 0,00d4 = 0,03d5 = 0,06d6 = 0,09

-0,30-0,69 0 0,810,480,09

-2-10123

-10-23027163

0,51587380,51982790,52374640,52762990,53147890,5352941

2,579369011,959604218,85487014,2460074,25183120,5352941

fd=0,39

f =13 flogX=52,423413

- 18 -

Page 19: Primera Parte [Estadistica]

1.10 MEDIDAS DE DISPERSIÓN. Las medidas de dispersión son aquellas que sirven para identificar que tan esparcidos están los datos o lecturas de un grupo, conjunto o población. Las más usuales son: El rango, la desviación media, la desviación estándar, la varianza, el recorrido intercuartílico, el recorrido entre percéntiles y el coeficiente de variación.

Dispersión o variación es el grado en que los datos numéricos tienden a extenderse al rededor de un valor medio.

1.10.1 DESVIACION MEDIA. La desviación media es la medida de dispersión que indica, en promedio la desviación de cada una de las lecturas con respecto a la media o promedio; matemáticamente representa el promedio de los valores absolutos de las diferencias entre cada observación y la media de éstas.

1.16

Para datos agrupados, la desviación media se calcula utilizando la siguiente formula:

1.17

donde: XJ - marcas de clase.

En las fórmulas 1.16 y 1.17 en lugar de la media puede utilizarse la mediana, con el propósito de atenuar los efectos de la existencia de algunos valores extremos, en ese caso se habla de la desviación mediana.

1.10.2 DESVIACION ESTANDAR. La desviación estándar es la medida de variación más utilizada para expresar el grado de dispersión de los valores de la distribución de frecuencias respecto a su media aritmética, se lo denomina en ocasiones desviación típica o desviación tipo.

- 19 -

Page 20: Primera Parte [Estadistica]

Se lo representa con la letra sigma minúscula ““ cuando se trata de datos de una población y cuando se trata de datos de una muestra se utiliza la letra “s” minúscula.

La desviación estándar muestral para datos independientes se define por:

1.18 1.19

donde: XJ valores observados en la muestra.N número total de observaciones.

Con el fin de facilitar el cálculo se puede utilizarse la siguiente formula:

1.20

Existen diferentes criterios que utilizan los expertos en estadística para el uso de n o de n 1 en el calculo de la desviación estándar, una regla práctica que se aplica es que si el número de observaciones en la muestra es menor de treinta se considera una muestra chica y se debe usar n 1. Para datos agrupados en una distribución de frecuencias, la desviación estándar muestral se calcula por la formula:

1.21

Existen métodos denominados cortos para él calculo de la desviación estándar, para datos independientes así como para datos agrupados, la formula 1.18 y 1.19 en este caso puede escribirse de la siguiente manera para datos independientes y agrupados respectivamente.

1.22

1.23

Si dJ = XJ A, dJ son las desviaciones de XJ con relación a una constante o una marca de clase cualquiera, entonces las fórmulas 1.22 y 1.23 se convierten en:

- 20 -

Page 21: Primera Parte [Estadistica]

1.24

1.25

Con frecuencia en el Control Estadístico de la Calidad, para muestras menores de treinta unidades se utiliza la siguiente formula:

1.26

Si en una distribución de frecuencias sus intervalos de clase tienen todos igual anchura c, entonces para el calculo de la desviación estándar, se puede utilizar el método clave o de compilación utilizando la siguiente formula:

1.27

donde

Las medidas de tendencia central así como las de dispersión se expresan en las mismas unidades de medida en que vienen expresadas los valores de las variables.

Para muestras de diez o menos observaciones, puede obtenerse la desviación

estándar a partir del recorrido o rango, entonces, = Donde d2 es un factor

utilizado para él cálculo estadístico del control por variables, (Anexo 1).

1.10.3 VARIANZA. La varianza matemáticamente representa el cuadrado de la desviación estándar, este valor se utiliza sobre todo en el diseño de experimentos.

1.10.4 RELACION ENTRE LAS MEDIDAS DE DISPERSION. Para distribuciones moderadamente asimétricas, como anota /3/ en la pagina 96 se cumple las siguientes relaciones empíricas:

Desviación media = Desviación estándar.

- 21 -

Page 22: Primera Parte [Estadistica]

Rango semi- intercuartil = Desviación estándar.

1.10.5 CORRECCION SHEPPARD PARA LA VARIANZA. Debido al agrupamiento de los datos en clases, el calculo de la desviación estándar tiene un error, denominado error de agrupamiento, para su corrección se utiliza la siguiente formula:

Varianza corregida = Varianza de datos agrupados -

C = tamaño del intervalo de clase.

1.10.6 PROPIEDADES DE LA DESVIACION ESTANDAR. En curvas de distribuciones normales el 68% de los sucesos se encuentran entre –1s –X yX +1s, el 95,45% se encuentra entre –2s –X yX + s, mientras que el 99,73% de los sucesos se encuentran entre –3s –X yX + 3s

Ejemplo: Utilizando los datos de la Tabla 3, calcular la desviación media, la desviación estándar por los métodos largo, corto y clave, aplicar la corrección Sheppard para la Varianza.

Tabla 5 CALCULO DE LA DESVIACIÓN MEDIA.

Clases o categorías

Límites de claseMarca de clase X

Frecuencia de clase f

|X 3,3439| f |X |

123456

3,265 - 3,2953,295 – 3,3253,325 – 3,3553,355 – 3,3853,385 – 3,4153,415 – 3,445

3,283,313,343,373,403,43

523362781

0,06390,03390,00390,02610,05610,0861

0,31950,77970,14040,70470,44880,0861

Tabla 6 CALCULO DE LA DESVIACION ESTANDAR

- 22 -

Page 23: Primera Parte [Estadistica]

X2 X2f DJ = XJ A f d2 f d f f2

0,0040830,0011490,0000150,0006810,0031470,007413

0,0204160,0264310,0005470,0183920,0251770,007413

10,758410,956111,155611,356911,560011,7649

53,7920251,9903401,6016306,6363 92,4800 11,7649

-0,06-0,03 0,00 0,03 0,06 0,09

0,01800,02070,00000,02430,02880,0081

-0,30-0,69 0,00 0,81 0,48 0,09

-2-1 0 1 2 3

-10-23 0 27 16 3

20230,027329

; ; ; ;

METODO LARGO

METODO CORTO

METODO CORTO UTILIZANDO DESVIACIONES

METODO CLAVE

VARIANZA CORREGIDA =

1.10.7 COEFICIENTE DE VARIACION

- 23 -

Page 24: Primera Parte [Estadistica]

El concepto de relación relativa se expresa así:

1.2

Tomando en cuenta que la dispersión absoluta es la desviación estándar s y el promedio representa la media aritméticaX, entonces a la dispersión relativa se conoce también como coeficiente de variación, o coeficiente de dispersión, como lo señala Murray R. Spiegel en su obra, Estadística /2/. La dispersión relativa se representa por V.

1.29

Generalmente su resultado se expresa en porcentaje.

EJEMPLOS DE APLICACIÓN

Ejemplo 1: En un torno revolver se tornean ejes de diámetro 12h10 (12-0,07). Se requiere evaluar la precisión de los mismos, para lo cual se utiliza un instrumento con aproximación de 0,01 mm. Al tomar una muestra de 200 ejes, ordenar sus valores en forma ascendente y construir una distribución de frecuencias se obtuvo los valores que se muestra en la Tabla 7.Construir: (a) un histograma y un polígono de frecuencias, (b) un histograma de frecuencias relativas y (c) calcular la desviación estándar.

Tabla 7 DISTRIBUCION DE FRECUENCIAS

Limite real, dI

De clase, mmMarca de clase Xi

Frecuencia de clase I

Frecuencia relativa

Frecuencia relativa

acumulada11,915 – 11,92511,925 – 11,93511,935 –11,94511,945 –11,95511,955 – 11,96511,965 – 11,97511,975 – 11,98511,985 – 11,99511,995 – 12,005

11,92011,93011,94011,95011,96011,97011,98011,99012,000

262048563420122

0,010,030,0100,0240,0280,0170,0100,060,01

0,010,040,140,380,660,830,930,991,00

0,00320,00540,00800,00480,00000,00340,00800,01080,0032

X = 11,96 rel =1

Solución:El rango calculado a partir de los límites reales de clase es dmax – dmin; 12,005

– 11,915 =0,09 mm.

- 24 -

Page 25: Primera Parte [Estadistica]

La media aritmética

Fig. 6 Histograma y polígono de frecuencias

Desviación estándar

EJERCICIOS PARA RESOLVER

1. Los siguientes datos fueron registrados al determinar el volumen de un nuevo producto, luego del proceso de envasado (cm3).

90,7 92,6 88,1 87,3 91,590,6 93,4 85,6 89,5 90,188,6 93,5 85,8 89,9 89,385,6 89,5 90,1 92,9 88,290,9 91,7 85,9 88,5 89,494,7 86,5 88,3 90,8 94,092,1 87,1 89,2 91,6 91,288,1 87,3 91,5 95,5 86,587,8 90,6 93,4 85,6 89,586,4 89,4 90,1 93,4 84,2

- Grafíque una tabla de frecuencias - Construir un histograma y un polígono de frecuencias.- Una distribución, un histograma, un polígono de frecuencias relativas.- Una distribución de frecuencias acumuladas.

- 25 -

2 6

20

212

20

34

56

48

0

10

20

30

40

50

60

11,92 11,93 11,94 11,95 11,96 11,97 11,98 11,99 12,00

mm.

Page 26: Primera Parte [Estadistica]

- Una ojiva y una ojiva porcentual.- Si la especificación es de 90 7,5 cm3. Indique cuantas de estas

especificaciones se encuentran fuera de tolerancias.- Encuentre la desviación estándar por los métodos: largo, corto y clave. - Utilizando la relación empírica: media – moda =3(media -mediana) encuentre el

valor modal para la distribución.

2. Calcule la moda, la media armónica, la media geométrica y la desviación media para el ejemplo anterior.

3. Luego del proceso de maquinado de ejes para motores, se tomó una muestra de n = 100 y se determinó su diámetro, obteniéndose los siguientes resultados (mm)/7/.

10,14 10,15 10,12 10,16 10,15 10,14 10,16 10,12 10,17 10,1310,16 10,13 10,15 10,17 10,14 10,13 10,17 10,15 10,11 10,1410,12 10,17 10,14 10,10 10,16 10,15 10,14 10,16 10,15 10,1510,15 10,16 10,18 10,16 10,10 10,18 10,16 10,13 10,14 10,1710,13 10,15 10,13 10,15 10,17 10,14 10,19 10,15 10,16 10,1510,14 10,18 10,14 10,18 10,16 10,12 10,16 10,18 10,14 10,1310,11 10,15 10,16 10,15 10,13 10,15 10,14 10,16 10,15 10,1210,16 10,17 10,14 10,16 10,19 10,21 10,13 10,15 10,19 10,1610,17 10,15 10,18 10,15 10,14 10,17 10,16 10,17 10,14 10,1510,14 10,16 10,15 10,19 10,16 10,15 10,14 10,15 10,16 10,14

- Indique gráficamente en el histograma si el proceso es capaz de cumplir con las especificaciones 0,15 (la condición para que un proceso sea capaz es que:

CP= ).

Para que un proceso sea exacto la condición es que la media del proceso sea igual a la media de la especificación. Indique con relación al valor nominal de la especificación, si este proceso es exacto o no.

- 26 -

Page 27: Primera Parte [Estadistica]

CAPITULO II

2.0 TEORIA ELEMENTAL DE PROBABILIDADES

La teoría de las probabilidades surgió en el siglo XVII en los trabajos de Pascal, Fermat, y Huygens, su desarrollo inicial se debe a la investigación de los juegos de azar. En la actualidad la teoría de las probabilidades, se ha convertido en una ciencia sin la cual no puede desarrollarse la experimentación, la astronomía, la estadística matemática, la teoría de la información, el control estadístico de la calidad, etc.

2.1 DEFINICION CLASICA DE PROBABILIDAD

La probabilidad de que un suceso aleatorio cualquiera A ocurra se denota por:

P(A) = 2.1

Donde m - número de casos favorables al suceso.n - Número total de casos posibles.

La probabilidad de no-ocurrencia del suceso viene expresada por la formula 2.2 y se conoce como el primer teorema básico de probabilidades.

q = 1 - P(A) 2.2

Entonces P(A) + q = 1 2.3

De la formula 2.3 se deduce que la probabilidad de ocurrencia de un suceso aleatorio cualquiera se encuentra comprendido entre 0 y 1.

Así por ejemplo durante el lanzamiento de un dado, siempre y cuando este se encuentre equilibrado puede darse el caso que aparezca los siguientes números 1,2,3,4,5,6 todos con igual probabilidad de salir. La probabilidad de obtener únicamente números pares es igual a:

2.2 DEFINICION DE PROBABILIDAD COMO FRECUENCIA RELATIVA.

Cuando el número de observaciones es grande, la probabilidad de ocurrencia del suceso se define como el límite de la frecuencia relativa.

- 27 -

Page 28: Primera Parte [Estadistica]

donde: Ns es el número de veces que ocurre el evento.N es el número de veces que se efectúa la experimentación.

Por ejemplo si en 1500 lanzamientos de una moneda resultan 840 caras, entonces la frecuencia relativa de caras es 840/1500 = 0,56. Si en otros 1500 lanzamientos resultan 930 caras, la frecuencia relativa en el total de los 3000 lanzamientos es (840 + 930)/ 3000 = 0,590.

2.3 ESPACIO MUESTRAL. El conjunto de todos los posibles resultados de un experimento aleatorio se conoce como espacio muestral (S). Este puede ser finito e infinito.

Un espacio muestral es discreto si su resultado puede colocarse en una correspondencia uno a uno con el conjunto de los enteros positivos. Y se dice que un espacio muestral es continuo cuando sus resultados consisten de un intervalo de números reales.

Un suceso es un conjunto de puntos de S tales como E1 o E2 como se muestra a continuación en el diagrama de Euler llamado también de Venn.

Fig. 7. Diagramas de Venn: a) unión de dos sucesos; b) intersección de dos sucesos; c) sucesos mutuamente excluyentes; d) un evento contenido en otro; e) un evento y

su complemento.

2.4 PROBABILIDAD CONDICIONAL. INDEPENDENCIA DE SUCESOS

Si A y B son dos eventos que se encuentran en un espacio muestral S, la probabilidad de que ocurra A dado que ocurrió B se denota por:

2.5

- 28 -

SE1

a

S

E2

b

SE1 E2

c

S

E2

E1

d

S

EE

e

E2 E1

Page 29: Primera Parte [Estadistica]

La formula 2.5 se denomina formula de la probabilidad condicional de A al ocurrir el evento B y es igual al cociente de la probabilidad del conjunto de A y B con respecto a la probabilidad marginal de B.

Por ejemplo, supóngase que la prueba consiste en arrojar un dado una sola vez. El suceso B es la salida de un número par y el suceso A, la salida del seis. En esta ocasión el suceso B es favorecido por tres casos (l=3) y el suceso (AB), por un solo caso (q=1). Por consiguiente, la probabilidad condicional del suceso A para la

condición B es igual a , o sea, P(A / B ) = .

Utilizando la noción de probabilidad condicional, se puede introducir un importante concepto de independencia de dos sucesos.

Sean A y B dos sucesos del espacio muestral S, El suceso A es estadísticamente independiente del suceso B, si la probabilidad condicional del suceso A para la condición B es igual a la probabilidad del suceso A, o sea, si

P(A / B) = P(A). 2.6

En el caso contrario, o sea, si P(A / B) P(A)P(B). 2.7

El suceso A se llama dependiente del suceso B.

De la ecuación 2.6 se desprende que si A es independiente de B, entonces

2.8

o, también:

P(AB) = P(A)P(B) 2.9

remplazando el valor de P(B) tendremos que P(A B) = P(A)P(B / A), de donde deducimos que, P(A)P(B) = P(A)P(B / A), para finalmente demostrar que el suceso B es independiente de A

P(B) = P(B / A) 2.8

2.5 SUCESOS MUTUAMENTE EXCLUYENTES.

Se dice que A y B son mutuamente excluyentes o incompatibles si la ocurrencia de uno de ellos imposibilita la ocurrencia del otro y se expresa por el teorema de la adición.

P(A B) = P(A) + P(B) 2.9

La ecuación 2.9 se conoce como caso especial del segundo teorema de probabilidades o del teorema de adición.

2.6 SUCESOS NO EXCLUYENTES.

- 29 -

Page 30: Primera Parte [Estadistica]

Si A1 y A2 son dos sucesos arbitrarios que se encuentran en un espacio muestral S y P(A B) denota la probabilidad de ocurrencia de A1 o A2 o ambos a la vez, entonces el teorema anterior se expresa de una forma más general.

P(A B) = P(A) + P(B) P(A B) 2.10

Conociéndose como el segundo teorema de probabilidades.

2.7 SUCESOS COMPUESTOS

La probabilidad del producto de los sucesos independientes en total es igual al producto de las probabilidades de estos sucesos. Por ejemplo si A, B y C son sucesos independientes, entonces:

P(A B C) = P(A)P(B)P(C) 2.11

Utilizando el concepto de probabilidad condicional se puede escribir que:

P(AB) = P(A)P(B / A) 2.12

Formula que se utiliza para sucesos compuestos dependientes y se conoce como el tercer teorema básico de probabilidades.

2.8 PERMUTACIONES Y COMBINACIONES

Se entiende por permutación el arreglo en un orden particular, de los objetos que forman un conjunto, por ejemplo consideramos las diferentes formas en que pueden situarse las letras a, b, c, d. Para la primera posición puede elegirse a cualquiera de las cuatro letras; para la segunda puede elegirse a cualquiera de las tres letras restantes; para la tercera posición de igual manera y para la cuarta posición debe seleccionarse la letra que no se utilizó. Entonces en este caso los arreglos o permutaciones son: 4321=24

La permutación de n objetos tomados de r en r se representa por:

2.13

El número de objetos tomados de n en n es:

2.14

Una combinación de n objetos de un conjunto, tomados de r en r es una selección de estos sin importar el orden de los r escogidos. George C. Canavos /1/ explica la diferencia entre una permutación y una combinación de la siguiente manera: el objetivo de la primera se centra en contar todas las posibles selecciones y todos los posibles arreglos, mientras que en la segunda el interés solo recae en contar el número de selecciones diferentes. De esta manera a, b, c y a, c, d son diferentes

- 30 -

Page 31: Primera Parte [Estadistica]

combinaciones de tres letras, mientras que a, c, d y a, d, c son distintas permutaciones de la misma combinación. El número de combinaciones de n objetos tomados de r en r se denota por

y viene expresado por:

2.15

Ejemplo: Calcular el número de combinaciones y permutaciones que pueden darse entre las letras a, b y c tomadas de dos en dos.

(Número de combinaciones). ab, ac y bc. Nótese que ab es la

misma combinación que , pero no la misma permutación.

nPr = 3 2 = 6 (Número de permutaciones). ab, ba, ac, ca, bc, y cb.

EJEMPLOS DE APLICACION

Ejemplo 1: Supongamos 10 miembros de una cooperativa aptos para ser elegidos Presidente, Vicepresidente y Secretario. Calcule el número de permutaciones posibles en la elección.

Solución: n =10, r = 3

Ejemplo 2. Encuentre el valor 8 P6

Solución: 876543 = 20160.

Ejemplo 3: De cuántas formas pueden 5 personas sentarse en un sillón si tienen solamente 3 asientos.

Solución: El primer asiento puede ocuparse con cualquiera de las 5 personas, quedando 4 para ocupar el segundo asiento y 3 personas para hacerlo el tercero. Luego el número de ordenaciones de n objetos diferentes tomados de r en r es:

Ejemplo 4: El Departamento de Control De Calidad comprueba la mitad de un lote de artículos y acepta todo el lote sí entre los artículos comprobados se desecha un solo artículo, como máximo. ¿ Cuál es la probabilidad de que un lote de 20 artículos se acepte si existen dos defectuosos?

Solución: Supóngase que el suceso A consiste en que entre los artículos comprobados no hay defectuosos y el suceso B, en que entre los artículos escogidos para la inspección se desecha un artículo. El lote de los artículos se reconocerá apto

- 31 -

Page 32: Primera Parte [Estadistica]

si se produce el suceso A B. Los sucesos A y B son mutuamente excluyentes o incompatibles, y por consiguiente es valida la formula:

P(A B) = P(A) + P(B)

Calculando la probabilidad del suceso A. Entre 20 artículos se puede escoger para la inspección 10 artículos por formas. Entre los artículos no defectuosos 10

artículos se escogen por formas. Razón por la cual .

Para el suceso B la cantidad de casos favorables es igual a (número de modos de escoger 9 artículos no defectuosos y un artículo defectuoso) y por eso

Conforme el teorema de la adición para sucesos mutuamente excluyentes tenemos:

Ejemplo 5: Supóngase una baraja de 36 naipes de la cual se saca a la suerte uno. ¿ Cuál es la probabilidad de que en una sola extracción se saque un naipe de espadas o un as?

Solución: Los Sucesos A (sale un naipe de espadas) y B (sale un as) no son mutuamente excluyentes o incompatibles. Por eso para determinar la probabilidad buscada del suceso AB. Se hace uso de la formula P(A) + P(B) P(A B)Las probabilidades de los sucesos, A, B y A B se calculan fácilmente:

, ,

Luego,

Ejemplo 6: Una sección de un circuito eléctrico está constituida por n elementos conectados en serie, cada uno de los cuales funciona independientemente

de los demás. Se conoce el grado de fiabilidad de cada uno durante un lapso de tiempo determinado. Hallar la probabilidad del buen funcionamiento de toda la sección del circuito, es decir la fiabilidad de la sección.

Solución: Si Ai es el suceso consistente en el funcionamiento irreprochable del elemento i y por A, el suceso consistente en el funcionamiento normal de toda la sección. Entonces:

A = A1 A2 A3…… An

- 32 -

1 2 nM N

Page 33: Primera Parte [Estadistica]

y puesto que los sucesos Ai son independientes en total,

P(A) = P(A1)P(A2)P(A3)…P(An) = P1P2…Pn

Ejemplo7: Considérese que A1 es el suceso extracción de un as de una baraja de cartas y A2 es el suceso de extracción de un rey, ¿cuál es la probabilidad de extracción de un as o un rey?

Solución: La probabilidad de extracción de un as o de un rey es:

P(A1 +A2) = 4/52 + 4/52 = 8/52 = 2/13

Un as o un rey no pueden extraerse al mismo tiempo en una sola extracción, siendo sucesos mutuamente excluyentes.

Ejemplo 8: Si A1, es el suceso extracción de un as, y A2 es el suceso de extracción de un brillo, entonces, A1 y A2 no son sucesos mutuamente excluyentes, puesto que puede ser extraído un as de brillos. ¿cuál es la probabilidad de extraer en una extracción un as o un brillo o ambos casos a la vez?

Solución:

Ejemplo 9: ¿De cuántas formas pueden seleccionarse 6 preguntas de un total de 10?

Solución: n = 10; C = 6.

Ejemplo 10: ¿Cuál es la probabilidad de que la primera carta que se entrega sea un as de cualquier tipo?

Solución:

Ejemplo 11: ¿Cuál es la probabilidad de que salga un 2 al tirar un dado?Solución:

a). P (2) = 1/6 b). P (4) = 1/6c). P (2,4) = 1/6 + 1/6 = 2/6 = 1/3son sucesos mutuamente excluyentes, por cuanto los dos sucesos no pueden ocurrir simultáneamente.

2.9 FORMULA DE LA PROBABILIDAD COMPLETA.

Sea H1, H2, … Hn un sistema completo de sucesos mutuamente excluyentes dos a dos vinculados con cierta prueba y sea A un suceso arbitrario ligado con el mismo experimento. Entonces la igualdad

- 33 -

Page 34: Primera Parte [Estadistica]

2.16

Se conoce como la fórmula de la probabilidad completa, donde los sucesos H1, H2, H3 suelen llamarse hipótesis. Esta formula se utiliza cuando es difícil encontrar directamente la probabilidad del suceso A, mientras que las probabilidades condicionales P(A / Hi) y las probabilidades de la hipótesis P(Hi) se calculan fácilmente.

Ejemplo: Dieciocho arboles de levas han sido fabricados en la primera sección de un taller, veinte en la segunda y doce en la tercera. Las secciones primera y tercera dan una producción de excelente calidad con la probabilidad de 0,9 y la segunda sección de 0,6 ¿cual es la probabilidad de que una pieza escogida al azar sea de excelente calidad?

Solución: Supóngase que el suceso A consiste en que la pieza escogida es de excelente calidad. Designemos por H1, H2, H3 los sucesos (hipótesis) consistentes en que la pieza escogida está fabricada en los talleres primero, segundo y tercero, respectivamente.Las probabilidades de la hipótesis son:

Las probabilidades condicionales del suceso A, a condición de que tengan lugar las hipótesis H1, H2, H3, están dadas, por lo que:

Aplicando la fórmula de la probabilidad compuesta tenemos que:

2.10 FORMULA DE BAYES. Imaginémonos la situación siguiente. Hay una urna que contiene tres bolas. Las bolas pueden ser de color blanco y de color negro, pero se desconoce completamente cuántas bolas en la urna son blancas y cuántas negras. En estas condiciones se pueden hacer cuatro hipótesis acerca del color de las bolas metidas en la urna, a saber: la hipótesis H0, o sea, en la urna hay 0 bolas de color blanco; la hipótesis H1, o sea, en la urna hay 1 bola blanca; la hipótesis H2, o sea, en la urna hay 2 bolas blancas y, por último, la hipótesis H3, o sea, en la urna hay 3 bolas blancas. Todas estas hipótesis son equiprobables, puesto que falta toda información acerca de la cantidad de las bolas blancas contenidas en la urna. Supongamos ahora, que de la urna se saca a la suerte una bola que resulta blanca. Una vez realizado este experimento, es ya completamente absurdo suponer que todas las cuatro hipótesis indicadas sean igualmente probables. Puesto que la bola extraída

- 34 -

Page 35: Primera Parte [Estadistica]

al azar es blanca, hay motivos de suponer más probable que en la urna haya más bolas blancas que negras, mientras que la hipótesis H0 después de la prueba realizada debe ser por completo abandonada. El hecho de que la bola sacada a la suerte es blanca, nos obliga a revisar el valor de la probabilidad de las hipótesis. Esta revalorización de las probabilidades de la hipótesis se lleva a cabo con ayude de las fórmulas de Bayes, que se deducen fácilmente del teorema de la multiplicación y de la fórmula de la probabilidad completa /11/.

Sea A un suceso arbitrario, y sean H1, H2, …, Hn un sistema completo de sucesos incompatibles dos a dos. Entonces conforme al teorema de multiplicación

2.17

de donde:

Sustituyendo ahora P(A) por su expresión en la fórmula de probabilidad completa, obtenemos la fórmula

2.18

Conocida como formula de Bayes.

Esta fórmula ofrece la expresión para las probabilidades de las hipótesis Hi, a condición de que se haya producido el suceso A, por las probabilidades P(Hi) y las probabilidades condicionales P(A / Hi) calculadas antes de producirse el suceso A.

Volvamos al problema acerca de la revalorización de las probabilidades de las hipótesis en el experimento con la urna de tres bolas. Sea A el suceso consistente en que una bola sacada a la suerte es blanca. Las probabilidades del suceso A a condición de que tengan lugar la hipótesis H0, H1, H2, H3 se calculan fácilmente:

Puesto que todas las suposiciones acerca de la cantidad de las bolas negras en la urna son igualmente verosímiles, entonces

Con ayuda de las fórmulas de Bayes obtenemos:

- 35 -

Page 36: Primera Parte [Estadistica]

Así, pues, si antes de sacar de la urna una bola no teníamos ningunos motivos de dar preferencia a cualquiera de las cuatro hipótesis y la probabilidad de cada una de ellas teníamos que suponer igual a 1/4, ahora, una vez sacada la bola blanca, revalorizamos las probabilidades de las hipótesis. Con ello, las probabilidades de que, en la urna hubiera 0, 1, 2, 3 bolas blancas suponemos iguales a 0, 1/6, 1/3, 1/2.

2.11 DISTRIBUCION DE PROBABILIDAD DISCRETA. Si una variable cualquiera X en un espacio muestral s, toma una serie de valores discretos X1, X2, X3... Xn con probabilidades respectivas P1, P2, P3... Pn donde la suma total de estas probabilidades es igual a 1, entonces se dice que para la variable X ha sido definida una distribución de probabilidad discreta. Esta ley de distribución se observa a continuación:

X (variable) X1 X2 X3 …… Xn-1 Xn

P(X)función de probabilidad P1 P2 P3 Pn-1 Pn

Por cuanto X puede tomar ciertos valores con ciertas probabilidades se le llama variable aleatoria discreta.

Ejemplo: Hallar las probabilidades de niños y niñas en familias con 4 hijos, suponiendo iguales la probabilidad de niño y niña. Construir una tabla que muestre la distribución de probabilidad de X. Representar gráficamente la distribución.

Sí V = suceso niño (varón); M = suceso niña (mujer).

La probabilidad de nacimiento de un niño es igual a la probabilidad de nacimiento de una niña, es decir: P(V) = P(M) = 1/2.

En familias con cuatro hijos pueden darse los siguientes casos mutuamente excluyentes:a) El nacimiento de cuatro niños (V V V V).

Entonces P(VVVV) = P(V)P(V)P(V)P(V) = 1/16.

b) El nacimiento de cuatro niñas (M M M M).Entonces P(MMMM) = P(M)P(M)P(M)P(M) = 1/16.

- 36 -

Page 37: Primera Parte [Estadistica]

c) El nacimiento de 3 niños y una niña.P(VVVM + VVMV + VMVV + MVVV) = P(V)P(V)P(V)P(M) + P(V)P(V)P(M)P(V) + P(V)P(M)P(V)P(V) +P(M)P(V)P(V)P(V) = 4/16.

d) El nacimiento de 2 niños y 2 niñasP(VVMM) + P(MMVV) + P(MVMV) + P(VMVM) + P(VMMV) + P(MVVM)== P(V)P(V)P(M)P(M) + P(M)P(M)P(V)P(V) ++ P(M)P(V)P(M)P(V) + P(V)P(M)P(V)P(M) ++ P(V)P(M)P(M)P(V) + P(M)P(V)P(V)P(M) = 6/16

e) El nacimiento de 3 niñas y un niño, se da un resultado similar al caso c si X es la variable aleatoria que muestra el número de niños.

Tenemos los siguientes datos:

X (Número de niños) 0 1 2 3 4P(X) (Probabilidad) 1/16 4/16 6/16 4/16 1/16

6/16│ │ │ │5/16├ │ │ │4/16├ │ │ │ │ │ │ │3/16├ │ │ │ │ │ │ │2/16├ │ │ │ │ │ │ │1/16├ │ │ │ │ │ │ │ │ │ │ │ └───┴───┴───┴───┴───┴───── x

0 1 2 3 4número de niños varones

Fig. 8. Distribución de probabilidad discreta

2.12 DISTRIBUCIONES DE PROBABILIDAD CONTINUA. Si los valores de la variable X toma una serie de valores continuos. El polígono de frecuencias relativas de cualquier muestra de una población es una curva continua, y se encuentra caracterizada por una función f(x) que se define como función de densidad de probabilidad y proporciona un medio para determinar la probabilidad de un intervalo a X b, de la Fig. 9 se puede determinar las siguientes condiciones: 1.

2.

3.

- 37 -

Page 38: Primera Parte [Estadistica]

donde f(x) es la función de densidad de probabilidad de la variable aleatoria continua.

Fig. 9. Distribución de probabilidad continua

Para cualesquiera a y b, entonces f(x) es la función de densidad de probabilidad de la variable aleatoria continua X.

Puesto que el área total bajo f(x) es uno, la probabilidad del intervalo a X b es el área acotada por la función de densidad y las rectas X = a y X = b.

2.13 ESPERANZA MATEMATICA. La esperanza matemática o simplemente esperanza de una variable aleatoria discreta (X) se designa por E(X) y se define como

E (X) = P1 X1 + P2 X2 + P3 X3... Pn Xn = 2.19

Si las probabilidades PJ se sustituyen por las frecuencias relativas fj / N,

donde N = f j la esperanza se reduce a , que es la media aritmética

X de una muestra de tamaño N, en la que X1; X2; X3;..XJ aparecen con estas frecuencias relativas. Cuando N crece, las frecuencias relativas se aproximan a las probabilidades PJ. Lo cual conduce a interpretación que E(X) representa la media de la población de la que se ha extraído una muestra. Si se denota por m la media de la muestra, la media de la población vendrá representada por .

En el caso de variables aleatorias continuas la esperanza matemática se define como

2.20

Ejemplo: En una lotería escolar de 1000 billetes hay un premio de 1.000 dólares, 10 premios de 100 dólares y 100 premios de 20 dólares. La ley de distribución de la variable aleatoria X del premio ganado en un billete viene dado por la tabulación:

- 38 -

xa b

f(x)

P(a X b)

Page 39: Primera Parte [Estadistica]

XJ 1000 100 20PJ 0,001 0,01 0,1

La esperanza matemática de X es igual a E(X) = Pj Xj =1000 0,001 + 100 0,01 + 200,1 = 4 dólares.

EJERCICIOS PARA RESOLVER:

1. Calcular la probabilidad P o un estimador de ella para cada uno de los siguientes casos:a). Extracción de una baraja de 52 cartas de un rey, un as, una jota de tréboles, en una sola extracción.b). Qué en una sola tirada de dos dados de una suma de 8 puntos.c). Extracción de un cerrojo no defectuoso de una población, si de 600 ya examinados, se encontró 12 piezas defectuosas.d). Qué en una sola tirada de 2 dados de la suma de 7 u 11.e). La aparición de al menos una cara en tres lanzamientos de una moneda.

2. Se extrae una bola al azar de una caja que contiene 10 rojas, 30 blancas, 20 azules y 15 naranjas. Hallar la probabilidad de que sea:a). Naranja o roja.b). No roja o azul.c). No azul.d). Blanca.e). Roja, blanca o azul

2.14 MOMENTOS, SESGO Y CURTOSIS.

2.14.1 MOMENTOS. La teoría de los momentos generaliza a las medidas de dispersión /5/.

Si X1, X2, X3...Xn son los N valores que toma la variable aleatoria discreta X, se define por la fórmula:

2.21

Como el momento de orden r con respecto al origen. El momento de primer orden (r = 1) representa la media aritméticaX

2.14.2 MOMENTO DE ORDEN r CON RESPETO A LA MEDIAX

Se define por 2.22

Si r = 1, entonces m1 = 0 ; si r = 2, entonces m2 = S² (Varianza)

- 39 -

Page 40: Primera Parte [Estadistica]

2.14.3 MOMENTO DE ORDEN r CON RESPECTO A UN PUNTO CUALQUIERA A

Se define como 2.23

Donde (X-A) = d, (son las desviaciones de X respecto de A)

Si los datos se presentan en forma de distribución de frecuencias entonces las fórmulas anteriores se transforman en:

2.24

2.25

2.26

Donde: N = f;X - marca de clase; f - frecuencia;

El r-ésimo momento de la distribución de probabilidad X alrededor de su origen, se determina también por:

2.27 si X es discreta

2.28 si X es continua

Ejemplo 1: Encuentre el momento de segundo orden para la distribución de frecuencias de la Tabla 1, con respecto a la media y al origen.

Solución:

CON RESPECTO AL ORIGEN

- 40 -

Page 41: Primera Parte [Estadistica]

CON RESPECTO A LA MEDIA

Cuando se trabaja con datos agrupados en una distribución de frecuencias y la desviación típica se ha calculado por el método clave, estos datos pueden aprovecharse para calcular los momentos con respecto a un punto a través de la fórmula:

2.29

Por ejemplo, para definir m'2 con los datos de la Tabla 6

= 0,00099 ohmios

2.15 RELACION ENTRE MOMENTOS

Entre momentos con relación a un punto cualquiera A (m'r) y con respecto a la media mr, existe las siguientes relaciones:

m2 = m'2 - m'12

m3 = m'3 - 3m'1 m'2 + 2m'13

m4 = m'4 - 4m'1 m'3 + 6m'12 m'2- 3m'14

2.16 SESGO. Es el grado de asimetría de una distribución de frecuencias. Si el polígono de frecuencias tiene una curva más larga a la derecha del máximo central que a la izquierda, se dice que la distribución está sesgada a la derecha o que tienen sesgo positivo. Si, por el contrario, se dice que está sesgada a la izquierda es que tiene sesgo negativo. En distribuciones sesgadas, la media tiende a situarse con respecto a la moda al mismo lado que la cola más larga, como se aprecia en la fig. 4

El cálculo del sesgo se realiza con las siguientes fórmulas empíricas /3/.

2.30

2.31

- 41 -

Page 42: Primera Parte [Estadistica]

Y se conoce como cálculo del primero y segundo coeficiente de sesgo respectivamente.

Se puede utilizar para él calculo del coeficiente de sesgo el tercer momento respecto de la media, expresado en forma adimensional.

2.32

Ejemplo: Hallar los coeficientes de sesgo (a) primero y (b) segundo para la distribución de frecuencias de la Tabla 1

Solución:

Media = 3,3439; Moda = 3,342 ohmios;

Mediana = 3,367; Desviación Típica = 0,031365 ohmios.

2.17 CURTOSIS. Es el grado de apuntamiento de una distribución. Normalmente se toma con relación a la distribución que presenta un apuntamiento relativo alto, tal como el de la curva de la Fig. 8a que se llama leptocúrtica, mientras que la de la Fig. 8b se llama platicúrtica. La distribución normal Fig. 8c que no es muy apuntada ni muy atachada se llama mesocúrtica.

La medida de la curtosis emplea el momento de cuarto orden con respecto a la media, expresado en forma adimencional y dado por:

2.33

Expresión que suele representarse por b2. Para una distribución normal a4 = b2

= 3 por lo que en ocasiones se dice que la curtosis es igual a (b2 - 3), que es positiva para una distribución leptocúrtica, negativa para una distribución platicúrtica y cero para una distribución normal.

- 42 -

a b c

Page 43: Primera Parte [Estadistica]

Fig. 8 Grado de apuntamiento de una distribución de frecuencias:a) leptocurtica, b) platicurtica; c) mesocurtica.

- 43 -

Page 44: Primera Parte [Estadistica]

CAPITULO III

DISTRIBUCIONES DE PROBABILIDADES

Las distribuciones de frecuencia en estadística y control de calidad son de uso frecuente, ya que indican la forma en que se distribuyen los datos y lecturas. Generalmente expresan las probabilidades en sus fórmulas matemáticas en función del área bajo la curva con respecto a un eje que normalmente es el eje X. Las distribuciones más usuales son: Normal o de Gauss, CHi-cuadrado o de Pearson, F o de Fisher, t de Student o Gusset, binomial o de Bernulli, exponencial o de Poisson, hipergeométrica y la de Weibull. De las distribuciones mencionadas la binomial, Poisson, hipergeometrica y la binomial negativa son distribuciones de probabilidad discretas, el resto son distribuciones de probabilidad continuas .

3.1 DISTRIBUCION NORMAL Llamada también de Gauss, es una de las distribuciones de frecuencias más importantes en estadística. Su apariencia física es la de una curva simétrica en forma de campana que se extiende hasta el infinito, asintóticamente en ambas direcciones, positiva y negativa. La frecuencia relativa con la cual una variable tomará valores entre dos puntos es el área bajo la curva, sobre el eje horizontal.

Las áreas bajo la curva normal representan las probabilidades de distribución normal. Como en el caso de los histogramas que describen otras distribuciones. El área total bajo la curva normal es igual a 1, y por lo tanto, las áreas bajo la curva normal puede considerarse como proporciones, probabilidades o, cuando se multiplican por 100, como porcentajes. Un gráfico de esta curva normal se muestra en la figura 9.

Fig. 9 Representación gráfica de la curva normal

Esta curva viene expresada por la fórmula:

- 44 -

0.4

0.3

0.2

0.1

10-1 2-2 3-3

Y

z

68.27%

95.45%

99.73%

Page 45: Primera Parte [Estadistica]

3.1

donde: - media; - desviación típica (estándar) poblacional; = 3,1416;X = variable (un valor particular de la población; valor aleatorio) - < X < Y = f(x;; ) densidad de distribución de probabilidad.La probabilidad de que una variable aleatoria normalmente distribuida X se

encuentre en el intervalo x1 X x2 está definida por la función de distribución acumulativa.

P( x1X x2) = 3.2

Cuando la variable X, se expresa en unidades estándar Z=(x - )/ donde Z es la variable aleatoria normal estandarizada, y si X se encuentra normalmente distribuida con media =0 y desviación estándar =1, entonces Z=(x - )/ también se encuentra normalmente distribuida con media cero y desviación estándar uno.

La ecuación anterior en ese caso puede ser remplazada por la forma canónica, la cual se obtiene al expresar X atravez de: X= t; X= t1; X= t2,

P(x1X x2) = 3.3

3.1.1 CARACTERISTICAS DE LA CURVA NORMAL.

- Es asíntota al eje de las X;- El área bajo la curva es igual a 1;- Es simétrica en torno a la media (eje de ordenadas);- La media da la tendencia central;- La desviación estándar expresa la dispersión.

3.1.2 PROPIEDADES DE LA DISTRIBUCION NORMAL.

- Media - Varianza ²- Desviación estándar - Coeficiente de sesgo 3 = 0- Coeficiente de curtosis 4 = 0- Desviación Media 2/ = 0,7979

EJEMPLOS DE APLICACION DE LA TABLA NORMAL

- 45 -

Page 46: Primera Parte [Estadistica]

Ejemplo 1: Los pesos individuales de un lote de piezas fundidas de hierro gris están normalmente distribuidas con una media de 7,465 kg y una desviación típica (estándar) de 0,045 kg. La especificación para peso es de 7,530 ± 0,075 kg

a) ¿Qué porcentaje de la producción cumplirá la especificación?b) ¿Qué porcentaje de la producción tendrá un peso mayor al límite superior de especificación?c) ¿Qué porcentaje de la producción tendrá un peso menor al límite inferior de especificación?d) ¿Qué acción debería ser tomada para reducir a un mínimo el porcentaje de producto defectuoso y cuál sería este porcentaje, tomando en cuenta que la capacidad de proceso no puede ser disminuida? /7/.

Solución:

Con este valor Z1 en la tabla de la distribución normal se obtiene: A1 = 0,09%, porcentaje de producción que tendrá un peso mayor al límite superior de especificación.

Mediante el mismo procedimiento anterior A2 = 41,29%, significa que 41,29% tendrá un peso menor al límite inferior de especificación.Luego 100% - 0,09% - 41,29% = 58,62%, el 58,62% cumple con la especificación.

Para reducir a un mínimo el porciento de producto defectuoso se debe centrar el proceso a 7,53 Kg (si la media de los pesos tomamos 7,53 Kg.)

En la tabla de la distribución normal A1 = 4,75%

- 46 -

7,4657,455 7,605

41,29%0,09%

Page 47: Primera Parte [Estadistica]

En la tabla de la distribución normal A2 = -4,75%A = 100% - (4.75% + 4,75%) = 90,5% porcentaje dentro de las especificaciones; 9,5% - porcentaje fuera de especificación.

Ejemplo 2: La vida de operación de un motor eléctrico, la cual es normalmente distribuida, tiene una media de 2.200 horas y una desviación estándar de 120 horas, ¿Cuál es la probabilidad de que un motor falle al operar 1900 horas o menos?

Solución:

P = 0,62%

3.2 DISTRIBUCION BINOMIAL La distribución binomial denominada también de BERNULLI, es una de las distribuciones discretas de probabilidad más importantes, se utiliza cuando alguien tiene que decidir entre si o no, pasa o no pasa, cara o cruz, bueno o malo. La función de probabilidad binomial en la P es la probabilidad de éxito del evento y q es la probabilidad de fallo del evento, siendo P + q = 1, entonces la probabilidad de que el suceso se presente exactamente X veces en N ensayos, viene dada por la fórmula matemática:

p(x;n,p) = n Cx Px qn-x 3.4

Donde:

X= 1, 2, 3... nP – es la probabilidad de obtener X éxitos o fracasos en n eventos,n Cx – el número de combinaciones de n casos tomados X de una sola vez,

- 47 -

22001900

0,62%

7,537,455 7,605

4,75% 4,75%

Page 48: Primera Parte [Estadistica]

q es la no-probabilidad del evento,

Ejemplo 1: ¿Cuál es la probabilidad de obtener exactamente 2 caras en 5 lanzamientos de una moneda?

Solución:Si n = 5; x = 2; P = 1/2; q = 1/2.

P(2; 5, 0.5)=

3.2.1 PROPIEDADES DE LA DISTRIBUCION BINOMIAL

- Media = N P- Varianza ² = NPq

- Desviación estándar 1

- Coeficiente de sesgo 2

- Coeficiente de curtosis

Ejemplo 2: Si la probabilidad de un cerrojo defectuoso es 0,01, hallar la media, la desviación típica (estándar), los coeficientes de sesgo y de curtosis de la distribución de cerrojos defectuosos de un total de 500.

Solución:

= NP = 500 (0,01) = 5, lo cual indica que 5 cerrojos son defectuosos.

= =

(sesgada a la derecha).

.

La distribución es platicúrtica con respecto a la distribución normal.

3.3 RELACION ENTRE LAS DISTRIBUCIONES BINOMIAL Y NORMAL. Si N es grande y ni P ni q están muy aproximados a cero, la distribución binomial puede aproximarse estrechamente a la distribución normal con variable tipificada dada por:

- 48 -

Page 49: Primera Parte [Estadistica]

3.5

3.4 DISTRIBUCION EXPONENCIAL (LLAMADA DE POISSON). La aplicación de la distribución exponencial se recomienda para eventos o fenómenos de baja probabilidad; es decir, cuando P es aproximadamente 10 veces menor que q.

La distribución de POISSON queda definida matemáticamente como:

3.6

Donde: X = 0,1,2,3...n - número de unidades (tamaño de la muestra);P - probabilidad;e = 2,71828, base de los logaritmos naturales;nP = C';C' - número esperado de defectos en la muestra.

Ejemplo: Un lote de 200 válvulas que contienen 3% de producto defectuoso es sometido a un plan de muestreo de aceptación correspondiente a n = 100. Utilizando la distribución de POISSON determinar la probabilidad de que en la muestra no se encuentre válvulas defectuosas.

Solución:

3.4.1 USO DE LAS TABLAS DE POISSON.

Ejemplo: Existe 2% de unidades defectuosas en una producción.

a) ¿Cuál es la probabilidad de no encontrar defectuosos en una muestra de 100 unidades?

b) ¿Cuál es la probabilidad de encontrar 1 unidad defectuosa?c) ¿Cuál es la probabilidad de encontrar 2,3,4,5...?

Solución: Si, C' = nP = 1000,02 = 2; Donde C' - número esperado de defectos en la muestra. Entramos en el anexo 3; con un valor de 2. Y se obtiene:

C 0 1 2 3 4 5 6 7 80,135 0,406 0,677 0,851 0,947 0,983 0,995 0,999 1

Donde: C - número de aceptación.a) Po = 0,135, substrayendo el último término encontramos las respuestas para los

siguientes valores, así:b) P1 = 0,271.c) P2 = 0,271; P3 = 0,180; P4 = 0,090; P5 = 0,036;

P6 = 0,012; P7 = 0,004; P8 = 0,001.

- 49 -

Page 50: Primera Parte [Estadistica]

Lo cual se puede comprobar con la fórmula (3.6), por ejemplo P(2):

3.4.2. PROPIEDADES DE LA DISTRIBUCION DE POISSON

- Media nP- Varianza ² = nP- Desviación estándar

- Coeficiente de sesgo

- Coeficiente de Curtosis

3.5 DISTRIBUCION HIPERGEOMETRICA. El muestreo es imprescindible en el control de calidad; por lo tanto, las distribuciones de probabilidad que se han tratado anteriormente, junto con la hipergeométrica, tienen una aplicación amplia. Esta distribución en el muestreo de una población finita, viene expresada por la siguiente formula:

3.7

donde N - número total de unidades en el lote;Np - número de unidades defectuosas en el lote;n - tamaño de la muestra.d - número de defectuosos en las muestras de tamaño n.

EJEMPLOS DE APLICACION

Ejemplo 1: Ciertas partes de maquinaria se embarcan en lotes de N = 20 con el objeto de aceptar el lote como bueno, es decir de acuerdo a las especificaciones, se selecciona al azar tres partes de cada lote y si la muestra, no contienen ninguna parte defectuosa se acepta el lote.¿Cuál es la probabilidad de aceptar lotes que contienen:

a) 4 partes defectuosas;b) 8 partes defectuosas;c) 10 partes defectuosas.

Solución:Utilizamos la distribución hipergeométrica:

- 50 -

Page 51: Primera Parte [Estadistica]

EN RESUMEN:

CALIDAD DEL LOTE PROBABILIDAD DE ACEPTACION

a) Pa =0,49128

b) Pa =0,19298

c) Pa =0,10526

Ejemplo 2: En un lote de 400 ejes se conoce que el 25% son defectuosos, se extrae una muestra de n = 10. ¿Cuál es la probabilidad de que todos los ejes de la muestra no sean defectuosos?

Solución:De acuerdo a la formula de la distribución hipergeométrica se tiene:

Ejemplo 3: Se tiene un lote de 100 artículos que están sujetos a inspección y éstos serán aceptados si una muestra de 5 tomada al azar, contiene "cero" artículos defectuosos. ¿Cuál es la probabilidad de que se acepte el lote si éste contiene 10 artículos defectuosos?

Solución:

- 51 -