MODELACION ESTADISTICA

17
ESTADISTICA PARA PROCESOS ANALISIS DE DATOS: En un proceso de manufactura, el diámetro en milímetros de cierto ensamble se considera de vital importancia para poder continuar con la producción. El inspector de control de calidad ha recopilado la siguiente información respecto a los diámetros de 10 unidades tomadas aleatoriamente con el propósito de analizar estadísticamente los datos. En la siguiente tabla se presenta dicha información: Elemen to # 1 # 2 # 3 # 4 # 5 # 6 # 7 # 8 # 9 # 10 Diámet ro 12 15 10 7 21 33 23 12 8 12 ANALISIS GRAFICO

Transcript of MODELACION ESTADISTICA

MODELACION ESTADISTICA

ESTADISTICA PARA PROCESOSANALISIS DE DATOS:

En un proceso de manufactura, el dimetro en milmetros de cierto ensamble se considera de vital importancia para poder continuar con la produccin. El inspector de control de calidad ha recopilado la siguiente informacin respecto a los dimetros de 10 unidades tomadas aleatoriamente con el propsito de analizar estadsticamente los datos. En la siguiente tabla se presenta dicha informacin:

Elemento# 1# 2# 3# 4# 5# 6# 7# 8# 9# 10

Dimetro121510721332312812

ANALISIS GRAFICO

MEDIDAS DE TENDENCIA CENTRAL: primer momento MEDIA MEDIANA

MODA

MEDIA:

MEDIANA:

EMBED Equation.3 MODA:

MEDIDAS DE DISPERSION: segundo momento RANGO

VARIANZA

DESVIACION ESTANDAR

RANGO:

VARIANZA

DATOS:

12, 15, 10, 7, 21, 33, 23, 12, 8, 12.

-3.310.89

-0.30.09

-5.328.09

-8.368.89

5.732.49

17.7313.29

7.759.29

-3.310.89

-7.353.29

-3.310.89

total588.10

DESVIACION ESTANDAR

MEDIDAS DE FORMA

COEFICIENTE ASIMETRIA: Tercer momentoEste coeficiente mide la asimetra de los datos respecto a su centro. Este coeficiente es cero para una variable simtrica. Cuando el valor absoluto del coeficiente es aproximadamente mayor que uno podemos concluir que los datos tienen una distribucin claramente asimtrica.

xi

12-0.40823-0.06803

15-0.03711-0.00005

10-0.65565-0.28184

7-1.02677-1.08247

210.705130.35059

332.1896210.49799

230.952540.86427

12-0.40823-0.06803

8-0.90306-0.73646

12-0.40823-0.06803

total9.40794

Asimetra:

Una caracterstica importante de un conjunto de datos es su homogeneidad. Si las desviaciones d:

son muy distintas, esto sugiere que hay datos que se separan mucho de la media y que tenemos por tanto alta heterogeneidad. Una posible medida de homogeneidad es la varianza de las d, que se expresa como:

CURTOSIS: cuarto momentoUna manera alternativa de medir la homogeneidad de los datos es el coeficiente de curtosis. Un objetivo central de la descripcin de los datos es decidir si los datos son una muestra homognea de una poblacin o corresponden a una mezcla de poblaciones distintas que deben estudiarse separadamente.Un caso especial importante de heterogeneidad es la presencia de una pequea proporcin de observaciones atpicas (outliers), que corresponden a datos heterogneos con el resto. La deteccin de estas observaciones es fundamental para una correcta descripcin de la mayora de los datos, ya que estos valores extremos distorsionan los valores descriptivos del conjunto.

El coeficiente de curtosis puede ayudar en este objetivo, ya que tomar un valor alto, mayor que 7 u 8.

Siempre que observemos un valor alto de la curtosis para una variable, esto implica heterogeneidad debido a unos pocos atpicos muy alejados del resto.

Aparece un tipo distinto de heterogeneidad cuando tenemos una mezcla de dos poblaciones, de manera que una proporcin importante de los datos, entre el 25% y el 50% son heterogneos con el resto. En este caso, el coeficiente de curtosis es pequeo, menor que 2.

x

12-0.408230.02777

15-0.037110.0000018

10-0.655650.18479

7-1.026771.11145

210.705130.24721

332.1896222.98661

230.952540.82325

12-0.408230.02777

8-0.903060,66506

12-0.408230.02777

total26.10168

OTRAS MEDIDAS

COEFICIENTE DE VARIACION

EMBED Equation.3 DESVIACION MEDIA Y ERROR ESTANDAR DE LA MEDIA.

n= 10

= 15.3

x

EMBED Equation.3

78.3

87.3

105.3

123.3

123.3

123.3

150.3

215.7

237.7

3317.7

= 62.2

CUARTILES, DECILES Y PERCENTILES.

EJERCICIODados los datos : 12, 15, 10, 7, 21, 33,23,12,8,12.

1. Ordenar en forma ascendente:

7,8,10,12,12,12,15,21,23,33

CALCULAR:

DIAGRAMA DE CAJA

Una medida alternativa de dispersin que puede ser ms representativa en el caso en que la distribucin es asimtrica o en presencia de datos atpicos, es el rango intercuartlico.

El rango intercuartlico (RIC). Hemos definido la mediana como el punto que separa el conjunto en dos partes de mismo tamao. Definimos de la misma manera los cuartiles como los puntos que separan el conjunto en cuatro partes de mismo tamao. El primer cuartil Q1 deja el 25% de los datos ordenados a su izquierda, y el otro 75% a su derecha, mientras que el tercer cuartil Q3 deja el 75% de los datos ordenados a su izquierda, y el otro 25% a su derecha. Por lo tanto el par (Q1,Q3) nos proporciona informacin sobre la dispersin presente en los datos: cuanto ms alejados estn los cuartiles, ms dispersos estn los datos. Por ello, calculamos el rango intercuartlico RIC como la diferencia entre Q3 y Q1.

El RIC tambin se utiliza para detectar datos atpicos:

Regla: Se consideran como atpicos los datos que son menores de Q1 1,5 RIC, o mayores de Q3 + 1,5 RIC.

El diagrama de caja-bigotes es un resumen grfico que permite visualizar, para un conjunto de datos, la tendencia central, la dispersin y la presencia posible de datos atpicos. Para realizarlo se necesita calcular la mediana, el primer cuartil, y el tercer cuartil de los datos.

Los segmentos 1.5 RIC (llamados bigotes) se recortan hasta el dato del conjunto inmediatamente superior a Q1 1,5 RIC para el bigote inferior, y el dato inmediatamente inferior a Q3 + 1,5 RIC, para el bigote superior.La mayor utilidad de los diagramas caja-bigotes es para comparar dos o ms conjuntos de datos.

La media es el promedio de los datos

EMBED Equation.3

Es el punto medio de una serie ordenada de datos.

PASOS:

Ordenar los datos en forma ascendente

7, 8, 10, 12,12, 12 , 15, 21, 23, 33

Si n es impar la mediana es el nmero de la mitad del conjunto ordenado.

Si n es par se debe promediar los dos valores intermedios del conjunto ordenado.

MEDIANA= 12+12/2=12 divide a los datos en dos mitades.

Es el valor mas frecuente dentro de un grupo de datos.

MODA= 12 ( SE REPITE 3 VECES)

Es la diferencia entre el valor mximo y mnimo de un grupo de datos.

12, 15, 10, 7, 21, 33, 23, 12, 8, 12.

Ordenar en formar ascendente.

7, 8, 10, 12, 12, 12,15, 21, 23, 33.

RANGO= MAX MIN

RANGO = 33 -7 = 26

Es el indicador de dispersin alrededor de la media.

EMBED Equation.3 EMBED Equation.3

Mide la dispersin promedio de los datos alrededor de la media.

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

Esta representa la elevacin o el achatamiento de una distribucin comparada con la distribucin normal.

Si la curtosis es +, la distribucin es relativamente elevada.

Si es es plana.

EMBED Equation.3

EMBED Equation.3

Es una medida de variacin alrededor de la media, es til cuando se desea comparar la variabilidad de dos conjuntos de datos.

EMBED Equation.3

Mide la exactitud de la media

EMBED Equation.3

EMBED Equation.3

EMBED Equation.3

Son aquellos que subdividen los datos de acuerdo con la proporcin de frecuencias observadas. Mientras que la mediana divide a la distribucin en 2 mitades, los cuartiles la dividen en cuatro cuartos, los deciles la dividen en diez decimos y los percentiles los dividen en cien partes.

Q Cuartiles.

D Deciles Los datos se deben de ordenar en

P Percentiles forma ascendente.

_1207403232.unknown

_1207497356.unknown

_1274523735

_1305552182

_1305552308

_1274528660.unknown

_1274528891.unknown

_1274530588.unknown

_1274523776

_1274523812

_1208068503.unknown

_1208069275.unknown

_1208069893.unknown

_1208070707.unknown

_1208070708.unknown

_1208070590.unknown

_1208069491.unknown

_1208069034.unknown

_1207497640.unknown

_1207497660.unknown

_1207498107.unknown

_1207497556.unknown

_1207497483.unknown

_1207407556.unknown

_1207407899.unknown

_1207496907.unknown

_1207496897.unknown

_1207407592.unknown

_1207404348.unknown

_1207404619.unknown

_1207407359.unknown

_1207407502.unknown

_1207404581.unknown

_1207403358.unknown

_1207404005.unknown

_1207403667.unknown

_1207403301.unknown

_1207402710.unknown

_1207403018.unknown

_1207403099.unknown

_1207402760.unknown

_1207399783.unknown

_1207402328.unknown

_1207402497.unknown

_1207399944.unknown

_1207399745.unknown

_1207399455.unknown