Reporte de Estadistica

22
Problema No.1 En una etapa inicial del procesamiento mecánico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto diámetro de las piezas manufacturadas. Para predecir el tiempo de vida útil de la herramienta se tomaron datos de horas de uso y el diámetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuación: Horas de uso Diámetro (mm) 16 26.2 32 25.7 48 26.0 64 27.7 80 28.3 96 29.5 112 30.1 128 31.8 144 31.4 160 33.4 176 33.6 192 32.7 208 35.0 224 36.1 240 35.7 256 36.2 272 36.8

description

Habla sobre problemas de estadística ya resueltos junto sus gráficas de regresión lineal

Transcript of Reporte de Estadistica

Problema No.1En una etapa inicial del procesamiento mecnico de piezas de acero, se sabe que una herramienta sufre un deterioro gradual que se refleja en cierto dimetro de las piezas manufacturadas. Para predecir el tiempo de vida til de la herramienta se tomaron datos de horas de uso y el dimetro promedio de cinco piezas producidas al final de la jornada. Los datos obtenidos para una herramienta se muestran a continuacin:Horas de usoDimetro (mm)

1626.2

3225.7

4826.0

6427.7

8028.3

9629.5

11230.1

12831.8

14431.4

16033.4

17633.6

19232.7

20835.0

22436.1

24035.7

25636.2

27236.8

28839.1

30438.7

32039.2

a) En este problema cul variable se considera independiente y cul dependiente?R: La variable dependiente sern las horas de trabajo mientras que la independiente ser el dimetro de la pieza.b) Mediante un diagrama de dispersin analice la relacin entre estas dos variables. Qu tipo de relacin observa y cules son algunos hechos especiales? Relacin positiva fuertec) Haga un anlisis de regresin (ajuste una lnea recta a estos datos, aplique pruebas de hiptesis y verifique residuos)d) La calidad de ajuste es satisfactoria? Argumentee) Si el dimetro mximo tolerado es de 45, Cuntas horas de uso estima que tiene esa herramienta?f) Seale el valor de la pendiente de la recta e interprtelo en trminos prcticosg) Obtenga el error estndar de estimacin y comente qu relacin tiene ste con la calidad de ajuste.

a) La variable independiente son las horas de uso y la variable dependiente es el dimetro de las piezas.b) Diagrama de dispersin: se puede observar que existe una correlacin lineal positiva entre las horas de uso y el dimetro, ya que conforme aumentan las horas de uso aumenta el dimetro.

c) Anlisis de regresin, como podemos observar la lnea recta que mejor explica la relacin entre las horas de uso y el dimetro est dada por: Dimetro = 24.8632 + 0.0464098*Horas de usoLa cual se puede observar en el grafico del modelo ajustado:

Prueba de Hiptesis:H0: 1= 0 o H0: El modelo no se ajustaH0: 1 0 o H0: El modelo si se ajustaDe acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables horas de uso y dimetro si existe una relacin.CoeficientesMnimos CuadradosEstndarEstadstico

ParmetroEstimadoErrorTValor-P

Intercepto24.86320.32320676.92670.0000

Pendiente0.04640980.0016862927.52180.0000

Para poder rechazar o aceptar la hiptesis nula tenemos que tomar en cuenta el anlisis de varianza del modelo, el cual se presenta a continuacin:Anlisis de VarianzaFuenteSuma de CuadradosGlCuadrado MedioRazn-FValor-P

Modelo366.6741366.674757.450.0000

Residuo8.71365180.484092

Total (Corr.)375.38819

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hiptesis nula.Verificacin de supuestos:El supuesto de varianza constante si se cumple ya que al graficar los residuos contra los predichos, los puntos caen aleatoriamente dentro de la banda horizontal sin que sigan algn patrn definido.

El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos de forma arbitraria dentro del grafico de residuos vs nmero de corrida, sin cumplir ninguna tendencia.

d) el coeficiente de determinacin R2ajustado es de 97.6788% lo cual indica que nuestro modelo tiene una calidad de ajuste satisfactoria, ya que explica el 97.6% de la variabilidad en Dimetro.e) El valor sera de 433.89 horas a un dimetro de 45 mm, sin embargo realizar una extrapolacin la cual est ms all de la regin que contiene a las observaciones originales est mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la regin, ya que nuestra regin de estudio va de 25.7 a 39.2 mm de dimetro.f) el valor de la pendiente es de 0.0464098, esto nos indica la razn de cambio en el dimetro (y) con respecto al cambio de las horas de uso (x), es decir cunto va a variar el dimetro cuando se varen las horas de uso.g) El error estndar de la estimacin fue de 0.695767, lo cual indica que la calidad de ajuste de nuestro modelo es buena, ya que si el error estndar de estimacin es menor la calidad del ajuste ser mayor.

Problema No. 2Se piensa que el nmero de libras de vapor consumidas mensualmente por una planta qumica se relaciona con la temperatura ambiente promedio (en F) de ese mes. En la tabla siguiente se muestra la temperatura y el consumo anual:

MesTemperaturaConsumo/1000

Enero21185.79

Febrero24214.47

Marzo32288.03

Abril47424.84

Mayo 50454.58

Junio59539.03

Julio68621.55

Agosto74657.06

Septiembre62562.03

Octubre50452.93

Noviembre41369.95

Diciembre30273.98

A) Trace un diagrama de dispersin de los datos. Parecera apropiado un modelo de regresin lineal simple en este caso?

R= Si, con la finalidad de saber cmo la temperatura afecta el consumo y as poder predecir a que temperatura es conveniente tratar el consumo.

B) Suponiendo que un modelo de regresin lineal simple es apropiado, ajuste el modelo de regresin que relacione el consumo de vapor () con la temperatura promedio ( ). Cul es la estimacin del consumo esperado de vapor cuando la temperatura promedio es 55F? R= 497.3545

C) Qu cambio se espera en el consumo de vapor promedio cuando la temperatura mensual promedio cambia 1F? R= 2.15%R= 108.7056 consumo/1000

D) Suponga que la temperatura mensual promedio es de 47F. Calcule el vapor ajustado y el residual correspondiente. VAPOR= 424.84RESIDUAL= -0.042718344

Problema No. 3En un artculo de Wear se presentan los datos del desgaste por rozamiento del acero dulce y la viscosidad del aceite. Los datos representativos, con y ( ), son:Yx

2401.6

1819.4

19315.5

15520.0

17222.0

11035.5

11343.0

7540.5

9433.0

a) Construya un diagrama de dispersin de los datos. Parecera plausible un modelo de regresin lineal simple?R= Si, parece correcto usar el diagrama

b) Ajuste el modelo de regresin lineal simple usando mnimos cuadrados. c) Estime el desgaste por rozamiento cuando la viscosidad es . R= 62.3768d) Obtenga el valor ajustado de cuando y calcule el residual correspondiente. Y=172Residual= 15.11749821

Problema No. 4En un proceso de extraccin se estudia la relacin entre tiempo de extraccin y rendimiento. Los datos obtenidos se muestran en la siguiente tabla.

Tiempo (minutos)Rendimiento (%)

1064

1581.7

2076.2

868.5

1277.9

1382.2

1574.2

1270

1476

2083.2

1985.3

a) En este problema cul variable se considera independiente y cul dependiente? b) Mediante un diagrama de dispersin analice la relacin entre estas dos variables. c) Haga un anlisis de regresin (ajuste una lnea recta a estos datos, aplique pruebas de hiptesis y verifique residuos). d) La calidad del ajuste es satisfactoria? Argumente e) Destaque el valor de la pendiente de la recta e interprtelo en trminos prcticos. f) Estime el rendimiento promedio que se espera a un tiempo de extraccin de 25 minutos y obtenga un intervalo de confianza para esta estimacin.

a) La variable dependiente es el % rendimiento y la variable independiente es el tiempo dado en minutos.b) Diagrama de dispersin: se puede visualizar que no existe una relacin ya que los puntos son muy dispersos, algunos incrementan y otros decrecen sin importar el tiempo, sin embargo se tendra que verificar los supuestos y comprobar si en verdad existe una relacin entre el rendimiento y el tiempo, si no es asi los datos que miden la calidad de ajuste nos lo indicaran.

c) Anlisis de regresin, como podemos observar la lnea recta que mejor explica la relacin entre el tiempo y el porcentaje de rendimiento est dada por: Rendimiento = 57.9578 + 1.19492*TiempoLa cual se puede observar en el grafico del modelo ajustado:

Prueba de Hiptesis:H0: 1= 0 o H0: El modelo no se ajustaH0: 1 0 o H0: El modelo si se ajustaDe acuerdo a la tabla de coeficientes podemos ver que si existe una pendiente, lo cual significa que entre las variables tiempo y porcentaje de rendimiento si existe una relacin.CoeficientesMnimos CuadradosEstndarEstadstico

ParmetroEstimadoErrorTValor-P

Intercepto57.95786.284039.223030.0000

Pendiente1.194920.4149592.879620.0164

Para poder rechazar o aceptar la hiptesis nula tenemos que tomar en cuenta el anlisis de varianza del modelo, el cual se presenta a continuacin:Anlisis de VarianzaFuenteSuma de CuadradosGlCuadrado MedioRazn-FValor-P

Modelo243.6841243.6848.290.0164

Residuo293.8721029.3872

Total (Corr.)537.55711

Analizando esta tabla podemos concluir que el modelo si se ajusta ya que el valor-P es menor al nivel de confianza de 0.05, por ello podemos decir que con un nivel de confianza del 95% se rechaza la hiptesis nula.Verificacin de supuestos:El supuesto de varianza constante si se cumple ya que los puntos se encuentran dispersos de forma aleatoria por toda la grfica a lo largo de la banda horizontal.

El supuesto de independencia si se cumple ya que los puntos o residuos se encuentran dispersos de forma arbitraria dentro del grfico de residuos vs nmero de corrida, sin cumplir ninguna tendencia.

d) el coeficiente de determinacin R2ajustado es de .3986 lo cual indica que nuestro modelo no tiene una buena calidad de ajuste, ya que solo nos explica el 39.865% de la variabilidad en Rendimiento. Adems en general, para fines de prediccin se recomienda un R2ajustado de al menos 0.7 o 70% de explicacin del modelo.e) el valor de la pendiente es de 1.19492, esto nos indica la razn de cambio en el %Rendimiento (y) con respecto al cambio de Tiempo(x), es decir cunto va a variar el Rendimiento cuando se vare el tiempo.f) Se podra calcular el valor que piden con respecto a los 2 min, sin embargo realizar una extrapolacin la cual est ms all de la regin que contiene a las observaciones originales est mal ya que probablemente el modelo ya no se ajuste adecuadamente fuera de la regin, ya que nuestra regin de estudio va de 8 a 20 min de Tiempo.

Problema No. 5En un artculo de Journal of Environmental Energineering se reportan los resultados de un estudio sobre la presencia de sodio y cloruros en corrientes superficiales de la parte central de Rhode Island. Los datos que se presentan a continuacin corresponden a la concentracin de cloruros y (en mg/l) y al rea de carretera de la vertiente x (en %).

xy

0.194.4

0.156.6

0.579.7

0.7010.6

0.6710.8

0.6310.9

0.4711.8

0.7012.1

0.6014.3

0.7814.7

0.8115.0

0.7817.3

0.6919.2

1.3023.1

1.0527.4

1.0627.7

1.7431.8

1.6239.5

a) Trace un diagrama de dispersin de los datos. Parecera apropiado un modelo de regresin lineal simple en este caso? R= Si, para ver la relacin aunque presentan un ndice de error alto

B) Ajuste el modelo de regresin lineal simple usando el mtodo de mnimos cuadrados.

b) Estime la concentracin de cloruros media de una vertiente que tiene 1% del rea de carretera.

R= 20.567

Encuentre el valor ajustado que corresponde a R= 10.13