ultimos Compendios

16
Angie Camacho Ejercicio 1 Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de la concentración de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo método manual. Se idea un nuevo método automático. Si se pone de manifiesto una alta correlación positiva entre las medidas tomadas empleando los dos métodos, entonces se hará uso habitual del método automático. Los datos obtenidos son los siguientes: Manual = X 2 5 4 0 12 0 7 5 15 0 30 0 27 0 40 0 45 0 57 5 Automático = Y 3 0 8 0 15 0 8 0 20 0 35 0 24 0 32 0 47 0 58 3 Comprobar la idoneidad del modelo lineal de regresión. Si el modelo es apropiado, hallar la recta de regresión de Y sobre X y utilizarla para predecir la lectura que se obtendría empleando la técnica automática con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R SOLUCION: Manual = X Automático = Y X 2 XY 25 30 625 750 40 80 1600 3200 120 150 14400 18000 75 80 5625 6000 150 200 22500 30000

description

compendios finales

Transcript of ultimos Compendios

Angie Camacho

Ejercicio 1Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un lago, se toman medidas de la concentracin de nitrato en el agua. Para monitorizar la variable se ha utilizado un antiguo mtodo manual. Se idea un nuevo mtodo automtico. Si se pone de manifiesto una alta correlacin positiva entre las medidas tomadas empleando los dos mtodos, entonces se har uso habitual del mtodo automtico. Los datos obtenidos son los siguientes: Manual = X254012075150300270400450575

Automtico = Y308015080200350240320470583

Comprobar la idoneidad del modelo lineal de regresin. Si el modelo es apropiado, hallar la recta de regresin de Y sobre X y utilizarla para predecir la lectura que se obtendra empleando la tcnica automtica con una muestra de agua cuya lectura manual es de 100. Realizar el ejercicio en R

SOLUCION:Manual = XAutomtico = Y

2530625750

408016003200

1201501440018000

758056256000

1502002250030000

30035090000105000

2702407290064800

400320160000128000

450470202500211500

575583330625335225

24052503900775902475

> datos=read.table("agua.txt", header=T)> attach(datos)> datos x y1 25 302 40 803 120 1504 75 805 150 2006 300 3507 270 2408 400 3209 450 47010 575 583

> regresion regresinCall:lm(formula = y ~ x, data = datos)

Coefficients:(Intercept) x 26.1150 0.9322

> summary(regresion)Call:lm(formula = y ~ x, data = datos)

Residuals: Min 1Q Median 3Q Max -78.98 -18.57 14.31 23.53 44.24

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 26.11496 21.20188 1.232 0.253 x 0.93216 0.07064 13.195 1.04e-06 ***---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 40.11 on 8 degrees of freedomMultiple R-squared: 0.9561, Adjusted R-squared: 0.9506 F-statistic: 174.1 on 1 and 8 DF, p-value: 1.036e-06

Se observa el intercepto=26.11496 y el valor de x=0.93216, adems de que entrega el valor de R=0.9561, valor que garantiza en cierta forma el uso del modelo lineal para el problema

Y=0.9(100)+26.11=116.11

Ejercicio 2

Sobre una hoja de papel cuadriculado dibuje aproximadamente 5 cuadrados de diversos tamaos.

a. Cuntos cuadritos encierra cada uno de los cuadrados dibujados?. Represente esta variable mediante la letra N b. Cunto mide el lado de cada cuadrado?. Represente esta variable mediante la letra Lc. Coleccione su informacin en una tabla de datos.d. Existe alguna relacin entre una y otra variable?. Detalle su respuesta.Represente las parejas (L,N) en un plano cartesianoe. Qu clase de curva obtiene?

Solucin

NLNL

1111

42168

938127

255625125

3661296216

75172019377

> cuadrititos=read.table("cuadras.txt",header=T)> attach(cuadrititos)> cuadrititos N L1 1 12 4 23 9 34 25 55 36 6

> regresion summary(regresion)Call:lm(formula = L ~ N, data = cuadrititos)

Residuals: 1 2 3 4 5 -0.4895 0.1011 0.4188 0.2353 -0.2658

Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 1.35302 0.28808 4.697 0.01826 * N 0.13647 0.01434 9.519 0.00246 **---Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 0.4287 on 3 degrees of freedomMultiple R-squared: 0.968, Adjusted R-squared: 0.9573 F-statistic: 90.61 on 1 and 3 DF, p-value: 0.002459

> plot(cuadrititos)> abline(lm(L~N))

Ejercicio 3

A partir de las siguientes observaciones para 5 aos de las variables X e Y, ajstese el modelo de regresin de Y en funcin de X ms idneo. Donde:

Y: produccin nacional de un subsector industrial, en millones de toneladas.X: tiempo

Ejercicio 4

Cinco nias de 2,4, 6,7 y 8 aos pesan respectivamente 15, 19, 25, 38, y 34 kilogramos respectivamente, entonces una nia de 12 aos pesara aproximadamente:

A. 45B. 55C. 15D. 51E. 61

Ejercicio 5En el anlisis de Regresin lineal se puede afirmar todo lo siguiente excepto:A. Ajusta los datos a una lnea rectaB. Predice valores de una variable si se conoce el valor de la otra C. Establece una relacin cuantitativa entre dos variables relacionadasD. El mtodo grfico para determinar la relacin entre dos variables es ms concreto que el mtodo matemtico o de mnimos cuadradosE. Una relacin lineal entre dos variables queda representada por una lnea recta llamada ecuacin de regresin

Ejercicio 6Dado Los siguientes datos expuestos en la tablaEdad12345

Estatura6080100110112

La frmula de regresin para los datos propuestos est dada por:A. y = 11,5x + 67,5 B. y = 7,5x + 85,5 C. y = 13,4x + 52,2 D. y = 14,4x + 47 E. y = 14x + 48,8

Ejercicio 7El Grafico para los puntos dispersos est dado por:ABCD

Rta:

Ejercicio 8El diagrama de dispersin para la regresin lineal esta dado porCDAB

Rta:

Ejercicio 9Los siguientes datos corresponden a 100 salarios tomados en una encuesta aplicada a 380 habitantes de Villavicencio. Determinar en R el grado de asimetra de los datos. establecer una conclusin.

2890003500008869003100006500009612003200007560001200000345000

2890003500008890003200006655009650003200007560001300000320000

2890003500008900003200006895009960003200007596001700100750000

28900056670089650032000068950099900034000075960017001001120000

31000056670090000032000069000010000003400007890001700100345000

31000056670093620032000069000010250003400007890001700100863000

31000060000094250032000069900010250003400008000001700100886000

320000700000109600032000069900010630003400008000001700100345000

320000700000111630034500085960017770003400008000001700100850000

3200007500001120000345000862300180000034500080000017001001750000

> salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,320000,665500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759600,1700100,750000,289000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,566700,900000,320000,690000,1000000,340000,789000,1700100,345000,310000,566700,936200,320000,690000,1025000,340000,789000,1700100,863000,310000,600000,942500,320000,699000,1025000,340000,800000,1700100,886000,320000,700000,1096000,320000,699000,1063000,340000,800000,1700100,345000,320000,700000,1116300,345000,859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,345000,862300,1800000,345000,800000,1700100,1750000)> par(mfrow=c(1,2))> f=table(salarios)> dd barplot(f)> plot(dd,add=T)

> summary(salarios) Min. 1st Qu. Median Mean 3rd Qu. Max. 289000 340000 700000 750900 947200 1800000

Esta es una asimetra positiva ya que Ejercicio 10En una distribucin asimtrica negativa:1. La moda se encuentra entre la media y la mediana1. La moda est ubicada a la derecha de la media1. La media es menor que la desviacin tpica1. La media es menor que la mediana1. La moda y la mediana son igualesEjercicio 11Los momentos de segundo orden con respecto a la media de dos distribuciones son 9 y 16, mientras que los momentos de tercer orden son 8.1 y 12. 8 respectivamente. La distribucin ms asimtrica es:

1. La primera porque tiene mayor grado de deformacin 1. La primera porque tiene menor grado de deformacin 1. La segunda porque tiene mayor grado de deformacin 1. La segunda porque tiene menor grado de deformacin

Ejercicio 12Uno de los siguientes enunciados es verdadero1. La media en una muestra de datos agrupados la divide en dos partes.1. Una distribucin de datos permite calcular todas las medidas de tendencia central1. La moda es un dato que permite analizar un resultado esperado1. Una medida de dispersin est libre del clculo de la media.Ejercicio 13En el anlisis de regresin lineal se puede afirmar todo lo siguiente, excepto1. Ajusta todos los datos a una lnea recta1. Predice el valor de una variable si se conoce el valor de la otra1. Establece una relacin cuantitativa entre dos variables1. El mtodo grafico es ms concreto que el mtodo matemtico1. Una relacin lineal de datos queda representada por una recta.

Ejercicio 14Dado que el grado de asimetra de una distribucin es de 2,27, la media es de 189,87 y la mediana 189,16, entonces la varianza toma un valor correspondiente a:1. 0.931. 0.881. 0.781. 1.881. 1.78

Ejercicio 15Tomando una distribucin ligeramente asimtrica, calcular la moda sabiendo que su media es igual a 3 y que la diferencia entre la media y la mediana es igual a -21. 2.9B. 0.91. 191. 91. 1/9

Ejercicio 16En la siguiente distribucin de datos el coeficiente de asimetra segn el coeficiente de Pearson es:Xi123456

f283575

1. 1. 21. 1/31. 31. 1

Ejercicio 17Retome los 100 datos y elabore una tabla en R para determinar el coeficiente de Gini. Utilice la librera ineq, y compare los resultados. Establezca conclusiones

2890003500008869003100006500009612003200007560001200000345000

2890003500008890003200006655009650003200007560001300000320000

2890003500008900003200006895009960003200007596001700100750000

28900056670089650032000068950099900034000075960017001001120000

31000056670090000032000069000010000003400007890001700100345000

31000056670093620032000069000010250003400007890001700100863000

31000060000094250032000069900010250003400008000001700100886000

320000700000109600032000069900010630003400008000001700100345000

320000700000111630034500085960017770003400008000001700100850000

3200007500001120000345000862300180000034500080000017001001750000

> library(ineq)>salarios=c(289000,350000,886900,310000,650000,961200,320000,756000,1200000,345000,289000,350000,889000,320000,665500,965000,320000,756000,1300000,320000,289000,350000,890000,320000,689500,996000,320000,759600,1700100,750000,289000,566700,896500,320000,689500,999000,340000,759600,1700100,1120000,310000,566700,900000,320000,690000,1000000,340000,789000,1700100,345000,310000,566700,936200,320000,690000,1025000,340000,789000,1700100,863000,310000,600000,942500,320000,699000,1025000,340000,800000,1700100,886000,320000,700000,1096000,320000,699000,1063000,340000,800000,1700100,345000,320000,700000,1116300,345000,859600,1777000,340000,800000,1700100,850000,320000,750000,1120000,345000,862300,1800000,345000,800000,1700100,1750000)> g=ineq(salarios,type="Gini")> g[1] 0.3122976

> plot(Lc(salarios),col="darkred",lwd=2)

Grfico16080100110112

ESTATURA

Hoja1EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico15070100110112

ESTATURA

Hoja1EDAD12345ESTATURA5070100110112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico1507092100112

ESTATURA

Hoja1EDAD12345ESTATURA507092100112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico1606092100112

ESTATURA

Hoja1EDAD12345ESTATURA606092100112

Hoja1

ESTATURA

Hoja2

Hoja3

Grfico170100100110112

ESTATURA

Hoja1EDAD12345ESTATURA70100100110112EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3

Grfico170100105115120

ESTATURA

Hoja1EDAD12345ESTATURA70100105115120EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3

Grfico1606092100112

ESTATURA

Hoja1EDAD12345ESTATURA606092100112EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3

Grfico16080100110112

ESTATURA

Hoja1EDAD12345ESTATURA6080100110112EDAD12345ESTATURA6080100110112

Hoja1

ESTATURA

Hoja2

ESTATURA

Hoja3