REGRESION Modoficado

23
MATERIA: ESTADISTICA ECONOMICA II DOCENTE: ING. MAURICO PERLA ALUMNOS: JERSON EDENILSON CARBAJAL PEÑA JOSE MANUEL MACHADO CARDENAS ELMER FABRICIO RODRIGUEZ ESCOBAR REGRESION

Transcript of REGRESION Modoficado

Page 1: REGRESION Modoficado

MATERIA: ESTADISTICA ECONOMICA II

DOCENTE:ING. MAURICO PERLA

ALUMNOS:JERSON EDENILSON CARBAJAL PEÑAJOSE MANUEL MACHADO CARDENASELMER FABRICIO RODRIGUEZ ESCOBAR

REGRESION

Page 2: REGRESION Modoficado

2ESTADISTICA ECONOMICA 2 /// REGRESION

INTRODUCCION

El propósito de este trabajo es proporcionar los conceptos y metodologías básicas para

extraer de grandes cantidades de datos las características principales de una relación que

no es evidente, con este trabajo se pretenden analizar las maneras de regresión para

ajustar algún tipo de ecuación a un conjunto de datos dados, con el propósito de obtener

una ecuación empírica de predicción razonablemente y que proporciones un modelo

teórico para analizar los datos.

Teniendo en cuenta que no se tiene problema alguno en las designaciones comunes de la

variable dependiente e independiente (X y Y), se preferiría denominarlas como variables

de respuesta y de predicción, ya que en la regresión solo puede asociarse un valor Y con

una predicción X; no es posible establecer una relación causa-efecto entre la Y y las X,

por ello algunos ejemplos proporcionan una idea del porque obtener una relación causa-

efecto esta mas allá del alcanze del análisis de la regresión, por ejemplo:

De manera obvia existe una relación entre la altura y el peso de los seres humanos, pero

implica esta relación ¿que pueda cambiar la altura de una persona si logra cambiar su

peso? En otro caso se tiene la relación entre la cantidad de gas bruto que se consume

en cierta área de alguna ciudad y la temperatura atmosférica promedio, pero significa esto

¿qué es posible aumentar la temperatura mediante la reducción del consumo en el gas?

La esencia de estos ejemplos anteriores esta en el hecho de el análisis de regresión y sus

tipos, que solo descubre una relación entre las variables de respuesta y las variables de

predicción, en lugar de detectar la relación causa-efecto, con lo cual en este trabajo se

pretende antes que nada poder hacer capaz de manejar de manera básica los términos

de la regresión y sus usos en el ámbito estadístico descriptivo.

Page 3: REGRESION Modoficado

3ESTADISTICA ECONOMICA 2 /// REGRESION

OBJETIVOS

OBJETIVO GENERAL

Comprender el análisis de la Regresión en el ámbito estadístico-descriptivo, de

manera tal que como estudiantes seamos capaces de realizar un buen uso del

mismo, así como también identificar los tipos de Regresión que existen, y la

manera de aplicar cada uno de ellos.

OBJETIVOS ESPECIFICOS

Comprender el análisis de la Regresión en el ámbito estadístico-descriptivo.

Identificar los tipos de Regresión existentes.

Saber hacer uso del método de regresión y los tipos que hay de manera

básica.

Page 4: REGRESION Modoficado

4ESTADISTICA ECONOMICA 2 /// REGRESION

Regresión

La regresión estadística o regresión a la media es la tendencia de una medición

extrema a presentarse más cercana a la media en una segunda medición. La

regresión se utiliza para predecir una medida basándonos en el conocimiento de

otra. El término regresión fue introducido por Francis Galton en su libro Natural

inheritance (1889), partiendo de los análisis estadísticos de Karl Pearson. Su

trabajo se centró en la descripción de los rasgos físicos de los descendientes a

partir de los de sus padres. Estudiando la altura de padres e hijos llegó a la

conclusión de que los padres muy altos tenían una tendencia a tener hijos que

heredaban parte de esta altura, pero los datos revelaban también una tendencia a

regresar a la media.

Los tipos de regresión más comunes entre dos variables son la regresión: lineal,

logarítmica, exponencial, cuadrática y cúbica. Cuando hay más de una variable

independiente “x”, la regresión más utilizada en la regresión múltiple. A

continuación se expresan matemáticamente los diferentes modelos.

REGRESIÓN ECUACIÓN

Lineal y = b0 + b1 x

Logarítmica y = b0 + b1 Ln (x)

Exponencial y = b0 e (b1

x)

Cuadrática y = b0+ b1 x +b2 x2

Cúbica y = b0+ b1 x +b2 x2 +b3 x3

Lineal Múltiple y = b0+ b1 x1 +b2 x2…+bn xn

Page 5: REGRESION Modoficado

5ESTADISTICA ECONOMICA 2 /// REGRESION

Regresión Lineal

En estadística la regresión lineal o ajuste lineal es un método matemático que

modeliza la relación entre una variable dependiente Y, las variables

independientes Xi y un término aleatorio ε. Este modelo puede ser expresado

como:

Donde β0 es la intersección o término "constante", las son los

parámetros respectivos a cada variable independiente, y p es el número de

parámetros independientes a tener en cuenta en la regresión. La regresión lineal

puede ser contrastada con la regresión no lineal.

La primera forma de regresiones lineales documentada fue el método de los

mínimos cuadrados, el cual fue publicado por Legendre en 1805, y por Gauss en

1809. El término "mínimos cuadrados" proviene de la descripción dada por

Legendre "moindres carrés". Sin embargo Gauss aseguró que conocía dicho

método desde 1795.

Tanto Legendre como Gauss aplicaron el método para determinar, a partir de

observaciones astronómicas, las órbitas de cuerpos alrededor del sol. En 1821,

Gauss publicó un trabajo en dónde desarrollaba de manera más profunda el

método de los mínimos cuadrados, y en dónde se incluía una versión del teorema

de Gauss-Márkov.

Ecuación de Regresión Lineal

Es el tipo de regresión más utilizada, es una ecuación que define la relación lineal

entre dos variables.

Ecuación de regresión lineal Y= b0 + b1 x

Page 6: REGRESION Modoficado

6ESTADISTICA ECONOMICA 2 /// REGRESION

Esta ecuación se calcula según el principio de Mínimos Cuadrados. La cual es la

técnica empleada para obtener la ecuación de regresión, minimizando la suma de

los cuadrados de las distancias verticales entre los valores verdaderos de "Y" y los

valores pronosticados.

La ecuación que minimizar la desviaciones de los valores de “Y” respecto a la

ecuación de la recta, cuando “b0= 0”, es:

Por lo tanto, la Expresión del coeficiente de regresión, “b1”, queda así:

Como podemos escribir:

Y=(∑ XY−∑ X∑Yn

∑ X2−(∑ X )2

n)X

Y=b1X

b1=∑ XY−

∑ X∑Y

n

∑ X 2−(∑ X )2

n

(Y−Y )=b1 (X−X )

Page 7: REGRESION Modoficado

7ESTADISTICA ECONOMICA 2 /// REGRESION

Que puede replantearse como:

De tal manera que la ordenada al origen, cuando “X” vale 0, “b0”, queda definida

de la siguiente manera:

Y=( Y−b1X )+b1X

b0=Y−b1X

Page 8: REGRESION Modoficado

8ESTADISTICA ECONOMICA 2 /// REGRESION

Ejemplo de Regresión Lineal.

Se tienen las notas de examen final de diez alumnos de las asignaturas de

matemáticas y español

Matemáticas 2 3 5 5 6 6 7 7 8 9

Español 2 2 5 5 6 7 5 8 7 10

Se supone que los alumnos con mejores notas en matemáticas, variable

independiente “X”, tienen las mejores notas en español, variable dependiente “Y”.

Esta pregunta se puede responder con un análisis de regresión correlación.

Lo primero que se hace es construir un gráfico de dispersión de punto como el que

se muestra a continuación

ma te má ti c a s

1086420

es

pa

ño

l

12

10

8

6

4

2

0

Gráfico de dispersión de puntos de las notas de las asignaturas de matemáticas y español

Page 9: REGRESION Modoficado

9ESTADISTICA ECONOMICA 2 /// REGRESION

Datos generados con una calculadora de mano:

x=5 .8 , y=5 .7 ,∑ x=58 ,∑ x2=378 ,∑ y=57 ,∑ y2=381 ,∑ xy=375

Luego se calcula el coeficiente de correlación “r”.

r=√ (375−(58 ) (57 )10)

2

(378−58210)(381−572

10)=0 .919

Este valor de “r” de 0.919 nos dice que hay una alta correlación entre las notas de

matemáticas y español.

Para hacer la recta de regresión debemos calcular:

b1=375−

(58 )(57 )10

378−582

10

=1 .0673

b0=5 .7−(1 .0673 )(5 .8 )=−0.4904

La recta de regresión esta queda determinada de la siguiente manera:

“Y = -0.4904 + 1.0673 X “.

Page 10: REGRESION Modoficado

10ESTADISTICA ECONOMICA 2 /// REGRESION

El gráfico de regresión es el siguiente:

Gráfico de Regresión. Se observa la recta de regresión y los datos

observados en forma de línea discontinua.

Page 11: REGRESION Modoficado

11ESTADISTICA ECONOMICA 2 /// REGRESION

Regresión Cuadrática

La regresión cuadrática es el proceso por el cual encontramos los parámetros de

una parábola que mejor se ajusten a una serie de datos que poseemos, ya sean

mediciones hechas o de otro tipo. Bueno, pero ¿Por qué habríamos de querer

ajustar nuestros datos precisamente a una parábola y no a otra función?

Una función cuadrática o de segundo grado se puede representar de manera

genérica como:

 

 

Entonces lo que nos interesa es encontrar los valores de a, b y c que hacen que el

valor de y calculado sea lo más cercano posible al medido.

A menudo en una investigación el objetivo es explicar el comportamiento de una

variable en términos de más de una variable, por ejemplo sea la variable y , cuyo

comportamiento explicaremos en términos de las variables

x1 , x2 ,. .. . , x k

Ahora estudiaremos la situación donde el comportamiento de la variable y

(llamada dependiente o respuesta)

Page 12: REGRESION Modoficado

12ESTADISTICA ECONOMICA 2 /// REGRESION

Se explicará mediante una relación lineal en función de las variables

x1 , x2 ,. .. . , x k (llamadas independientes o también explicativas). La variable

respuesta es de tipo cuantitativa y las variables explicativas deben ser

cuantitativas y/o categóricas.

Modelo

Sea y una variable respuesta y x1 , x2 ,. .. . , x k variables independientes;

deseamos describir la relación que hay entre la variable respuesta y las variables

explicativas, si entre ellas hay una relación lineal se espera que:

Y i=β0+β1X i1+β2X i

2+ .. .. . ..+βk X i

k

Y i Es la variable respuesta cuantitativa para el i-ésimo objeto, este es un valor

estimado.

βk , son los parámetros poblacionales (valores constantes fijos) llamados

coeficientes. Siendo “k” el número de de variables independientes.

Se espera que la variable dependiente varíe linealmente con las variables

independientes.

Page 13: REGRESION Modoficado

13ESTADISTICA ECONOMICA 2 /// REGRESION

Ejemplo de Regresión Cuadrática.

En determinado proceso se realizaron una serie de 24 mediciones, que luego al

graficarse se determinó que es de naturaleza cuadrática. Se desea encontrar los

parámetros del polinomio de segundo grado, que mejor se ajusta a esa serie de

datos, y cuál es el valor de la variable dependiente, cuando el valor de la variable

independiente es de 20.

La tabla con los datos medidos es la siguiente:

 X Y

0 10,08

0,5 12,03

1 11,38

1,5 18,81

2 20,53

2,5 28,50

3 31,38

3,5 38,40

4 48,39

4,5 60,60

5 66,66

5,5 82,61

6 91,37

6,5 105,44

7 122,537,5 137,77

8 152,74

8,5 172,65

9 188,84

9,5 207,77

10 230,94

10,5 251,35

11 274,07

11,5 295,95

 Ahora, teniendo  en cuenta la matriz que dedujimos anteriormente, sabemos que tenemos

que encontrar los valores de la suma de x, la suma de x2, de x3, x4, de Yi, xYi,  x2*Yi  y

n=24.

Page 14: REGRESION Modoficado

14ESTADISTICA ECONOMICA 2 /// REGRESION

 X Y X^2 X^3 X^4 Xyi X^2Yi

0 10,08 0,00 0,00 0,00 0,00 0,00

0,5 12,03 0,25 0,13 0,06 6,01 3,01

1 11,38 1,00 1,00 1,00 11,38 11,38

1,5 18,81 2,25 3,38 5,06 28,21 42,31

2 20,53 4,00 8,00 16,00 41,06 82,13

2,5 28,50 6,25 15,63 39,06 71,24 178,11

3 31,38 9,00 27,00 81,00 94,14 282,41

3,5 38,40 12,25 42,88 150,06 134,39 470,36

4 48,39 16,00 64,00 256,00 193,56 774,26

4,5 60,60 20,25 91,13 410,06 272,68 1227,08

5 66,66 25,00 125,00 625,00 333,31 1666,55

5,5 82,61 30,25 166,38 915,06 454,37 2499,02

6 91,37 36,00 216,00 1296,00 548,23 3289,38

6,5 105,44 42,25 274,63 1785,06 685,39 4455,05

7 122,53 49,00 343,00 2401,00 857,74 6004,20

7,5 137,77 56,25 421,88 3164,06 1033,24 7749,32

8 152,74 64,00 512,00 4096,00 1221,90 9775,23

8,5 172,65 72,25 614,13 5220,06 1467,54 12474,08

9 188,84 81,00 729,00 6561,00 1699,55 15295,92

9,5 207,77 90,25 857,38 8145,06 1973,80 18751,13

10 230,94 100,00 1000,00 10000,00 2309,40 23093,97

10,5 251,35 110,25 1157,63 12155,06 2639,18 27711,38

11 274,07 121,00 1331,00 14641,00 3014,81 33162,86

11,5 295,95 132,25 1520,88 17490,06 3403,37 39138,76

Total    138 266,078,166 1081 9522 89452,75 22494,51 208137,88

 

Reemplacemos los valores en la matriz... Aquí tenemos la matriz.

Page 15: REGRESION Modoficado

15ESTADISTICA ECONOMICA 2 /// REGRESION

 

24 138 1081 2660,8

138 1081 9522 22495

1081 9522 89453 208138

1  5,75 45,04 110,86

0 287,5 3306,25 7195,4

0 3306,25 40762,95 88291,13

1 0 -21,08 -33,04

0 1 11,5 25,02

0 0 2741,08 5544,03

1 0 0 9,60

0 1 0 1,76

0 0 1 2,02     

 

Por lo tanto: a=9.6 b=1.76 c=2.02

La parábola de mejor ajuste es entonces:

Page 16: REGRESION Modoficado

16ESTADISTICA ECONOMICA 2 /// REGRESION

Regresión exponencial

Será aquella en la que la función de ajuste será una función exponencial del tipo

y = a.bx

La regresión exponencial aunque no es lineal es linealizable tomando logaritmos

ya que haciendo el cambio de variable v = log y tendremos que la función anterior

nos generaría:

v = log y = log( a.bx) = log a + x log b

 

la solución de nuestro problema vendría de resolver la regresión lineal entre v ý x,

y una vez obtenida supuesta ésta: v* = A + B x ; obviamente la solución final será:

a = antilog A y b = antilog B.

Page 17: REGRESION Modoficado

17ESTADISTICA ECONOMICA 2 /// REGRESION

CONCLUSIONES

Con este trabajo se concluye que:

El método de regresión es de suma importancia para el manejo de datos

estadísticos-descriptivos, en la manera en que sean los datos agrupados e

identificados ordenadamente.

El análisis de regresión no es capaz de identificar la relación entre dos

fenómenos de causa-efecto, aunque se a capaz de identificar las variables

de manera individual y proporcional entre los fenómenos en estudio.

El uso de la Regresión en la economía es de amplio uso, debido a la

manera ordenada de manejar los datos e identificar los datos.

Page 18: REGRESION Modoficado

18ESTADISTICA ECONOMICA 2 /// REGRESION

RECOMENDACIONES

Con este trabajo se recomienda que:

El manejo de los datos de un fenómeno en estudio cualquiera sea dado por

el método de Regresión, debido a la manera bien ordenada y la agrupación

efectiva de datos que este proporciona.

El análisis de regresión es una herramienta efectiva y precisa por lo cual se

recomienda su estudio para realizar un buen manejo de los datos de un

fenómeno dado, ya que es capaz de identificar claramente las variables.

Es necesario el uso de la Regresión para satisfacer las necesidades de un

problema económico que necesite manejar e identificar las variables de

predicción de una manera efectiva.

Page 19: REGRESION Modoficado

19ESTADISTICA ECONOMICA 2 /// REGRESION

BIBLIOGRAFIA

Páginas Web

http://es.wikipedia.org/wiki/Regresi%C3%B3n_lineal

http://www.arquimedex.com/index.php?accion=1&id=83

http://www.monografias.com/trabajos14/estadistica/estadistica.shtml?

monosearch

http://www.umss.edu.bo/epubs/etexts/downloads/18/alumno/cap2.html

Libros

PROBABILIDAD Y ESTADISTICA aplicaciones y métodos.

Autor: George C. Canavos

ESTADISTICA APLICADA A LOS NEGOCIOS Y LA ECONOMIA

Autor: Allen L. Webster