AD4001 s10 ss

21
Sesión 10 Sesión 10 Regresión lineal simple Regresión lineal simple Estadística en las organizaciones CD4001 Dr. Jorge Ramírez Medina

description

Estadística en las organizaciones Sesión 10 Dr. Jorge Ramírez Medina Regresión lineal simple

Transcript of AD4001 s10 ss

Page 1: AD4001 s10 ss

Sesión 10Sesión 10Regresión lineal simpleRegresión lineal simple

Estadística en las organizaciones CD4001

Dr. Jorge Ramírez Medina

Page 2: AD4001 s10 ss

Qué tipoQué tipo de relaciónde relación

se examina?se examina?

Cuántas son Cuántas son las variables las variables

a predecir?a predecir?

Dependencia Interdependencia

Cuál es la escala Cuál es la escala de medición de de medición de

la variable la variable dependiente?dependiente?

Cuál es la escala Cuál es la escala de medición de de medición de

la variable la variable dependiente?dependiente?

Cuál es la escala Cuál es la escala de medición de de medición de

la variable la variable predictora?predictora?

SEMSEM

Múltiples relaciones deVariables dependientes eindependientes Varias variables

dependientes en una sola relación

Una variable dependientes en una sola relación

Correlación Correlación canónicacanónica

Análisis Análisis Multivariado Multivariado de varianza de varianza

(Manova)(Manova)

Correlación Correlación canónica canónica

con variables con variables dummydummy

Regresión múltipleRegresión múltipleAnálisis ConjointAnálisis Conjoint

Análisis discriminante Análisis discriminante múltiplemúltiple

Modelos de Modelos de probabilidad lineal probabilidad lineal

(logit Analysis)(logit Analysis)

Métrica No Métrica

Métrica No Métrica

No MétricaMétrica

Page 3: AD4001 s10 ss

Correlación canónica

Y1+Y2+Y3+…+Yn = X1+X2+X3+…+Xn

métrica, no métrica métrica, no métrica

Manova

Y1+Y2+Y3+…+Yn = X1+X2+X3+…+Xn

métrica no métrica

Análisis de Varianza

Y1 = X1+X2+X3+…+Xn

métrica no métrica

Análisis discriminante múltiple

Y1= X1+X2+X3+…+Xn

no métrica (dicotómica) métrica

Análisis de regresión múltiple

Y1= X1+X2+X3+…+Xn

métrica métrica, no métrica

Análisis Cojoint

Y1= X1+X2+X3+…+Xn

métrica, no métrica no métrica

SEM

Y1 =Y2 =Ym =

X11+X12+X13+…+X1n

X21+X22+X23+…+X2n

Xm1+Xm2+Xm3+…+Xmn

métrica métrica, no métrica

Relación entre los métodos de dependencia multivariados

Page 4: AD4001 s10 ss

Modelo de regresión Modelo de regresión lineal simplelineal simple

• Modelo de regresión lineal simple y = 0 + 1x +

• Ecuación de regresión lineal simpleE(y) = 0 + 1x

• Ecuación estimada de regresión lineal simpley = b0 + b1x

^

Dr Jorge Ramírez MedinaEGADE Business School

Page 5: AD4001 s10 ss

Método de Método de mínimos cuadradosmínimos cuadrados

Criterio de mínimos cuadrados

en donde:yi = es el valor observado de la

variable dependiente para la ith observaciónyi = es el valor estimado de la variable

dependiente para la ith observación

min (y yi i )2min (y yi i )2

^

Dr Jorge Ramírez MedinaEGADE Business School

Page 6: AD4001 s10 ss

Pendiente de Ecuación estimada de regresión lineal simple

Intercepto en y de la Ecuación estimada de regresión lineal simple

Calculando bCalculando b11 y b y b00

Dr Jorge Ramírez MedinaEGADE Business School

Page 7: AD4001 s10 ss

EjemploEjemplo

Restaurante i

Población estudiantes

(miles) xi

Ventas trimestrales (miles de $)

1 2 58

2 6 105

3 8 88

4 8 118

5 12 117

6 16 137

7 20 157

8 20 169

9 22 149

10 26 202Dr Jorge Ramírez MedinaEGADE Business School

Page 8: AD4001 s10 ss

SCESCE

Dr Jorge Ramírez MedinaEGADE Business School

Residual representa el error

Es lo que se minimiza con el criterio de Mínimos cuadrados

SCE: Suma de cuadrados debido al error. Medida de error al usar

Page 9: AD4001 s10 ss

STCSTC

Dr Jorge Ramírez MedinaEGADE Business School

Asumamos que no tenemos información de xi, entonces usaremos el promedio de las ventas.

El error correspondiente es STC (Suma total de cuadrados)

Page 10: AD4001 s10 ss

SCE y STCSCE y STC

Dr Jorge Ramírez MedinaEGADE Business School

SCE: Que tanto se agrupan las observaciones en torno a la recta STC: Que tanto se agrupan las observaciones en torno a la recta

P10

Page 11: AD4001 s10 ss

SCRSCR

Dr Jorge Ramírez MedinaEGADE Business School

SCR: Suma de cuadrados debido a la regresión

P10

Page 12: AD4001 s10 ss

• SSE• SST• SSR

¿Qué tan bien se ajustan ¿Qué tan bien se ajustan a los datos la ecuación a los datos la ecuación

de regresión?de regresión?2)( ii yy 2)( ii yy ^̂

Dr Jorge Ramírez MedinaEGADE Business School

2)( yyi2)( yyi

2)( yyi2)( yyi

SST = SSR + SSE

( ) ( ) ( )y y y y y yi i i i 2 2 2( ) ( ) ( )y y y y y yi i i i 2 2 2^̂^̂

Page 13: AD4001 s10 ss

Coefficient of Determination

rr22 = SSR/SST = SSR/SSTwhere:

SST = total sum of squares SSR = sum of squares due

to regression SSE = sum of squares due

to error

El Coeficiente de El Coeficiente de determinacióndeterminación

Dr Jorge Ramírez MedinaEGADE Business School

Page 14: AD4001 s10 ss

• Sample Correlation Coefficient

where: b1 = the slope of the

estimated regression equation

El coeficiente de El coeficiente de correlacióncorrelación

21 ) of(sign rbrxy 21 ) of(sign rbrxy

ionDeterminat oft Coefficien ) of(sign 1brxy ionDeterminat oft Coefficien ) of(sign 1brxy

xbby 10ˆ xbby 10ˆ

Dr Jorge Ramírez MedinaEGADE Business School

Page 15: AD4001 s10 ss

EjemploEjemplo

• Sample Correlation Coefficient

The sign of b1 in the equation

is “+”. rrxyxy = +.9366 = +.9366

21 ) of(sign rbrxy 21 ) of(sign rbrxy

ˆ 10 5y x ˆ 10 5y x

=+ .8772xyr =+ .8772xyr

Dr Jorge Ramírez MedinaEGADE Business School

Page 16: AD4001 s10 ss

• Residual for Observation i

yyii – – yyii

• Standardized Residual for Observation i

Where

Análisis de residuosAnálisis de residuos

y ysi i

y yi i

y ysi i

y yi i

s s hy y ii i 1s s hy y ii i 1^̂

Dr Jorge Ramírez MedinaEGADE Business School

Page 17: AD4001 s10 ss

EjemploEjemplo

Residuals

Observation Predicted Cars Sold Residuals1 15 -12 25 -13 20 -24 15 25 25 2

Observation Predicted Cars Sold Residuals1 15 -12 25 -13 20 -24 15 25 25 2

Dr Jorge Ramírez MedinaEGADE Business School

Page 18: AD4001 s10 ss

Diferencias y Diferencias y similitudessimilitudes

Dr. Jorge Ramírez MedinaITESM EGADE

Pruebas de asociaciónPruebas de asociación

Pruebas de diferenciasPruebas de diferencias

Pruebas de hipótesisPruebas de hipótesis

ANOVA REGRESSION DISCRIMINANT/LOGITSimilaritiesNumber of One One OnedependentvariablesNumber ofindependent Multiple Multiple Multiplevariables

DifferencesNature of thedependent Metric Metric CategoricalvariablesNature of theindependent Categorical Metric Metricvariables

Page 19: AD4001 s10 ss

When ANOVA is the When ANOVA is the Correct TestCorrect Test

Page 20: AD4001 s10 ss

Asignación para la siguiente sesión

Dr. Jorge Ramírez MedinaEGADE Business School

Page 21: AD4001 s10 ss

Fin Sesión Diez