Concepto El diseño de discontinuidad en la regresión ofrece mejores perspectivas que el diseño de...

Post on 31-Jan-2016

225 views 0 download

Transcript of Concepto El diseño de discontinuidad en la regresión ofrece mejores perspectivas que el diseño de...

TEMA XVII

ESQUEMA GENERAL

Análisis de la covariancia (ANCOVA)

Análisis de la variancia (ANOVA) y de la regresión (AR)

Representación gráfica del diseño

Concepto del DDR

DISEÑO DE DISCONTINUIDAD EN LA REGRESIÓN

Ejemplo práctico

Concepto

El diseño de discontinuidad en la regresión ofrece mejores perspectivas que el diseño de grupos no equivalentes, dado que se conoce la naturaleza del proceso de selección de los grupos (o asignación de las unidades de estudio). ..//..

Aunque es escasa la utilización de esta estrategia, constituye un buen ejemplo de cómo es posible verificar el efecto del tratamiento mediante grupos organizados en función de los valores de la variable pre-tratamiento. En la práctica, su uso se ha limitado al ámbito de la investigación sobre educación compensatoria (Trochim, 1984).

Lógica del diseño

Según la lógica del diseño, los sujetos son considerados, a partir de un punto de corte en la variable pre-tratamiento, como pertenecientes al grupo control o experimental (grupo de tratamiento). Por esta razón, la estrategia de discontinuidad en la regresión requiere que se conozca el criterio de formación del grupo control y grupo experimental (o de tratamiento); es decir, el criterio de selección (Thistlethwaite y Campbell, 1960).

Representación gráfica

Según Cain (1975), una clara ilustración de la modelación del procedimiento de selección es el uso de una puntuación pre-test (pre-tratamiento) en la asignación de los sujetos a los grupos de tratamiento (control y experimental). La estructura del diseño de discontinuidad en la regresión suele representarse, por lo general, en forma gráfica. ..//..

El eje de las ordenadas representa los valores de la variable de resultado y el eje de las abcisas los valores de la covariable donde está marcado un punto de corte, X0, para que queden delimitados los grupos.

DISEÑO DE DISCONTINUIDAD EN LA REGRESIÓN

PATRONES HIPOTÉTICOS DE LAS LÍNEAS DE REGRESIÓN

a) Efecto nulo b) Efecto principal negativo c) Efecto principal positivo

d) Efecto de interacción positivo e) Efectos de interacción y principal negativo

Variable de selección y diseño

Azar V.S. (?) V.S. (Pre)

D.Exp. DGNE DDR

Modelos de análisis del diseño

A) Análisis de la variancia

B) Análisis de la covariancia

C) Análisis de la regresión

Estrategias de análisis

1) ANOVA(x) V.Pre A(H0)

ANOVA(y) V. Dep.

X

2) ANCOVA Y XY

3) ANÁLISIS DE LA REGRESIÓN

Análisis de la variancia (1)

Modelo estructural del anova

Yij = + j + ij

Análisis de la covariancia (2)

Modelo estructural de Análisis de la Covariancia (ANCOVA)

_Yij = + j + 1 (Xij – X..) + ’ij

Análisis de la regresión (3)

Yi = bo + b1Ti + i

Modelo de la regresión simple

Yi = bo + b1Xi + b2Ti + i

Modelo de la regresión múltiple

Yi = bo + b1Xi + b2Ti + b3XTi + i

Modelo de la Regresión con término de interacción

Ejemplo práctico

El propósito del análisis de datos es, en esta clase de diseños, comparar dos ecuaciones de la regresión en el punto de corte. Se pretende, por ejemplo, estudiar el efecto de un programa sobre el rendimiento escolar. Puesto que los sujetos seleccionados que van a seguir el programa presentan niveles más altos en variables relacionadas con el rendimiento escolar que los controles, se decide utilizar esta información previa como covariable.

De acuerdo con la estrategia del diseño, los sujetos que puntúan bajo en la covariable actúan de grupo control y los que puntúan alto, de grupo experimental o de tratamiento. A continuación se presentan los datos de este hipotético estudio, donde los sujetos control obtienen puntuaciones entre 1 y 5 en la covariable, y los sujetos que reciben el tratamiento entre 6 y 10. El punto de corte se sitúa en el intervalo 5-6.

Nótese que los sujetos van a parar al grupo control o experimental, independientemente de si se encuentran el la parte inferior o superior del punto de corte.

La asignación de los sujetos a un grupo u otro (control o experimental) es arbitraria y depende de los objetivos de la investigación.

12.1 121 1489

7.7 77 609

5.6 56 342

2.7 27 89

947168

4346657579

Y1122233445

X

Control

9101213131112141314

667778899

10

YX

Experimental

DISEÑO DE DISCONTINUIDAD EN LA REGRESIÓN

Medias:( ):( )2

( ) ( )

Modelos de la variancia y de la regresión lineal simple (1) y (3)

Análisis de la variancia (1)

Cálculo de las sumas de cuadrados del anova

SCtotal(y) = 4² + 3² + ... + 14² - C = 1831 - 1566.4 = 264.55

SCA(y) = 56²/10 + 121²/10 - C = 1777.7 - 1566.45 = 211.25

SCS/A(y) = 4² + 3² + ... + 14² - 56²/10 - 121²/10 = 1831 - 1777.7 = 53.3

C = (56 + 121)²/20 = 1566.45

RESULTADO DEL ANOVA. DISEÑO DE DISCONTINUIDAD EN LA REGRESIÓN

(VARIABLE Y)

F0.99(1/18) = 8.28; F0.95(1/18) = 4.41

an-1=19 264.55Total

<0.0171.37211.25

2.96

a-1=1

a(n-1)=18

211.25

53.30

Entre Trat (A)

Error (S/A)

pFCMg.lSCF.V.

Análisis de la regresión (3)

Reorganización de la matriz de datos para el análisis de la regresión.

Codificación de efectos

V.dependiente (Y) Grupo (T) 4 1 3 1 4 1 6 1 6 1 5 1 7 1 5 1 7 1 9 1 56 9 -1 10 -1 12 -1 13 -1 13 -1 11 -1 12 -1 14 -1 13 -1 14 -1 121

M: 8.85 0.00 ΣY²/ΣT²: 1831.00 20.00 Σ(YT)j : -65

SC: 264.45 20.00 SP: -65

Estimación de los parámetros del modelo de la regresión simple

_ _

b0 = Y - b1T

SPYT

b1 = -----------

SCT

Cálculo de b1

(56+121)(10-10) SPYT = (56 - 121) - ---------------------- = -65 20y (0)²SCT = 20 - -------- = 20 20Con estas sumas, se calcula b1,

-65b1 = ------- = -3.25 20

Cálculo de b0

Media total: 8.85

b0 = 8.85 - (-3.25)(0) = 8.85

Prueba de significación de b1

CME(Y)

sb = ------------ (error estándar de b1)(ANOVA)

SCT (variable de tratamiento)

2.96

sb = ---------- = 0.3847 20

De donde b -3.25 t = ------- = ----------- = -8.44

sb 0.3847

Decisión estadística

Entrando en las tablas de t con los grados de libertad del error del análisis de la variancia (g.l. = 18) y a un nivel de significación de 0.05, el valor teórico es 2.101. El valor teórico es más pequeño que el empírico o calculado. De esto se infiere que, vía análisis de la regresión, hay una diferencia significativa entre ambos grupos. Verifíquese la equivalencia entre t y F; es decir 8.44 = 71.37, y entre el análisis de la variancia y el análisis de la regresión.

Modelo de la covariancia (2.1)Asumiendo la homogeneidad de las

pendientes

Cálculo de las Sumas de Productos F.V. SP

Σj(ΣiXij)(ΣiYij) (27)(56)+(77)(121) Variable A ------------------- – Cxy = ------------------------- – 920.4

n 10 = 162.5

Error S/A SPtot – SPA = 194.6 – 162.5 = 32.1

Total (T) ΣiΣjXijYij – Cxy = 1115 – 920.4 = 194.6

Suma de productos de tratamientos

(27)(56)+(77)(121)

Variable A: --------------------------- – 920.4 10

= 162.5

Suma de productos del error

Error S/A : 194.6 – 162.5 = 32.1

Suma de productos del total

Total (T): 1115 – 920.4 = 194.6

Cálculo de las SP’s por grupo

(ΣiXij)(ΣiYij)

Grupo (Gj): ΣiXijYij – ----------------------

n

G1 = 168 - [(27)(56)]/10 = 16.8 G2 = 947 - [(77)(121)]/10 = 15.3

SPS/A = 32.1

Factor de corrección para la media

(ΣiΣjXij)(ΣiΣjYij) (104)(177)

Cxy = --------------------- = ------------- = 920.4

an 20

Cálculo de las sumas de cuadrados ajustadas del ancova

F.V. SC g.l. (estimación SC)

A(aj) SCA(y') = SCtot(y') – SCS/A(y') a – 1 23.65 – 21.30 = 2.35

SPS/A² 32.1²

S/A(aj) SCS/A(y') = SCS/A(y) – ------------ a(n – 1) – 1 53.30 – ----------- = 21.30 SCS/A(x) 32.2

SPtot² 194.6² Total(aj) SCtot(y') = SCtot(y) – ----------- an – 2 264.55 – ---------- = 23.65

SCtot(x) 157.2

Orden de ejecución de los cálculos:

Se procede empezando por el total y termina con el de tratamientos

Suma de cuadrados ajustada para el total

SPtot²

SCtot(y') = SCtot(y) – ----------- SCtot(x)

32.1²

264.55 – ------------ = 23.65

157.2

Suma de cuadrados ajustada para el error

SPS/A²

SCS/A(y') = SCS/A(y) – ----------- SCS/A(x)

194.6²

53.30 – ------------ = 21.30

32.2

Suma de cuadrados ajustada para los tratamientos

SCA(y') = SCtot(y) – SCS/A(y’)

23.65 – 21.30 = 2.35

Valor de la razón F

CMA(aj) 2.35

F = ------------- = -------------- = 1.88

CMS/A(aj) 1.25

Resultado del ANCOVA

F0.99(1/17) = 8.40; F0.95(1/17) = 4.45

an-2=1823.65Total (aj)

>0.051.882.35

1.25

a-1=1

a(n-1)-1=17

2.35

21.30

Variable A (aj)

Error S/A (aj)

pFCMg.lSCF.V.

Análisis de la Covariancia (2.2)Líneas de la regresión no paralelas

Control Tratamiento

X - X0 Y X - X0 Y

Análisis de la CovarianciaLíneas de regresión no paralelas

TotalesMedias

Comparación de los valores F

Fe - te Ft - tt

ANOVA = 71.37 F0.95(1/18) = 4.41 t

AR = 8.44 t0.95(18) = 2.101

ANCOVA = 1.88 F0.95(1/17) = 4.45

Debería realizarse el análisis de la regresión múltiple, comparable con el ANCOVA

Fin diseños cuasi transversales