Estimacion fecundacion mujeres en Ecuador Regresion Lineal

46
UNIVERSIDAD DE SANTIAGO DE CHILE MÉTODOS MULTIVARIADOS ESTIMACIÓN DE LA FECUNDIDAD DE LAS MUJERES EN EL ECUADOR INTEGRANTES Roberth Alcívar Cevallos Jorge Párraga Álava PROFESOR Dr. Iván Derpich Fecha de entrega: 27 de diciembre de 2013

Transcript of Estimacion fecundacion mujeres en Ecuador Regresion Lineal

UNIVERSIDAD DE SANTIAGO DE CHILE

MÉTODOS MULTIVARIADOS

ESTIMACIÓN DE LA FECUNDIDAD DE

LAS MUJERES EN EL ECUADOR

INTEGRANTES

Roberth Alcívar Cevallos

Jorge Párraga Álava

PROFESOR

Dr. Iván Derpich

Fecha de entrega: 27 de diciembre de 2013

ÍNDICE DE CONTENIDO

1. Introducción ............................................................................................. 2

2. Motivación ............................................................................................... 3

3. Objetivos ................................................................................................. 3

3.1. Objetivo General .................................................................................. 3

3.2. Objetivos Específicos ............................................................................. 4

4. La fecundidad y su estado actual ....................................................................... 4

4.1. La fecundidad a nivel mundial .................................................................... 4

4.2. La fecundidad en Latinoamérica .................................................................. 6

4.3. La fecundidad en Ecuador ........................................................................ 9

5. Regresión lineal para la fecundidad en el Ecuador ................................................... 11

5.1. Selección de los datos a utilizar ................................................................. 11

5.2. Construcción de las variables a utilizar ......................................................... 15

5.3. Significancia y construcción varios modelos ................................................... 16

5.3.1. Significancia del modelo 1 o inicial....................................................... 16

5.3.2. Significancia de modelo 2 ................................................................. 18

5.3.3. Significancia de modelo 3 ................................................................. 21

5.3.4. Construcción de modelo significativo .................................................... 23

5.3.4.1. Multicolinealidad .......................................................................... 23

5.3.4.2. Autocorrelación ............................................................................ 27

5.4. Selección del mejor modelo ..................................................................... 35

6. Conclusiones finales .................................................................................. 39

7. Referencias bibliográficas ............................................................................. 41

Anexos ...................................................................................................... 42

Anexo 1. Sitio web del INEC (Instituto Nacional Estadísticas y Censos Ecuador) .................... 43

Anexo 1. Diccionario de datos de variables del censo 2010 INEC ..................................... 44

ÍNDICE DE GRÁFICOS Y TABLAS

Gráfico 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007 .......................... 6

Gráfico 2. Tasa Global de Fecundidad según diferentes proyecciones 1950-2030 ......................... 7

Gráfico 3. Los 4 países latinos con trayectoria de la fecundidad por debajo del nivel de reemplazo en

2005-2010 ..................................................................................................... 8

Gráfico 4. Natalidad en Chile 1990-2012 .................................................................... 9

Gráfico 5. Natalidad en Ecuador 1990-2007 ............................................................... 10

Gráfico 6. Cantidad de hijos por años 1959-2009 ......................................................... 14

Gráfico 7. Gráfico de los residuales variable X1 ........................................................... 30

Gráfico 8. Gráfico de los residuales variable X2 ........................................................... 30

Gráfico 9. Gráfico de los residuales variable X3 ........................................................... 31

Gráfico 10. Comportamiento variable Sueldo, planteada como regresión lineal. ........................ 34

Gráfico 11. Comportamiento variable Rama de actividad planteada como regresión lineal. ............ 35

Gráfico 12. Comportamiento variable Grupo de actividad planteada como regresión lineal. ............ 35

Gráfico 13. Proyección de fecundidad en Ecuador hasta 2023. ........................................... 38

Tabla 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007 ............................ 5

Tabla 2. Codificación de “Actividad Semanal” ............................................................ 12

Tabla 3. Codificación de “Tipo de actividad” ............................................................. 12

Tabla 4. Codificación de “Rama de actividad” ............................................................ 13

Tabla 5. Codificación de “Estado conyugal” .............................................................. 13

Tabla 6. Codificación de “Grupo Económico” ............................................................ 13

Tabla 7. Codificación de “Cultura y Costumbres”......................................................... 13

Tabla 8. Datos a usar en el modelo 1 o inicial de regresión lineal ........................................ 15

Tabla 9. Variables a utilizar en el estudio .................................................................. 16

Tabla 10. Datos a usar en el modelo 2 de regresión lineal ................................................ 19

Tabla 11. Datos a usar en el modelo 3 de regresión lineal ................................................ 21

Tabla 12. Tabla con nuevos valores de la regresión. ...................................................... 32

2

1. Introducción

La fecundidad es la capacidad reproductiva de una población, guarda directa

relación con la fertilidad y con la edad al casarse o cohabitar, la disponibilidad y

empleo de métodos anticonceptivos, el desarrollo económico, el estado social de la

mujer, edad, entre otros. Muchos países en vías de desarrollo han experimentado

rápidas disminuciones en la fecundidad a partir de la década de 1960. Aunque

algunos ya han alcanzado el nivel de reemplazo de 2.1 nacimientos a lo largo de la

vida de una mujer y otros esperan hacerlo en el futuro, la disminución de la

fecundidad en otros países es más lenta e incluso se ha estancado. [1]

En todas estas situaciones, y tal como indica Ishida et al. (2010), se ha

evidenciado la importancia de la fecundidad dentro de estudios demográficos pues

ligeros cambios en esta, afectan dramáticamente la magnitud de la población a nivel

biológico o en sus determinantes sociales, históricos y culturales que afectan todo

el proceso reproductivo de la especie humana.

Para estudiar cambios de esta naturaleza se han creado varios métodos

estadísticos, uno de ellos el llamado regresión lineal el cual modela la relación entre

una variable dependiente Y, las variables independientes Xi, [2] lo que permite

hacer una predicción del comportamiento de alguna de estas en un determinado

punto o momento. Y es por ello que en este estudio se pretende “predecir”, a través

del método citado, como varia el número de hijos que tienen las mujeres en el

Ecuador según el año de nacimiento, además de verificar si aspectos como etnia,

nivel de educación, situación laboral, entre otras, influyen en esta cantidad.

Para tal análisis, la principal fuente de información será obtenida del censo

de población 2010 realizado por el INEC (Instituto Nacional de Estadísticas y

Censos) del Ecuador, pues se aporta importante información bastante actualizada.

3

2. Motivación

A nivel mundial, varios estudios han demostrado que la tendencia de

reducción de la fecundidad es el presagio de tiempos difíciles para las economías

de los países. Por ejemplo, una reducción de la población activa puede disminuir la

productividad, mientras que el aumento de la proporción de personas mayores

amenaza la solvencia de los sistemas de pensiones y de seguridad social. A medida

que desciende el tamaño de los hogares, se reduce la capacidad para cuidar de las

personas mayores, y éstas se enfrentan al aumento de los costes y de las

necesidades de atención sanitaria. [3]

Todos estos elementos combinados pueden crear barreras importantes para

alcanzar los objetivos de crecimiento de varios países, pero sobre de países en vías

de desarrollo como el Ecuador. Saber cuántos hijos tendrá una mujer en el Ecuador

durante su vida no es una tarea fácil, afortunadamente, en la actualidad se emplean

diferentes métodos y análisis estadísticos, el más popular es la regresión lineal, la

cual permite conocer este dato, e incluso hacerse una idea de lo que sucederá con

esta variable demográfica en un futuro; por lo que en este estudio se hará uso de

este método y demás análisis estadísticos para estudiar la fecundidad de las

mujeres en el Ecuador.

3. Objetivos

3.1. Objetivo General

Usar el método de regresión lineal para estimar la cantidad de hijos que

tendrán las mujeres en el Ecuador en los próximos diez años.

4

3.2. Objetivos Específicos

Elegir la base de datos de información censal a usar en el estudio.

Seleccionar las variables a emplear para la estimación del modelo.

Determinar la significancia de las variables escogidas a través de varios test

estadísticos.

Construir diferentes modelos de regresión con las variables significativas.

Seleccionar el mejor modelo de regresión lineal que cumpla con todos los

test estadísticos realizados.

4. La fecundidad y su estado actual

4.1. La fecundidad a nivel mundial

A nivel mundial la fecundidad presenta situaciones interesantes, en poco más

de cincuenta años se ha bajado la fecundidad de un promedio de 5 hijos por mujer,

para todo el mundo, a 2.7, casi a la mitad. Esto sin duda es un gran éxito de

enormes consecuencias benéficas para el planeta y sus habitantes, logrado en un

periodo de tiempo muy breve para un cambio tan importante; y el descenso ha sido

mayor en los países subdesarrollados que en los avanzados, lo que eleva la

importancia del alcance.

5

Región

Promedio de hijos por

mujer Cambio %

1950 2007

Asia 5.9 2.4 3.5 59

Latinoamérica y Caribe 5.9 2.5 3.4 58

Oceanía 3.8 2.1 1.7 45

Norte América 3.5 2.0 1.5 43

Europa 2.6 1.5 1.1 42

África 6.6 5.0 1.6 24

Tabla 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007

Fuente: L. Jaramillo, «Descenso de la fecundidad humana de1950 a 2007»

Asia es la región donde el descenso fue mayor, casi un 60% de reducción,

en la que influye sobre todo la política de control del crecimiento adoptada y

ejecutada muy decididamente por China, Corea del Norte, Thailandia e Indonesia,

y por el mediocre resultado en India y Bangladesh, que aún no siendo muy

espectacular tiene un gran peso en el promedio asiático por la magnitud de la

población de esos países.

En segundo lugar le sigue, Latinoamérica y el Caribe, con un porcentaje de

descenso casi igual al de Asia, a pesar de la fuerte oposición de instituciones

conservadoras, en particular la Iglesia Católica y los dirigentes comunistas;

evidentemente las poblaciones en su mayoría se han liberado mucho del poder

político y religioso para orientar la vida personal y realizar sus ideales de

fecundidad. Norte América y Europa tuvieron descensos menores aunque muy

significativos, principalmente porque es más difícil bajar la fecundidad cuando ya

está baja que cuando está muy alta. Esto de ninguna manera le resta significado al

cambio de los países desarrollados, porque bajar a casi la mitad una fecundidad

reducida es indicativo de un cambio muy importante en la mentalidad de la gente,

aún la de niveles más altos.

6

En último lugar viene África, logrando reducir la fecundidad de la región de

6.6 a 5.0 en 57, representando una reducción de tan solo un 24%. [3]

Gráfico 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007

Fuente: L. Jaramillo, «Descenso de la fecundidad humana de 1950 a 2007,» University

Research CO

Así, en el gráfico 1, se observa la tendencia de la fecundidad a nivel mundial,

y a continuación se hará un análisis exhaustivo de lo que sucede en la región de

Latinoamérica.

4.2. La fecundidad en Latinoamérica

En un estudio realizado en 2011 por la CEPAL (Comisión Económica para

América latina – Naciones Unidas) se indica que desde mediados del siglo XX la

fecundidad en América Latina experimentó grandes reducciones debido al proceso

de desarrollo iniciado en los países de esta región. (Gráfico 2). Este descenso ha

sobrepasado reiteradamente las estimaciones realizadas. Si bien los factores que

0,00

1,00

2,00

3,00

4,00

5,00

6,00

7,00

Asia Latinoaméricay Caribe

Oceanía Norte América Europa África

Reducción de la tasa global de fecundidad en el mundo desde 1950 a 2007

Hijos por mujer en 1950 Hijos por mujer 2007

7

más contribuyeron a este descenso están ligados a la exposición a las relaciones

sexuales, el impacto del uso de anticonceptivos ha aumentado rápidamente,

asociado no solo al incremento generalizado de la prevalencia anticonceptiva sino

también al uso de métodos modernos. Aunque la tendencia descendente fue

generalizada, el momento de inicio y el ritmo de este fenómeno han sido muy

diferentes en los países de la región. [4]

Gráfico 2. Tasa Global de Fecundidad según diferentes proyecciones 1950-2030

Fuente: Centro Latinoamericano y Caribeño de Demografía (CELADE) – División de

Población de la CEPAL sobre la base de Comisión Económica para América Latina y el

Caribe (CEPAL), “Proyección de población”, Observatorio demográfico, N°7 (LC/G.2414-

P), Santiago de Chile, 2009.

En el mismo estudio, se indica que en el ámbito regional, si bien los

descensos son generalizados, Centroamérica sigue presentando tasas mayores

que el promedio regional, aunque similares a las del promedio mundial y menores

que las del promedio de los países menos desarrollados. Además, como es de

esperar en una subregión con grandes desigualdades económicas y sociales, el

8

momento de inicio y el ritmo de este fenómeno son bien diferentes en los distintos

países.

Así, los países con una tasa de fecundidad muy baja y que están por debajo

del nivel de reemplazo son Brasil, Chile, Costa Rica y Cuba. (Gráfico 3).

Gráfico 3. Los 4 países latinos con trayectoria de la fecundidad por debajo del nivel de

reemplazo en 2005-2010

Fuente: Centro Latinoamericano y Caribeño de Demografía (CELADE) – División de

Población de la CEPAL sobre la base de Comisión Económica para América Latina y el

Caribe (CEPAL), “Proyección de población”, Observatorio demográfico, N°7 (LC/G.2414-

P), Santiago de Chile, 2009.

De hecho, en Chile recientemente se propuso promover la natalidad a través

de un bono de maternidad a las parejas que en el futuro tengan tres o más hijos.

De esa forma, se entregarán $200,00 USD por el nacimiento del tercer hijo, monto

que irá subiendo hasta 400,00 USD en el caso del quinto. [5] Debido a la baja en

la tasa de fecundidad del país como se observa en el Gráfico 4.

9

Gráfico 4. Natalidad en Chile 1990-2012

Fuente: E, Donoso, «Fecundidad en Chile: 2000-2012,» Revista Chilena de Obstetricia y

Ginecología”

4.3. La fecundidad en Ecuador

Durante la década pasada, Ecuador experimentó cambios en el

comportamiento de los patrones demográficos, en los cuales la natalidad,

mortalidad y fecundidad juegan un papel preponderante. Por ejemplo, en 1990 de

cada 1000 personas 5 morían, mientras que 17 años más tarde sólo 4 personas

mueren, es decir, la tasa de mortalidad ha disminuido. Actualmente, la esperanza

de vida al nacer de una persona supera los 75 años, mientras que en 1990 era de

69 años, según UNICEF. Por otra parte, la tasa de natalidad paso de un 3% a un

2% y, la tasa de fecundidad, paso de 10,64% a 6,85%; en el mismo período. [6]

Esta situación se evidencia en el gráfico 5, en donde se observa la evolución

de la tasa de natalidad en el período de tiempo 1990-2007. Puede observarse un

245000

250000

255000

260000

265000

270000

275000

280000

285000

290000

295000

1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012

Nacid

os

viv

os

Años

Natalidad en Chile 1990-2012

10

constante decrecimiento de la tasa de natalidad con ciertos puntos de corrección,

los cuales no hacen más que ratificar la tendencia decreciente.

Gráfico 5. Natalidad en Ecuador 1990-2007

Fuente: C. Lanchimba y P. Medina, «Fecundidad en el Ecuador y su relación con el entorno

social y evolutivo»

11

5. Regresión lineal para la fecundidad en el Ecuador

Para la estimación de la fecundidad en el Ecuador, a través de regresión

lineal, se siguieron las siguientes etapas:

1. Selección de los datos a utilizar

2. Construcción de las variables a usar en el estudio

3. Significancia y construcción de modelos elaborados

4. Selección del mejor modelo

5.1. Selección de los datos a utilizar

Para la estimación de la fecundación de las mujeres, se utilizó la base de

datos del censo de población 2010 realizado por el INEC (Instituto Nacional de

Estadísticas y Censos) del Ecuador y que está disponible en

http://www.ecuadorencifras.gob.ec/base-de-datos-censo-2010/ (archivo

REDATAM.rar). Con el archivo en cuestión se procedió a extraer la información

importante para el análisis, pues por tratarse una base de datos censal de un país

existía una cantidad enorme de datos. Esto mediante la herramienta INTEGRADA

DE CONSULTAS disponible en el sitio web antes mencionado1, procediendo de la

siguiente manera:

1. Se seleccionó los datos de aquellas pobladores mujeres. Y que además

hayan tenido al menos un hijo.

2. Se seleccionaron las variables correspondientes a fecundidad y trabajo

(Anexo 2), de las cuales se escogieron las siguientes:

a. Promedio de hijos

b. Años de escolaridad

c. Cultura y costumbres

1 http://redatam.inec.gob.ec/cgibin/RpWebEngine.exe/PortalAction?&MODE=MAIN&BASE=CPV2010&MAIN=WebSer

verMain.inl

12

d. Horas trabajadas

e. Actividad semanal

f. Estado Civil

g. Rama de Actividad

h. Tipo de Actividad

i. Grupo de actividad

j. Sueldo o salario promedio

La idea del procedimiento es observar que datos pueden ser tomados como

variables que según una tendencia se cree puedan afectar el número de hijos de

las mujeres. Así mismo, es importante indicar que en algunos de los casos los

datos obtenidos eran texto y no números por lo que para efectos de este estudio se

debió codificar como sigue:

Tabla 2. Codificación de “Actividad Semanal”

De este modo un valor de 4, indica que la mujer trabajó en un negocio de la

familia.

Tabla 3. Codificación de “Tipo de actividad”

Así, un valor de 6, indica que la mujer es cesante.

Codificado 1 2 3 4 5 6 7

Valor realTrabajó al menos

una hora

No trabajó pero

SI tiene trabajo

Al menos una

hora fabricó

algún producto o

brindó algún

servicio

Al menos una

hora ayudó en

algún negocio o

trabajo de un

familiar

Al menos una

hora realizó

labores agrícolas

o cuidó animales

Es Cesante;

Buscó trabajo

habiendo

trabajado antes

y está disponible

para trabajar

No trabajó

Actividad semanal

Codificado 1 2 3 4 5 6 7 8 9

Valor realTrabajó al

menos 1 hora

No trabajó pero

si tiene trabajo

Trabajó al

menos 1 hora

en servicios o

fabricacion de

productos

Trabajó al

menos 1 hora

en negocio

familiar

Trabajó al

menos 1 hora

en labores

agricolas

CesanteBusca trabajo

por primera vezRentista Jubilado

Tipo de actividad

13

Tabla 4. Codificación de “Rama de actividad”

En este caso, por ejemplo un valor de 16 indica que la mujer trabaja en la

rama de enseñanza.

Tabla 5. Codificación de “Estado conyugal”

Para el estado conyugal se aplicó la misma idea que en variables anteriores,

por ejemplo un valor de 6 indica que la mujer es soltera.

Tabla 6. Codificación de “Grupo Económico”

En este caso un valor de 4 indica que la mujer labora como personal de apoyo

administrativo.

Tabla 7. Codificación de “Cultura y Costumbres”

Para identidad cultural un valor de 3 indica que la mujer se identifica como

de raza negra.

Codificado 1 2 3 4 5 6 7 8 9 16 17 18 19 20 21 22 23

Valor real

Agricultura,

ganaderia,

silvicultura y

pesca

Explotación

de minas y

canteras

Industrias

manufacture

ras

Suministro

de

electricidad,

gas, vapor y

aire

acondiciona

do

Distribución

de agua,

alcantarillad

o y gestión

de

desechos

Construcció

n

Comercio al

por mayor y

menor

Transporte y

almacenami

ento

Actividades

de

alo jamiento

y servicio de

comidas

Enseñanza

Actividades

de la

atención de

la salud

humana

Artes,

entretenimie

nto y

recreacion

Otras

actividades

de servicios

Actividades

de los

hogares

como

empleadore

s

Actividades

de

organizacio

nes y

organos

extraterritori

ales

No

declarado

Trabajador

nuevo

Rama de actividad recodificada

Codificado 1 2 3 4 5 6

Valor real Casado/a Unido/a Separado/a Divorciado/a Viudo/a Soltero/a

Estado conyugal

Codificado 1 2 3 4 5 6 7 8 9

Valor realDirectores y

gerentes

Profesionales

científ icos e

intelectuales

Tecnicos y

profesionales

del nivel medio

Personal de

apoyo

administrativo

Trabajadores

de los

servicios y

vendedores

Agricultores y

trabajadores

calif icados

Oficiales,

operarios y

artesanos

Operadores de

instalaciones y

maquinaria

Ocupaciones

elementales

Grupo de ocupación recodificado

Codificado 1 2 3 4 5 6 7 8

Valor real IndígenaAfroecuatorian

o/aNegro/a Mulato/a Montubio/a Mestizo/a Blanco/a Otro/a

Como se identifica según su cultura y costumbres

14

Luego de codificar los datos obtenidos, se procedió a visualizarlos y, de ello

lo más llamativo fue el que arroja la evolución de la cantidad de hijos que han tenido

las mujeres desde 1959 hasta 2009, como se indica a continuación.

Gráfico 6. Cantidad de hijos por años 1959-2009

Conclusión

Luego de estudiar los datos obtenidos, es posible afirmar que con el

transcurrir de los años el número de hijos que tienen las mujeres parece disminuir.

Por lo que se a continuación se estudiaran factores como cultura, estado civil,

actividad laboral, sueldo o ingreso mínimos de las mujeres que tienen hijos, entre

otros; con la finalidad de verificar si son factores que afectan la cantidad de hijos

que tienen las mujeres en el Ecuador.

0,000

1,000

2,000

3,000

4,000

5,000

6,000

7,000

1959 1969 1979 1989 1999 2009

Canti

dad d

e h

ijos

Años

Evolución de la cantidad de hijos fecundados

15

5.2. Construcción de las variables a utilizar

Una vez que se seleccionaron los datos relevantes del estudio se detallan a

continuación:

Tabla 8. Datos a usar en el modelo 1 o inicial de regresión lineal

De esta forma, las variables a utilizar en el modelo de regresión lineal inicial son:

n Y X1 X2 X3 X4 X5 X6 X7 X8 X9

AñosPromedio

de hijos

Años de

escolaridad

Cultura y

costumbre

Horas

trabajadas

Actividad

Semanal

Estado

Civil

Rama de

Actividad

Tipo de

Actividad

Grupo de

actividad

Sueldo o

salario 1959 6,619 7,836 5,615 29,944 4,437 2,516 7,490 6,507 6,6932 798,4331960 6,392 8,124 5,607 30,510 4,264 2,406 7,819 6,208 6,5902 835,308

1961 6,146 8,374 5,635 29,985 4,183 2,390 8,062 6,076 6,5451 856,434

1962 5,980 8,496 5,652 30,341 4,074 2,388 8,225 5,912 6,4828 885,160

1963 5,888 8,798 5,637 31,622 3,971 2,335 8,537 5,743 6,3998 912,383

1964 5,726 8,794 5,620 30,805 3,870 2,342 8,736 5,512 6,6062 882,519

1965 5,500 9,093 5,651 31,226 3,642 2,244 9,255 5,121 6,4468 955,6461966 5,367 9,112 5,621 31,489 3,646 2,263 9,139 5,134 6,4823 939,135

1967 5,320 9,454 5,620 31,512 3,571 2,247 9,258 4,998 6,4359 960,9641968 5,084 9,570 5,624 31,409 3,439 2,230 9,336 4,806 6,3735 981,813

1969 4,933 9,652 5,648 32,462 3,405 2,240 9,374 4,758 6,4089 963,854

1970 4,852 9,949 5,666 32,215 3,308 2,234 9,591 4,585 6,4074 968,472

1971 4,744 9,941 5,653 32,671 3,272 2,208 9,595 4,516 6,4085 961,3901972 4,632 10,076 5,651 32,094 3,245 2,214 9,491 4,482 6,4060 958,594

1973 4,466 10,289 5,648 32,771 3,210 2,198 9,440 4,430 6,3586 979,680

1974 4,406 10,268 5,665 33,334 3,176 2,259 9,510 4,343 6,4386 942,658

1975 4,231 10,448 5,647 32,361 3,143 2,184 9,696 4,302 6,3969 957,432

1976 4,164 10,508 5,650 32,873 3,097 2,214 9,547 4,225 6,4277 953,876

1977 4,041 10,611 5,665 32,511 3,078 2,175 9,641 4,180 6,3813 964,499

1978 3,954 10,861 5,648 32,529 3,047 2,178 9,513 4,142 6,3527 979,161

1979 3,840 10,726 5,667 33,552 3,021 2,215 9,545 4,092 6,4362 938,904

1980 3,780 10,743 5,650 32,799 3,037 2,206 9,544 4,119 6,3998 950,067

1981 3,708 10,860 5,666 32,915 2,993 2,169 9,623 4,058 6,4312 940,663

1982 3,614 10,887 5,661 32,950 2,989 2,225 9,473 4,047 6,4542 926,478

1983 3,526 10,959 5,683 33,120 2,956 2,200 9,543 3,994 6,4375 925,6721984 3,478 10,820 5,642 33,158 2,963 2,274 9,388 4,012 6,4592 915,157

1985 3,345 10,942 5,666 33,081 2,927 2,229 9,444 3,956 6,4205 930,986

1986 3,330 10,854 5,638 32,599 2,983 2,256 9,373 4,022 6,4531 921,965

1987 3,231 11,016 5,622 32,688 2,927 2,230 9,412 3,937 6,4212 933,679

1988 3,201 11,021 5,639 32,206 3,001 2,284 9,351 4,056 6,4102 937,732

1989 3,043 11,086 5,650 32,491 2,983 2,335 9,413 4,035 6,3538 955,036

1990 2,987 11,145 5,639 33,236 2,983 2,343 9,356 4,032 6,4172 921,482

1991 2,921 11,110 5,623 32,805 3,032 2,428 9,323 4,116 6,4368 909,992

1992 2,805 11,202 5,627 33,189 3,006 2,466 9,359 4,077 6,4192 904,803

1993 2,672 11,321 5,623 33,232 3,029 2,508 9,492 4,091 6,4260 911,970

1994 2,613 11,290 5,626 32,788 3,081 2,663 9,530 4,170 6,4884 882,306

1995 2,483 11,439 5,611 33,127 3,089 2,708 9,582 4,174 6,4192 903,355

1996 2,367 11,465 5,602 32,076 3,108 2,837 9,667 4,194 6,4505 896,115

1997 2,272 11,564 5,607 32,800 3,162 2,988 9,620 4,279 6,4345 884,345

1998 2,127 11,731 5,619 32,905 3,248 3,121 9,698 4,392 6,4770 868,996

1999 2,023 11,656 5,605 33,059 3,369 3,325 9,629 4,572 6,6032 828,312

2000 1,892 11,905 5,597 32,544 3,486 3,550 9,624 4,729 6,6724 796,467

2001 1,764 11,650 5,597 32,287 3,685 3,792 9,496 5,043 6,8308 732,218

2002 1,627 11,566 5,598 32,008 3,917 4,051 9,570 5,373 7,0052 685,374

2003 1,493 11,701 5,572 31,128 4,186 4,289 9,710 5,764 7,2161 635,131

2004 1,397 11,240 5,565 32,839 4,424 4,618 9,550 6,130 7,4224 574,937

2005 1,295 11,073 5,616 31,076 4,787 4,941 9,663 6,684 7,7986 496,885

2006 1,226 10,749 5,533 30,627 5,206 5,222 9,516 7,307 7,9813 453,456

2007 1,152 10,212 5,554 31,532 5,837 5,486 8,857 8,286 8,5108 354,138

2008 1,109 9,507 5,506 26,050 6,129 5,675 8,754 8,740 8,6345 334,392

2009 1,075 8,753 5,561 30,571 6,354 5,815 8,942 9,085 8,722 324,131

16

Tabla 9. Variables a utilizar en el estudio

Variable Identificación Tipo

Cantidad de hijos Y Variable explicada

Año de escolaridad X1 Variable explicativa

Identidad cultural X2 Variable explicativa

Horas trabajadas por semana X3 Variable explicativa

Actividad semanal X4 Variable explicativa

Estado civil X5 Variable explicativa

Rama de actividad X6 Variable explicativa

Tipo de actividad X7 Variable explicativa

Grupo de actividad X8 Variable explicativa

Sueldo o salario X9 Variable explicativa

5.3. Significancia y construcción varios modelos

Con la definición de variables se procedió a elaborar los modelos de

regresión lineal, como se detalla enseguida:

5.3.1. Significancia del modelo 1 o inicial

Por tratarse del modelo inicial o modelo 1, este se construye considerando

todas las variables en estudio. El modelo formalizado es:

𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽4𝑋4 + 𝛽5𝑋5 + 𝛽6𝑋6 + 𝛽7𝑋7 + 𝛽8𝑋8 + 𝛽9𝑋9

De este modo se realiza la prueba de hipótesis a cada parámetro del modelo

1 de regresión lineal:

𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 𝛽7 = 𝛽8 = 𝛽9 = 0

𝐻1: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 𝛽7 = 𝛽8 = 𝛽9 ≠ 0

17

Hipótesis

Se desea demostrar si el Año de escolaridad, Identidad cultural, Horas trabajadas

por semana, Actividad semanal, Estado civil, Rama de actividad, Tipo de actividad

Grupo de actividad, Sueldo o salario son factores que indican la cantidad de hijos

que tendrá una mujer en el Ecuador durante su vida. Para probar o desmentir la

hipótesis propuesta se realizaran las pruebas estadísticas tomando como muestra

los datos de la tabla 8. Así, la herramienta de análisis de datos de excel, arrojó lo

siguiente:

Con esto, se verifica si el modelo regresión lineal es significativo, de la siguiente

forma:

a) Para el modelo en general

Se usa distribución fisher y se obtiene, con un 95% de confianza:

Ftabla=2,1177

Y como Ftabla < 328,71 (Fcalculado) se rechaza H0 es decir el modelo pasa el

test (es significativo) con un coeficiente de determinación R2=0,9863.

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple0,993141775

Coeficiente de determinación R^20,986330584

R^2 ajustado 0,983329981

Error típico 0,200790972

Observaciones 51

ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F

Regresión 9 119,2737212 13,25263569 328,710742 2,78833E-35

Residuos 41 1,652997585 0,040317014

Total 50 120,9267188

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%

Intercepción 21,61063528 12,48237211 1,731292346 0,09091943 -3,598026593 46,8192972 -3,59802659 46,8192972

Años de escolaridad -0,422784464 0,214633011 -1,969801669 0,05564191 -0,856244624 0,0106757 -0,85624462 0,0106757

Cultura y costumbres 1,170692347 2,134054507 0,548576591 0,58627109 -3,139118164 5,48050286 -3,13911816 5,48050286

Horas trabajadas -0,017190425 0,044695513 -0,384611886 0,70251282 -0,107454844 0,07307399 -0,10745484 0,07307399

Que hizo la semana pasada 2,081692003 5,067304023 0,410808587 0,68335212 -8,151936081 12,3153201 -8,15193608 12,3153201

Estado Civil -2,619554712 0,531457054 -4,929005446 1,409E-05 -3,692854006 -1,54625542 -3,69285401 -1,54625542

Rama de Actividad 1,200161202 0,271702897 4,417182205 7,143E-05 0,65144607 1,74887633 0,65144607 1,74887633

Tipo de Actividad 0,465845911 3,075094608 0,151489944 0,8803322 -5,744433637 6,67612546 -5,74443364 6,67612546

Grupo de actividad -3,644786914 0,77215816 -4,720259529 2,7452E-05 -5,204191954 -2,08538187 -5,20419195 -2,08538187

Sueldo o salario promedio -0,010422292 0,00277183 -3,760076288 0,000531 -0,016020117 -0,00482447 -0,01602012 -0,00482447

18

b) Para cada variable explicativa del modelo

Se usa distribución t-student, y se obtiene con 95% de confianza:

ttabla=2,0195

Y se lo compara con el estadístico t de cada variable. Por lo tanto las

variables que tienen un estadístico t > ttabla o < -ttabla son las variables

significativas, pues en dichos rangos están las zonas de rechazo de H0.

Conclusión

En general el modelo 1, es significativo, pero como X1, X2, X3, X4, X7 no pasan la

prueba, estas variables son eliminadas y quedan como variables significativas

únicamente: X5= Estado Civil, X6= Rama de Actividad, X8= Grupo de actividad, X9=

Sueldo.

5.3.2. Significancia de modelo 2

Luego de eliminar las variables X1, X2, X3, X4, X7 por no ser significativa, se

elabora un nuevo modelo de regresión lineal al que llamaremos modelo 2, y que es

el siguiente:

𝑌 = 𝛽0 + 𝛽5𝑋5 + 𝛽6𝑋6 + 𝛽8𝑋8 + 𝛽9𝑋9

Y realiza la prueba de hipótesis a cada parámetro del modelo 1 de regresión

lineal:

𝐻0: 𝛽5 = 𝛽6 = 𝛽8 = 𝛽9 = 0

𝐻1: 𝛽5 = 𝛽6 = 𝛽8 = 𝛽9 ≠ 0

Hipótesis

Se desea demostrar si Estado Civil, Rama de Actividad, Grupo de actividad y Sueldo

promedio son factores que indican la cantidad de hijos que tendrá una mujer en el

Ecuador durante su vida. Para ello se trabajará con los datos de la tabla 10:

19

Tabla 10. Datos a usar en el modelo 2 de regresión lineal

Y nuevamente se usa la herramienta de análisis de datos en Excel, con la cual se

obtiene lo siguiente:

n Y X5 X6 X8 X9

AñosPromedio

de hijosEstado Civil

Rama de

Actividad

Grupo de

actividad

Sueldo o

salario

1959 6,619 2,516 7,490 6,6932 798,4331960 6,392 2,406 7,819 6,5902 835,3081961 6,146 2,390 8,062 6,5451 856,4341962 5,980 2,388 8,225 6,4828 885,1601963 5,888 2,335 8,537 6,3998 912,3831964 5,726 2,342 8,736 6,6062 882,5191965 5,500 2,244 9,255 6,4468 955,6461966 5,367 2,263 9,139 6,4823 939,1351967 5,320 2,247 9,258 6,4359 960,9641968 5,084 2,230 9,336 6,3735 981,8131969 4,933 2,240 9,374 6,4089 963,8541970 4,852 2,234 9,591 6,4074 968,4721971 4,744 2,208 9,595 6,4085 961,3901972 4,632 2,214 9,491 6,4060 958,5941973 4,466 2,198 9,440 6,3586 979,6801974 4,406 2,259 9,510 6,4386 942,6581975 4,231 2,184 9,696 6,3969 957,4321976 4,164 2,214 9,547 6,4277 953,8761977 4,041 2,175 9,641 6,3813 964,4991978 3,954 2,178 9,513 6,3527 979,1611979 3,840 2,215 9,545 6,4362 938,9041980 3,780 2,206 9,544 6,3998 950,0671981 3,708 2,169 9,623 6,4312 940,6631982 3,614 2,225 9,473 6,4542 926,4781983 3,526 2,200 9,543 6,4375 925,6721984 3,478 2,274 9,388 6,4592 915,1571985 3,345 2,229 9,444 6,4205 930,9861986 3,330 2,256 9,373 6,4531 921,9651987 3,231 2,230 9,412 6,4212 933,6791988 3,201 2,284 9,351 6,4102 937,7321989 3,043 2,335 9,413 6,3538 955,0361990 2,987 2,343 9,356 6,4172 921,4821991 2,921 2,428 9,323 6,4368 909,9921992 2,805 2,466 9,359 6,4192 904,8031993 2,672 2,508 9,492 6,4260 911,970

1994 2,613 2,663 9,530 6,4884 882,3061995 2,483 2,708 9,582 6,4192 903,3551996 2,367 2,837 9,667 6,4505 896,1151997 2,272 2,988 9,620 6,4345 884,3451998 2,127 3,121 9,698 6,4770 868,9961999 2,023 3,325 9,629 6,6032 828,312

2000 1,892 3,550 9,624 6,6724 796,4672001 1,764 3,792 9,496 6,8308 732,218

2002 1,627 4,051 9,570 7,0052 685,3742003 1,493 4,289 9,710 7,2161 635,1312004 1,397 4,618 9,550 7,4224 574,9372005 1,295 4,941 9,663 7,7986 496,8852006 1,226 5,222 9,516 7,9813 453,456

2007 1,152 5,486 8,857 8,5108 354,1382008 1,109 5,675 8,754 8,6345 334,3922009 1,075 5,815 8,942 8,722 324,131

20

De inmediato se procede nuevamente a verificar si el modelo 2 de regresión lineal

es significativo, de la siguiente forma:

a) Para el modelo en general

Se usa distribución fisher y se obtiene, con un 95% de confianza:

Ftabla=2,5740

Y como Ftabla < 76,35 (Fcalculado) se rechaza H0 es decir el modelo pasa el

test (es significativo) con un coeficiente de determinación R2=0,8690.

b) Para cada variable explicativa del modelo

Se usa distribución t-student, y se obtiene con 95% de confianza:

ttabla=2,0129

Y se lo compara con el estadístico t de cada variable. Por lo tanto las

variables con 2,0129< estadístico t <-2,0129 son las variables significativas,

pues en dichos rangos están las zonas de rechazo de H0.

Conclusión

En general el modelo 2, es significativo, pero como X5, no pasa la prueba, esta

variable es eliminada y quedan como variables significativas únicamente: X6= Rama

de Actividad, X8= Grupo de actividad, X9= Sueldo.

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple0,932252986

Coeficiente de determinación R^20,869095629

R^2 ajustado 0,85771264

Error típico 0,586623279

Observaciones 51

ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F

Regresión 4 105,0968827 26,27422069 76,3503897 1,02788E-19

Residuos 46 15,82983606 0,344126871

Total 50 120,9267188

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%

Intercepción -11,89173086 9,253673809 -1,285082131 0,20519663 -30,51841014 6,734948424 -30,51841014 6,734948424

Estado Civil 0,25723021 0,675138213 0,381003779 0,70495448 -1,101752526 1,616212947 -1,101752526 1,616212947

Rama de Actividad -2,218216789 0,289227765 -7,669446212 9,1204E-10 -2,800402085 -1,636031493 -2,800402085 -1,636031493

Grupo de actividad 2,985380143 0,774730717 3,853442336 0,00035929 1,425928093 4,544832193 1,425928093 4,544832193

Sueldo o salario promedio 0,018116606 0,005662529 3,199384096 0,00249542 0,006718526 0,029514686 0,006718526 0,029514686

21

5.3.3. Significancia de modelo 3

Luego de eliminar la variable X5, por no ser significativa, se elabora un nuevo

modelo de regresión lineal al que llamaremos modelo 3, y que es el siguiente:

𝑌 = 𝛽0 + 𝛽6𝑋6 + 𝛽8𝑋8 + 𝛽9𝑋9

Y realiza la prueba de hipótesis a cada parámetro del modelo 1 de regresión

lineal:

𝐻0: 𝛽6 = 𝛽8 = 𝛽9 = 0

𝐻1: 𝛽6 = 𝛽8 = 𝛽9 ≠ 0

Hipótesis

Se desea demostrar si estas tres variables son factores que indican la cantidad de

hijos que tendrá una mujer en el Ecuador durante su vida. Los datos son:

Tabla 11. Datos a usar en el modelo 3 de regresión lineal

n Y X6 X8 X9

AñosPromedio

de hijos

Rama de

Actividad

Grupo de

actividad

Sueldo o

salario1959 6,619 7,490 6,6932 798,4331960 6,392 7,819 6,5902 835,3081961 6,146 8,062 6,5451 856,4341962 5,980 8,225 6,4828 885,1601963 5,888 8,537 6,3998 912,3831964 5,726 8,736 6,6062 882,5191965 5,500 9,255 6,4468 955,6461966 5,367 9,139 6,4823 939,1351967 5,320 9,258 6,4359 960,9641968 5,084 9,336 6,3735 981,8131969 4,933 9,374 6,4089 963,8541970 4,852 9,591 6,4074 968,4721971 4,744 9,595 6,4085 961,3901972 4,632 9,491 6,4060 958,5941973 4,466 9,440 6,3586 979,6801974 4,406 9,510 6,4386 942,6581975 4,231 9,696 6,3969 957,4321976 4,164 9,547 6,4277 953,8761977 4,041 9,641 6,3813 964,4991978 3,954 9,513 6,3527 979,1611979 3,840 9,545 6,4362 938,9041980 3,780 9,544 6,3998 950,0671981 3,708 9,623 6,4312 940,6631982 3,614 9,473 6,4542 926,4781983 3,526 9,543 6,4375 925,6721984 3,478 9,388 6,4592 915,1571985 3,345 9,444 6,4205 930,9861986 3,330 9,373 6,4531 921,9651987 3,231 9,412 6,4212 933,6791988 3,201 9,351 6,4102 937,7321989 3,043 9,413 6,3538 955,0361990 2,987 9,356 6,4172 921,4821991 2,921 9,323 6,4368 909,9921992 2,805 9,359 6,4192 904,8031993 2,672 9,492 6,4260 911,9701994 2,613 9,530 6,4884 882,3061995 2,483 9,582 6,4192 903,3551996 2,367 9,667 6,4505 896,1151997 2,272 9,620 6,4345 884,3451998 2,127 9,698 6,4770 868,9961999 2,023 9,629 6,6032 828,3122000 1,892 9,624 6,6724 796,4672001 1,764 9,496 6,8308 732,2182002 1,627 9,570 7,0052 685,3742003 1,493 9,710 7,2161 635,1312004 1,397 9,550 7,4224 574,9372005 1,295 9,663 7,7986 496,8852006 1,226 9,516 7,9813 453,4562007 1,152 8,857 8,5108 354,1382008 1,109 8,754 8,6345 334,3922009 1,075 8,942 8,722 324,131

22

Y por tercera vez se usa la herramienta de análisis de datos en Excel, con la

cual se obtiene lo siguiente:

De inmediato se procede a verificar si el modelo 3 de regresión lineal es

significativo, de la siguiente forma:

a) Para el modelo en general

Se usa distribución fisher y se obtiene, con un 95% de confianza:

Ftabla=2,8023

Y como Ftabla < 35,01 (Fcalculado) se rechaza H0 es decir el modelo pasa el

test (es significativo) con un coeficiente de determinación R2=0,8686.

b) Para cada variable explicativa del modelo

Se usa distribución t-student, y se obtiene con 95% de confianza:

ttabla=2,0129

Y se lo compara con el estadístico t de cada variable. Por lo tanto las

variables con 2,0129 < estadístico t < -2,0129 son las variables significativas,

pues en dichos rangos están las zonas de rechazo de H0.

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple0,932031399

Coeficiente de determinación R^20,868682529

R^2 ajustado 0,860300563

Error típico 0,581264045

Observaciones 51

ANÁLISIS DE VARIANZA

Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F

Regresión 3 105,046928 35,01564265 103,637083 9,9121E-21

Residuos 47 15,87979085 0,33786789

Total 50 120,9267188

Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%

Intercepción -9,489418425 6,711208372 -1,413965697 0,16396206 -22,9906282 4,011791354 -22,9906282 4,011791354

Rama de Actividad -2,129529932 0,170100214 -12,51926664 1,4103E-16 -2,471727423 -1,787332441 -2,471727423 -1,787332441

Grupo de actividad 2,859844778 0,694769507 4,116249706 0,00015423 1,462148814 4,257540743 1,462148814 4,257540743

Sueldo o salario promedio 0,016161461 0,002372141 6,813027394 1,5709E-08 0,011389329 0,020933593 0,011389329 0,020933593

23

Conclusión

En general el modelo 3, es significativo, además de que las tres variables X6, X8, X9,

también lo son, por lo que podemos escribir la ecuación del modelo 3 de regresión

lineal como sigue:

�̂� = −9,489 − 2,130𝑋6 + 2,860𝑋8 + 0,016𝑋9

(Ecuación del modelo 3)

5.3.4. Construcción de modelo significativo

Una vez que se obtuvo un modelo (3) significativo se procede a redefinir las

variables explicativas (X1, X2, X3), de la siguiente manera:

o X1 = Rama de Actividad

o X2 = Grupo de actividad

o X3 = Sueldo

5.3.4.1. Multicolinealidad

Al contar con las variables explicativas del modelo 3 redefinidas como X1, X2,

X3, se procede a verificar si existe MULTICOLINEALIDAD2 entre ellas.

Para el efecto se procede a calcular los coeficientes de determinación3

para el conjunto de variables: (X1 y X2), (X1 y X3) y finalmente (X2 y X3), todo

mediante los datos de la tabla 11, así los parámetros obtenidos son:

2 Término, atribuido a Ragnar Frisch, que se refiere a una situación en que existe una relación lineal entre las variables X. (variables explicativas) 3 Estimador que muestra el grado de certeza con el que las variables estimadas son explicadas.

24

Lo que permite elaborar la matriz de correlación simple utilizando los coeficientes

de correlación múltiple.

X1 X2 X3

X1 1 0,152017685 0,166458126

X2 0,152017685 1 0,979957961

X3 0,166458126 0,979957961 1

Determinante= 0,038459558

Resumen

X1 y X2

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,15201768

Coeficiente de determinación R^2 0,02310938

R^2 ajustado 0,00317283

Error típico 0,49010635

Observaciones 51

Resumen

X1 y X3

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,16645813

Coeficiente de determinación R^2 0,02770831

R^2 ajustado 0,00786562

Error típico 0,48895134

Observaciones 51

Resumen

X2 y X3

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,97995796

Coeficiente de determinación R^2 0,9603176

R^2 ajustado 0,95950776

Error típico 0,11970981

Observaciones 51

25

Conclusión

Como en la matriz de correlación se obtuvo una determinante (0,038459558)

menor que 0,80 4 se puede tener una idea de que el modelo no posee una

multicolinealidad fuerte, lo que indica que las variables significativas (X1, X2, X3)

de nuestro estudio no se definen unas con otras.

Sin embargo para tener mucha más seguridad de la no presencia de

multicolinealidad, se realizara el test de Farrar-Glauber [8] el cual permite verificar

si los regresores se encuentran correlacionados. Para ello definimos las siguientes

hipótesis:

𝐻0: 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎𝑠 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎𝑛 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠

𝐻1: 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎𝑠 𝑁𝑂 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎𝑛 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠

Hipótesis

Se desea saber si las variables regresoras de nuestro modelo se encuentran

o no correlacionados.

En este caso se usa distribución chi-cuadrado para el X2tabla el cual se

compara con el estadístico Gobservado cuya fórmula es:

𝐺 = − [(𝑛 − 1) − (2𝑘 + 5)

6] 𝑙𝑛[𝑑𝑒𝑡(𝑋′𝑋)]

4 Umbral sugerido por Derpich, I. (2013)

26

Se crea la matriz X con una columna de 1s.

Se traspone la matriz X, convirtiéndose en XT , como se ve enseguida:

X1 X2 X3

Rama de Actividad Grupo de actividad Sueldo1 7,490 6,6932 798,4331 7,819 6,5902 835,3081 8,062 6,5451 856,4341 8,225 6,4828 885,1601 8,537 6,3998 912,3831 8,736 6,6062 882,5191 9,255 6,4468 955,6461 9,139 6,4823 939,1351 9,258 6,4359 960,9641 9,336 6,3735 981,8131 9,374 6,4089 963,8541 9,591 6,4074 968,4721 9,595 6,4085 961,3901 9,491 6,4060 958,5941 9,440 6,3586 979,6801 9,510 6,4386 942,6581 9,696 6,3969 957,4321 9,547 6,4277 953,8761 9,641 6,3813 964,4991 9,513 6,3527 979,1611 9,545 6,4362 938,9041 9,544 6,3998 950,0671 9,623 6,4312 940,6631 9,473 6,4542 926,4781 9,543 6,4375 925,6721 9,388 6,4592 915,1571 9,444 6,4205 930,9861 9,373 6,4531 921,9651 9,412 6,4212 933,6791 9,351 6,4102 937,7321 9,413 6,3538 955,0361 9,356 6,4172 921,4821 9,323 6,4368 909,9921 9,359 6,4192 904,8031 9,492 6,4260 911,9701 9,530 6,4884 882,3061 9,582 6,4192 903,3551 9,667 6,4505 896,1151 9,620 6,4345 884,3451 9,698 6,4770 868,9961 9,629 6,6032 828,3121 9,624 6,6724 796,4671 9,496 6,8308 732,2181 9,570 7,0052 685,3741 9,710 7,2161 635,1311 9,550 7,4224 574,9371 9,663 7,7986 496,8851 9,516 7,9813 453,4561 8,857 8,5108 354,1381 8,754 8,6345 334,3921 8,942 8,722 324,131

27

Para luego realizar la multiplicación de XT * X y obtener lo siguiente:

637597,647 667041,106 683910,621 706847,287

667041,106 697844,400 715493,019 739489,001

683910,621 715493,019 733588,023 758190,925

706847,287 739489,001 758190,925 783619,045

De este modo, se puede aplicar la fórmula (en pag. 25) para obtener el Gobservado, Y

con 95% de confianza se obtiene mediante distribución chi cuadrado el X2tabla:

Gobservado=43,0397

𝑋2tabla=7,2609

Conclusión

Como Gobservado es mayor que 𝑋2tabla entonces se rechaza H0, es decir que

NO existe correlación entre las variables regresoras.

5.3.4.2. Autocorrelación

Con el análisis efectuado anteriormente se evidenció que en el modelo (3)

significativo de regresión lineal no existe correlación entre las variables sin

embargo, ahora es necesario evaluar la AUTOCORRELACIÓN DE LOS DATOS5,

esto mediante el test de Durbin Watson. [9] Para ello se plantea la hipótesis:

𝐻0: No hay autocorrelacion

𝐻1: hay autocorrelacion

Hipótesis

Se desea determinar si los datos presentan o no autocorrelación.

5 La autocorrelación se define como la correlación existente entre los miembros de una serie de observaciones ordenadas en el tiempo o en el espacio. [13]

1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1

X1 Rama de Actividad 7,5 7,8 8,1 8,2 8,5 8,7 9,3 9,1 9,3 9,3 9,4 9,6 9,6 9,5 9,4 9,5 9,7 9,5 9,6 9,5 9,5 9,5 9,6 9,5 9,5 9,4 9,4 9,4 9,4 9,4 9,4 9,4 9,3 9,4 9,5 9,5 9,6 9,7 9,6 9,7 9,6 9,6 9,5 9,6 9,7 9,6 9,7 9,5 8,9 8,8 8,9

X2 Grupo de actividad 6,7 6,6 6,5 6,5 6,4 6,6 6,4 6,5 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,5 6,4 6,5 6,4 6,5 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,5 6,4 6,5 6,4 6,5 6,6 6,7 6,8 7,0 7,2 7,4 7,8 8,0 8,5 8,6 8,7

X3 Sueldo o salario 798,4 835,3 856,4 885,2 912,4 882,5 955,6 939,1 961,0 981,8 # # # 968,5 961,4 958,6 979,7 942,7 957,4 953,9 964,5 979,2 # # # 950,1 940,7 926,5 925,7 915,2 931,0 # # # 933,7 937,7 955,0 921,5 910,0 # # # 912,0 # # # # # # 896,1 # # # # # # # # # 796,5 732,2 685,4 635,1 574,9 # # # 453,5 354,1 # # # 324,1

28

Para el efecto, se usó la opción análisis de datos de Excel, en donde se

escogió regresión lineal marcando análisis y gráficos de residuales, obteniendo lo

siguiente:

Observación Pronóstico para Y Residuos

1 6,605879604 0,01352582 2 6,20733513 0,184899158 3 5,902110755 0,243553625 4 5,841429228 0,138182113 5 5,378494297 0,509266897 6 5,062464637 0,663222986 7 4,682838897 0,817288103 8 4,764060472 0,603010424 9 4,731344247 0,588197595

10 4,724609822 0,359270712 11 4,454616088 0,4788692 12 4,063114276 0,789110407 13 3,943459111 0,800548946 14 4,110867457 0,520892722 15 4,424522741 0,041722818 16 3,907512302 0,498191314 17 3,631194995 0,599729436 18 3,978090975 0,185875643 19 3,817615329 0,223516195 20 4,245658771 -0,291202356 21 3,765728888 0,074032839 22 3,843026258 -0,06322797 23 3,613978278 0,093902157 24 3,769512556 -0,155477468 25 3,5591092 -0,0331768 26 3,781616685 -0,304037067 27 3,807245083 -0,462363399 28 3,906336097 -0,576122194 29 3,920704491 -0,690034222 30 4,085379335 -0,884116802 31 4,07149911 -1,028444266 32 3,831601757 -0,84441753 33 3,77227276 -0,851355923 34 3,560388627 -0,755644976 35 3,413232531 -0,741402216 36 3,031412044 -0,418427703 37 3,063850034 -0,580532365 38 2,855297072 -0,487903955 39 2,719389409 -0,446997551 40 2,424881045 -0,297906489 41 2,275672343 -0,25304623 42 1,970918407 -0,079389886 43 1,656738082 0,107452235 44 1,242385849 0,385059449 45 0,733528147 0,759268185 46 0,691618329 0,705543518 47 0,266673306 1,027955622 48 0,400048201 0,826398542 49 1,712996405 -0,560883729 50 1,965407999 -0,855968875 51 1,651675504 -0,576406686

Gracias a lo cual se obtuvo:

Numerador 4,5671

Denominador 15,8798

29

Datos necesarios para el cálculo del dobservado, para el mismo se usa la siguiente

formula:

Donde T es el número de observaciones y et es el residual asociado a la

observación en el tiempo t. De esta forma el dobservado es:

dobservado=0,2876

Para probar la autocorrelación, la estadística de prueba dobservado se compara con

los valores críticos inferiores y superiores (dL and dU), como sigue6:

a) Autocorrelación positiva

o Si dobservado < dL, se rechaza H0, hay autocorrelación positiva.

o Si dobservado > dU, no se rechaza H0, no hay autocorrelación positiva.

o Si dL < dobservado < dU, la prueba no es concluyente.

b) Autocorrelación negativa

o Si dobservado > 4 - dL, se rechaza H0, hay autocorrelación negativa.

o Si dobservado < 4 - dU, no se rechaza H0, no hay autocorrelación

negativa.

o Si 4 - dL < dobservado < 4- dU, la prueba no es concluyente.

Entonces, para nuestro caso al 99% de confianza, con n=51 y k=3 se tiene7:

dL 1.24

du 1.49

6 Criterio de decisión obtenido en ayudantía de métodos multivariado. 7 Tabla K, límites de estadística de Durbin-Watson. Aprox. n=50

30

Conclusiones

Como dobservado es menor que dL entonces podemos afirmar que existe

autocorrelación positiva, es decir existe una relación entre dos variables que

muestra que una variable disminuye conforme otra aumenta. Esta autocorrelación

se evidencia también mediante las gráficas de los residuales (gráfico 7, gráfico 8,

gráfico 9) pues se observa tendencias (puntos azules) hacia arriba y hacia abajo

con grandes zonas de sobreestimación y subestimación.8

Gráfico 7. Gráfico de los residuales variable X1

Gráfico 8. Gráfico de los residuales variable X2

8 Autocorrelación positiva, los residuos consecutivos comparten valores y signos similares, mostrándose amplias zonas de

sobrestimación y subestimación lo que genera visibles patrones de “ondas”. [14]

-1,5

-1

-0,5

0

0,5

1

1,5

7,0 7,5 8,0 8,5 9,0 9,5 10,0

Resi

duos

Variable X 1

Variable X1 Gráfico de los residuales

-1,5

-1

-0,5

0

0,5

1

1,5

6,0 7,0 8,0 9,0

Resi

duos

Variable X 2

Variable X2 Gráfico de los residuales

31

Gráfico 9. Gráfico de los residuales variable X3

CORRECCIÓN DE AUTOCORRELACIÓN

Gracias al test de Durbin Watson se evidenció que los datos presentan

autocorrelacion positiva, por lo que la misma debe ser corregida. Para ello se hará

uso del test de Cochrane-Orcutt [10] con el cual se busca reformular la variable Y.

Modelo Significativo Inicial

𝑌𝑖 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3

Nuevo Modelo Significativo al que se quiere llegar

𝑌𝑖′ = 𝛽0′ + 𝛽1𝑋1′ + 𝛽2𝑋2′ + 𝛽3𝑋3′

Se calcula lo siguiente:

𝜌 =∑(𝐸𝑡∗𝐸𝑡−1)

∑(𝐸𝑡2)

= 0,8457

𝛽1′ = 𝛽1

𝛽2′ = 𝛽2 𝑋𝑡′ = 𝑋𝑡 − 𝑟𝑋𝑡−1

𝛽3′ = 𝛽3 𝑌𝑡′ = 𝑌𝑡 − 𝑟𝑌𝑡−1

-1,5

-1

-0,5

0

0,5

1

1,5

300,0 500,0 700,0 900,0R

esi

duos

Variable X 3

Variable X3 Gráfico de los residuales

32

De forma que se obtiene la tabla 12 con datos nuevos:

Tabla 12. Tabla con nuevos valores de la regresión.

n Y X1 X2 X3

AñoPromedio

de hijos

Rama de

Actividad

Grupo de

actividad

Sueldo o

salarioY' X'1 X'2 X'3

1959 6,6194 7,4900 6,6932 798,4333 --- --- --- ---

1960 6,3922 7,8186 6,5902 835,3076 0,7940 1,4841 0,9295 160,0477

1961 6,1457 8,0617 6,5451 856,4340 0,7396 1,4493 0,9716 149,9883

1962 5,9796 8,2246 6,4828 885,1601 0,7820 1,4065 0,9474 160,8471

1963 5,8878 8,5371 6,3998 912,3826 0,8306 1,5813 0,9171 163,7751

1964 5,7257 8,7360 6,6062 882,5193 0,7462 1,5160 1,1937 110,8889

1965 5,5001 9,2552 6,4468 955,6462 0,6577 1,8668 0,8597 209,2721

1966 5,3671 9,1394 6,4823 939,1353 0,7154 1,3120 1,0300 130,9155

1967 5,3195 9,2581 6,4359 960,9641 0,7804 1,5286 0,9536 166,7080

1968 5,0839 9,3357 6,3735 981,8131 0,5850 1,5058 0,9305 169,0958

1969 4,9335 9,3738 6,4089 963,8543 0,6339 1,4783 1,0187 133,5044

1970 4,8522 9,5907 6,4074 968,4724 0,6798 1,6630 0,9872 153,3108

1971 4,7440 9,5945 6,4085 961,3900 0,6403 1,4834 0,9895 142,3226

1972 4,6318 9,4913 6,4060 958,5938 0,6196 1,3769 0,9861 145,5163

1973 4,4662 9,4404 6,3586 979,6797 0,5490 1,4133 0,9408 168,9670

1974 4,4057 9,5097 6,4386 942,6577 0,6285 1,5256 1,0609 114,1120

1975 4,2309 9,6956 6,3969 957,4320 0,5049 1,6530 0,9516 160,1970

1976 4,1640 9,5470 6,4277 953,8759 0,5857 1,3471 1,0176 144,1459

1977 4,0411 9,6408 6,3813 964,4988 0,5195 1,5665 0,9452 157,7762

1978 3,9545 9,5125 6,3527 979,1614 0,5367 1,3590 0,9558 163,4547

1979 3,8398 9,5446 6,4362 938,9044 0,4954 1,4996 1,0636 110,7970

1980 3,7798 9,5441 6,3998 950,0673 0,5324 1,4719 0,9565 156,0066

1981 3,7079 9,6225 6,4312 940,6633 0,5112 1,5508 1,0187 137,1617

1982 3,6140 9,4726 6,4542 926,4781 0,4782 1,3346 1,0151 130,9298

1983 3,5259 9,5429 6,4375 925,6723 0,4694 1,5316 0,9790 142,1209

1984 3,4776 9,3877 6,4592 915,1566 0,4956 1,3170 1,0148 132,2867

1985 3,3449 9,4439 6,4205 930,9856 0,4038 1,5044 0,9578 157,0091

1986 3,3302 9,3727 6,4531 921,9655 0,5013 1,3857 1,0231 134,6019

1987 3,2307 9,4120 6,4212 933,6789 0,4142 1,4852 0,9636 153,9440

1988 3,2013 9,3506 6,4102 937,7320 0,4690 1,3906 0,9796 148,0906

1989 3,0431 9,4128 6,3538 955,0357 0,3356 1,5047 0,9325 161,9665

1990 2,9872 9,3558 6,4172 921,4817 0,4136 1,3952 1,0435 113,7782

1991 2,9209 9,3229 6,4368 909,9917 0,3946 1,4104 1,0096 130,6659

1992 2,8047 9,3593 6,4192 904,8031 0,3344 1,4747 0,9753 135,1947

1993 2,6718 9,4919 6,4260 911,9700 0,2998 1,5765 0,9971 146,7498

1994 2,6130 9,5299 6,4884 882,3056 0,3533 1,5023 1,0537 111,0241

1995 2,4833 9,5815 6,4192 903,3552 0,2734 1,5218 0,9318 157,1618

1996 2,3674 9,6666 6,4505 896,1155 0,2672 1,5632 1,0216 132,1198

1997 2,2724 9,6196 6,4345 884,3448 0,2702 1,4443 0,9791 126,4720

1998 2,1270 9,6985 6,4770 868,9963 0,2051 1,5629 1,0351 121,0783

1999 2,0226 9,6293 6,6032 828,3118 0,2238 1,4270 1,1254 93,3745

2000 1,8915 9,6236 6,6724 796,4666 0,1809 1,4798 1,0878 95,9375

2001 1,7642 9,4962 6,8308 732,2184 0,1645 1,3572 1,1877 58,6217

2002 1,6274 9,5696 7,0052 685,3735 0,1354 1,5383 1,2282 66,1136

2003 1,4928 9,7104 7,2161 635,1309 0,1164 1,6171 1,2916 55,4892

2004 1,3972 9,5503 7,4224 574,9368 0,1347 1,3379 1,3195 37,7868

2005 1,2946 9,6627 7,7986 496,8846 0,1130 1,5857 1,5212 10,6426

2006 1,2264 9,5158 7,9813 453,4562 0,1315 1,3438 1,3858 33,2254

2007 1,1521 8,8567 8,5108 354,1385 0,1149 0,8089 1,7608 -29,3636

2008 1,1094 8,7544 8,6345 334,3921 0,1351 1,2640 1,4366 34,8861

2009 1,0753 8,9419 8,7224 324,1312 0,1370 1,5381 1,4200 41,3254

33

Con la tabla 12 lista, se procede a verificar si estos regresores están libres

de autocorrelación.

Resumen

Estadísticas de la regresión

Coeficiente de correlación múltiple 0,776346048

Coeficiente de determinación R^2 0,602713186

R^2 ajustado 0,576803177

Error típico 0,140631763

Observaciones 50

ANÁLISIS DE VARIANZA

Grados de libertadSuma de cuadradosPromedio de los cuadradosF Valor crítico de F

Regresión 3 1,3801656 0,4600552 23,261789 2,60374E-09

Residuos 46 0,9097555 0,0197773

Total 49 2,2899211

Coeficientes Error típico Estadístico tProbabilidad Inferior 95% Superior 95% Inferior 95,0%Superior 95,0%

Intercepción -1,126203717 0,7166047 -1,571583 0,1229011 -2,568654146 0,316246712 -2,568654146 0,316247

Variable X 1 -0,238507075 0,1609212 -1,4821361 0,1451228 -0,562424581 0,085410431 -0,562424581 0,08541

Variable X 2 0,975094899 0,4393478 2,2194143 0,0314295 0,090733555 1,859456243 0,090733555 1,859456

Variable X 3 0,007137326 0,0016271 4,3864532 6,657E-05 0,003862085 0,010412568 0,003862085 0,010413

Observación Pronóstico para Y Residuos

1 0,568493814 0,2255029

2 0,546036036 0,1935164

3 0,610171944 0,1718594

4 0,559810924 0,2708065

5 0,467642383 0,278582

6 0,760477547 -0,1027431

7 0,499648904 0,215793

8 0,628893762 0,1515488

9 0,628823169 -0,0438451

10 0,467370773 0,1665182

11 0,534026211 0,1457961

12 0,500668424 0,1396619

13 0,545548675 0,0740559

14 0,660098266 -0,1110767

15 0,358902076 0,2695584

16 0,550847798 -0,0459643

17 0,573558377 0,0121835

18 0,547966522 -0,0284314

19 0,648250855 -0,1115054

20 0,344032474 0,1513221

21 0,568849266 -0,0364572

22 0,476250475 0,0349367

23 0,479786703 -0,0016217

24 0,477446173 -0,008016

25 0,493383302 0,0022053

26 0,569554219 -0,1657701

27 0,501580611 -0,0002375

28 0,557917886 -0,1437134

29 0,554277649 -0,0852937

30 0,580238361 -0,2445911

31 0,370656495 0,0429213

32 0,454503054 -0,0599411

33 0,43806938 -0,1036362

34 0,517431697 -0,2176606

35 0,33539583 0,0179383

36 0,541118312 -0,267683

37 0,440116739 -0,1729428

38 0,38674781 -0,1165341

39 0,374561123 -0,1694192

40 0,297292757 -0,0735154

41 0,266338952 -0,0854084

42 0,126604214 0,0378614

43 0,17641721 -0,0410027

44 0,14354321 -0,0271281

45 0,111046847 0,0236106

46 0,054890918 0,0581147

47 0,141680077 -0,0101414

48 0,188249668 -0,0733813

49 0,222176144 -0,0871146

50 0,186499196 -0,0495176

34

Numerador 1,1613

Denominador 0,9098

Por lo que dobservado=1,2765 y al 99% de confianza, con n=50 y k=3 se tiene:

dL 1.24

du 1.49

Cayendo en zona de indecisión por lo que finalmente la ecuación del modelo

de regresión está dada por:

�̂� = −1,1262 − 0,2385𝑋1 + 0,9750𝑋2 + 0,0071𝑋3

Conclusión:

El número de hijos que tiene durante su vida una mujer en el Ecuador,

depende de tres variables, es decir, la rama de actividad en la que labora, grupo de

actividad en la que realiza sus actividades y sueldo promedio que percibe.

Así que a continuación cada uno de las variables X1, X2 y X3 la plantearemos

como una ecuación de regresión lineal simple, para visualizar cómo se comporta

por separado cada una de ellas.

Gráfico 10. Comportamiento variable Sueldo, planteada como regresión lineal.

y = -7,7341x + 1048,4

0,000

200,000

400,000

600,000

800,000

1000,000

1200,000

1 11 21 31 41 51

Sueld

o p

erc

ibid

o

Observación

Comportamiento X1 - Sueldo

Sueldo o salario promedio Lineal (Sueldo o salario promedio)

35

Gráfico 11. Comportamiento variable Rama de actividad planteada como regresión lineal.

Gráfico 12. Comportamiento variable Grupo de actividad planteada como regresión lineal.

5.4. Selección del mejor modelo

Como las pruebas y procedimientos estadísticos previos permitieron

determinar que el número de hijos que tiene durante su vida una mujer en el

Ecuador, depende de tres variables, este es escogido como el mejor modelo de la

regresión y el cual está dado por la ecuación:

�̂� = −𝟏, 𝟏𝟐𝟔𝟐 − 𝟎, 𝟐𝟑𝟖𝟓𝑿𝟏 + 𝟎, 𝟗𝟕𝟓𝟎𝑿𝟐 + 𝟎, 𝟎𝟎𝟕𝟏𝑿𝟑

Por lo que ahora se estimará el comportamiento del número de hijos tenidos

por mujeres según los años.

y = 0,0155x + 8,8974

0,000

2,000

4,000

6,000

8,000

10,000

12,000

1 11 21 31 41 51

Sueld

o p

erc

ibid

o

Observación

Comportamiento X2 - Rama de actividad

Rama de Actividad Lineal (Rama de Actividad)

y = 0,024x + 6,0629

0,0000

2,0000

4,0000

6,0000

8,0000

10,0000

1 11 21 31 41 51

Sueld

o p

erc

ibid

o

Observación

Comportamiento X3 - Grupo de actividad

Grupo de actividad Lineal (Grupo de actividad)

36

Hipótesis

𝐻0: 𝐴 𝑚𝑒𝑑𝑖𝑑𝑎 𝑞𝑢𝑒 𝑝𝑎𝑠𝑎𝑛 𝑙𝑜𝑠 𝑎ñ𝑜𝑠 𝑑𝑖𝑠𝑚𝑖𝑛𝑢𝑦𝑒 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒𝑛 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑒𝑙 𝐸𝑐𝑢𝑎𝑑𝑜𝑟

𝐻1: 𝐴 𝑚𝑒𝑑𝑖𝑑𝑎 𝑞𝑢𝑒 𝑝𝑎𝑠𝑎𝑛 𝑙𝑜𝑠 𝑎ñ𝑜𝑠 𝑛𝑜 𝑑𝑖𝑠𝑚𝑖𝑛𝑢𝑦𝑒 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒𝑛 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑒𝑙 𝐸𝑐𝑢𝑎𝑑𝑜𝑟

Para confirmar o desmentir esta hipótesis se realizará la siguiente regresión

lineal:

Años Y' Resumen

1960 0,7940 Estadísticas de la regresión1961 0,7396 Coeficiente de correlación múltiple0,9811380951962 0,7820 Coeficiente de determinación R^20,9626319621963 0,8306 R^2 ajustado 0,9618534611964 0,7462 Error típico 0,0422220961965 0,6577 Observaciones 50

1966 0,71541967 0,7804 ANÁLISIS DE VARIANZA

1968 0,5850 Grados de libertadSuma de cuadradosPromedio de los cuadradosF Valor crítico de F1969 0,6339 Regresión 1 2,2043513 2,2043513 1236,5202 6,412E-361970 0,6798 Residuos 48 0,0855699 0,00178271971 0,6403 Total 49 2,2899211

1972 0,61961973 0,5490 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%1974 0,6285 Intercepción 29,31514612 0,8211545 35,699916 3,186E-36 27,664104 30,966188 27,664104 30,9661881975 0,5049 Variable X 1 -0,014549997 0,0004138 -35,16419 6,412E-36 -0,015382 -0,013718 -0,015382 -0,013718

1976 0,58571977 0,51951978 0,53671979 0,4954 Análisis de los residuales1980 0,53241981 0,5112 Observación Pronóstico para Y Residuos1982 0,4782 1 0,797152781 -0,0031561983 0,4694 2 0,782602784 -0,043051984 0,4956 3 0,768052788 0,01397851985 0,4038 4 0,753502791 0,07711461986 0,5013 5 0,738952795 0,00727161987 0,4142 6 0,724402798 -0,0666681988 0,4690 7 0,709852801 0,00558921989 0,3356 8 0,695302805 0,08513981990 0,4136 9 0,680752808 -0,0957751991 0,3946 10 0,666202812 -0,0323141992 0,3344 11 0,651652815 0,02816951993 0,2998 12 0,637102818 0,00322751994 0,3533 13 0,622552822 -0,0029481995 0,2734 14 0,608002825 -0,0589811996 0,2672 15 0,593452829 0,03500761997 0,2702 16 0,578902832 -0,0740191998 0,2051 17 0,564352835 0,0213891999 0,2238 18 0,549802839 -0,0302682000 0,1809 19 0,535252842 0,00149262001 0,1645 20 0,520702846 -0,0253482002 0,1354 21 0,506152849 0,02623922003 0,1164 22 0,491602852 0,01958432004 0,1347 23 0,477052856 0,00111212005 0,1130 24 0,462502859 0,00692742006 0,1315 25 0,447952863 0,04763582007 0,1149 26 0,433402866 -0,0296192008 0,1351 27 0,418852869 0,08249032009 0,1370 28 0,404302873 0,0099016

29 0,389752876 0,079231130 0,37520288 -0,03955631 0,360652883 0,05292532 0,346102886 0,048459133 0,33155289 0,002880334 0,317002893 -0,01723235 0,302452897 0,050881236 0,2879029 -0,01446837 0,273352903 -0,00617938 0,258802907 0,011410839 0,24425291 -0,03911140 0,229702914 -0,00592641 0,215152917 -0,03422242 0,20060292 -0,03613743 0,186052924 -0,05063844 0,171502927 -0,05508845 0,156952931 -0,02229646 0,142402934 -0,02939747 0,127852937 0,003685748 0,113302941 0,001565549 0,098752944 0,0363086

50 0,084202948 0,0527786

37

Se realiza la prueba de significancia con distribución Fisher y t-Student

según el caso y con un 95% de confianza se obtiene:

Ftabla=4,0426

ttabla=2,0106

Conclusión

Como Fobservado es mayor que Ftabla el modelo pasa el test, de igual forma

como tobservado es mayor que ttabla también pasa el test, por lo que la variable X1

(años) es una variable significativa para el modelo, y podríamos decir:

�̂� = 29,3151 − 0,0145𝑋1

Luego de esto se debería determinar si existe multicolinealidad pero como

solo tenemos una variable, se obvia este paso; y se realiza el test de Durbin Watson.

𝐻0: 𝜌 = 0

𝐻1: 𝜌 ≠ 0

Hipótesis

Se desea determinar si los datos presentan auto correlación igual a cero

(existe auto correlación) o distinta de cero (no existe auto correlación).

Y en base a la tabla de análisis residual realizada en la página 35, se obtiene

lo siguiente:

Numerador 0,185355

Denominador 0,085570

De esta forma el dobservado es:

dobservado=2,1661

Así con 99% confianza, n=50 y k=1 se tiene:

dL 1.32

du 1.40

38

Conclusión

Como dobservado es mayor que du y menor que 4- du no se rechaza H0. Es decir

que no existe autocorrelación. Por lo que en esta regresión es posible observar que

el modelo pasa el test y que los años son una variable significativa para estimar en

n° promedio de hijos que tiene una mujer de Ecuador durante su vida. Por ello, se

estima dicho número mediante regresión con su respectivo gráfico.

Gráfico 13. Proyección de fecundidad en Ecuador hasta 2023.

Año N° hijos

2010 0,9741702

2011 0,9600702

2012 0,9459703

2013 0,9318703

2014 0,9177703

2015 0,9036703

2016 0,8895703

2017 0,8754703

2018 0,8613703

2019 0,8472703

2020 0,8331704

2021 0,8190704

2022 0,8049704

2023 0,7908704

y = -0,0145x + 29,315

0

0,2

0,4

0,6

0,8

1

1,2

1,4

1,6

1,8

2

2010 2012 2014 2016 2018 2020 2022

de

hij

os

Años

Estimacion del n° hijos fecundados por mujeres en el Ecuador

N° hijos Lineal (N° hijos)

39

6. Conclusiones finales

Se ha trabajado con los datos de VII Censo de Población y VI de Vivienda –

2010 del Ecuador, de esto se extrajo una muestra con la cual ha construido una

regresión lineal múltiple que ha permitido deducir que el número promedio que

tienen las mujeres en este país es explicado por la rama de actividad (Agricultura,

ganadería, silvicultura y pesca, Suministro de electricidad, gas, vapor y aire acondicionado,

Construcción, Comercio al por mayor y menor, entre otros), grupo de actividad (Directores y

gerentes, Técnicos y profesionales del nivel medio, Agricultores y trabajadores calificados, Oficiales,

operarios y artesanos, entre otros) y el sueldo promedio que perciben mensualmente las

mujeres.

Cuando la rama de actividad en la que se desempeña la mujer está

relacionada con el segmento artesanos, agricultura, personal de apoyo, o

segmentos altos según codificación de tabla 4 se notó que las mujeres son más

probables a tener mayor cantidad de hijos, situación que cambia cuando a pesar de

estar en este grupo se desarrollan como personal gerencial, directivo o de toma de

decisiones (tabla 6). Mientras que para mujeres con sueldo altos se evidencia que

tienen menor cantidad de hijos en comparación a aquellas que ganan menos.

Para probar la veracidad de este estudio se realizaron diversos análisis

estadísticos como el test de significancia de las variables, el cual determina si existe

una relación lineal entre la variable respuesta Y con alguna de las variables

regresoras X.; el test de Farrar-Glauber para determinar si las variables regresoras

se relacionan entre sí; y el test de Durbin Watson para determinar si existe

autocorrelación de los datos. En todos los casos al presentarse alguno de estos

inconvenientes se realizó la respectiva corrección mediante métodos estadísticos

estudiados.

Finalmente se estimó que para el año 2023 la tasa de fecundidad estará

cercana a 0,79 hijos por mujer, es decir, disminuye aprox. 500% con respecto a

40

datos de 1960 y un 350% aprox. al 1980. Situación ya acontecida en otros países,

por lo que es probable que pase mucho tiempo antes que la población ecuatoriana

sufra una transición demográfica notable.

41

7. Referencias bibliográficas

[1] K. Ishida, P. Stupp y J. Ordoñez, «Estancamiento de la disminución de la fecundidad

en el Ecuador,» 2010.

[2] I. Derpich, «Material de cátedra Métodos Multivariados,» 2013.

[3] R. Corporation, «¿Implosión demográfica? la baja fecundidad y las medidas tomadas

en la UE,» Research Brief, 2006.

[4] L. Jaramillo, «Descenso de la fecundidad humana de1950 a 2007,» University

Research CO, 2010.

[5] CEPAL, «Panorama social de America Latina,» 2011.

[6] L. Tercera, «Bono para incentivar el aumento de la natalidad,» LaTercera.com, Mayo

2013.

[7] C. Lanchimba y P. Medina, «Fecundidad en el Ecuador y su relación con el entorno

social y evolutivo,» Analítika, vol. 1, nº 1, pp. 27-51, 2011.

[8] D. Farrar y R. Glauber, «Multicolineality in regression analysis,» Economics and

Statist, nº 49, pp. 92-107, 1967.

[9] J. Durbin y G. Watson, «Durbin and Watson Test,» 1951.

[10] D. Cochrane y G. Orcutt, «Cochrane-Orcutt estimation,» 1949.

[11] E. Donoso, «Fecundidad en Chile: 2000-2008,» Revista Chilena de Obstetricia y

Ginecología, vol. 76, nº 3, pp. 135-137, 2011.

[12] A. Figueras, «Esponjas Marinas,» 2009. [En línea]. Available:

http://www.madrimasd.org/blogs/ciencia_marina/2009/03/31/115600.

[13] H. Ordoñez, «Sitio web del departamento de matemáticas y estadística. Universidad

Nacional de Colombia,» 23 01 2009. [En línea]. Available:

http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capitulocu

atro/4_5_5.html.

[14] R. Arce, «Conceptos Básicos sobre la autocorrelación en el modelo básico de

regresión lineal,» Madrid, 2010.

42

Anexos

43

Anexo 1. Sitio web del INEC (Instituto Nacional Estadísticas y Censos

Ecuador)

44

Anexo 1. Diccionario de datos de variables del censo 2010 INEC

#N o mbre de la

ent idad

N o mbre de la

variableR ó tulo R ango A lias Grupo

1 CE11 Total País2 PROVIN Provincia de empadronamiento3 CANTON Cantón de empadronamiento4 PARROQ Parroquia de empadronamiento5 ZONA Zona Censal6 SECTOR Sector Censal7 VIVIENDA Vivienda8 HOGAR Hogar9 PERSONA Persona

9.1 P00 Número de orden de la persona en el hogar ene-50 Identificación9.2 P01 Sexo 01-feb SEXO General9.3 P02 Parentesco o relación con el/la jefe/a del 01-dic PARENT General9.4 P03 Edad 0-120 EDAD General9.5 GEDAD Grupos quinquenales de edad ene-22 General9.6 GRANEDAD Grandes grupos de edad 01-mar General9.7 P04M M es de nacimiento 01-dic General9.8 P04A Año de nacimiento 1890-2010 General9.9 P05 Tiene cédula de ciudadanía ecuatoriana 01-feb CEDULA General9.10 P06 Está inscrito en el Registro Civil 01-feb REGCIVIL General9.11 P07 Tiene seguro de salud privado 01-sep SEGPRIV General9.12 P08 Discapacidad permanente por más de un 01-sep DISCAP Discapacidad9.13 P091 Discapacidad Intelectual (Retardo mental) 01-sep DM ENTAL Discapacidad9.14 P092 Discapacidad Físico-M otora (Parálisis y 02-sep LISIADO Discapacidad9.15 P093 Discapacidad Visual (Ceguera) 03-sep CEGUERA Discapacidad9.16 P094 Discapacidad Auditiva (Sordera) 04-sep SORDERA Discapacidad9.17 P095 Discapacidad M ental (enfermedades 05-sep M ENTAL Discapacidad9.18 P10 Asiste actualmente a establecimiento de 01-sep Discapacidad9.19 P11L Lugar de nacimiento 01-mar LUGNAC M igración9.20 P11P Provincia de nacimiento ene-90 PRONAC M igración9.21 P11C Cantón de nacimiento 101-9004 CANNAC M igración9.22 P11PQ Ciudad o parroquia rural de nacimiento 10150-900451 PARNAC M igración9.23 P11A Año de llegada al Ecuador 1905-2010 ANLLEGA M igración9.24 P12L Lugar de residencia habitual 01-mar LUGVIV M igración9.25 P12P Provincia de residencia habitual ene-99 PROVIV M igración9.26 P12C Cantón de residencia habitual 101-9004 CANVIV M igración9.27 P12PQ Ciudad o parroquia rural de residencia 10150-900451 PARVIV M igración9.28 P13L Lugar donde vivía hace 5 años (Noviembre 01-abr LUGCIN M igración9.29 P13P Provincia donde vivía hace 5 años ene-99 PROCIN M igración9.30 P13C Cantón donde vivía hace 5 años 101-9999 CANCIN M igración9.31 P13PQ Ciudad o parroquia rural donde vivía hace 5 10150-999999 PARCIN M igración9.32 P141P El padre habla(ba) habitualmente idioma 01-ene Idiomas9.33 P141M La madre habla(ba) habitualmente idioma 01-ene Idiomas9.34 P142P El padre habla(ba) habitualmente idioma 02-feb Idiomas9.35 P142M La madre habla(ba) habitualmente idioma 02-feb Idiomas9.36 P143P El padre habla(ba) habitualmente idioma 03-mar Idiomas9.37 P143M La madre habla(ba) habitualmente idioma 03-mar Idiomas9.38 P144P El padre no habla(ba) habitualmente ningún 04-abr Idiomas9.39 P144M La madre no habla(ba) habitualmente ningún 04-abr Idiomas9.40 P151 Habla idioma Indígena 01-feb Idiomas9.41 P151C Idioma Indígena que habla ene-88 LENGUA Idiomas9.42 P152 Habla idioma Catellano/Español 02-feb Idiomas9.43 P153 Habla idioma Extranjero 03-mar Idiomas9.44 P154 No habla ningún Idioma 04-abr Idiomas9.45 P16 Auto identificación según su cultura y 01-ago ETNIA Etnia9.46 P17 Nacionalidad o Pueblo Indígena al que ene-99 NACIONA Etnia9.47 P181 Niño(a) participa en Programa del INFA 01-ene Infantes9.48 P182 Niño(a) participa en Programa del 02-feb Infantes9.49 P183 Niño(a) participa en Programa de Centro 03-mar Infantes9.50 P184 Niño(a) participa en Programa de Centro 04-abr Infantes9.51 P185 Niño(a) participa en Otro programas 05-may Infantes9.52 P186 Niño(a) le cuida la madre, el padre, familiares 06-sep Infantes9.53 P187 Niño(a) le cuida familiares o conocidos 07-sep Infantes9.54 P19 Sabe leer y escribir 01-feb ALFAB Educación9.55 P20T En los últimos seis meses ha utilizado 01-sep CELULAR Tics9.56 P20I En los últimos seis meses ha utilizado 01-sep INTERNET Tics9.57 P20C En los últimos seis meses ha utilizado 01-sep PC Tics9.58 P21 Asiste actualmente a un establecimiento de 01-feb ASISTE Educación9.59 P22 Establecimiento de enseñanza regular al que 01-abr Educación9.60 P23 Nivel de instrucción más alto al que asiste o ene-99 NIVINS Educación9.61 P24 Grado, curso o año más alto que asiste o 01-oct GRADO Educación9.62 GRAESC Grados de escolaridad (Sistema Actual) 0-25 Educación9.63 GRAESCSA Grados de escolaridad (Sistema Anterior) 0-30 Educación9.64 P25 Tiene título de ciclo postbachillerato, 01-sep TIENTIT Educación9.65 P26 Título de ciclo postbachillerato, superior o 1-999 TITUNI Educación9.66 P27 Qué hizo la semana pasada 01-jul HISEM P Trabajo9.67 P28 Si NO ha trabajado 01-jul ALOM EJOR Trabajo9.68 TIPOACT Tipo de actividad ene-13 Trabajo9.69 RAM ACT Rama de actividad (Primer nivel) ene-23 RAM A2 Trabajo9.70 GRUOCU Grupo de ocupación (Primer Nivel) 01-dic OCUP2 Trabajo9.71 P31 Categoría de ocupación 01-sep CATOCU Trabajo9.72 CATOCUP Categoría de ocupación 01-oct Trabajo9.73 P32 Número de horas trabajadas 1-140 HORAS Trabajo9.74 P33 Trabajo dentro o fuera del hogar 01-sep Trabajo9.75 P34 Estado conyugal 01-jun ESTCIV General9.76 P35 Aporte o afiliación a la Seguridad Social 01-sep AFILIADO General9.77 P36 Total de hijos e hijas nacidos vivos tenidos 0-99 HIJVIV Fecundidad9.78 P36H Total de hijos nacidos vivos 0-99 HVTOTHO Fecundidad9.79 P36M Total de hijas nacidas vivas 0-99 HVTOTM UJ Fecundidad9.80 P37 Total de hijos e hijas que están vivos 0-99 HVIACT Fecundidad9.81 P38 A que edad tuvo su primer hijo o hija nacido dic-99 HVEDAD Fecundidad9.82 P39A En que año tuvo su último hijo o hija nacido 1920-9999 ANULTHIJ Fecundidad9.83 P39M En qué mes tuvo su último hijo o hija nacido ene-99 M ESNAC Fecundidad9.84 P40 Esta vivo el último hijo o hija nacido vivo 01-sep ULTVIV Fecundidad