Estimacion fecundacion mujeres en Ecuador Regresion Lineal
-
Upload
jorge-a-parraga-a -
Category
Engineering
-
view
274 -
download
2
Transcript of Estimacion fecundacion mujeres en Ecuador Regresion Lineal
UNIVERSIDAD DE SANTIAGO DE CHILE
MÉTODOS MULTIVARIADOS
ESTIMACIÓN DE LA FECUNDIDAD DE
LAS MUJERES EN EL ECUADOR
INTEGRANTES
Roberth Alcívar Cevallos
Jorge Párraga Álava
PROFESOR
Dr. Iván Derpich
Fecha de entrega: 27 de diciembre de 2013
ÍNDICE DE CONTENIDO
1. Introducción ............................................................................................. 2
2. Motivación ............................................................................................... 3
3. Objetivos ................................................................................................. 3
3.1. Objetivo General .................................................................................. 3
3.2. Objetivos Específicos ............................................................................. 4
4. La fecundidad y su estado actual ....................................................................... 4
4.1. La fecundidad a nivel mundial .................................................................... 4
4.2. La fecundidad en Latinoamérica .................................................................. 6
4.3. La fecundidad en Ecuador ........................................................................ 9
5. Regresión lineal para la fecundidad en el Ecuador ................................................... 11
5.1. Selección de los datos a utilizar ................................................................. 11
5.2. Construcción de las variables a utilizar ......................................................... 15
5.3. Significancia y construcción varios modelos ................................................... 16
5.3.1. Significancia del modelo 1 o inicial....................................................... 16
5.3.2. Significancia de modelo 2 ................................................................. 18
5.3.3. Significancia de modelo 3 ................................................................. 21
5.3.4. Construcción de modelo significativo .................................................... 23
5.3.4.1. Multicolinealidad .......................................................................... 23
5.3.4.2. Autocorrelación ............................................................................ 27
5.4. Selección del mejor modelo ..................................................................... 35
6. Conclusiones finales .................................................................................. 39
7. Referencias bibliográficas ............................................................................. 41
Anexos ...................................................................................................... 42
Anexo 1. Sitio web del INEC (Instituto Nacional Estadísticas y Censos Ecuador) .................... 43
Anexo 1. Diccionario de datos de variables del censo 2010 INEC ..................................... 44
ÍNDICE DE GRÁFICOS Y TABLAS
Gráfico 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007 .......................... 6
Gráfico 2. Tasa Global de Fecundidad según diferentes proyecciones 1950-2030 ......................... 7
Gráfico 3. Los 4 países latinos con trayectoria de la fecundidad por debajo del nivel de reemplazo en
2005-2010 ..................................................................................................... 8
Gráfico 4. Natalidad en Chile 1990-2012 .................................................................... 9
Gráfico 5. Natalidad en Ecuador 1990-2007 ............................................................... 10
Gráfico 6. Cantidad de hijos por años 1959-2009 ......................................................... 14
Gráfico 7. Gráfico de los residuales variable X1 ........................................................... 30
Gráfico 8. Gráfico de los residuales variable X2 ........................................................... 30
Gráfico 9. Gráfico de los residuales variable X3 ........................................................... 31
Gráfico 10. Comportamiento variable Sueldo, planteada como regresión lineal. ........................ 34
Gráfico 11. Comportamiento variable Rama de actividad planteada como regresión lineal. ............ 35
Gráfico 12. Comportamiento variable Grupo de actividad planteada como regresión lineal. ............ 35
Gráfico 13. Proyección de fecundidad en Ecuador hasta 2023. ........................................... 38
Tabla 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007 ............................ 5
Tabla 2. Codificación de “Actividad Semanal” ............................................................ 12
Tabla 3. Codificación de “Tipo de actividad” ............................................................. 12
Tabla 4. Codificación de “Rama de actividad” ............................................................ 13
Tabla 5. Codificación de “Estado conyugal” .............................................................. 13
Tabla 6. Codificación de “Grupo Económico” ............................................................ 13
Tabla 7. Codificación de “Cultura y Costumbres”......................................................... 13
Tabla 8. Datos a usar en el modelo 1 o inicial de regresión lineal ........................................ 15
Tabla 9. Variables a utilizar en el estudio .................................................................. 16
Tabla 10. Datos a usar en el modelo 2 de regresión lineal ................................................ 19
Tabla 11. Datos a usar en el modelo 3 de regresión lineal ................................................ 21
Tabla 12. Tabla con nuevos valores de la regresión. ...................................................... 32
2
1. Introducción
La fecundidad es la capacidad reproductiva de una población, guarda directa
relación con la fertilidad y con la edad al casarse o cohabitar, la disponibilidad y
empleo de métodos anticonceptivos, el desarrollo económico, el estado social de la
mujer, edad, entre otros. Muchos países en vías de desarrollo han experimentado
rápidas disminuciones en la fecundidad a partir de la década de 1960. Aunque
algunos ya han alcanzado el nivel de reemplazo de 2.1 nacimientos a lo largo de la
vida de una mujer y otros esperan hacerlo en el futuro, la disminución de la
fecundidad en otros países es más lenta e incluso se ha estancado. [1]
En todas estas situaciones, y tal como indica Ishida et al. (2010), se ha
evidenciado la importancia de la fecundidad dentro de estudios demográficos pues
ligeros cambios en esta, afectan dramáticamente la magnitud de la población a nivel
biológico o en sus determinantes sociales, históricos y culturales que afectan todo
el proceso reproductivo de la especie humana.
Para estudiar cambios de esta naturaleza se han creado varios métodos
estadísticos, uno de ellos el llamado regresión lineal el cual modela la relación entre
una variable dependiente Y, las variables independientes Xi, [2] lo que permite
hacer una predicción del comportamiento de alguna de estas en un determinado
punto o momento. Y es por ello que en este estudio se pretende “predecir”, a través
del método citado, como varia el número de hijos que tienen las mujeres en el
Ecuador según el año de nacimiento, además de verificar si aspectos como etnia,
nivel de educación, situación laboral, entre otras, influyen en esta cantidad.
Para tal análisis, la principal fuente de información será obtenida del censo
de población 2010 realizado por el INEC (Instituto Nacional de Estadísticas y
Censos) del Ecuador, pues se aporta importante información bastante actualizada.
3
2. Motivación
A nivel mundial, varios estudios han demostrado que la tendencia de
reducción de la fecundidad es el presagio de tiempos difíciles para las economías
de los países. Por ejemplo, una reducción de la población activa puede disminuir la
productividad, mientras que el aumento de la proporción de personas mayores
amenaza la solvencia de los sistemas de pensiones y de seguridad social. A medida
que desciende el tamaño de los hogares, se reduce la capacidad para cuidar de las
personas mayores, y éstas se enfrentan al aumento de los costes y de las
necesidades de atención sanitaria. [3]
Todos estos elementos combinados pueden crear barreras importantes para
alcanzar los objetivos de crecimiento de varios países, pero sobre de países en vías
de desarrollo como el Ecuador. Saber cuántos hijos tendrá una mujer en el Ecuador
durante su vida no es una tarea fácil, afortunadamente, en la actualidad se emplean
diferentes métodos y análisis estadísticos, el más popular es la regresión lineal, la
cual permite conocer este dato, e incluso hacerse una idea de lo que sucederá con
esta variable demográfica en un futuro; por lo que en este estudio se hará uso de
este método y demás análisis estadísticos para estudiar la fecundidad de las
mujeres en el Ecuador.
3. Objetivos
3.1. Objetivo General
Usar el método de regresión lineal para estimar la cantidad de hijos que
tendrán las mujeres en el Ecuador en los próximos diez años.
4
3.2. Objetivos Específicos
Elegir la base de datos de información censal a usar en el estudio.
Seleccionar las variables a emplear para la estimación del modelo.
Determinar la significancia de las variables escogidas a través de varios test
estadísticos.
Construir diferentes modelos de regresión con las variables significativas.
Seleccionar el mejor modelo de regresión lineal que cumpla con todos los
test estadísticos realizados.
4. La fecundidad y su estado actual
4.1. La fecundidad a nivel mundial
A nivel mundial la fecundidad presenta situaciones interesantes, en poco más
de cincuenta años se ha bajado la fecundidad de un promedio de 5 hijos por mujer,
para todo el mundo, a 2.7, casi a la mitad. Esto sin duda es un gran éxito de
enormes consecuencias benéficas para el planeta y sus habitantes, logrado en un
periodo de tiempo muy breve para un cambio tan importante; y el descenso ha sido
mayor en los países subdesarrollados que en los avanzados, lo que eleva la
importancia del alcance.
5
Región
Promedio de hijos por
mujer Cambio %
1950 2007
Asia 5.9 2.4 3.5 59
Latinoamérica y Caribe 5.9 2.5 3.4 58
Oceanía 3.8 2.1 1.7 45
Norte América 3.5 2.0 1.5 43
Europa 2.6 1.5 1.1 42
África 6.6 5.0 1.6 24
Tabla 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007
Fuente: L. Jaramillo, «Descenso de la fecundidad humana de1950 a 2007»
Asia es la región donde el descenso fue mayor, casi un 60% de reducción,
en la que influye sobre todo la política de control del crecimiento adoptada y
ejecutada muy decididamente por China, Corea del Norte, Thailandia e Indonesia,
y por el mediocre resultado en India y Bangladesh, que aún no siendo muy
espectacular tiene un gran peso en el promedio asiático por la magnitud de la
población de esos países.
En segundo lugar le sigue, Latinoamérica y el Caribe, con un porcentaje de
descenso casi igual al de Asia, a pesar de la fuerte oposición de instituciones
conservadoras, en particular la Iglesia Católica y los dirigentes comunistas;
evidentemente las poblaciones en su mayoría se han liberado mucho del poder
político y religioso para orientar la vida personal y realizar sus ideales de
fecundidad. Norte América y Europa tuvieron descensos menores aunque muy
significativos, principalmente porque es más difícil bajar la fecundidad cuando ya
está baja que cuando está muy alta. Esto de ninguna manera le resta significado al
cambio de los países desarrollados, porque bajar a casi la mitad una fecundidad
reducida es indicativo de un cambio muy importante en la mentalidad de la gente,
aún la de niveles más altos.
6
En último lugar viene África, logrando reducir la fecundidad de la región de
6.6 a 5.0 en 57, representando una reducción de tan solo un 24%. [3]
Gráfico 1. Reducción de la tasa global de fecundidad en el mundo 1950 a 2007
Fuente: L. Jaramillo, «Descenso de la fecundidad humana de 1950 a 2007,» University
Research CO
Así, en el gráfico 1, se observa la tendencia de la fecundidad a nivel mundial,
y a continuación se hará un análisis exhaustivo de lo que sucede en la región de
Latinoamérica.
4.2. La fecundidad en Latinoamérica
En un estudio realizado en 2011 por la CEPAL (Comisión Económica para
América latina – Naciones Unidas) se indica que desde mediados del siglo XX la
fecundidad en América Latina experimentó grandes reducciones debido al proceso
de desarrollo iniciado en los países de esta región. (Gráfico 2). Este descenso ha
sobrepasado reiteradamente las estimaciones realizadas. Si bien los factores que
0,00
1,00
2,00
3,00
4,00
5,00
6,00
7,00
Asia Latinoaméricay Caribe
Oceanía Norte América Europa África
Reducción de la tasa global de fecundidad en el mundo desde 1950 a 2007
Hijos por mujer en 1950 Hijos por mujer 2007
7
más contribuyeron a este descenso están ligados a la exposición a las relaciones
sexuales, el impacto del uso de anticonceptivos ha aumentado rápidamente,
asociado no solo al incremento generalizado de la prevalencia anticonceptiva sino
también al uso de métodos modernos. Aunque la tendencia descendente fue
generalizada, el momento de inicio y el ritmo de este fenómeno han sido muy
diferentes en los países de la región. [4]
Gráfico 2. Tasa Global de Fecundidad según diferentes proyecciones 1950-2030
Fuente: Centro Latinoamericano y Caribeño de Demografía (CELADE) – División de
Población de la CEPAL sobre la base de Comisión Económica para América Latina y el
Caribe (CEPAL), “Proyección de población”, Observatorio demográfico, N°7 (LC/G.2414-
P), Santiago de Chile, 2009.
En el mismo estudio, se indica que en el ámbito regional, si bien los
descensos son generalizados, Centroamérica sigue presentando tasas mayores
que el promedio regional, aunque similares a las del promedio mundial y menores
que las del promedio de los países menos desarrollados. Además, como es de
esperar en una subregión con grandes desigualdades económicas y sociales, el
8
momento de inicio y el ritmo de este fenómeno son bien diferentes en los distintos
países.
Así, los países con una tasa de fecundidad muy baja y que están por debajo
del nivel de reemplazo son Brasil, Chile, Costa Rica y Cuba. (Gráfico 3).
Gráfico 3. Los 4 países latinos con trayectoria de la fecundidad por debajo del nivel de
reemplazo en 2005-2010
Fuente: Centro Latinoamericano y Caribeño de Demografía (CELADE) – División de
Población de la CEPAL sobre la base de Comisión Económica para América Latina y el
Caribe (CEPAL), “Proyección de población”, Observatorio demográfico, N°7 (LC/G.2414-
P), Santiago de Chile, 2009.
De hecho, en Chile recientemente se propuso promover la natalidad a través
de un bono de maternidad a las parejas que en el futuro tengan tres o más hijos.
De esa forma, se entregarán $200,00 USD por el nacimiento del tercer hijo, monto
que irá subiendo hasta 400,00 USD en el caso del quinto. [5] Debido a la baja en
la tasa de fecundidad del país como se observa en el Gráfico 4.
9
Gráfico 4. Natalidad en Chile 1990-2012
Fuente: E, Donoso, «Fecundidad en Chile: 2000-2012,» Revista Chilena de Obstetricia y
Ginecología”
4.3. La fecundidad en Ecuador
Durante la década pasada, Ecuador experimentó cambios en el
comportamiento de los patrones demográficos, en los cuales la natalidad,
mortalidad y fecundidad juegan un papel preponderante. Por ejemplo, en 1990 de
cada 1000 personas 5 morían, mientras que 17 años más tarde sólo 4 personas
mueren, es decir, la tasa de mortalidad ha disminuido. Actualmente, la esperanza
de vida al nacer de una persona supera los 75 años, mientras que en 1990 era de
69 años, según UNICEF. Por otra parte, la tasa de natalidad paso de un 3% a un
2% y, la tasa de fecundidad, paso de 10,64% a 6,85%; en el mismo período. [6]
Esta situación se evidencia en el gráfico 5, en donde se observa la evolución
de la tasa de natalidad en el período de tiempo 1990-2007. Puede observarse un
245000
250000
255000
260000
265000
270000
275000
280000
285000
290000
295000
1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 2012
Nacid
os
viv
os
Años
Natalidad en Chile 1990-2012
10
constante decrecimiento de la tasa de natalidad con ciertos puntos de corrección,
los cuales no hacen más que ratificar la tendencia decreciente.
Gráfico 5. Natalidad en Ecuador 1990-2007
Fuente: C. Lanchimba y P. Medina, «Fecundidad en el Ecuador y su relación con el entorno
social y evolutivo»
11
5. Regresión lineal para la fecundidad en el Ecuador
Para la estimación de la fecundidad en el Ecuador, a través de regresión
lineal, se siguieron las siguientes etapas:
1. Selección de los datos a utilizar
2. Construcción de las variables a usar en el estudio
3. Significancia y construcción de modelos elaborados
4. Selección del mejor modelo
5.1. Selección de los datos a utilizar
Para la estimación de la fecundación de las mujeres, se utilizó la base de
datos del censo de población 2010 realizado por el INEC (Instituto Nacional de
Estadísticas y Censos) del Ecuador y que está disponible en
http://www.ecuadorencifras.gob.ec/base-de-datos-censo-2010/ (archivo
REDATAM.rar). Con el archivo en cuestión se procedió a extraer la información
importante para el análisis, pues por tratarse una base de datos censal de un país
existía una cantidad enorme de datos. Esto mediante la herramienta INTEGRADA
DE CONSULTAS disponible en el sitio web antes mencionado1, procediendo de la
siguiente manera:
1. Se seleccionó los datos de aquellas pobladores mujeres. Y que además
hayan tenido al menos un hijo.
2. Se seleccionaron las variables correspondientes a fecundidad y trabajo
(Anexo 2), de las cuales se escogieron las siguientes:
a. Promedio de hijos
b. Años de escolaridad
c. Cultura y costumbres
1 http://redatam.inec.gob.ec/cgibin/RpWebEngine.exe/PortalAction?&MODE=MAIN&BASE=CPV2010&MAIN=WebSer
verMain.inl
12
d. Horas trabajadas
e. Actividad semanal
f. Estado Civil
g. Rama de Actividad
h. Tipo de Actividad
i. Grupo de actividad
j. Sueldo o salario promedio
La idea del procedimiento es observar que datos pueden ser tomados como
variables que según una tendencia se cree puedan afectar el número de hijos de
las mujeres. Así mismo, es importante indicar que en algunos de los casos los
datos obtenidos eran texto y no números por lo que para efectos de este estudio se
debió codificar como sigue:
Tabla 2. Codificación de “Actividad Semanal”
De este modo un valor de 4, indica que la mujer trabajó en un negocio de la
familia.
Tabla 3. Codificación de “Tipo de actividad”
Así, un valor de 6, indica que la mujer es cesante.
Codificado 1 2 3 4 5 6 7
Valor realTrabajó al menos
una hora
No trabajó pero
SI tiene trabajo
Al menos una
hora fabricó
algún producto o
brindó algún
servicio
Al menos una
hora ayudó en
algún negocio o
trabajo de un
familiar
Al menos una
hora realizó
labores agrícolas
o cuidó animales
Es Cesante;
Buscó trabajo
habiendo
trabajado antes
y está disponible
para trabajar
No trabajó
Actividad semanal
Codificado 1 2 3 4 5 6 7 8 9
Valor realTrabajó al
menos 1 hora
No trabajó pero
si tiene trabajo
Trabajó al
menos 1 hora
en servicios o
fabricacion de
productos
Trabajó al
menos 1 hora
en negocio
familiar
Trabajó al
menos 1 hora
en labores
agricolas
CesanteBusca trabajo
por primera vezRentista Jubilado
Tipo de actividad
13
Tabla 4. Codificación de “Rama de actividad”
En este caso, por ejemplo un valor de 16 indica que la mujer trabaja en la
rama de enseñanza.
Tabla 5. Codificación de “Estado conyugal”
Para el estado conyugal se aplicó la misma idea que en variables anteriores,
por ejemplo un valor de 6 indica que la mujer es soltera.
Tabla 6. Codificación de “Grupo Económico”
En este caso un valor de 4 indica que la mujer labora como personal de apoyo
administrativo.
Tabla 7. Codificación de “Cultura y Costumbres”
Para identidad cultural un valor de 3 indica que la mujer se identifica como
de raza negra.
Codificado 1 2 3 4 5 6 7 8 9 16 17 18 19 20 21 22 23
Valor real
Agricultura,
ganaderia,
silvicultura y
pesca
Explotación
de minas y
canteras
Industrias
manufacture
ras
Suministro
de
electricidad,
gas, vapor y
aire
acondiciona
do
Distribución
de agua,
alcantarillad
o y gestión
de
desechos
Construcció
n
Comercio al
por mayor y
menor
Transporte y
almacenami
ento
Actividades
de
alo jamiento
y servicio de
comidas
Enseñanza
Actividades
de la
atención de
la salud
humana
Artes,
entretenimie
nto y
recreacion
Otras
actividades
de servicios
Actividades
de los
hogares
como
empleadore
s
Actividades
de
organizacio
nes y
organos
extraterritori
ales
No
declarado
Trabajador
nuevo
Rama de actividad recodificada
Codificado 1 2 3 4 5 6
Valor real Casado/a Unido/a Separado/a Divorciado/a Viudo/a Soltero/a
Estado conyugal
Codificado 1 2 3 4 5 6 7 8 9
Valor realDirectores y
gerentes
Profesionales
científ icos e
intelectuales
Tecnicos y
profesionales
del nivel medio
Personal de
apoyo
administrativo
Trabajadores
de los
servicios y
vendedores
Agricultores y
trabajadores
calif icados
Oficiales,
operarios y
artesanos
Operadores de
instalaciones y
maquinaria
Ocupaciones
elementales
Grupo de ocupación recodificado
Codificado 1 2 3 4 5 6 7 8
Valor real IndígenaAfroecuatorian
o/aNegro/a Mulato/a Montubio/a Mestizo/a Blanco/a Otro/a
Como se identifica según su cultura y costumbres
14
Luego de codificar los datos obtenidos, se procedió a visualizarlos y, de ello
lo más llamativo fue el que arroja la evolución de la cantidad de hijos que han tenido
las mujeres desde 1959 hasta 2009, como se indica a continuación.
Gráfico 6. Cantidad de hijos por años 1959-2009
Conclusión
Luego de estudiar los datos obtenidos, es posible afirmar que con el
transcurrir de los años el número de hijos que tienen las mujeres parece disminuir.
Por lo que se a continuación se estudiaran factores como cultura, estado civil,
actividad laboral, sueldo o ingreso mínimos de las mujeres que tienen hijos, entre
otros; con la finalidad de verificar si son factores que afectan la cantidad de hijos
que tienen las mujeres en el Ecuador.
0,000
1,000
2,000
3,000
4,000
5,000
6,000
7,000
1959 1969 1979 1989 1999 2009
Canti
dad d
e h
ijos
Años
Evolución de la cantidad de hijos fecundados
15
5.2. Construcción de las variables a utilizar
Una vez que se seleccionaron los datos relevantes del estudio se detallan a
continuación:
Tabla 8. Datos a usar en el modelo 1 o inicial de regresión lineal
De esta forma, las variables a utilizar en el modelo de regresión lineal inicial son:
n Y X1 X2 X3 X4 X5 X6 X7 X8 X9
AñosPromedio
de hijos
Años de
escolaridad
Cultura y
costumbre
Horas
trabajadas
Actividad
Semanal
Estado
Civil
Rama de
Actividad
Tipo de
Actividad
Grupo de
actividad
Sueldo o
salario 1959 6,619 7,836 5,615 29,944 4,437 2,516 7,490 6,507 6,6932 798,4331960 6,392 8,124 5,607 30,510 4,264 2,406 7,819 6,208 6,5902 835,308
1961 6,146 8,374 5,635 29,985 4,183 2,390 8,062 6,076 6,5451 856,434
1962 5,980 8,496 5,652 30,341 4,074 2,388 8,225 5,912 6,4828 885,160
1963 5,888 8,798 5,637 31,622 3,971 2,335 8,537 5,743 6,3998 912,383
1964 5,726 8,794 5,620 30,805 3,870 2,342 8,736 5,512 6,6062 882,519
1965 5,500 9,093 5,651 31,226 3,642 2,244 9,255 5,121 6,4468 955,6461966 5,367 9,112 5,621 31,489 3,646 2,263 9,139 5,134 6,4823 939,135
1967 5,320 9,454 5,620 31,512 3,571 2,247 9,258 4,998 6,4359 960,9641968 5,084 9,570 5,624 31,409 3,439 2,230 9,336 4,806 6,3735 981,813
1969 4,933 9,652 5,648 32,462 3,405 2,240 9,374 4,758 6,4089 963,854
1970 4,852 9,949 5,666 32,215 3,308 2,234 9,591 4,585 6,4074 968,472
1971 4,744 9,941 5,653 32,671 3,272 2,208 9,595 4,516 6,4085 961,3901972 4,632 10,076 5,651 32,094 3,245 2,214 9,491 4,482 6,4060 958,594
1973 4,466 10,289 5,648 32,771 3,210 2,198 9,440 4,430 6,3586 979,680
1974 4,406 10,268 5,665 33,334 3,176 2,259 9,510 4,343 6,4386 942,658
1975 4,231 10,448 5,647 32,361 3,143 2,184 9,696 4,302 6,3969 957,432
1976 4,164 10,508 5,650 32,873 3,097 2,214 9,547 4,225 6,4277 953,876
1977 4,041 10,611 5,665 32,511 3,078 2,175 9,641 4,180 6,3813 964,499
1978 3,954 10,861 5,648 32,529 3,047 2,178 9,513 4,142 6,3527 979,161
1979 3,840 10,726 5,667 33,552 3,021 2,215 9,545 4,092 6,4362 938,904
1980 3,780 10,743 5,650 32,799 3,037 2,206 9,544 4,119 6,3998 950,067
1981 3,708 10,860 5,666 32,915 2,993 2,169 9,623 4,058 6,4312 940,663
1982 3,614 10,887 5,661 32,950 2,989 2,225 9,473 4,047 6,4542 926,478
1983 3,526 10,959 5,683 33,120 2,956 2,200 9,543 3,994 6,4375 925,6721984 3,478 10,820 5,642 33,158 2,963 2,274 9,388 4,012 6,4592 915,157
1985 3,345 10,942 5,666 33,081 2,927 2,229 9,444 3,956 6,4205 930,986
1986 3,330 10,854 5,638 32,599 2,983 2,256 9,373 4,022 6,4531 921,965
1987 3,231 11,016 5,622 32,688 2,927 2,230 9,412 3,937 6,4212 933,679
1988 3,201 11,021 5,639 32,206 3,001 2,284 9,351 4,056 6,4102 937,732
1989 3,043 11,086 5,650 32,491 2,983 2,335 9,413 4,035 6,3538 955,036
1990 2,987 11,145 5,639 33,236 2,983 2,343 9,356 4,032 6,4172 921,482
1991 2,921 11,110 5,623 32,805 3,032 2,428 9,323 4,116 6,4368 909,992
1992 2,805 11,202 5,627 33,189 3,006 2,466 9,359 4,077 6,4192 904,803
1993 2,672 11,321 5,623 33,232 3,029 2,508 9,492 4,091 6,4260 911,970
1994 2,613 11,290 5,626 32,788 3,081 2,663 9,530 4,170 6,4884 882,306
1995 2,483 11,439 5,611 33,127 3,089 2,708 9,582 4,174 6,4192 903,355
1996 2,367 11,465 5,602 32,076 3,108 2,837 9,667 4,194 6,4505 896,115
1997 2,272 11,564 5,607 32,800 3,162 2,988 9,620 4,279 6,4345 884,345
1998 2,127 11,731 5,619 32,905 3,248 3,121 9,698 4,392 6,4770 868,996
1999 2,023 11,656 5,605 33,059 3,369 3,325 9,629 4,572 6,6032 828,312
2000 1,892 11,905 5,597 32,544 3,486 3,550 9,624 4,729 6,6724 796,467
2001 1,764 11,650 5,597 32,287 3,685 3,792 9,496 5,043 6,8308 732,218
2002 1,627 11,566 5,598 32,008 3,917 4,051 9,570 5,373 7,0052 685,374
2003 1,493 11,701 5,572 31,128 4,186 4,289 9,710 5,764 7,2161 635,131
2004 1,397 11,240 5,565 32,839 4,424 4,618 9,550 6,130 7,4224 574,937
2005 1,295 11,073 5,616 31,076 4,787 4,941 9,663 6,684 7,7986 496,885
2006 1,226 10,749 5,533 30,627 5,206 5,222 9,516 7,307 7,9813 453,456
2007 1,152 10,212 5,554 31,532 5,837 5,486 8,857 8,286 8,5108 354,138
2008 1,109 9,507 5,506 26,050 6,129 5,675 8,754 8,740 8,6345 334,392
2009 1,075 8,753 5,561 30,571 6,354 5,815 8,942 9,085 8,722 324,131
16
Tabla 9. Variables a utilizar en el estudio
Variable Identificación Tipo
Cantidad de hijos Y Variable explicada
Año de escolaridad X1 Variable explicativa
Identidad cultural X2 Variable explicativa
Horas trabajadas por semana X3 Variable explicativa
Actividad semanal X4 Variable explicativa
Estado civil X5 Variable explicativa
Rama de actividad X6 Variable explicativa
Tipo de actividad X7 Variable explicativa
Grupo de actividad X8 Variable explicativa
Sueldo o salario X9 Variable explicativa
5.3. Significancia y construcción varios modelos
Con la definición de variables se procedió a elaborar los modelos de
regresión lineal, como se detalla enseguida:
5.3.1. Significancia del modelo 1 o inicial
Por tratarse del modelo inicial o modelo 1, este se construye considerando
todas las variables en estudio. El modelo formalizado es:
𝑌 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3 + 𝛽4𝑋4 + 𝛽5𝑋5 + 𝛽6𝑋6 + 𝛽7𝑋7 + 𝛽8𝑋8 + 𝛽9𝑋9
De este modo se realiza la prueba de hipótesis a cada parámetro del modelo
1 de regresión lineal:
𝐻0: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 𝛽7 = 𝛽8 = 𝛽9 = 0
𝐻1: 𝛽1 = 𝛽2 = 𝛽3 = 𝛽4 = 𝛽5 = 𝛽6 = 𝛽7 = 𝛽8 = 𝛽9 ≠ 0
17
Hipótesis
Se desea demostrar si el Año de escolaridad, Identidad cultural, Horas trabajadas
por semana, Actividad semanal, Estado civil, Rama de actividad, Tipo de actividad
Grupo de actividad, Sueldo o salario son factores que indican la cantidad de hijos
que tendrá una mujer en el Ecuador durante su vida. Para probar o desmentir la
hipótesis propuesta se realizaran las pruebas estadísticas tomando como muestra
los datos de la tabla 8. Así, la herramienta de análisis de datos de excel, arrojó lo
siguiente:
Con esto, se verifica si el modelo regresión lineal es significativo, de la siguiente
forma:
a) Para el modelo en general
Se usa distribución fisher y se obtiene, con un 95% de confianza:
Ftabla=2,1177
Y como Ftabla < 328,71 (Fcalculado) se rechaza H0 es decir el modelo pasa el
test (es significativo) con un coeficiente de determinación R2=0,9863.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple0,993141775
Coeficiente de determinación R^20,986330584
R^2 ajustado 0,983329981
Error típico 0,200790972
Observaciones 51
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 9 119,2737212 13,25263569 328,710742 2,78833E-35
Residuos 41 1,652997585 0,040317014
Total 50 120,9267188
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%
Intercepción 21,61063528 12,48237211 1,731292346 0,09091943 -3,598026593 46,8192972 -3,59802659 46,8192972
Años de escolaridad -0,422784464 0,214633011 -1,969801669 0,05564191 -0,856244624 0,0106757 -0,85624462 0,0106757
Cultura y costumbres 1,170692347 2,134054507 0,548576591 0,58627109 -3,139118164 5,48050286 -3,13911816 5,48050286
Horas trabajadas -0,017190425 0,044695513 -0,384611886 0,70251282 -0,107454844 0,07307399 -0,10745484 0,07307399
Que hizo la semana pasada 2,081692003 5,067304023 0,410808587 0,68335212 -8,151936081 12,3153201 -8,15193608 12,3153201
Estado Civil -2,619554712 0,531457054 -4,929005446 1,409E-05 -3,692854006 -1,54625542 -3,69285401 -1,54625542
Rama de Actividad 1,200161202 0,271702897 4,417182205 7,143E-05 0,65144607 1,74887633 0,65144607 1,74887633
Tipo de Actividad 0,465845911 3,075094608 0,151489944 0,8803322 -5,744433637 6,67612546 -5,74443364 6,67612546
Grupo de actividad -3,644786914 0,77215816 -4,720259529 2,7452E-05 -5,204191954 -2,08538187 -5,20419195 -2,08538187
Sueldo o salario promedio -0,010422292 0,00277183 -3,760076288 0,000531 -0,016020117 -0,00482447 -0,01602012 -0,00482447
18
b) Para cada variable explicativa del modelo
Se usa distribución t-student, y se obtiene con 95% de confianza:
ttabla=2,0195
Y se lo compara con el estadístico t de cada variable. Por lo tanto las
variables que tienen un estadístico t > ttabla o < -ttabla son las variables
significativas, pues en dichos rangos están las zonas de rechazo de H0.
Conclusión
En general el modelo 1, es significativo, pero como X1, X2, X3, X4, X7 no pasan la
prueba, estas variables son eliminadas y quedan como variables significativas
únicamente: X5= Estado Civil, X6= Rama de Actividad, X8= Grupo de actividad, X9=
Sueldo.
5.3.2. Significancia de modelo 2
Luego de eliminar las variables X1, X2, X3, X4, X7 por no ser significativa, se
elabora un nuevo modelo de regresión lineal al que llamaremos modelo 2, y que es
el siguiente:
𝑌 = 𝛽0 + 𝛽5𝑋5 + 𝛽6𝑋6 + 𝛽8𝑋8 + 𝛽9𝑋9
Y realiza la prueba de hipótesis a cada parámetro del modelo 1 de regresión
lineal:
𝐻0: 𝛽5 = 𝛽6 = 𝛽8 = 𝛽9 = 0
𝐻1: 𝛽5 = 𝛽6 = 𝛽8 = 𝛽9 ≠ 0
Hipótesis
Se desea demostrar si Estado Civil, Rama de Actividad, Grupo de actividad y Sueldo
promedio son factores que indican la cantidad de hijos que tendrá una mujer en el
Ecuador durante su vida. Para ello se trabajará con los datos de la tabla 10:
19
Tabla 10. Datos a usar en el modelo 2 de regresión lineal
Y nuevamente se usa la herramienta de análisis de datos en Excel, con la cual se
obtiene lo siguiente:
n Y X5 X6 X8 X9
AñosPromedio
de hijosEstado Civil
Rama de
Actividad
Grupo de
actividad
Sueldo o
salario
1959 6,619 2,516 7,490 6,6932 798,4331960 6,392 2,406 7,819 6,5902 835,3081961 6,146 2,390 8,062 6,5451 856,4341962 5,980 2,388 8,225 6,4828 885,1601963 5,888 2,335 8,537 6,3998 912,3831964 5,726 2,342 8,736 6,6062 882,5191965 5,500 2,244 9,255 6,4468 955,6461966 5,367 2,263 9,139 6,4823 939,1351967 5,320 2,247 9,258 6,4359 960,9641968 5,084 2,230 9,336 6,3735 981,8131969 4,933 2,240 9,374 6,4089 963,8541970 4,852 2,234 9,591 6,4074 968,4721971 4,744 2,208 9,595 6,4085 961,3901972 4,632 2,214 9,491 6,4060 958,5941973 4,466 2,198 9,440 6,3586 979,6801974 4,406 2,259 9,510 6,4386 942,6581975 4,231 2,184 9,696 6,3969 957,4321976 4,164 2,214 9,547 6,4277 953,8761977 4,041 2,175 9,641 6,3813 964,4991978 3,954 2,178 9,513 6,3527 979,1611979 3,840 2,215 9,545 6,4362 938,9041980 3,780 2,206 9,544 6,3998 950,0671981 3,708 2,169 9,623 6,4312 940,6631982 3,614 2,225 9,473 6,4542 926,4781983 3,526 2,200 9,543 6,4375 925,6721984 3,478 2,274 9,388 6,4592 915,1571985 3,345 2,229 9,444 6,4205 930,9861986 3,330 2,256 9,373 6,4531 921,9651987 3,231 2,230 9,412 6,4212 933,6791988 3,201 2,284 9,351 6,4102 937,7321989 3,043 2,335 9,413 6,3538 955,0361990 2,987 2,343 9,356 6,4172 921,4821991 2,921 2,428 9,323 6,4368 909,9921992 2,805 2,466 9,359 6,4192 904,8031993 2,672 2,508 9,492 6,4260 911,970
1994 2,613 2,663 9,530 6,4884 882,3061995 2,483 2,708 9,582 6,4192 903,3551996 2,367 2,837 9,667 6,4505 896,1151997 2,272 2,988 9,620 6,4345 884,3451998 2,127 3,121 9,698 6,4770 868,9961999 2,023 3,325 9,629 6,6032 828,312
2000 1,892 3,550 9,624 6,6724 796,4672001 1,764 3,792 9,496 6,8308 732,218
2002 1,627 4,051 9,570 7,0052 685,3742003 1,493 4,289 9,710 7,2161 635,1312004 1,397 4,618 9,550 7,4224 574,9372005 1,295 4,941 9,663 7,7986 496,8852006 1,226 5,222 9,516 7,9813 453,456
2007 1,152 5,486 8,857 8,5108 354,1382008 1,109 5,675 8,754 8,6345 334,3922009 1,075 5,815 8,942 8,722 324,131
20
De inmediato se procede nuevamente a verificar si el modelo 2 de regresión lineal
es significativo, de la siguiente forma:
a) Para el modelo en general
Se usa distribución fisher y se obtiene, con un 95% de confianza:
Ftabla=2,5740
Y como Ftabla < 76,35 (Fcalculado) se rechaza H0 es decir el modelo pasa el
test (es significativo) con un coeficiente de determinación R2=0,8690.
b) Para cada variable explicativa del modelo
Se usa distribución t-student, y se obtiene con 95% de confianza:
ttabla=2,0129
Y se lo compara con el estadístico t de cada variable. Por lo tanto las
variables con 2,0129< estadístico t <-2,0129 son las variables significativas,
pues en dichos rangos están las zonas de rechazo de H0.
Conclusión
En general el modelo 2, es significativo, pero como X5, no pasa la prueba, esta
variable es eliminada y quedan como variables significativas únicamente: X6= Rama
de Actividad, X8= Grupo de actividad, X9= Sueldo.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple0,932252986
Coeficiente de determinación R^20,869095629
R^2 ajustado 0,85771264
Error típico 0,586623279
Observaciones 51
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 4 105,0968827 26,27422069 76,3503897 1,02788E-19
Residuos 46 15,82983606 0,344126871
Total 50 120,9267188
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -11,89173086 9,253673809 -1,285082131 0,20519663 -30,51841014 6,734948424 -30,51841014 6,734948424
Estado Civil 0,25723021 0,675138213 0,381003779 0,70495448 -1,101752526 1,616212947 -1,101752526 1,616212947
Rama de Actividad -2,218216789 0,289227765 -7,669446212 9,1204E-10 -2,800402085 -1,636031493 -2,800402085 -1,636031493
Grupo de actividad 2,985380143 0,774730717 3,853442336 0,00035929 1,425928093 4,544832193 1,425928093 4,544832193
Sueldo o salario promedio 0,018116606 0,005662529 3,199384096 0,00249542 0,006718526 0,029514686 0,006718526 0,029514686
21
5.3.3. Significancia de modelo 3
Luego de eliminar la variable X5, por no ser significativa, se elabora un nuevo
modelo de regresión lineal al que llamaremos modelo 3, y que es el siguiente:
𝑌 = 𝛽0 + 𝛽6𝑋6 + 𝛽8𝑋8 + 𝛽9𝑋9
Y realiza la prueba de hipótesis a cada parámetro del modelo 1 de regresión
lineal:
𝐻0: 𝛽6 = 𝛽8 = 𝛽9 = 0
𝐻1: 𝛽6 = 𝛽8 = 𝛽9 ≠ 0
Hipótesis
Se desea demostrar si estas tres variables son factores que indican la cantidad de
hijos que tendrá una mujer en el Ecuador durante su vida. Los datos son:
Tabla 11. Datos a usar en el modelo 3 de regresión lineal
n Y X6 X8 X9
AñosPromedio
de hijos
Rama de
Actividad
Grupo de
actividad
Sueldo o
salario1959 6,619 7,490 6,6932 798,4331960 6,392 7,819 6,5902 835,3081961 6,146 8,062 6,5451 856,4341962 5,980 8,225 6,4828 885,1601963 5,888 8,537 6,3998 912,3831964 5,726 8,736 6,6062 882,5191965 5,500 9,255 6,4468 955,6461966 5,367 9,139 6,4823 939,1351967 5,320 9,258 6,4359 960,9641968 5,084 9,336 6,3735 981,8131969 4,933 9,374 6,4089 963,8541970 4,852 9,591 6,4074 968,4721971 4,744 9,595 6,4085 961,3901972 4,632 9,491 6,4060 958,5941973 4,466 9,440 6,3586 979,6801974 4,406 9,510 6,4386 942,6581975 4,231 9,696 6,3969 957,4321976 4,164 9,547 6,4277 953,8761977 4,041 9,641 6,3813 964,4991978 3,954 9,513 6,3527 979,1611979 3,840 9,545 6,4362 938,9041980 3,780 9,544 6,3998 950,0671981 3,708 9,623 6,4312 940,6631982 3,614 9,473 6,4542 926,4781983 3,526 9,543 6,4375 925,6721984 3,478 9,388 6,4592 915,1571985 3,345 9,444 6,4205 930,9861986 3,330 9,373 6,4531 921,9651987 3,231 9,412 6,4212 933,6791988 3,201 9,351 6,4102 937,7321989 3,043 9,413 6,3538 955,0361990 2,987 9,356 6,4172 921,4821991 2,921 9,323 6,4368 909,9921992 2,805 9,359 6,4192 904,8031993 2,672 9,492 6,4260 911,9701994 2,613 9,530 6,4884 882,3061995 2,483 9,582 6,4192 903,3551996 2,367 9,667 6,4505 896,1151997 2,272 9,620 6,4345 884,3451998 2,127 9,698 6,4770 868,9961999 2,023 9,629 6,6032 828,3122000 1,892 9,624 6,6724 796,4672001 1,764 9,496 6,8308 732,2182002 1,627 9,570 7,0052 685,3742003 1,493 9,710 7,2161 635,1312004 1,397 9,550 7,4224 574,9372005 1,295 9,663 7,7986 496,8852006 1,226 9,516 7,9813 453,4562007 1,152 8,857 8,5108 354,1382008 1,109 8,754 8,6345 334,3922009 1,075 8,942 8,722 324,131
22
Y por tercera vez se usa la herramienta de análisis de datos en Excel, con la
cual se obtiene lo siguiente:
De inmediato se procede a verificar si el modelo 3 de regresión lineal es
significativo, de la siguiente forma:
a) Para el modelo en general
Se usa distribución fisher y se obtiene, con un 95% de confianza:
Ftabla=2,8023
Y como Ftabla < 35,01 (Fcalculado) se rechaza H0 es decir el modelo pasa el
test (es significativo) con un coeficiente de determinación R2=0,8686.
b) Para cada variable explicativa del modelo
Se usa distribución t-student, y se obtiene con 95% de confianza:
ttabla=2,0129
Y se lo compara con el estadístico t de cada variable. Por lo tanto las
variables con 2,0129 < estadístico t < -2,0129 son las variables significativas,
pues en dichos rangos están las zonas de rechazo de H0.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple0,932031399
Coeficiente de determinación R^20,868682529
R^2 ajustado 0,860300563
Error típico 0,581264045
Observaciones 51
ANÁLISIS DE VARIANZA
Grados de libertad Suma de cuadrados Promedio de los cuadrados F Valor crítico de F
Regresión 3 105,046928 35,01564265 103,637083 9,9121E-21
Residuos 47 15,87979085 0,33786789
Total 50 120,9267188
Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95% Inferior 95,0% Superior 95,0%
Intercepción -9,489418425 6,711208372 -1,413965697 0,16396206 -22,9906282 4,011791354 -22,9906282 4,011791354
Rama de Actividad -2,129529932 0,170100214 -12,51926664 1,4103E-16 -2,471727423 -1,787332441 -2,471727423 -1,787332441
Grupo de actividad 2,859844778 0,694769507 4,116249706 0,00015423 1,462148814 4,257540743 1,462148814 4,257540743
Sueldo o salario promedio 0,016161461 0,002372141 6,813027394 1,5709E-08 0,011389329 0,020933593 0,011389329 0,020933593
23
Conclusión
En general el modelo 3, es significativo, además de que las tres variables X6, X8, X9,
también lo son, por lo que podemos escribir la ecuación del modelo 3 de regresión
lineal como sigue:
�̂� = −9,489 − 2,130𝑋6 + 2,860𝑋8 + 0,016𝑋9
(Ecuación del modelo 3)
5.3.4. Construcción de modelo significativo
Una vez que se obtuvo un modelo (3) significativo se procede a redefinir las
variables explicativas (X1, X2, X3), de la siguiente manera:
o X1 = Rama de Actividad
o X2 = Grupo de actividad
o X3 = Sueldo
5.3.4.1. Multicolinealidad
Al contar con las variables explicativas del modelo 3 redefinidas como X1, X2,
X3, se procede a verificar si existe MULTICOLINEALIDAD2 entre ellas.
Para el efecto se procede a calcular los coeficientes de determinación3
para el conjunto de variables: (X1 y X2), (X1 y X3) y finalmente (X2 y X3), todo
mediante los datos de la tabla 11, así los parámetros obtenidos son:
2 Término, atribuido a Ragnar Frisch, que se refiere a una situación en que existe una relación lineal entre las variables X. (variables explicativas) 3 Estimador que muestra el grado de certeza con el que las variables estimadas son explicadas.
24
Lo que permite elaborar la matriz de correlación simple utilizando los coeficientes
de correlación múltiple.
X1 X2 X3
X1 1 0,152017685 0,166458126
X2 0,152017685 1 0,979957961
X3 0,166458126 0,979957961 1
Determinante= 0,038459558
Resumen
X1 y X2
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,15201768
Coeficiente de determinación R^2 0,02310938
R^2 ajustado 0,00317283
Error típico 0,49010635
Observaciones 51
Resumen
X1 y X3
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,16645813
Coeficiente de determinación R^2 0,02770831
R^2 ajustado 0,00786562
Error típico 0,48895134
Observaciones 51
Resumen
X2 y X3
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,97995796
Coeficiente de determinación R^2 0,9603176
R^2 ajustado 0,95950776
Error típico 0,11970981
Observaciones 51
25
Conclusión
Como en la matriz de correlación se obtuvo una determinante (0,038459558)
menor que 0,80 4 se puede tener una idea de que el modelo no posee una
multicolinealidad fuerte, lo que indica que las variables significativas (X1, X2, X3)
de nuestro estudio no se definen unas con otras.
Sin embargo para tener mucha más seguridad de la no presencia de
multicolinealidad, se realizara el test de Farrar-Glauber [8] el cual permite verificar
si los regresores se encuentran correlacionados. Para ello definimos las siguientes
hipótesis:
𝐻0: 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎𝑠 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎𝑛 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠
𝐻1: 𝐿𝑎𝑠 𝑣𝑎𝑟𝑖𝑎𝑏𝑙𝑒𝑠 𝑟𝑒𝑔𝑟𝑒𝑠𝑜𝑟𝑎𝑠 𝑁𝑂 𝑠𝑒 𝑒𝑛𝑐𝑢𝑒𝑛𝑡𝑟𝑎𝑛 𝑐𝑜𝑟𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑎𝑠
Hipótesis
Se desea saber si las variables regresoras de nuestro modelo se encuentran
o no correlacionados.
En este caso se usa distribución chi-cuadrado para el X2tabla el cual se
compara con el estadístico Gobservado cuya fórmula es:
𝐺 = − [(𝑛 − 1) − (2𝑘 + 5)
6] 𝑙𝑛[𝑑𝑒𝑡(𝑋′𝑋)]
4 Umbral sugerido por Derpich, I. (2013)
26
Se crea la matriz X con una columna de 1s.
Se traspone la matriz X, convirtiéndose en XT , como se ve enseguida:
X1 X2 X3
Rama de Actividad Grupo de actividad Sueldo1 7,490 6,6932 798,4331 7,819 6,5902 835,3081 8,062 6,5451 856,4341 8,225 6,4828 885,1601 8,537 6,3998 912,3831 8,736 6,6062 882,5191 9,255 6,4468 955,6461 9,139 6,4823 939,1351 9,258 6,4359 960,9641 9,336 6,3735 981,8131 9,374 6,4089 963,8541 9,591 6,4074 968,4721 9,595 6,4085 961,3901 9,491 6,4060 958,5941 9,440 6,3586 979,6801 9,510 6,4386 942,6581 9,696 6,3969 957,4321 9,547 6,4277 953,8761 9,641 6,3813 964,4991 9,513 6,3527 979,1611 9,545 6,4362 938,9041 9,544 6,3998 950,0671 9,623 6,4312 940,6631 9,473 6,4542 926,4781 9,543 6,4375 925,6721 9,388 6,4592 915,1571 9,444 6,4205 930,9861 9,373 6,4531 921,9651 9,412 6,4212 933,6791 9,351 6,4102 937,7321 9,413 6,3538 955,0361 9,356 6,4172 921,4821 9,323 6,4368 909,9921 9,359 6,4192 904,8031 9,492 6,4260 911,9701 9,530 6,4884 882,3061 9,582 6,4192 903,3551 9,667 6,4505 896,1151 9,620 6,4345 884,3451 9,698 6,4770 868,9961 9,629 6,6032 828,3121 9,624 6,6724 796,4671 9,496 6,8308 732,2181 9,570 7,0052 685,3741 9,710 7,2161 635,1311 9,550 7,4224 574,9371 9,663 7,7986 496,8851 9,516 7,9813 453,4561 8,857 8,5108 354,1381 8,754 8,6345 334,3921 8,942 8,722 324,131
27
Para luego realizar la multiplicación de XT * X y obtener lo siguiente:
637597,647 667041,106 683910,621 706847,287
667041,106 697844,400 715493,019 739489,001
683910,621 715493,019 733588,023 758190,925
706847,287 739489,001 758190,925 783619,045
De este modo, se puede aplicar la fórmula (en pag. 25) para obtener el Gobservado, Y
con 95% de confianza se obtiene mediante distribución chi cuadrado el X2tabla:
Gobservado=43,0397
𝑋2tabla=7,2609
Conclusión
Como Gobservado es mayor que 𝑋2tabla entonces se rechaza H0, es decir que
NO existe correlación entre las variables regresoras.
5.3.4.2. Autocorrelación
Con el análisis efectuado anteriormente se evidenció que en el modelo (3)
significativo de regresión lineal no existe correlación entre las variables sin
embargo, ahora es necesario evaluar la AUTOCORRELACIÓN DE LOS DATOS5,
esto mediante el test de Durbin Watson. [9] Para ello se plantea la hipótesis:
𝐻0: No hay autocorrelacion
𝐻1: hay autocorrelacion
Hipótesis
Se desea determinar si los datos presentan o no autocorrelación.
5 La autocorrelación se define como la correlación existente entre los miembros de una serie de observaciones ordenadas en el tiempo o en el espacio. [13]
1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1
X1 Rama de Actividad 7,5 7,8 8,1 8,2 8,5 8,7 9,3 9,1 9,3 9,3 9,4 9,6 9,6 9,5 9,4 9,5 9,7 9,5 9,6 9,5 9,5 9,5 9,6 9,5 9,5 9,4 9,4 9,4 9,4 9,4 9,4 9,4 9,3 9,4 9,5 9,5 9,6 9,7 9,6 9,7 9,6 9,6 9,5 9,6 9,7 9,6 9,7 9,5 8,9 8,8 8,9
X2 Grupo de actividad 6,7 6,6 6,5 6,5 6,4 6,6 6,4 6,5 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,5 6,4 6,5 6,4 6,5 6,4 6,4 6,4 6,4 6,4 6,4 6,4 6,5 6,4 6,5 6,4 6,5 6,6 6,7 6,8 7,0 7,2 7,4 7,8 8,0 8,5 8,6 8,7
X3 Sueldo o salario 798,4 835,3 856,4 885,2 912,4 882,5 955,6 939,1 961,0 981,8 # # # 968,5 961,4 958,6 979,7 942,7 957,4 953,9 964,5 979,2 # # # 950,1 940,7 926,5 925,7 915,2 931,0 # # # 933,7 937,7 955,0 921,5 910,0 # # # 912,0 # # # # # # 896,1 # # # # # # # # # 796,5 732,2 685,4 635,1 574,9 # # # 453,5 354,1 # # # 324,1
28
Para el efecto, se usó la opción análisis de datos de Excel, en donde se
escogió regresión lineal marcando análisis y gráficos de residuales, obteniendo lo
siguiente:
Observación Pronóstico para Y Residuos
1 6,605879604 0,01352582 2 6,20733513 0,184899158 3 5,902110755 0,243553625 4 5,841429228 0,138182113 5 5,378494297 0,509266897 6 5,062464637 0,663222986 7 4,682838897 0,817288103 8 4,764060472 0,603010424 9 4,731344247 0,588197595
10 4,724609822 0,359270712 11 4,454616088 0,4788692 12 4,063114276 0,789110407 13 3,943459111 0,800548946 14 4,110867457 0,520892722 15 4,424522741 0,041722818 16 3,907512302 0,498191314 17 3,631194995 0,599729436 18 3,978090975 0,185875643 19 3,817615329 0,223516195 20 4,245658771 -0,291202356 21 3,765728888 0,074032839 22 3,843026258 -0,06322797 23 3,613978278 0,093902157 24 3,769512556 -0,155477468 25 3,5591092 -0,0331768 26 3,781616685 -0,304037067 27 3,807245083 -0,462363399 28 3,906336097 -0,576122194 29 3,920704491 -0,690034222 30 4,085379335 -0,884116802 31 4,07149911 -1,028444266 32 3,831601757 -0,84441753 33 3,77227276 -0,851355923 34 3,560388627 -0,755644976 35 3,413232531 -0,741402216 36 3,031412044 -0,418427703 37 3,063850034 -0,580532365 38 2,855297072 -0,487903955 39 2,719389409 -0,446997551 40 2,424881045 -0,297906489 41 2,275672343 -0,25304623 42 1,970918407 -0,079389886 43 1,656738082 0,107452235 44 1,242385849 0,385059449 45 0,733528147 0,759268185 46 0,691618329 0,705543518 47 0,266673306 1,027955622 48 0,400048201 0,826398542 49 1,712996405 -0,560883729 50 1,965407999 -0,855968875 51 1,651675504 -0,576406686
Gracias a lo cual se obtuvo:
Numerador 4,5671
Denominador 15,8798
29
Datos necesarios para el cálculo del dobservado, para el mismo se usa la siguiente
formula:
Donde T es el número de observaciones y et es el residual asociado a la
observación en el tiempo t. De esta forma el dobservado es:
dobservado=0,2876
Para probar la autocorrelación, la estadística de prueba dobservado se compara con
los valores críticos inferiores y superiores (dL and dU), como sigue6:
a) Autocorrelación positiva
o Si dobservado < dL, se rechaza H0, hay autocorrelación positiva.
o Si dobservado > dU, no se rechaza H0, no hay autocorrelación positiva.
o Si dL < dobservado < dU, la prueba no es concluyente.
b) Autocorrelación negativa
o Si dobservado > 4 - dL, se rechaza H0, hay autocorrelación negativa.
o Si dobservado < 4 - dU, no se rechaza H0, no hay autocorrelación
negativa.
o Si 4 - dL < dobservado < 4- dU, la prueba no es concluyente.
Entonces, para nuestro caso al 99% de confianza, con n=51 y k=3 se tiene7:
dL 1.24
du 1.49
6 Criterio de decisión obtenido en ayudantía de métodos multivariado. 7 Tabla K, límites de estadística de Durbin-Watson. Aprox. n=50
30
Conclusiones
Como dobservado es menor que dL entonces podemos afirmar que existe
autocorrelación positiva, es decir existe una relación entre dos variables que
muestra que una variable disminuye conforme otra aumenta. Esta autocorrelación
se evidencia también mediante las gráficas de los residuales (gráfico 7, gráfico 8,
gráfico 9) pues se observa tendencias (puntos azules) hacia arriba y hacia abajo
con grandes zonas de sobreestimación y subestimación.8
Gráfico 7. Gráfico de los residuales variable X1
Gráfico 8. Gráfico de los residuales variable X2
8 Autocorrelación positiva, los residuos consecutivos comparten valores y signos similares, mostrándose amplias zonas de
sobrestimación y subestimación lo que genera visibles patrones de “ondas”. [14]
-1,5
-1
-0,5
0
0,5
1
1,5
7,0 7,5 8,0 8,5 9,0 9,5 10,0
Resi
duos
Variable X 1
Variable X1 Gráfico de los residuales
-1,5
-1
-0,5
0
0,5
1
1,5
6,0 7,0 8,0 9,0
Resi
duos
Variable X 2
Variable X2 Gráfico de los residuales
31
Gráfico 9. Gráfico de los residuales variable X3
CORRECCIÓN DE AUTOCORRELACIÓN
Gracias al test de Durbin Watson se evidenció que los datos presentan
autocorrelacion positiva, por lo que la misma debe ser corregida. Para ello se hará
uso del test de Cochrane-Orcutt [10] con el cual se busca reformular la variable Y.
Modelo Significativo Inicial
𝑌𝑖 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3
Nuevo Modelo Significativo al que se quiere llegar
𝑌𝑖′ = 𝛽0′ + 𝛽1𝑋1′ + 𝛽2𝑋2′ + 𝛽3𝑋3′
Se calcula lo siguiente:
𝜌 =∑(𝐸𝑡∗𝐸𝑡−1)
∑(𝐸𝑡2)
= 0,8457
𝛽1′ = 𝛽1
𝛽2′ = 𝛽2 𝑋𝑡′ = 𝑋𝑡 − 𝑟𝑋𝑡−1
𝛽3′ = 𝛽3 𝑌𝑡′ = 𝑌𝑡 − 𝑟𝑌𝑡−1
-1,5
-1
-0,5
0
0,5
1
1,5
300,0 500,0 700,0 900,0R
esi
duos
Variable X 3
Variable X3 Gráfico de los residuales
32
De forma que se obtiene la tabla 12 con datos nuevos:
Tabla 12. Tabla con nuevos valores de la regresión.
n Y X1 X2 X3
AñoPromedio
de hijos
Rama de
Actividad
Grupo de
actividad
Sueldo o
salarioY' X'1 X'2 X'3
1959 6,6194 7,4900 6,6932 798,4333 --- --- --- ---
1960 6,3922 7,8186 6,5902 835,3076 0,7940 1,4841 0,9295 160,0477
1961 6,1457 8,0617 6,5451 856,4340 0,7396 1,4493 0,9716 149,9883
1962 5,9796 8,2246 6,4828 885,1601 0,7820 1,4065 0,9474 160,8471
1963 5,8878 8,5371 6,3998 912,3826 0,8306 1,5813 0,9171 163,7751
1964 5,7257 8,7360 6,6062 882,5193 0,7462 1,5160 1,1937 110,8889
1965 5,5001 9,2552 6,4468 955,6462 0,6577 1,8668 0,8597 209,2721
1966 5,3671 9,1394 6,4823 939,1353 0,7154 1,3120 1,0300 130,9155
1967 5,3195 9,2581 6,4359 960,9641 0,7804 1,5286 0,9536 166,7080
1968 5,0839 9,3357 6,3735 981,8131 0,5850 1,5058 0,9305 169,0958
1969 4,9335 9,3738 6,4089 963,8543 0,6339 1,4783 1,0187 133,5044
1970 4,8522 9,5907 6,4074 968,4724 0,6798 1,6630 0,9872 153,3108
1971 4,7440 9,5945 6,4085 961,3900 0,6403 1,4834 0,9895 142,3226
1972 4,6318 9,4913 6,4060 958,5938 0,6196 1,3769 0,9861 145,5163
1973 4,4662 9,4404 6,3586 979,6797 0,5490 1,4133 0,9408 168,9670
1974 4,4057 9,5097 6,4386 942,6577 0,6285 1,5256 1,0609 114,1120
1975 4,2309 9,6956 6,3969 957,4320 0,5049 1,6530 0,9516 160,1970
1976 4,1640 9,5470 6,4277 953,8759 0,5857 1,3471 1,0176 144,1459
1977 4,0411 9,6408 6,3813 964,4988 0,5195 1,5665 0,9452 157,7762
1978 3,9545 9,5125 6,3527 979,1614 0,5367 1,3590 0,9558 163,4547
1979 3,8398 9,5446 6,4362 938,9044 0,4954 1,4996 1,0636 110,7970
1980 3,7798 9,5441 6,3998 950,0673 0,5324 1,4719 0,9565 156,0066
1981 3,7079 9,6225 6,4312 940,6633 0,5112 1,5508 1,0187 137,1617
1982 3,6140 9,4726 6,4542 926,4781 0,4782 1,3346 1,0151 130,9298
1983 3,5259 9,5429 6,4375 925,6723 0,4694 1,5316 0,9790 142,1209
1984 3,4776 9,3877 6,4592 915,1566 0,4956 1,3170 1,0148 132,2867
1985 3,3449 9,4439 6,4205 930,9856 0,4038 1,5044 0,9578 157,0091
1986 3,3302 9,3727 6,4531 921,9655 0,5013 1,3857 1,0231 134,6019
1987 3,2307 9,4120 6,4212 933,6789 0,4142 1,4852 0,9636 153,9440
1988 3,2013 9,3506 6,4102 937,7320 0,4690 1,3906 0,9796 148,0906
1989 3,0431 9,4128 6,3538 955,0357 0,3356 1,5047 0,9325 161,9665
1990 2,9872 9,3558 6,4172 921,4817 0,4136 1,3952 1,0435 113,7782
1991 2,9209 9,3229 6,4368 909,9917 0,3946 1,4104 1,0096 130,6659
1992 2,8047 9,3593 6,4192 904,8031 0,3344 1,4747 0,9753 135,1947
1993 2,6718 9,4919 6,4260 911,9700 0,2998 1,5765 0,9971 146,7498
1994 2,6130 9,5299 6,4884 882,3056 0,3533 1,5023 1,0537 111,0241
1995 2,4833 9,5815 6,4192 903,3552 0,2734 1,5218 0,9318 157,1618
1996 2,3674 9,6666 6,4505 896,1155 0,2672 1,5632 1,0216 132,1198
1997 2,2724 9,6196 6,4345 884,3448 0,2702 1,4443 0,9791 126,4720
1998 2,1270 9,6985 6,4770 868,9963 0,2051 1,5629 1,0351 121,0783
1999 2,0226 9,6293 6,6032 828,3118 0,2238 1,4270 1,1254 93,3745
2000 1,8915 9,6236 6,6724 796,4666 0,1809 1,4798 1,0878 95,9375
2001 1,7642 9,4962 6,8308 732,2184 0,1645 1,3572 1,1877 58,6217
2002 1,6274 9,5696 7,0052 685,3735 0,1354 1,5383 1,2282 66,1136
2003 1,4928 9,7104 7,2161 635,1309 0,1164 1,6171 1,2916 55,4892
2004 1,3972 9,5503 7,4224 574,9368 0,1347 1,3379 1,3195 37,7868
2005 1,2946 9,6627 7,7986 496,8846 0,1130 1,5857 1,5212 10,6426
2006 1,2264 9,5158 7,9813 453,4562 0,1315 1,3438 1,3858 33,2254
2007 1,1521 8,8567 8,5108 354,1385 0,1149 0,8089 1,7608 -29,3636
2008 1,1094 8,7544 8,6345 334,3921 0,1351 1,2640 1,4366 34,8861
2009 1,0753 8,9419 8,7224 324,1312 0,1370 1,5381 1,4200 41,3254
33
Con la tabla 12 lista, se procede a verificar si estos regresores están libres
de autocorrelación.
Resumen
Estadísticas de la regresión
Coeficiente de correlación múltiple 0,776346048
Coeficiente de determinación R^2 0,602713186
R^2 ajustado 0,576803177
Error típico 0,140631763
Observaciones 50
ANÁLISIS DE VARIANZA
Grados de libertadSuma de cuadradosPromedio de los cuadradosF Valor crítico de F
Regresión 3 1,3801656 0,4600552 23,261789 2,60374E-09
Residuos 46 0,9097555 0,0197773
Total 49 2,2899211
Coeficientes Error típico Estadístico tProbabilidad Inferior 95% Superior 95% Inferior 95,0%Superior 95,0%
Intercepción -1,126203717 0,7166047 -1,571583 0,1229011 -2,568654146 0,316246712 -2,568654146 0,316247
Variable X 1 -0,238507075 0,1609212 -1,4821361 0,1451228 -0,562424581 0,085410431 -0,562424581 0,08541
Variable X 2 0,975094899 0,4393478 2,2194143 0,0314295 0,090733555 1,859456243 0,090733555 1,859456
Variable X 3 0,007137326 0,0016271 4,3864532 6,657E-05 0,003862085 0,010412568 0,003862085 0,010413
Observación Pronóstico para Y Residuos
1 0,568493814 0,2255029
2 0,546036036 0,1935164
3 0,610171944 0,1718594
4 0,559810924 0,2708065
5 0,467642383 0,278582
6 0,760477547 -0,1027431
7 0,499648904 0,215793
8 0,628893762 0,1515488
9 0,628823169 -0,0438451
10 0,467370773 0,1665182
11 0,534026211 0,1457961
12 0,500668424 0,1396619
13 0,545548675 0,0740559
14 0,660098266 -0,1110767
15 0,358902076 0,2695584
16 0,550847798 -0,0459643
17 0,573558377 0,0121835
18 0,547966522 -0,0284314
19 0,648250855 -0,1115054
20 0,344032474 0,1513221
21 0,568849266 -0,0364572
22 0,476250475 0,0349367
23 0,479786703 -0,0016217
24 0,477446173 -0,008016
25 0,493383302 0,0022053
26 0,569554219 -0,1657701
27 0,501580611 -0,0002375
28 0,557917886 -0,1437134
29 0,554277649 -0,0852937
30 0,580238361 -0,2445911
31 0,370656495 0,0429213
32 0,454503054 -0,0599411
33 0,43806938 -0,1036362
34 0,517431697 -0,2176606
35 0,33539583 0,0179383
36 0,541118312 -0,267683
37 0,440116739 -0,1729428
38 0,38674781 -0,1165341
39 0,374561123 -0,1694192
40 0,297292757 -0,0735154
41 0,266338952 -0,0854084
42 0,126604214 0,0378614
43 0,17641721 -0,0410027
44 0,14354321 -0,0271281
45 0,111046847 0,0236106
46 0,054890918 0,0581147
47 0,141680077 -0,0101414
48 0,188249668 -0,0733813
49 0,222176144 -0,0871146
50 0,186499196 -0,0495176
34
Numerador 1,1613
Denominador 0,9098
Por lo que dobservado=1,2765 y al 99% de confianza, con n=50 y k=3 se tiene:
dL 1.24
du 1.49
Cayendo en zona de indecisión por lo que finalmente la ecuación del modelo
de regresión está dada por:
�̂� = −1,1262 − 0,2385𝑋1 + 0,9750𝑋2 + 0,0071𝑋3
Conclusión:
El número de hijos que tiene durante su vida una mujer en el Ecuador,
depende de tres variables, es decir, la rama de actividad en la que labora, grupo de
actividad en la que realiza sus actividades y sueldo promedio que percibe.
Así que a continuación cada uno de las variables X1, X2 y X3 la plantearemos
como una ecuación de regresión lineal simple, para visualizar cómo se comporta
por separado cada una de ellas.
Gráfico 10. Comportamiento variable Sueldo, planteada como regresión lineal.
y = -7,7341x + 1048,4
0,000
200,000
400,000
600,000
800,000
1000,000
1200,000
1 11 21 31 41 51
Sueld
o p
erc
ibid
o
Observación
Comportamiento X1 - Sueldo
Sueldo o salario promedio Lineal (Sueldo o salario promedio)
35
Gráfico 11. Comportamiento variable Rama de actividad planteada como regresión lineal.
Gráfico 12. Comportamiento variable Grupo de actividad planteada como regresión lineal.
5.4. Selección del mejor modelo
Como las pruebas y procedimientos estadísticos previos permitieron
determinar que el número de hijos que tiene durante su vida una mujer en el
Ecuador, depende de tres variables, este es escogido como el mejor modelo de la
regresión y el cual está dado por la ecuación:
�̂� = −𝟏, 𝟏𝟐𝟔𝟐 − 𝟎, 𝟐𝟑𝟖𝟓𝑿𝟏 + 𝟎, 𝟗𝟕𝟓𝟎𝑿𝟐 + 𝟎, 𝟎𝟎𝟕𝟏𝑿𝟑
Por lo que ahora se estimará el comportamiento del número de hijos tenidos
por mujeres según los años.
y = 0,0155x + 8,8974
0,000
2,000
4,000
6,000
8,000
10,000
12,000
1 11 21 31 41 51
Sueld
o p
erc
ibid
o
Observación
Comportamiento X2 - Rama de actividad
Rama de Actividad Lineal (Rama de Actividad)
y = 0,024x + 6,0629
0,0000
2,0000
4,0000
6,0000
8,0000
10,0000
1 11 21 31 41 51
Sueld
o p
erc
ibid
o
Observación
Comportamiento X3 - Grupo de actividad
Grupo de actividad Lineal (Grupo de actividad)
36
Hipótesis
𝐻0: 𝐴 𝑚𝑒𝑑𝑖𝑑𝑎 𝑞𝑢𝑒 𝑝𝑎𝑠𝑎𝑛 𝑙𝑜𝑠 𝑎ñ𝑜𝑠 𝑑𝑖𝑠𝑚𝑖𝑛𝑢𝑦𝑒 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒𝑛 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑒𝑙 𝐸𝑐𝑢𝑎𝑑𝑜𝑟
𝐻1: 𝐴 𝑚𝑒𝑑𝑖𝑑𝑎 𝑞𝑢𝑒 𝑝𝑎𝑠𝑎𝑛 𝑙𝑜𝑠 𝑎ñ𝑜𝑠 𝑛𝑜 𝑑𝑖𝑠𝑚𝑖𝑛𝑢𝑦𝑒 𝑒𝑙 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑞𝑢𝑒 𝑡𝑖𝑒𝑛𝑒𝑛 𝑙𝑎𝑠 𝑚𝑢𝑗𝑒𝑟𝑒𝑠 𝑒𝑛 𝑒𝑙 𝐸𝑐𝑢𝑎𝑑𝑜𝑟
Para confirmar o desmentir esta hipótesis se realizará la siguiente regresión
lineal:
Años Y' Resumen
1960 0,7940 Estadísticas de la regresión1961 0,7396 Coeficiente de correlación múltiple0,9811380951962 0,7820 Coeficiente de determinación R^20,9626319621963 0,8306 R^2 ajustado 0,9618534611964 0,7462 Error típico 0,0422220961965 0,6577 Observaciones 50
1966 0,71541967 0,7804 ANÁLISIS DE VARIANZA
1968 0,5850 Grados de libertadSuma de cuadradosPromedio de los cuadradosF Valor crítico de F1969 0,6339 Regresión 1 2,2043513 2,2043513 1236,5202 6,412E-361970 0,6798 Residuos 48 0,0855699 0,00178271971 0,6403 Total 49 2,2899211
1972 0,61961973 0,5490 Coeficientes Error típico Estadístico t Probabilidad Inferior 95% Superior 95%Inferior 95,0%Superior 95,0%1974 0,6285 Intercepción 29,31514612 0,8211545 35,699916 3,186E-36 27,664104 30,966188 27,664104 30,9661881975 0,5049 Variable X 1 -0,014549997 0,0004138 -35,16419 6,412E-36 -0,015382 -0,013718 -0,015382 -0,013718
1976 0,58571977 0,51951978 0,53671979 0,4954 Análisis de los residuales1980 0,53241981 0,5112 Observación Pronóstico para Y Residuos1982 0,4782 1 0,797152781 -0,0031561983 0,4694 2 0,782602784 -0,043051984 0,4956 3 0,768052788 0,01397851985 0,4038 4 0,753502791 0,07711461986 0,5013 5 0,738952795 0,00727161987 0,4142 6 0,724402798 -0,0666681988 0,4690 7 0,709852801 0,00558921989 0,3356 8 0,695302805 0,08513981990 0,4136 9 0,680752808 -0,0957751991 0,3946 10 0,666202812 -0,0323141992 0,3344 11 0,651652815 0,02816951993 0,2998 12 0,637102818 0,00322751994 0,3533 13 0,622552822 -0,0029481995 0,2734 14 0,608002825 -0,0589811996 0,2672 15 0,593452829 0,03500761997 0,2702 16 0,578902832 -0,0740191998 0,2051 17 0,564352835 0,0213891999 0,2238 18 0,549802839 -0,0302682000 0,1809 19 0,535252842 0,00149262001 0,1645 20 0,520702846 -0,0253482002 0,1354 21 0,506152849 0,02623922003 0,1164 22 0,491602852 0,01958432004 0,1347 23 0,477052856 0,00111212005 0,1130 24 0,462502859 0,00692742006 0,1315 25 0,447952863 0,04763582007 0,1149 26 0,433402866 -0,0296192008 0,1351 27 0,418852869 0,08249032009 0,1370 28 0,404302873 0,0099016
29 0,389752876 0,079231130 0,37520288 -0,03955631 0,360652883 0,05292532 0,346102886 0,048459133 0,33155289 0,002880334 0,317002893 -0,01723235 0,302452897 0,050881236 0,2879029 -0,01446837 0,273352903 -0,00617938 0,258802907 0,011410839 0,24425291 -0,03911140 0,229702914 -0,00592641 0,215152917 -0,03422242 0,20060292 -0,03613743 0,186052924 -0,05063844 0,171502927 -0,05508845 0,156952931 -0,02229646 0,142402934 -0,02939747 0,127852937 0,003685748 0,113302941 0,001565549 0,098752944 0,0363086
50 0,084202948 0,0527786
37
Se realiza la prueba de significancia con distribución Fisher y t-Student
según el caso y con un 95% de confianza se obtiene:
Ftabla=4,0426
ttabla=2,0106
Conclusión
Como Fobservado es mayor que Ftabla el modelo pasa el test, de igual forma
como tobservado es mayor que ttabla también pasa el test, por lo que la variable X1
(años) es una variable significativa para el modelo, y podríamos decir:
�̂� = 29,3151 − 0,0145𝑋1
Luego de esto se debería determinar si existe multicolinealidad pero como
solo tenemos una variable, se obvia este paso; y se realiza el test de Durbin Watson.
𝐻0: 𝜌 = 0
𝐻1: 𝜌 ≠ 0
Hipótesis
Se desea determinar si los datos presentan auto correlación igual a cero
(existe auto correlación) o distinta de cero (no existe auto correlación).
Y en base a la tabla de análisis residual realizada en la página 35, se obtiene
lo siguiente:
Numerador 0,185355
Denominador 0,085570
De esta forma el dobservado es:
dobservado=2,1661
Así con 99% confianza, n=50 y k=1 se tiene:
dL 1.32
du 1.40
38
Conclusión
Como dobservado es mayor que du y menor que 4- du no se rechaza H0. Es decir
que no existe autocorrelación. Por lo que en esta regresión es posible observar que
el modelo pasa el test y que los años son una variable significativa para estimar en
n° promedio de hijos que tiene una mujer de Ecuador durante su vida. Por ello, se
estima dicho número mediante regresión con su respectivo gráfico.
Gráfico 13. Proyección de fecundidad en Ecuador hasta 2023.
Año N° hijos
2010 0,9741702
2011 0,9600702
2012 0,9459703
2013 0,9318703
2014 0,9177703
2015 0,9036703
2016 0,8895703
2017 0,8754703
2018 0,8613703
2019 0,8472703
2020 0,8331704
2021 0,8190704
2022 0,8049704
2023 0,7908704
y = -0,0145x + 29,315
0
0,2
0,4
0,6
0,8
1
1,2
1,4
1,6
1,8
2
2010 2012 2014 2016 2018 2020 2022
n°
de
hij
os
Años
Estimacion del n° hijos fecundados por mujeres en el Ecuador
N° hijos Lineal (N° hijos)
39
6. Conclusiones finales
Se ha trabajado con los datos de VII Censo de Población y VI de Vivienda –
2010 del Ecuador, de esto se extrajo una muestra con la cual ha construido una
regresión lineal múltiple que ha permitido deducir que el número promedio que
tienen las mujeres en este país es explicado por la rama de actividad (Agricultura,
ganadería, silvicultura y pesca, Suministro de electricidad, gas, vapor y aire acondicionado,
Construcción, Comercio al por mayor y menor, entre otros), grupo de actividad (Directores y
gerentes, Técnicos y profesionales del nivel medio, Agricultores y trabajadores calificados, Oficiales,
operarios y artesanos, entre otros) y el sueldo promedio que perciben mensualmente las
mujeres.
Cuando la rama de actividad en la que se desempeña la mujer está
relacionada con el segmento artesanos, agricultura, personal de apoyo, o
segmentos altos según codificación de tabla 4 se notó que las mujeres son más
probables a tener mayor cantidad de hijos, situación que cambia cuando a pesar de
estar en este grupo se desarrollan como personal gerencial, directivo o de toma de
decisiones (tabla 6). Mientras que para mujeres con sueldo altos se evidencia que
tienen menor cantidad de hijos en comparación a aquellas que ganan menos.
Para probar la veracidad de este estudio se realizaron diversos análisis
estadísticos como el test de significancia de las variables, el cual determina si existe
una relación lineal entre la variable respuesta Y con alguna de las variables
regresoras X.; el test de Farrar-Glauber para determinar si las variables regresoras
se relacionan entre sí; y el test de Durbin Watson para determinar si existe
autocorrelación de los datos. En todos los casos al presentarse alguno de estos
inconvenientes se realizó la respectiva corrección mediante métodos estadísticos
estudiados.
Finalmente se estimó que para el año 2023 la tasa de fecundidad estará
cercana a 0,79 hijos por mujer, es decir, disminuye aprox. 500% con respecto a
40
datos de 1960 y un 350% aprox. al 1980. Situación ya acontecida en otros países,
por lo que es probable que pase mucho tiempo antes que la población ecuatoriana
sufra una transición demográfica notable.
41
7. Referencias bibliográficas
[1] K. Ishida, P. Stupp y J. Ordoñez, «Estancamiento de la disminución de la fecundidad
en el Ecuador,» 2010.
[2] I. Derpich, «Material de cátedra Métodos Multivariados,» 2013.
[3] R. Corporation, «¿Implosión demográfica? la baja fecundidad y las medidas tomadas
en la UE,» Research Brief, 2006.
[4] L. Jaramillo, «Descenso de la fecundidad humana de1950 a 2007,» University
Research CO, 2010.
[5] CEPAL, «Panorama social de America Latina,» 2011.
[6] L. Tercera, «Bono para incentivar el aumento de la natalidad,» LaTercera.com, Mayo
2013.
[7] C. Lanchimba y P. Medina, «Fecundidad en el Ecuador y su relación con el entorno
social y evolutivo,» Analítika, vol. 1, nº 1, pp. 27-51, 2011.
[8] D. Farrar y R. Glauber, «Multicolineality in regression analysis,» Economics and
Statist, nº 49, pp. 92-107, 1967.
[9] J. Durbin y G. Watson, «Durbin and Watson Test,» 1951.
[10] D. Cochrane y G. Orcutt, «Cochrane-Orcutt estimation,» 1949.
[11] E. Donoso, «Fecundidad en Chile: 2000-2008,» Revista Chilena de Obstetricia y
Ginecología, vol. 76, nº 3, pp. 135-137, 2011.
[12] A. Figueras, «Esponjas Marinas,» 2009. [En línea]. Available:
http://www.madrimasd.org/blogs/ciencia_marina/2009/03/31/115600.
[13] H. Ordoñez, «Sitio web del departamento de matemáticas y estadística. Universidad
Nacional de Colombia,» 23 01 2009. [En línea]. Available:
http://www.virtual.unal.edu.co/cursos/sedes/manizales/4030006/lecciones/capitulocu
atro/4_5_5.html.
[14] R. Arce, «Conceptos Básicos sobre la autocorrelación en el modelo básico de
regresión lineal,» Madrid, 2010.
44
Anexo 1. Diccionario de datos de variables del censo 2010 INEC
#N o mbre de la
ent idad
N o mbre de la
variableR ó tulo R ango A lias Grupo
1 CE11 Total País2 PROVIN Provincia de empadronamiento3 CANTON Cantón de empadronamiento4 PARROQ Parroquia de empadronamiento5 ZONA Zona Censal6 SECTOR Sector Censal7 VIVIENDA Vivienda8 HOGAR Hogar9 PERSONA Persona
9.1 P00 Número de orden de la persona en el hogar ene-50 Identificación9.2 P01 Sexo 01-feb SEXO General9.3 P02 Parentesco o relación con el/la jefe/a del 01-dic PARENT General9.4 P03 Edad 0-120 EDAD General9.5 GEDAD Grupos quinquenales de edad ene-22 General9.6 GRANEDAD Grandes grupos de edad 01-mar General9.7 P04M M es de nacimiento 01-dic General9.8 P04A Año de nacimiento 1890-2010 General9.9 P05 Tiene cédula de ciudadanía ecuatoriana 01-feb CEDULA General9.10 P06 Está inscrito en el Registro Civil 01-feb REGCIVIL General9.11 P07 Tiene seguro de salud privado 01-sep SEGPRIV General9.12 P08 Discapacidad permanente por más de un 01-sep DISCAP Discapacidad9.13 P091 Discapacidad Intelectual (Retardo mental) 01-sep DM ENTAL Discapacidad9.14 P092 Discapacidad Físico-M otora (Parálisis y 02-sep LISIADO Discapacidad9.15 P093 Discapacidad Visual (Ceguera) 03-sep CEGUERA Discapacidad9.16 P094 Discapacidad Auditiva (Sordera) 04-sep SORDERA Discapacidad9.17 P095 Discapacidad M ental (enfermedades 05-sep M ENTAL Discapacidad9.18 P10 Asiste actualmente a establecimiento de 01-sep Discapacidad9.19 P11L Lugar de nacimiento 01-mar LUGNAC M igración9.20 P11P Provincia de nacimiento ene-90 PRONAC M igración9.21 P11C Cantón de nacimiento 101-9004 CANNAC M igración9.22 P11PQ Ciudad o parroquia rural de nacimiento 10150-900451 PARNAC M igración9.23 P11A Año de llegada al Ecuador 1905-2010 ANLLEGA M igración9.24 P12L Lugar de residencia habitual 01-mar LUGVIV M igración9.25 P12P Provincia de residencia habitual ene-99 PROVIV M igración9.26 P12C Cantón de residencia habitual 101-9004 CANVIV M igración9.27 P12PQ Ciudad o parroquia rural de residencia 10150-900451 PARVIV M igración9.28 P13L Lugar donde vivía hace 5 años (Noviembre 01-abr LUGCIN M igración9.29 P13P Provincia donde vivía hace 5 años ene-99 PROCIN M igración9.30 P13C Cantón donde vivía hace 5 años 101-9999 CANCIN M igración9.31 P13PQ Ciudad o parroquia rural donde vivía hace 5 10150-999999 PARCIN M igración9.32 P141P El padre habla(ba) habitualmente idioma 01-ene Idiomas9.33 P141M La madre habla(ba) habitualmente idioma 01-ene Idiomas9.34 P142P El padre habla(ba) habitualmente idioma 02-feb Idiomas9.35 P142M La madre habla(ba) habitualmente idioma 02-feb Idiomas9.36 P143P El padre habla(ba) habitualmente idioma 03-mar Idiomas9.37 P143M La madre habla(ba) habitualmente idioma 03-mar Idiomas9.38 P144P El padre no habla(ba) habitualmente ningún 04-abr Idiomas9.39 P144M La madre no habla(ba) habitualmente ningún 04-abr Idiomas9.40 P151 Habla idioma Indígena 01-feb Idiomas9.41 P151C Idioma Indígena que habla ene-88 LENGUA Idiomas9.42 P152 Habla idioma Catellano/Español 02-feb Idiomas9.43 P153 Habla idioma Extranjero 03-mar Idiomas9.44 P154 No habla ningún Idioma 04-abr Idiomas9.45 P16 Auto identificación según su cultura y 01-ago ETNIA Etnia9.46 P17 Nacionalidad o Pueblo Indígena al que ene-99 NACIONA Etnia9.47 P181 Niño(a) participa en Programa del INFA 01-ene Infantes9.48 P182 Niño(a) participa en Programa del 02-feb Infantes9.49 P183 Niño(a) participa en Programa de Centro 03-mar Infantes9.50 P184 Niño(a) participa en Programa de Centro 04-abr Infantes9.51 P185 Niño(a) participa en Otro programas 05-may Infantes9.52 P186 Niño(a) le cuida la madre, el padre, familiares 06-sep Infantes9.53 P187 Niño(a) le cuida familiares o conocidos 07-sep Infantes9.54 P19 Sabe leer y escribir 01-feb ALFAB Educación9.55 P20T En los últimos seis meses ha utilizado 01-sep CELULAR Tics9.56 P20I En los últimos seis meses ha utilizado 01-sep INTERNET Tics9.57 P20C En los últimos seis meses ha utilizado 01-sep PC Tics9.58 P21 Asiste actualmente a un establecimiento de 01-feb ASISTE Educación9.59 P22 Establecimiento de enseñanza regular al que 01-abr Educación9.60 P23 Nivel de instrucción más alto al que asiste o ene-99 NIVINS Educación9.61 P24 Grado, curso o año más alto que asiste o 01-oct GRADO Educación9.62 GRAESC Grados de escolaridad (Sistema Actual) 0-25 Educación9.63 GRAESCSA Grados de escolaridad (Sistema Anterior) 0-30 Educación9.64 P25 Tiene título de ciclo postbachillerato, 01-sep TIENTIT Educación9.65 P26 Título de ciclo postbachillerato, superior o 1-999 TITUNI Educación9.66 P27 Qué hizo la semana pasada 01-jul HISEM P Trabajo9.67 P28 Si NO ha trabajado 01-jul ALOM EJOR Trabajo9.68 TIPOACT Tipo de actividad ene-13 Trabajo9.69 RAM ACT Rama de actividad (Primer nivel) ene-23 RAM A2 Trabajo9.70 GRUOCU Grupo de ocupación (Primer Nivel) 01-dic OCUP2 Trabajo9.71 P31 Categoría de ocupación 01-sep CATOCU Trabajo9.72 CATOCUP Categoría de ocupación 01-oct Trabajo9.73 P32 Número de horas trabajadas 1-140 HORAS Trabajo9.74 P33 Trabajo dentro o fuera del hogar 01-sep Trabajo9.75 P34 Estado conyugal 01-jun ESTCIV General9.76 P35 Aporte o afiliación a la Seguridad Social 01-sep AFILIADO General9.77 P36 Total de hijos e hijas nacidos vivos tenidos 0-99 HIJVIV Fecundidad9.78 P36H Total de hijos nacidos vivos 0-99 HVTOTHO Fecundidad9.79 P36M Total de hijas nacidas vivas 0-99 HVTOTM UJ Fecundidad9.80 P37 Total de hijos e hijas que están vivos 0-99 HVIACT Fecundidad9.81 P38 A que edad tuvo su primer hijo o hija nacido dic-99 HVEDAD Fecundidad9.82 P39A En que año tuvo su último hijo o hija nacido 1920-9999 ANULTHIJ Fecundidad9.83 P39M En qué mes tuvo su último hijo o hija nacido ene-99 M ESNAC Fecundidad9.84 P40 Esta vivo el último hijo o hija nacido vivo 01-sep ULTVIV Fecundidad