UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial...

24
UNIVERSIDAD DE EL SALVADOR. FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA. ESCUELA DE MATEMÁTICA. CARRERA: MAESTRÍA EN ESTADÍSTICA. ANTEPROYECTO DE TESIS PARA OPTAR AL GRADO DE MAESTRO EN ESTADÍSTICA. TÍTULO DE TESIS: COMPARACIÓN ENTRE EL ANÁLISIS DISCRIMINANTE Y LA REGRESIÓN LOGÍSTICA EN LA CLASIFICACIÓN DE UNA COLONIA DE CANGREJOS HERRADURA (Limulus polyphemus). ASESORES: INTERNO: Dr. JOSÉ NERYS FUNES TORRES. Profesor de la UES. EXTERNO: Dr. JOSÉ MIGUEL GARCÍA-SANTESMASES MARTÍN-TESORERO. Profesor de la UCM de España. ESTUDIANTE: Lic. RENÉ ARMANDO PEÑA AGUILAR. 1

Transcript of UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial...

Page 1: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

UNIVERSIDAD DE EL SALVADOR.FACULTAD DE CIENCIAS NATURALES Y MATEMÁTICA.

ESCUELA DE MATEMÁTICA.

CARRERA:

MAESTRÍA EN ESTADÍSTICA.

ANTEPROYECTO DE TESIS PARA OPTAR AL GRADO DE MAESTRO EN ESTADÍSTICA.

TÍTULO DE TESIS:

COMPARACIÓN ENTRE EL ANÁLISIS DISCRIMINANTE Y LA REGRESIÓN LOGÍSTICA EN LA CLASIFICACIÓN DE UNA COLONIA DE CANGREJOS

HERRADURA (Limulus polyphemus).

ASESORES:

INTERNO: Dr. JOSÉ NERYS FUNES TORRES. Profesor de la UES.

EXTERNO: Dr. JOSÉ MIGUEL GARCÍA-SANTESMASES MARTÍN-TESORERO. Profesor de la UCM de España.

ESTUDIANTE: Lic. RENÉ ARMANDO PEÑA AGUILAR.

CIUDAD UNIVERSITARIA, NOVIEMBRE DE 2009.

1

Page 2: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

Tabla de contenido.

1. Introducción....................................................................................................................3

2. Justificación...................................................................................................................6

3. Planteamiento del Problema...................................................................................8

4. Objetivos.........................................................................................................................9

4.1. Objetivo general.....................................................................................9

4.2. Objetivos específicos..............................................................................9

5.Marco teórico...............................................................................................................10

5.1 Análisis Discriminante en Poblaciones Desconocidas.......................10

5.2 Modelos Lineales Generalizados.........................................................11

6. Metodología.................................................................................................................14

7. Cronograma de actividades...................................................................................16

8. Bibliografía..................................................................................................................16

2

Page 3: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

1. Introducción.

El desarrollo de este trabajo de tesis estará direccionado al estudio de la efectividad de

clasificación entre los métodos “Análisis Discriminante”, que consiste en ubicar a los

individuos en una determinada población con base a características medibles y observadas

en los individuos; y la “Regresión Logística”, que se utiliza para estimar las probabilidades

de que un individuo pertenezca a un determinado grupo dado que las características de ese

individuo han tomado ciertos valores concretos. Estas técnicas serán aplicadas a un

conjunto de variables que representan características cualitativas y cuantitativas de una

muestra de 173 animales marinos cuyo nombre científico es Limulus polyphemus,

comúnmente conocidos como “cangrejo herradura” y el número de individuos satélites que

tiene cada cangrejo herradura hembra. En lo que sigue utilizaremos el nombre “cangrejo

herradura” para referirnos a Limulus polyphemus.

Cada cangrejo herradura hembra tiene en su nido un cangrejo macho. Las características del

cangrejo hembra que trataré en este trabajo como es el color, el estado de las espinas, el

peso y el ancho de la caparazón, se piensa que pueden explicar la presencia a su alrededor

de otros cangrejos machos que la persiguen llamados “individuos satélites”.

Se utilizará la teoría de los Modelos Lineales Generalizados para tratar los modelos

particulares, el de regresión logística y el modelo de regresión de Poisson. El primer

modelo se utilizará para predecir la probabilidad de que un cangrejo herradura hembra

tenga individuos satélites y el segundo modelo para predecir el número de individuos

satélites que puede tener un cangrejo herradura hembra dado que las variables de sus

características han tomado ciertos valores.

Los métodos estadísticos utilizados en esta investigación pueden ser aplicados en cualquier

estudio de clasificación de individuos, siempre que se disponga de la información

necesaria.

Para finalizar esta introducción, realizaremos una descripción más detallada del cangrejo de

herradura.

3

Page 4: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

El cangrejo herradura, también conocido como ostrorep, cangrejo cacerola, cacerola de la

Molucas, cacerolita del mar, cangrejo del Japón, cangrejo bayoneta, tanquecito de mar,

cucaracha marina, es un artrópodo quelicerado. A pesar de sus sobre nombres, esta especie

está más próxima a las arañas que a los cangrejos propiamente dichos.

Algunas imágenes del cangrejo herradura son:

4

Page 5: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

Clasificación científica del cangrejo herradura.

Clasificación científicaReino: AnimaliaFilo: ArthropodaSubfilo: ChelicerataClase: MerostomataOrden: XiphosuraFamilia: LimulidaeGénero: LimulusEspecie: L. polyphemusNombre científico Limulus polyphemus

Tiene un cuerpo dividido en tres lóbulos divididos por surcos longitudinales y patas

ventrales de las que surgen apéndices y ojos compuestos, sus hábitos son aún desconocidos

para muchos biólogos marinos.

El cangrejo herradura se encuentra normalmente en el Golfo de México y a lo largo de las

costas del Atlántico Norte. Puede alcanzar los 50 cm, y se alimenta de moluscos, gusanos y

otros invertebrados. Pasa gran parte de su vida enterrado en la arena, donde captura a sus

presas.

En el campo de la medicina, el cangrejo herradura sirve para el test LAL que es una prueba

de detección de pirógenos en Lisado de Amebocitos de Limulus(Un pirógeno es cualquier

agente productor de fiebre, es decir, sustancias que actuando sobre los centros

termorreguladores del hipotálamo producen un aumento de temperatura). Es muy útil para

garantizar que vacunas y otros preparados parenterales estén exentos de pirógenos. Además

supone una ventaja frente a los métodos antiguos que se basaban en medir el incremento de

la temperatura rectal de un conejo tras la administración del pirógeno (hay que proteger a

los animales de experimentación).

5

Page 6: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

2. Justificación.

El problema de la clasificación de individuos en una u otra población no es un proceso

sencillo. El Análisis Discriminante es muy útil cuando se tiene información de los

individuos que permite clasificarlos por grupos. Otro método es el de clasificación a través

de la Regresión Logística, esta técnica es útil cuando hay información de los individuos que

permitan determinar la probabilidad de pertenencia a un determinado grupo.

A nivel de nuestro país, las investigaciones estadísticas utilizan muy poco los métodos

avanzados del Análisis Multivariante y los modelos lineales generalizados para el análisis

de datos. Este hecho se debe a que dichos métodos, a pesar de ser importantes, son de

escaso dominio a nivel de Licenciatura en Estadística o áreas afines. Son temáticas que se

desarrollan en estudios de postgrado en el campo de la Estadística, por lo que se conoce

muy poco en nuestro país.

Uno de los propósitos de utilizar los dos métodos de clasificación (Análisis Discriminante y

Regresión Logística) es estudiar si existen diferencias en cuanto a la efectividad de

clasificación entre ambos métodos, para ello, se aplicaran a una base de datos de una

muestra de 173 cangrejos herradura hembra e individuos satélites. Los datos fueron

obtenidos del libro Categorical Data Analysis, en dicho libro, se han realizado otros tipos

de análisis con los datos antes descritos, pero ningún análisis similar al que se pretende

realizar para resolver el problema planteado en este trabajo de investigación.

Además, se utilizarán los modelos lineales generalizados, concretamente los modelos de

regresión logística y regresión de Poisson, para estimar la probabilidad de que un cangrejo

herradura hembra tenga individuos satélites y el número de individuos satélites en el

cangrejo hembra respectivamente para conocer las peores características de atractividad en

el cangrejo herradura hembra y, proteger los cangrejos con dichas características para

obtener reproducción y evitar su extinción.

6

Page 7: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

Obviamente, el conocer y aplicar los diferentes métodos avanzados del Análisis

Multivariante y los modelos lineales generalizados para el análisis estadístico de datos me

ayudará al desempeño docente, de igual manera puede ser de gran utilidad para cualquier

investigador que tenga interés de conocer estos métodos y su utilidad. Concretamente, en el

trabajo de formar futuros profesionales en el área de la estadística con mejor calidad para

resolver problemas que demanda nuestro medio social. Al mismo tiempo, como docente del

área de estadística debemos especializarnos cada día más con el fin de facilitar en el futuro

la participación en una transformación curricular de la carrera en estadística que la lleve a

un buen nivel competitivo internacionalmente.

También, es de mencionar que en la Licenciatura en Estadística sólo se tiene una asignatura

de Análisis Multivariante en la cual no se desarrolla la comparación entre métodos de

clasificación de individuos, como el Análisis Discriminante y la Regresión Logística.

Además, a nivel de la Licenciatura en Estadística, en el área del Análisis Multivariante, se

ha hecho únicamente la tesis titulada “Los Métodos Estadísticos Multivariados y sus

Aplicaciones. Una guía para su estudio”, la que consiste en la elaboración de un texto que

sirva de apoyo al estudio de los métodos multivariados. Se presenta una sistematización de

los métodos multivariados por separado, sin llegar a hacer un análisis de la aplicación de

cada uno de ellos. Esta investigación se realizó con el objetivo de servir a los estudiantes de

las carreras afines con la estadística.

A nivel de la Maestría en Estadística, en el área de Modelos Lineales Generalizados, se ha

hecho únicamente la tesis titulada “Construcción de un Modelo de Regresión Logístico

Sobre la Oferta Laboral a Jefes(as) de Hogares en El Salvador”, la que consiste en

determinar las probabilidades de que un(a) jefe(a) de hogar se encuentre desocupado(a) a

partir del conocimiento de variables socio-económicas y demográficas. Sin embargo, no se

presenta ningún otro método de clasificación de individuos, para conocer la efectividad

entre ellos.

Bajo estas premisas, en el presente trabajo se hará una aplicación de los métodos: Análisis

Discriminante y Regresión Logística, para la clasificación de individuos. Luego se hará un

7

Page 8: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

estudio de la efectividad de clasificación de ambos métodos, para concluir cual de los

métodos proporciona mejores resultados en esta investigación. Por otra parte, en la

Universidad de El Salvador no se ha realizado ninguna investigación de este tipo, por lo

cual, se justifica el desarrollo de este trabajo de investigación.

3. Planteamiento del Problema.

Para el estudio se tendrán en cuenta cuatro características del cangrejo de herradura hembra

que son relevantes en el número de individuos satélites.

Donde

La variable respuesta será Yi que cuenta el número de individuos satélites en el i-ésimo

cangrejo hembra, que puede tomar los valores 0, 1, 2, 3,. . . . , y por ello podría pensarse en

modelarse como una variable aleatoria de Poisson.

El problema del presente trabajo está formado por los siguientes tres puntos:

1. Determinar entre los métodos de clasificación “Análisis Discriminante” y “Regresión Logística” el que mejor clasifica los vectores para la muestra de los 173 cangrejos herradura hembra.

8

Page 9: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

2. Ajustar y validar un modelo lineal generalizado de Poisson para predecir el número de individuos satélites en el cangrejo herradura hembra, dado que su vector de características ha tomado ciertos valores. Esto se hará con la finalidad de estudiar las características del cangrejo herradura hembra que la hacen menos atractiva ante los individuos satélites y, tomar medidas de protección para su reproducción y evitar su extinción.

3. Ajustar y validar un modelo lineal generalizado de regresión logística para predecir la probabilidad de que un cangrejo herradura hembra tenga individuos satélites dado que su vector de características ha tomado ciertos valores.

4. Objetivos.

4.1. Objetivo general.

Clasificar si el cangrejo herradura hembra tiene individuos satélites utilizando el Análisis

Multivariante y Modelos Lineales Generalizado, además se verificará la efectividad de

clasificación de ambos métodos.

4.2. Objetivos específicos.

1. Estudiar y comprender lo que se necesita de la teoría de los Modelos Lineales

Generalizados para tratar los modelos logísticos y de Poisson.

2. Estudiar y aplicar la teoría sobre la clasificación estadística de datos, concretamente

los métodos de Análisis Discriminante y de Regresión Logística.

3. Determinar la efectividad de los métodos de clasificación “Análisis Discriminante” y la “Regresión Logística” aplicando dichos métodos a los datos vectoriales

observados en la muestra de 173 cangrejos herradura hembra e individuos satélites.

4. Explicar el número de individuos satélites a partir de las variables color, estado de

las espinas, peso y anchura del caparazón del cangrejo herradura hembra a través

del modelo lineal generalizado de Poisson.

5. Estimar la probabilidad de que un cangrejo herradura hembra tenga individuos

satélites a partir de las variables color, estado de las espinas, peso y anchura del

9

Page 10: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

caparazón del cangrejo herradura hembra a través del modelo lineal generalizado de

regresión logística.

6. Diseñar una metodología que ayude a la comprensión de los métodos de

clasificación aquí tratados y de la aplicación de Modelos Lineales Generalizados

para que sea utilizada por futuros profesionales de las carreras en Estadística.

5. Marco teórico.

En esta sección realizaremos un breve resumen del Análisis Discriminante y de los modelos

lineales generalizados con énfasis en los modelos de regresión logísticos y de Poisson, dado

que estas serán las técnicas estadísticas utilizadas en el estudio.

5.1 Análisis Discriminante en Poblaciones Desconocidas.

Partimos de que tenemos poblaciones posibles. Como caso particular, la clasificación clásica es para . La matriz general de datos , de dimensión , ( individuos y

variables), puede considerarse ahora en matrices, correspondientes a las subpoblaciones. Vamos a llamar a los elementos de estas submatrices, donde

representa el individuo, la variable y el grupo o submatriz. Llamamos al número de elementos en el grupo y el número total de observaciones es:

.

Vamos a llamar al vector fila que contiene los valores de las variables para el individuo en el grupo . El vector de medias dentro de cada subpoblación será:

La matriz de varianzas covarianzas para los elementos de la subpoblación será:

10

Page 11: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

donde se ha dividido por para tener estimaciones centradas de las varianzas y covarianzas. Si suponemos que las poblaciones tienen la misma matriz de varianzas y covarianzas, su mejor estimación centrada con todos los datos será una combinación lineal de las estimaciones centradas de las matrices de covarianza en cada población, con peso proporcional a su precisión. Por tanto:

y llamaremos a la matriz de suma de cuadrados dentro de las subpoblaciones, la que podemos escribir como:

Para obtener la funciones discriminantes utilizamos como una estimación de , y como la estimación de la matriz de varianzas covarianzas poblacional . En concreto, suponiendo iguales las probabilidades a priori y los costos de clasificación, clasificaremos al elemento en el grupo que conduzca a un valor mínimo de la distancia de Mahalanobis entre el punto y la media del grupo . Es decir, clasificamos un nuevo elemento en aquella población donde

donde

Se complementaran más detalles en el desarrollo del trabajo.

5.2 Modelos Lineales Generalizados.

Consideremos particularmente una variable aleatoria univariante cuya distribución de probabilidades depende solamente del parámetro y es el parámetro de dispersión que se supone conocido o se estima. La distribución pertenece a la familia exponencial si puede escribirse en la forma

(I)

donde , son funciones conocidas para cada variable aleatoria .Si , se dice que la distribución está escrita en la forma canónica o estándar y

es llamada algunas veces el parámetro natural de la distribución.

11

Page 12: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

Si la variable aleatoria pertenece a la familia exponencial y tiene una distribución canónica o estándar, está puede escribirse de la forma

(II)

Sean variables aleatorias univariantes. Supongamos que las distribuciones de las variables , coinciden en la forma (por ejemplo, todas normales o todas binomiales o todas de Poisson, etc.) pero no necesariamente en el parámetro y que la función de densidad de cada es de la forma (II), es decir:

(III)

Para la especificación del modelo lineal generalizado no estamos directamente interesados en los parámetros , ya que hay tantos parámetros como observaciones . Al plantear un modelo lineal generalizado consideramos un conjunto reducido de parámetros

, de modo que una transformación de sea una combinación lineal de ellos; es decir,

donde

es una función monótona y diferenciable llamada nexo (del inglés, “linkfunction”).

son los valores que toman las variables explicativas, ,

en el individuo . Si la variable explicativa es continua (covariable), se utiliza una única variable . Si la variable explicativa es discreta (factor), se utilizan tantas variables como niveles tenga el factor. Tales variables artificiales (“dumy”, en inglés) sólo toman los valores de “1” y “0”. Si el individuo i-ésimo pertenece al nivel del factor, entonces la k-ésima variable artificial toma el valor de “1” y las restantes el valor “0”.

es el vector de de parámetros. Las covariables tienen un único parámetro asociado, mientras que los factores tienen tantos parámetros asociados como niveles.

En definitiva, un modelo lineal generalizado tiene tres componentes:

1. La componente aleatoria que consiste en variables de respuesta, , independientes con funciones de densidad de la forma (III).

12

Page 13: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

2. La componente sistemática consiste en el conjunto de los predictores lineales tales que

3. La tercera componente consiste en la función de enlace o nexo que conecta las componentes aleatoria y sistemática. Sea . El modelo enlaza

a por , es decir, . El nexo es

una función monótona y diferenciable.

La función de enlace o nexo que transforma la media a el parámetro natural es llamado el enlace canónico o nexo canónico. Esto es, y

.

Ejemplo 1. Si los siguen una distribución de Poisson, entonces

donde

Para el modelo lineal generalizado de Poisson y

Por tanto, , es decir,

Ejemlo 2. Si los siguen una distribución binomial con , entonces

13

Page 14: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

donde

Para el modelo lineal generalizado logístico , se tiene que

, y despejando se tiene:

Es decir,

Esta teoría se complementará más en el desarrollo del trabajo con la parte de estimación de

los parámetros e inferencia y validación de los modelos.

6. Metodología.

El procedimiento del desarrollo de este trabajo se basará en las siguientes fases:

FASE I.

En un primer momento se investigará, utilizando la bibliografía necesaria, cómo abordar las

técnicas de clasificación del Análisis Discriminante y la Regresión Logística.

14

Page 15: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

FASE II.

En segundo lugar se construirá las partes del Anteproyecto de tesis. Esta fase, se traslapa

en el tiempo con la fase I ya que, conforme se va disponiendo de la información

bibliográfica se van elaborando las partes del Anteproyecto.

FASE III.

En esta tercera fase se elaborará el primer capítulo que será una ampliación del marco

teórico señalado en este anteproyecto que fundamente las técnicas clásicas de clasificación

del Análisis Discriminante y de los modelos lineales generalizados, particularmente, el

modelo de regresión logística y el modelo de regresión de Poisson.

FASE IV.

En esta fase, se iniciará el segundo y último capítulo que contenga una aplicación de la

teoría descrita en el capítulo uno. Con el uso del SPSS se hará un análisis exploratorio de

las variables consideradas en esta investigación, y que se encuentran descritas en el

planteamiento del problema de este documento; posteriormente se tratará la clasificación de

la muestra de los 173 cangrejos herradura hembras con las técnicas de los métodos

Análisis Discriminante y Regresión Logística.

FASE V.

Siguiendo con el capitulo dos, con la ayuda del SPSS, se ajustaran los modelos lineales

generalizados de Poisson y logístico y un chequeo de sus validaciones, el modelo de

Poisson tendrá la finalidad de predecir el número de individuos satélites según algunos

factores característicos de atractividad del cangrejo herradura hembra y el modelo logístico,

la probabilidad de que un cangrejo herradura hembra tenga individuos satélites.

Esta fase finalizará con una comparación de la clasificación obtenida con los métodos

Análisis Discriminante y Regresión Logística, a fin de determinar el mejor método de

clasificación.

FASE VI.

15

Page 16: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

Esta última fase se dedicará a la escritura de la memoria.

7. Cronograma de actividades

En esta sección, hacemos una distribución por semanas de las actividades a realizar en cada una de las fases:

CALENDARIZACIÓN DE ACTIVIDADES2009-2010

MES SEPT OCT. NOV DIC ENE FEB MAR

Semana 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2 3 4 1 2

Fases

I

II

III

IV

V

VI

8. Bibliografía.1. Agresti, Alan. (2002), Categorical Data Analysis, segunda edición, John Wiley & Sons, United States of America.

2. Arriola, Balmes Amilcar; Rivera, Meiby Zulema. (2001), Los Métodos Estadísticos Multivariados y sus Aplicaciones. Una guia para su estudio, Universidad de El Salvador, tesis de Licenciatura en Estadística.

3. Christensen, Ronald. (1997), Log-Linear Models and Logistic Regression, second edition, Springer Verlag, United States of America.

4. Cuadras, Carles M. (2008), Nuevos Métodos de Análisis Multivariante, Universidad de Barcelona, España.

5. Dobson, Annette J. (2002), An introduction to generalized linear models, second edition, Chapman & Hall/crc, United States of America.

16

Page 17: UNIVERSIDAD DE EL SALVADOR - WordPress.com  · Web viewSi los siguen una distribución binomial con , entonces . donde Para el modelo lineal generalizado logístico , se tiene que,

6. Hardin, James W.; Hilbe, Joseph M. (2007), Generalized Linear Models and Extensions, second edition, Stata Press. United States of America.

7. Lindsey, James K. (1997), Applying Generalized Linear Models, Springer Verlag.

8. Lemus, Rolando; Lemus, Oscar Hernán. (2005), Construcción de un Modelo de Regresión Logístico Sobre la Oferta Laboral a Jefes(as) de Hogares en El Salvador, Universidad de El Salvador, tesis de Maestría en Estadística.

9. Peña, Daniel. (2002), Análisis de Datos Multivariante, primera edición, McGraw-Hill/Interamericana de España. También, destacar las siguientes direcciones en internet de las que también se sacó información:

http://es.wikipedia.org/wiki/Limulus_polyphemus

http://bvs.sld.cu/revistas/far/vol38_1_04/far08104.htm

http://es.wikipedia.org/wiki/Pir%C3%B3geno

http://images.google.com.sv/imgres?imgurl=http://bp1.blogger.com/_eRfFfCN7S1M/RnjuTy98IjI/AAAAAAAAAgY/Cy4CPSeBbug/s200/limul_kueste.jpg&imgrefurl=http://jaimegulindavila.blogspot.com/2007_06_01_archive.html&usg=__wRPQN8IXiPRGV0Jhv7ocO-12t-Y=&h=200&w=199&sz=18&hl=es&start=7&um=1&tbnid=ym-8zZtowuAuKM:&tbnh=104&tbnw=103&prev=/images%3Fq%3Damebocitos%26hl%3Des%26lr%3D%26rlz%3D1R2GGLL_es%26sa%3DX%26um%3D1

Nota: Nota: La última vez que se visitaron estas direcciones fue en octubre de 2009.

17