EstadisticaDescriptivaMultivariada-I-11

3
 1 2016365-1: Estad ´ ıstica descrip tiva multiv ariada Programa del curso I-11 Martes y jueves: 2 a.m. a 4 p.m. Campo El´ ıas Pardo E-mail: [email protected] Web: http://www.docen tes.unal.edu.co/cepardot/ Consu ltas: mar tes y juev es 16 a 18. Mi´ ercol es y viernes 11 a 12. Ocina : 404-325 4 cr´editos = 4 horas presenciales y 8 horas de traba jo del estudiante semanalmente. Prerrequisitos Para estud iantes de la Car rera de Estad´ ıstica:  ´ Algebra matricial Los estu diant es de la carre ra de estad ´ ıstic a aprov ech an mejor esta asignatura si han tomad o los cursos: Comunicaci´ on (espa˜ nol), Bases de datos, Dise˜ no y desarrollo de encuestas y Metodolog ´ ıa. Para estudiantes de otras carreras  Los cursos b´ asicos de estad ´ ıstica propios del plan de estudios.  El curso de matem´ aticas que contenga los temas de ´algebra lineal. Descripci´ on de la asignatura Aborda el an´ alisis descriptivo y exploratorio multivariado de tablas grandes de datos (muchas las y columnas). Recurre a la representaci´ on geom´etrica multidimensional de las tablas de datos y a su lectura mediante proyecciones en planos, denominados factoriales, y a la conformaci´on de grup os homog´eneos en el sentido de variabilidad baja dentro de los grupos y alta entre grupos. La s representaciones geom´ etricas permiten visualizar la informaci´ on relevante contenida en las tablas de datos. El aprendizaje se consolida mediante una aplicaci´ on real siguiendo las pautas de la metodolog ´ ıa de la investigaci´ on. El estudiante que curse la asignatura y cumpla con las exigencias acad´ emicas, po dr´ a: Aplic ar los m´ etodos empleand o programas de uso libre y comercial y utili zarlos en el cont exto de situ aci one s espec´ ıfica s. Abordar el aprendizaje de otros etodos de la estad ´ ıstica exploratoria multidimensional. Consolidar los conocimientos sobre metodolog ´ ıa de la investigaci´ on. Mejorar las destrezas en redacci´ on de textos, normas de presentaci´ on de trabajos escritos y de presentaci´ on oral de los resultados. Contenido 1. Intr oducci´ on (semana 1) etodo s es tad´ ısticos explor atorio s multidi mension ales (Lectura: introdu cci´ on de Lebart, Morineau & Piron (1995)). Lectura en l ´ ınea del manual de introducci´ on a R. 2. Repre sent aci´ on multivariada de datos. (semana 2) Repaso de espacios euclidianos multidimensionales (espacios vectoriales en n con producto in- terno). Representaci´ on geom´ etrica de tablas de datos. Signicado de las estad ´ ısticas b´asicas y de las operaciones de centrado y reducido. Inercia y contribuciones a la inercia de las y columnas. Proyecci´ on sobre cualquier eje. Contribuci´ on de las las y columnas a la inercia proyectadas sobre un eje. Calidad de la representaci´ on sobre un eje.

Transcript of EstadisticaDescriptivaMultivariada-I-11

5/11/2018 EstadisticaDescriptivaMultivariada-I-11 - slidepdf.com

http://slidepdf.com/reader/full/estadisticadescriptivamultivariada-i-11 1/3

1

2016365-1: Estadıstica descriptiva multivariada

Programa del curso I-11

Martes y jueves: 2 a.m. a 4 p.m.Campo Elıas Pardo E-mail: [email protected]: http://www.docentes.unal.edu.co/cepardot/

Consultas: martes y jueves 16 a 18. Miercoles y viernes 11 a 12. Oficina: 404-3254 creditos = 4 horas presenciales y 8 horas de traba jo del estudiante semanalmente.

Prerrequisitos

Para estudiantes de la Carrera de Estadıstica: Algebra matricial

Los estudiantes de la carrera de estadıstica aprovechan mejor esta asignatura si han tomado loscursos: Comunicacion (espanol), Bases de datos, Diseno y desarrollo de encuestas y Metodologıa.

Para estudiantes de otras carreras

• Los cursos basicos de estadıstica propios del plan de estudios.• El curso de matematicas que contenga los temas de algebra lineal.

Descripcion de la asignatura

Aborda el analisis descriptivo y exploratorio multivariado de tablas grandes de datos (muchas filas ycolumnas). Recurre a la representacion geometrica multidimensional de las tablas de datos y a su lecturamediante proyecciones en planos, denominados factoriales, y a la conformacion de grupos homogeneos enel sentido de variabilidad baja dentro de los grupos y alta entre grupos. Las representaciones geometricaspermiten visualizar la informacion relevante contenida en las tablas de datos. El aprendizaje se consolidamediante una aplicacion real siguiendo las pautas de la metodologıa de la investigacion.

El estudiante que curse la asignatura y cumpla con las exigencias academicas, podra:

Aplicar los metodos empleando programas de uso libre y comercial y utilizarlos en el contexto desituaciones especıficas.

Abordar el aprendizaje de otros metodos de la estadıstica exploratoria multidimensional.

Consolidar los conocimientos sobre metodologıa de la investigacion.

Mejorar las destrezas en redaccion de textos, normas de presentacion de trabajos escritos y depresentacion oral de los resultados.

Contenido1. Introduccion (semana 1)

Metodos estadısticos exploratorios multidimensionales (Lectura: introduccion de Lebart, Morineau& Piron (1995)). Lectura en lınea del manual de introduccion a R.

2. Representacion multivariada de datos. (semana 2)

Repaso de espacios euclidianos multidimensionales (espacios vectoriales en ℜn con producto in-terno). Representacion geometrica de tablas de datos. Significado de las estadısticas basicas y delas operaciones de centrado y reducido. Inercia y contribuciones a la inercia de filas y columnas.Proyeccion sobre cualquier eje. Contribucion de las filas y columnas a la inercia proyectadas sobreun eje. Calidad de la representacion sobre un eje.

5/11/2018 EstadisticaDescriptivaMultivariada-I-11 - slidepdf.com

http://slidepdf.com/reader/full/estadisticadescriptivamultivariada-i-11 2/3

2

3. Analisis en componentes principales - ACP. (semana3 a 5)

Objetivos del ACP. Espacio de los individuos. Espacio de las variables. Relaciones entre los dosespacios. Ayudas para la interpretacion de los ejes factoriales. Proyeccion de elementos ilustrativos.ACP generalizado. Analisis en coordenadas principales.

Primer parcial (marzo 15).

4. Analisis de correspondencias simples - ACS. (semana 6 a 8)

Objetivos del ACS Tablas obtenidas de la tabla de contingencia. Representacion geometrica de lastablas de perfiles. El ACS como dos ACP.

5. Analisis de correspondencias multiples - ACM. (semanas 9 a 11)

Objetivos del ACM. Codificaciones de las variables cualitativas. El ACM como el AC de la tabladisyuntiva completa. El ACM como el AC de la tabla de Burt. ACM y ACS en el caso de dosvariables.

Segundo parcial (abril 28)

6. Metodos de clasificacion (agrupamiento) (semanas 12 a 14)

Objetivos de los metodos de agrupamiento. Indices de similitud, disimilitud y distancia entre indivi-duos. Inercia intra y entre grupos. Clasificacion alrededor de centros moviles. Clasificacion jerarquicaaglomerativa. El metodo de Ward. Caracterizacion de las clases. Combinacion de metodos factorialesy de clasificacion.

Tercer parcial (mayo 24)

7. Presentacion de trabajos de aplicacion (semana 15 y 16, mayo 26 y 31 y junio 1).

Metodologıa

Este es un curso de aprendizaje asistido. Las clases se utilizan para aclarar dudas, presentar avancesde los trabajos y controlar el aprendizaje. Durante el curso se realizan varios talleres y es recomendable

hacerlos en grupo (los mismos del trabajo de curso). Los talleres no tienen calificacion pero se recomiendarealizarlos por escrito para adquirir destreza en la preparacion de informes utilizando las herramientasde edicion y las normas de presentacion de trabajos. El curso cuenta con un aula virtual donde se poneel programa los talleres, documentos del curso, enlaces de interes, etc.

R. Los paquetes de R que se utilizan en este curso son: FactoMineR, ade4 y FactoClass. Para evitarla proliferacion de virus y el uso mas eficiente de R se recomienda utilizar el sistema operativo Linux. Enla sala esta instalada la distribucion Ubuntu que es bastante amigable.

Software comercial

Este semestre disponemos del SPAD version 7 en ingles, instalado en la sala y se utilizara para lostalleres en clase (15 licencias simultaneas). Los estudiantes pueden utilizar cualquier software comercialpara los talleres y trabajos, siempre que la Universidad tenga licencia, tales como: SAS, SPSS, Xstat (enExcel).

Calificacion

Tres parciales 20 % c/u : 60.

Trabajo de investigacion utilizando los metodos aprendidos 40 %: propuesta: 10 % y final: 30 %. Eltrabajo se debe hacer en grupo de 3 estudiantes. Se recomienda usar LATEX con el tipo de documento\documentclass[report]{revcoles}. La plantilla esta disponible en:

http://www.docentes.unal.edu.co/eccubidesg/docs/LaTeX/Report.zip.

5/11/2018 EstadisticaDescriptivaMultivariada-I-11 - slidepdf.com

http://slidepdf.com/reader/full/estadisticadescriptivamultivariada-i-11 3/3

3

Textos guıa

Lebart et al. (1995), Escofier & Pages (1992) y Langrand & Pinzon (2009).

Documentos: Cabarcas & Pardo (2001), Pardo & Ortiz (2004), Pardo (2005, 2008), Bautista (1990),Bautista (1994), Morineau & Aluja (1994).

Referencias

Bautista, L. (1990), ‘Introduccion al analisis multivariado de datos’, Folleto Coloquio Distrital de Ma-tematicas y Estadıstica, Bogota.

Bautista, L. (1994), ‘Metodos de clasificacion’, Folleto Simposio de Estadstica [sobre] Analisis multiva-riado de datos, Bogota.

Benzecri, J. (1992), Correspondence Analysis Handbook , Marcel Dekker.

Cabarcas, G. & Pardo, C.-E. (2001), ‘Metodos estadısticos multivariados en investigacion social’, Simposio

de Estadıstica  .*http://www.docentes.unal.edu.co/cepardot/docs/SimposiosEstadistica/

Escofier, B. & Pages, J. (1992), An´ alisis factoriales simples y m´ ultiples. Objetivos, metodos e interpreta-

ci´ on , Universidad del Pais Vasco, Bilbao.

Greenacre, M. (2007), Correspondence Analysis in Practice, 2 edn, Chapman & Hall, Boca Raton, FL.

Jambu, M. (1983), Cluster Analysis and Data Analysis, North-Holland, Amsterdam.

Langrand, C. & Pinzon, L. M. (2009), An´ alisis de datos. Metodos y ejemplos, Editorial Escuela Colom-biana de Ingenierıa, Bogota.

Lebart, L., Morineau, A. & Piron, M. (1995), Statisitique exploratoire multidimensionnelle, Dunod, Paris.

Lebart, L., Morineau, A. & Warwick (1984), Multivariate Descriptive Statistical Analysis, Wiley, New

York.

Morineau, A. & Aluja, T. (1994), ‘Analisis de correspondencias’, Folleto Simposio de Estadstica [sobre]Analisis multivariado de datos, Bogota.

Pardo, C. E. (2005), Analisis de correspondencias de tablas de contingencia estructuradas, in  ‘MemoriasColoquio Distrital de Matematicas y Estadıstica’, Universidad Distrital, pp. 65–90.*http://www.docentes.unal.edu.co/cepardot/docs/ColoquioDistritalMatEst/AnalCorresTCE.pdf 

Pardo, C. E. (2008), ‘Geometrıa euclidiana en estadıstica: metodos en ejes principales’.*http://www.docentes.unal.edu.co/cepardot/docs/Conferencias/ACPgeometriaEuclidiana.pdf 

Pardo, C. E. & Ortiz, J. (2004), An alisis multivariado de datos en R, in  ‘Simposio de Estadıstica’,Universidad Nacional de Colombia. Departamento de Estadıstica, Cartagena.

*www.docentes.unal.edu.co/cepardot/docs/SimposiosEstadistica/PardoOrtiz04.pdf 

Pena, D. (2002), An´ alisis de datos multivariantes, McGraw-Hill, Madrid.