Explotación de datos

8
Universidad Nacional del Oeste Asignatura: Explotación de Datos Cod. de materia: 07046 Carrera: Licenciatura en Informática Cod. de carrera: 288 Ciclo académico: Superior Año de la carrera: 3er Horas de clases Semanales: Teóricas: 1 Prácticas: 3 Régimen de Cursado: Cuatrimestral correspondiente al 2do Cuatrimestre de 3er año Observaciones: v Cuerpo Docente/s Responsable: Dejean Gustavo Profesores: Auxiliares: Espacios Curriculares Correlativos Precedentes Aprobada/s Cod. Asig. Cursada/s y regularizada/s Cod. Asig. Base de Datos II 07042 Espacios Curriculares Correlativos Subsiguientes Nómina Cod. Asig. Práctica Profesional 07057

Transcript of Explotación de datos

Page 1: Explotación de datos

Universidad Nacional del Oeste

Asignatura: Explotación de Datos

Cod. de materia: 07046

Carrera: Licenciatura en Informática Cod. de carrera: 288

Ciclo académico: Superior Año de la carrera: 3er Horas de clases Semanales: Teóricas: 1 Prácticas: 3 Régimen de Cursado: Cuatrimestral correspondiente al 2do Cuatrimestre de 3er año

Observaciones:

v

Cuerpo Docente/s Responsable: Dejean Gustavo Profesores: Auxiliares:

Espacios Curriculares Correlativos Precedentes

Aprobada/s Cod. Asig. Cursada/s y regularizada/s Cod. Asig.

Base de Datos II 07042

Espacios Curriculares Correlativos Subsiguientes

Nómina Cod. Asig.

Práctica Profesional 07057

Page 2: Explotación de datos

1 - FUNDAMENTACIÓN

La disponibilidad de grandes volúmenes de información y de herramientas de software, han permitido que en la actualidad, las técnicas de Explotación de Datos sean utilizadas en casi todos los campos disciplinares, tanto en las Ciencias exactas como en las Ciencias sociales y en aplicaciones comerciales. Solo por citar algunos ejemplos podemos nombrar las siguientes áreas: Medicina, Biología, Sociales, Astronomía, aplicaciones comerciales como ser: Entidades financieras, Bancarias, de Seguros, en Seguridad y análisis de mercados. Por este motivo, es importante que el alumno pueda manejar: los conceptos y técnicas más habituales de la explotación de Datos, el software apropiado y el análisis de los resultados o Modelos obtenidos.

2 – OBJETIVOS GENERALES

* Conocer las principales técnicas de Explotación de Datos. * Saber aplicar las técnicas necesarias para poder extraer conocimiento oculto contenido en la Información a partir de un conjunto de datos.

3 – OBJETIVOS ESPECÍFICOS

* Manejar con práctica las herramientas de software más comunes utilizadas en la Industria.

*Dominar las técnicas de análisis de componentes principales.

* Saber analizar, usando técnicas de regresión, un conjunto de datos.

4 – CONTENIDOS MÍNIMOS

El proceso de extracción del conocimiento. Técnicas de minería de datos predictivas y descriptivas. Análisis exploratorio, tipos de gráficos. Calidad de los datos. Transformación de datos. El modelo lineal. Análisis discriminante. Árboles de decisión. Métodos de agrupamiento.

5 – PROGRAMA ANALÍTICO

Unidad I Introducción al concepto de explotación de Datos. El proceso de extracción del conocimiento. Técnicas de Minería de Datos. Unidad II Estadística descriptiva Tipos de variables: cualitativas y cuantitativas. Tablas de simple y doble entrada. Análisis exploratorio de datos. Tipos de gráficos: histogramas, tortas, polígonos, diagramas de tallo-hoja, diagramas de dispersión. Estadísticos de tendencia central y dispersión. Limpieza y transformación de datos. Unidad III El Modelo de regresión lineal simple Estimación de los parámetros β0 y β1 por mínimos cuadrados. Propiedades de los estimadores por mínimos cuadrados. Estimación de σ. Prueba de hipótesis de la pendiente y de la ordenada al origen: Uso de pruebas t. Prueba del significado de la

Page 3: Explotación de datos

regresión, Análisis de varianza. Intervalos de confianza de β0, β1 y σ. Predicción de nuevas observaciones. Algunas consideraciones sobre el uso de la regresión. Regresión por el origen. Estimación por máxima verosimilitud. Unidad IV Regresión lineal múltiple Estimación de los coeficientes de regresión por mínimos cuadrados. Inadecuación de los diagramas de dispersión. Pruebas de Hipótesis. Predicción de nuevas observaciones. Multicolinealidad. Comprobación de la adecuación del Modelo. Diagnóstico para balanceo e influencia. Unidad V Análisis Discriminante Hipótesis en el modelo discriminante. Estimación del modelo. Clasificación mediante el modelo discriminante. Unidad VI Métodos de agrupamiento Técnicas descriptivas y predictivas de clasificación. Agrupamientos jerárquicos. El dendograma en el análisis del agrupamiento jerárquico. Agrupamiento no jerárquico de K-medias. Unidad VII Árboles de decisión Árboles de decisión como técnica predictiva de clasificación. Características de los árboles de decisión. Árboles de decisión como técnica de segmentación. Método Chaid.

6 – CRITERIOS DE EVALUACIÓN

El alumno deberá conocer y sabe aplicar, usando el software necesario, las técnicas más habituales de la minería de datos a un

conjunto de datos.

7- METODOLOGÍA DE TRABAJO PARA LA MODALIDAD PRESENCIAL (explicar el desarrollo general de la materia)

La actividad curricular constará de clases teórico-prácticas y principalmente de laboratorio. Cada tema teórico será abordado en clase brindando ejemplos de aplicación; posteriormente, se realizará análisis de datos utilizando el software necesario. Los TTPP especiales deberán ser resueltos de a pares de alumnos. Las técnicas y recursos didácticos empleados serán: Exposición oral por parte del profesor con abundante formulación de preguntas y seleccionando convenientemente las respuestas dadas por los alumnos. Exposición usando presentaciones o directamente usando el software proyectado con cañon. Trabajos grupales, resolución de un caso real. (trabajo práctico especial) Consultas (personalizadas y/o públicas). Utilización del software disponible. Utilización de INTERNET como un medio habitual para la búsqueda de respuestas a consultas, bajar bibliotecas, software y como

medio de comunicación con los proveedores de software.

8- ACREDITACIÓN DE ALUMNOS PRESENCIALES

Parciales Se tomarán un parcial según figura en el cronograma. Podrán rendir examen parcial todos los alumnos que cumplan un 75 % de

asistencia al día del parcial. Los parciales corregidos serán entregados en mano a los alumnos, teniendo la posibilidad de realizar

preguntas sobre las correcciones efectuadas. Previamente a la entrega de los parciales corregidos, se explica brevemente la

solución a los problemas planteados haciendo hincapié en los puntos donde se observaron los errores más comunes. Se tomará un

único recuperatorio del parcial. Las evaluaciones se tomarán, en lo posible, en laboratorio con uso del software apropiado.

Page 4: Explotación de datos

Regularidad

Para regularizar la materia el alumno deberá aprobar el parcial, tener un 75% de presentismo y aprobar los TTPP especial

propuesto en clase. El régimen de promociones está completamente sujeto al reglamento de la UNO y es de público conocimiento.

Regularización Para regularizar la materia el alumno deberá aprobar el parcial, tener un 75% de presentismo y aprobar los TTPP especiales propuestos en clase. El régimen de promociones está completamente sujeto al reglamento de la UNO y es de público conocimiento. Aprobación Para poder rendir el examen final, el alumno deberá tener regularizada la materia. El final se aprueba con nota mayor o igual a 4.

Promoción: No aplica

9- METODOLOGÍA DE TRABAJO PARA LOS ALUMNOS EN EL SISTEMA DE ASISTENCIA TÉCNICO PEDAGÓGICO (Tutorías)

Se realizaran a lo largo de la cursada en forma planificada, y frente al pedido de los alumnos, distintas clases de consultas donde los alumnos pueden exponer sus dudas y los docentes clarificar esas dudas. Los alumnos cuentan además con la bibliografía, tanto obligatoria y optativa, así también como una guía de ejercicios de referencia.

10- ACREDITACIÓN DE ALUMNOS NO PRESENCIALES ( Alumnos oyentes)

Regularización: Para regularizar la materia el alumno deberá aprobar el segundo parcial (en 1ra o en 2da instancia) y tener los 3 TTPP especiales aprobados. El régimen de promociones está completamente sujeto al reglamento de la UNO y es de público conocimiento. La evaluación se aprueba con nota mayor o igual a cuatro sobre una escala de diez puntos. Los días de evaluación serán los mismos días que rigen para los alumnos presenciales. Aprobación Final Para poder rendir el examen final, el alumno deberá tener regularizada la materia. El final se aprueba con nota mayor o igual a 4

sobre una escala de 10.

4.Promoción No aplica

11- METODOLOGÍA DE TRABAJO SUGERIDA PARA EL APRENDIZAJE AUTOASISTIDO: ALUMNOS LIBRES.

Instalar el software utilizado en la cátedra. Resolver todos los ejercicios de la guía de TTPP. Se recomienda asistir a las clases de consultas a realizar durante el cuatrimestre.

12- ACREDITACIÓN DE ALUMNOS LIBRES

Se deberá desarrollar un proyecto similar a los que realizan los alumnos presenciales. Las consignas para este proyecto se deberán solicitar con al menos una anticipación de 30 días a la fecha del examen final. El Proyecto se deberá entregar y defender con al menos una anticipación de 7 días a la fecha del examen final. La entrega y defensa exitosa del Proyecto habilitará para rendir un examen teórico en una única oportunidad. El examen teórico versará sobre la totalidad del contenido de la materia.

Page 5: Explotación de datos
Page 6: Explotación de datos

13- BIBLIOGRAFÍA

Apellido/s Nombre/s

Año Edición

Título de la Obra Capítulo/

Tomo Lugar de Edición

Editorial Unidad Biblioteca PMB

Otr UNO

Montgomery – Peck – Vining Dallas E. Johnson Pérez Lopez, César

2006 2000 2008

Introducción al análisis de Regresión Lineal Métodos Multivariados Aplicados al análisis de Datos Minería de Datos

1 al 6 7 al 9

Compañía Editorial Continental International Thomson Editores. Thomson.

Libros (Bibliografía Complementaria)

Apellido/s Nombre/s

Año Edición

Título de la Obra Capítulo/

Tomo Lugar de Edición

Editorial Unidad Biblioteca PMB

Otro UNO

Artículos de Revistas

Apellido/s Nombre/s Tomo-vol Título de la

Revista Título del Artículo Fecha Unidad Biblioteca

PMB Otro

UNO

Recursos de Internet

Autor/es Apellido/s Auto/es

Nombre/ s Título Datos Adicionales Disponibilidad / Dirección Electrónica

Page 7: Explotación de datos

14- CALENDARIZACIÓN DE LA PROPUESTA (expresar en semanas).

Cronograma 1º clase: Unidad 1

2º clase: Unidad 2

3º clase: Unidad 2 - entrega del TP especial nro 1

4º clase: Unidad 3

5º clase: Unidad 3

6º clase: Unidad 3

7º clase: Unidad 4

8º clase: Unidad 4 - entrega del TP especial nro 2

9º clase: Unidad 5

10º clase: Unidad 5 - entrega del TP especial nro 3

11º clase: Unidad 6

12º clase: evaluación Parcial.

13º clase: Unidad 6

14º clase: recuperatorio

15º clase: Unidad 7 - firma de libretas.

Page 8: Explotación de datos

15- VIGENCIA DE PROGRAMA

Año Firma del Profesor Responsable Aclaración Firma

2015

Fecha

16- Observaciones

VISADO

División/Jefe de Cátedra

Departamento Escuela

Fecha: Fecha: Fecha:

Formulario: A001 DGGA