Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos...

10
1 R for Data Mining Análisis de datos, segmentación y técnicas de predicción con R Curso:

Transcript of Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos...

Page 2: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

2

R es el lenguaje de programación estadístico por excelencia. Se destaca porquees una de las herramientas estadísticas de mayor crecimiento. R es un software libre, altamente recomendable por lo robusto y potente de sus rutinas. En este curso, el estudiante será capaz de aplicar técnicas de reducción de variables y de entender la necesidad del uso de diversos modelos predictivos y algoritmos para predecir el comportamiento futuro de un objeto en estudio. Asimismo, el estudiante aprenderá algunas técnicas de calibración y selección del mejor modelo predictivo que se adecúe mejor a sus datos y objetivos de estudio.

Presentación

Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en herramientas de análisis de datos; profesionales que se desempeñen como investigadores o analistas de datos; personal de procesamiento de datos, business intelligence, analistas de datos, etc. Estudiantes de maestría y de pregrado provenientes de carreras profesionales como Estadística, Ingeniería Estadística, Ingeniería de Sistemas, Ingeniería Informática y carreras afines.

Dirigido a:

Page 3: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

3

MetodologíaEl curso se basa en la aplicación de casos prácticos fundamentados en la teoría.Se desarrollan ejercicios y aplicaciones basadas en situaciones reales.

Se dispone de: 9 Casos de aplicación, situaciones reales con aplicaciones en el mercado peruano. 9 Base de datos de prueba para aplicar lo aprendido. 9Material didáctico para el desarrollo del curso.

Conocimientos de estadística descriptiva, multivariante y distribuciones de probabilidad. Conocimientos del software R a nivel básico (exportar, importar, concepto de objetos, funciones básicas, gráficos, paquetes como Rattle y RCommander). De preferencia, haber llevado el curso R for Business Analytics.

Pre-requisitos:

Page 4: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

4

Beneficios 9 Certificado de especialización. 9 Pertenecer a la Comunidad más grande de profesionales de business analytics. 9 Plana docente compuesta por líderes del sector, especializados en herramientas y temas a

desarrollar. 9 Descuentos en programas complementarios. 9 Laboratorios de cómputo. 9 Material didáctico con el desarrollo del curso. 9 Acceso a bibliografía especializada. 9 Acceso a la bolsa de trabajo especializada de DMC.

• Rentabilidad única en el mercado laboral.• Desarrollo de pensamiento crítico y analítico.• Serás un profesional muy valorado en la actualidad.

Las empresas actuales están buscando profesionales que se diferencien en la gestión.Las ventajas competitivas que obtienes al estar en constante capacitación son muchas,entre las que destacamos:

Page 5: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

5

SyllabusI. Introducción a la minería de datos:

• Definición de minería de datos.• Modelos analíticos: modelos supervisados y no

supervisados.• Modelos de minería de datos: KDD, CRISP y SEMMA.

II. Técnicas de preparación de datos:• Limpieza de datos.• Métodos gráficos para identificar outliers y

extremos.• Manejo de datos atípicos.• Manejo de datos faltantes.• Transformación de datos.• Selección de variables.

III. Técnicas supervisadas, análisis de regresión logística:• Regresión logística binaria: modelo, estimación

de coeficientes, prueba de hipótesis, medidas de bondad de ajuste, interpretación de coeficientes y odds ratio.

IV. Indicadores para evaluación de modelos de clasificación:

• Matriz de confusión.• Estadístico Kappa.• Estadístico K-S.• Curva ROC.• Coeficiente Gini.• Log-Loss.

V. Técnicas de balanceo de datos:• Técnicas de balanceo de datos: undersampling,

oversampling, SMOTE.

VI. Árboles de clasificación y métodos de validación:• Algoritmo CART.• Bagging y Random Forest.• Métodos de validación: resustitución, validación cruzada,

train-test.

VIII. Reglas de asociación:• Canasta de compras.• Reglas de asociación: algoritmo apriori.

Page 6: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

IE Business School - Jacquelin Flor B.Jefe de Metodología y Herramientas de Riesgos.

Máster en Administración de Negocios (IE Business School, Madrid-España). Especialista en marketing relacional - UPC. Bachiller en Ingeniería Estadística - UNI. 6 años de experiencia

en la construcción de modelos estadísticos.

Ing. Jesús Walter Salinas F.Ingeniero estadístico de la Universidad Nacional

Agraria La Molina y Magister en Ingeniería Industrial, mención en Gestión Industrial de la UNMSM. Docente de estadística e informática y estadística aplicada (maestría) en la UNALM. Docente de

maestría en Ciencia de Datos de la URP.

MSc. Daniel Chávez G.MSc Data Science – Universidad Ricardo Palma.

Ingeniero Estadístico e Informático de la Universidad Nacional Agraria La Molina. Líder de proyectos (Business Analytics y Big Data) – Atento Perú. Consultor en Analytics – Digitex.

Actualmente, líder de proyectos Big Data – Telefónica del Perú.

Ing. David Allende Q.Experto en data mining en la División de CRM del

Banco Internacional del Perú. Experiencia en la División de Inteligencia de Negocios de Telefónica del Perú, consultor analítico y capacitador de SPSS Andino, profesor a tiempo parcial en la división de

Estudios Profesionales para Ejecutivos (EPE) de la UPC. Especialista en inteligencia de negocios de la universidad ESAN, Ingeniero Estadístico e Informático de la UNALM. Experiencia en proyectos de Business Analytics, BI y Big Data.

Nota: Todos los profesores mencionados están relacionados al curso especializado.No necesariamente podrían desarrollar una clase.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

6

Instructor

Page 7: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

7

Medios de pago

1. Depósito en las cuentas BBVA o BCP:

N° Cuenta de Ahorros: 0011-0177-02-00180473

N° Cuenta de Corriente: 193-2251181-0-01

3. Oficina DMC

2. Pago online:

Dirección: Calle Río de la Plata 167, Of. 203, San Isidro. Lima - Perú.

Horario de atención:De lunes a viernes de 9:00 a.m. a 7:00 p.m. y sábados de 9:00 a.m. a 4:00 p.m.

Razón Social

R.U.C

J&J Data Mining Consulting S.A.C

20520972740

Page 8: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

8

CertificadoCertificación otorgada a nombre de Data Mining Consulting. Empresa de capacitación en herramientas analíticas del Perú.

9 Certificado de especialización

¿Cómo obtengo mi certificado de especialización?

Al finalizar el curso el capacitador evaluará a los participantes con un caso aplicativo: 9 La nota mínima requerida es (14) catorce. 9 Asistencia mínima del 80% en todo el curso.

Page 9: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

9

Data Mining Consulting SACDMC es una empresa pionera dedicada a la extracción de conocimiento desde grandes bases de datos, con más de 8 años experiencia en la capacitación de temas de minería de datos, scoring de riesgo crediticio, business intelligence, técnicas de segmentación, business analytics y big data. DMC es la única empresa peruana reconocida como uno de los referentes de capacitación en temas de big data.

Algunas empresas que confiaron en nosotros:

Page 10: Curso - dmc.pedmc.pe/uploads/brochures-2018/r-for-data-mining.pdf · Presentación Dirigido a todos aquellos profesionales interesados en ampliar sus conocimientos en ... Digitex.

Web: dmc.pe Teléfono. 253-5066 Móvil: 995900126 / 975491764 Email: [email protected]

10

Contacto

Email: [email protected] / [email protected]: www.dmc.peTeléfono: (511) 253-5066Móvil: 995-900-126 / 975-491-764 Dirección: Calle Río de la Plata 167, Of. 203, San Isidro. Lima - Perú.De lunes a viernes de 9:00 a.m. a 7:00 p.m. y sábados de 9:00 a.m. a 4:00 p.m.