Introducción a la minería de datos · 7 Minería de datos Proceso de utilizar datos “crudos”...
Transcript of Introducción a la minería de datos · 7 Minería de datos Proceso de utilizar datos “crudos”...
1
Introducción a laminería de datos
2
Temario
¿Qué es minería de datos? ¿Quién usa minería de datos? ¿Por qué de la minería de datos? Ciclo virtuoso de la minería de datos
3
Definición de minería de datos
Minería de datos es la exploración y análisis degrandes cantidades de datos con el objeto deencontrar patrones y reglas significativas(conocimiento)
4
Definición de minería de datos
La minería de datos se refiere a la aplicación demétodos de aprendizaje y estadísticos para laobtención de patrones y modelo
Sistema deInformación Preparación
de los datosMinería de
Datos PatronesEvaluación /
Interpretación /Visualización
Conocimiento
5
La minería de datos es un campomultidisciplinario
Minería de datos
InteligenciaArtificial
(“MachineLearning”)
Estadística
Bases deDatos
(VLDB)
Graficación yvisualización
Ciencias dela información
Otrasdisciplinas
6
La minería de datos es un subconjunto dela inteligencia de negocios
7
Minería de datos Proceso de utilizar datos “crudos” para inferir
importantes relaciones entre ellos Colección de técnicas poderosas para analizar grandes
volúmenes de datos No existe un solo enfoque para minería de datos sino
un conjunto de técnicas que se pueden utilizar demanera independiente o en combinación
Existe una relación con la estadística, aunquefrecuentemente se separan las técnicas que no estánbasadas en métodos estadísticos
8
Tipos de aplicaciones de la mineríade datos
Aplicaciones o problemas de minería de datospueden clasificarse en las siguientes categorías Clasificación Estimación Pronóstico Asociación Agrupación o segmentación
9
Clasificación
Examinar las características de un nuevo objetoy asignarle una clase o categoría de acuerdo a unconjunto de tales objetos previamente definido
Ejemplos: Clasificar aplicaciones a crédito como bajo, medio y
alto riesgo Detectar reclamos fraudulentos de seguros
10
Estimación
Relacionado con clasificación Mientras clasificación asigna un valor discreto,
estimación produce un valor continuo Ejemplos: Estimar el precio de una vivienda Estimar el ingreso total de una familia
11
Pronóstico
Predecir un valor futuro con base a valorespasados
Ejemplos: Predecir cuánto efectivo requerirá un cajero
automático en un fin de semana
12
Asociación
Determinar cosas u objetos que van juntos Ejemplo: Determinar que productos se adquieren
conjuntamente en un supermercado
13
Agrupación o segmentación
Dividir una población en un número de gruposmás homogéneos
No depende de clases pre-definidas a diferenciade clasificación
Ejemplo: Dividir la base de clientes de acuerdo con los hábitos
de consumo
14
Usos de la minería de datos
Administración de la relación con los clientes: Identificar nuevos clientes potenciales para aumentar
ventas Ampliar la base de cliente con la mínima inversión
por parte de la empresa Retener clientes existentes evitando que se vayan a la
competencia (“attrition”) Vender más a clientes existentes (“ventas cruzadas”)
15
Usos de la minería de datos
Detección de fraudes en el uso de tarjetas decrédito
Determinar patrones que puedan estarrelacionados con lavado de dinero
Determinar el precio de una casa con base ensus características y el precio de otras casasvendidas
16
Usos de la minería de datos
Usos de la minería de datos se han ampliado conel comercio electrónico
17
Recomendaciones
18
Disponibilidad de datos detransacciones
19
¿Por qué de la minería de datos?
Datos se encuentran disponibles Poder computacional es cada vez menos costoso Las presiones competitivas son enormes Software para minería de datos se encuentra
disponible
20
Ciclo virtuoso de la minería de datos
21
Principales técnicas de minería dedatos
Análisis de encadenamiento Árboles de decisión Redes neuronales artificiales Algoritmos genéticos