UNIVERSIDAD POLITECNICA DE
TLAXCALA
PROFESOR: DR. PEDRO AARÓN HERNÁNDEZ AVALOS
MATERIA: MINERÍA DE DATOS
CUATRIMESTRE: OCTAVO
ALUMNO: EDUARDO PALMA GONZÁLEZ
MINERÍA DE DATOS
Minería de datos es el conjunto de técnicas y
tecnologías que permiten explorar grandes
bases de datos, que intenta descubrir
patrones en grandes volúmenes de
conjuntos de datos.
MÉTODOS QUE UTILIZA DATAMINING
Inteligencia artificial
Aprendizaje automático
Estadística
Sistemas de bases de datos.
ETAPAS
Determinación de los objetivos. Trata de ladelimitación de los objetivos que el clientedesea bajo la orientación del especialista enminería de datos.
Preprocesamiento de los datos. Se refiere ala selección, la limpieza, el enriquecimiento, lareducción y la transformación de las bases dedatos. Esta etapa consume generalmentealrededor del setenta por ciento del tiempototal de un proyecto de minería de datos.
Determinación del modelo. Se comienzarealizando unos análisis estadísticos de los datos, ydespués se lleva a cabo una visualización gráficade los mismos para tener una primeraaproximación. Según los objetivos planteados y latarea que debe llevarse a cabo, pueden utilizarsealgoritmos desarrollados en diferentes áreas de laInteligencia Artificial.
Análisis de los resultados. Verifica si losresultados obtenidos son coherentes y los cotejacon los obtenidos por los análisis estadísticos y devisualización gráfica. El cliente determina si sonnovedosos y si le aportan un nuevo conocimientoque le permita considerar sus decisiones.
LAS TÉCNICAS
+ Redes Neuronales.
+ Regresión Lineal.
+ Árboles de Decisión.
+ Modelos Estadísticos.
+ Reglas de Asociación.
REDES NEURONALES
Es un paradigma de aprendizaje y
procesamiento automático. Trata de un
sistema de interconexión de neuronas que
colaboran entre sí para producir un estímulo
de salida.
ÁRBOL DE DECISIÓN
Son representaciones
gráficas y analíticas de
datos ya establecidos
mediante una base de datos.
Ayuda en la toma de
decisiones, desde un punto
de vista probabilístico,
con el fin de obtener la opción
que mejor convenga.
REGRESIÓN LINEAL
Es la más utilizada para formar relaciones
entre datos.
Rápida y eficaz pero insuficiente en
espacios multidimensionales donde
puedan relacionarse más de 2 variables.
MARKET BASKET ANALYSIS
Permite detectar que productos se
adquieren conjuntamente, permite
incorporar variables técnicas que ayudan
en la interpretación.
TÉCNICAS DE CLUSTERING
Son técnicas que parten de una medida de
proximidad entre individuos y a partir de
ahí, buscar los grupos de individuos más
parecidos entre sí, según una serie de
variables mesuradas.
REDES BAYESIANAS
Consiste en representar todos los posibles
sucesos en que estamos interesados
mediante un grafo de probabilidades
condicionales de transición entre sucesos.
MODELOS LINEALES GENERALIZADOS
Son modelos que permiten tratar diferentes
tipos de variables de respuesta, por
ejemplo la preferencia entre productos
concurrentes en el mercado.
PREVISIÓN LOCAL
La idea de base es que individuos
parecidos tendrán comportamientos
similares respecto de una cierta variable de
respuesta.
REFERENCIAS
http://tecnicasmd.blogspot.mx/2015/04/tecnic
as-de-mineria-de-datos.html
http://es.slideshare.net/jorgeklz1/apriori-
algoritmo-reglas-de-asociacion-datamining-
mineria-datos-soporte-confianza
http://www.dynamics.unam.edu/DinamicaNo
Lineal/Articulos/MineriaRedesNVacunas.pdf