Ejemplo de Arboles de decision aplicados a la Minería de Datos.
-
Upload
miguel-bermeo -
Category
Technology
-
view
1.889 -
download
7
Transcript of Ejemplo de Arboles de decision aplicados a la Minería de Datos.
![Page 1: Ejemplo de Arboles de decision aplicados a la Minería de Datos.](https://reader036.fdocuments.es/reader036/viewer/2022071704/55a8ecf21a28abb92b8b470a/html5/thumbnails/1.jpg)
ARBOLES DE DECISIÓN APLICADOS A LA MINERIA DE DATOS
Miguel Ángel Bermeo Otavo [email protected]
UNIVERSIDAD MANUELA BELTRAN – BOGOTA, COLOMBIA
RESUMEN: En el siguiente artículo, se pretende mostrar las características principales de la minería de datos (Data Mining) y ejemplificar con árboles de decisión (técnica de Data Mining) un caso de la vida real para comprender su uso más práctico, mostrando la información de manera gráfica y totalmente comprensible.
PALABRAS CLAVE: Arboles de decisión, Minería de datos, Data Mining y decision trees.
ABSTRACT: In the following article, is to show the main characteristics of data mining (Data Mining) and exemplify with decision trees technique (Data Mining) a case of real life to understand more practical use, displaying the information in a graphic and completely understandable.
KEY WORDS: Decision trees, Data Mining, Data Mining and decision trees.
1. INTRODUCCION
La minería de datos o Data Mining en inglés, es un campo de estudio de las Ciencias computacionales, en donde también se encuentra como etapa del (KDD) en la inteligencia artificial (IA). La minería de datos básicamente es un proceso donde se pretende descubrir patrones en grandes volúmenes de datos prominentes de Bases de datos que aporten una influencia para la toma de decisiones. Esta de igual forma utiliza los métodos de la (IA), de forma automática o semiautomática para analizar las grandes cantidades de datos en busca de patrones interesantes que se desconocen.
Los arboles de decisión son un modelo predictivo, que construye diagramas de construcciones lógicas a partir de una base de datos. Esta una técnica utilizada por la minería de datos para el análisis de datos con el fin de tomar decisiones convenientes.
2. ARBOLES DE DESICION
Los arboles de decisión, son representaciones gráficas y analíticas de datos introducidos por medio de una base de datos ya establecida. Estos ayudan en la toma de decisiones, desde un punto de vista probabilístico con el fin de elegir la opción más conveniente. Los arboles de decisión se caracterizan por ser una técnica utilizada por la minería de datos, en donde se busca
solucionar problemas de predicción, clasificación y segmentación, una vez analizados todos los datos.
Existen algoritmos para realizar el análisis de los datos como; Algoritmo ID3 y C4.5 (evolución del ID3), de igual forma existen algoritmos que no son de decisión, sino utilizados para problemas de regresión, para este tipo se utiliza el algoritmo CART.
2.1 CARACTERTISTCAS Y VENTAJAS DE LOS ARBOLES DE DECISION:
Terminología:
- Nodo de decisión: indica que debe tomarse una
decisión en ese punto del proceso y su re prestación se da por un cuadrado.
- Nodo de probabilidad: indica que en ese punto del
proceso ocurre un evento aleatorio. Representado por un círculo.
- Rama: Indica distintos caminos por donde se puede
emprender cuando se toma una decisión o sucede un evento aleatorio.
- Ventajas de los árboles de decisión:
Facilitan la interpretación de la decisión tomada
Facilita la comprensión del conocimiento utilizando la toma de decisiones.
Reduce el número de variables independientes
Explica el comportamiento respecto a una determinada decisión.
2.2 DEMOSTRACION DE ARBOL DE DECISIÓN
Ejemplo: Préstamo de Crédito:
Cliente Moroso Antiguedad Ingresos Trabajo Fijo Conceder Credito?
1 si >5 600 − 1200 si no
2 no <1 600 − 1200 si si
3 si 1 − 5 >1200 si no
4 no >5 >1200 no si
5 no <1 >1200 si si
6 si 1 − 5 600 − 1200 si no
7 no 1 − 5 >1200 si si
8 no <1 <600 si no
9 no >5 600 − 1200 no no
10 si 1 − 5 <600 no no
Tabla 1. BD Préstamo de Crédito
![Page 2: Ejemplo de Arboles de decision aplicados a la Minería de Datos.](https://reader036.fdocuments.es/reader036/viewer/2022071704/55a8ecf21a28abb92b8b470a/html5/thumbnails/2.jpg)
En la tabla 1 se relacionan 10 clientes a los que se evaluara de acuerdo a unos factores establecido si se les puede o no conceder un crédito bancario.
Árbol:
3. REFERENCIAS:
[1] (2013, Febrero 5) Wikipedia [En línea]. Disponible en http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos
[2] (2013, Junio) Slideshare [En línea]. Disponible en: http://www.slideshare.net/04071977/mineria-de-datos
[3] (2012, Octubre 11) Diposit.ub.edu [En línea]. Disponible en: http://diposit.ub.edu/dspace/bitstream/2445/43762/1/618361.pdf
[4] (2007) it.uc3m.es [En línea]. Disponible en: http://www.it.uc3m.es/jvillena/irc/practicas/03-04/18.mem.pdf
[5] (2012) utm.mx [En línea]. Disponible en: http://www.utm.mx/~jahdezp/archivos%20estructuras/DESICION.pdf