Ejemplo de Arboles de decision aplicados a la Minería de Datos.

2
ARBOLES DE DECISIÓN APLICADOS A LA MINERIA DE DATOS Miguel Ángel Bermeo Otavo [email protected] UNIVERSIDAD MANUELA BELTRAN – BOGOTA, COLOMBIA RESUMEN: En el siguiente artículo, se pretende mostrar las características principales de la minería de datos (Data Mining) y ejemplificar con árboles de decisión (técnica de Data Mining) un caso de la vida real para comprender su uso más práctico, mostrando la información de manera gráfica y totalmente comprensible. PALABRAS CLAVE: Arboles de decisión, Minería de datos, Data Mining y decision trees. ABSTRACT: In the following article, is to show the main characteristics of data mining (Data Mining) and exemplify with decision trees technique (Data Mining) a case of real life to understand more practical use, displaying the information in a graphic and completely understandable. KEY WORDS: Decision trees, Data Mining, Data Mining and decision trees. 1. INTRODUCCION La minería de datos o Data Mining en inglés, es un campo de estudio de las Ciencias computacionales, en donde también se encuentra como etapa del (KDD) en la inteligencia artificial (IA). La minería de datos básicamente es un proceso donde se pretende descubrir patrones en grandes volúmenes de datos prominentes de Bases de datos que aporten una influencia para la toma de decisiones. Esta de igual forma utiliza los métodos de la (IA), de forma automática o semiautomática para analizar las grandes cantidades de datos en busca de patrones interesantes que se desconocen. Los arboles de decisión son un modelo predictivo, que construye diagramas de construcciones lógicas a partir de una base de datos. Esta una técnica utilizada por la minería de datos para el análisis de datos con el fin de tomar decisiones convenientes. 2. ARBOLES DE DESICION Los arboles de decisión, son representaciones gráficas y analíticas de datos introducidos por medio de una base de datos ya establecida. Estos ayudan en la toma de decisiones, desde un punto de vista probabilístico con el fin de elegir la opción más conveniente. Los arboles de decisión se caracterizan por ser una técnica utilizada por la minería de datos, en donde se busca solucionar problemas de predicción, clasificación y segmentación, una vez analizados todos los datos. Existen algoritmos para realizar el análisis de los datos como; Algoritmo ID3 y C4.5 (evolución del ID3), de igual forma existen algoritmos que no son de decisión, sino utilizados para problemas de regresión, para este tipo se utiliza el algoritmo CART. 2.1 CARACTERTISTCAS Y VENTAJAS DE LOS ARBOLES DE DECISION: Terminología: - Nodo de decisión: indica que debe tomarse una decisión en ese punto del proceso y su re prestación se da por un cuadrado. - Nodo de probabilidad: indica que en ese punto del proceso ocurre un evento aleatorio. Representado por un círculo. - Rama: Indica distintos caminos por donde se puede emprender cuando se toma una decisión o sucede un evento aleatorio. - Ventajas de los árboles de decisión: Facilitan la interpretación de la decisión tomada Facilita la comprensión del conocimiento utilizando la toma de decisiones. Reduce el número de variables independientes Explica el comportamiento respecto a una determinada decisión. 2.2 DEMOSTRACION DE ARBOL DE DECISIÓN Ejemplo: Préstamo de Crédito: Cliente Moroso Antiguedad Ingresos Trabajo Fijo Conceder Cre 1 si >5 600 − 1200 si no 2 no <1 600 − 1200 si si 3 si 1 − 5 >1200 si no 4 no >5 >1200 no si 5 no <1 >1200 si si 6 si 1 − 5 600 − 1200 si no 7 no 1 − 5 >1200 si si 8 no <1 <600 si no 9 no >5 600 − 1200 no no 10 si 1 − 5 <600 no no Tabla 1. BD Préstamo de Crédito

Transcript of Ejemplo de Arboles de decision aplicados a la Minería de Datos.

Page 1: Ejemplo de Arboles de decision aplicados a la Minería de Datos.

ARBOLES DE DECISIÓN APLICADOS A LA MINERIA DE DATOS

Miguel Ángel Bermeo Otavo [email protected]

UNIVERSIDAD MANUELA BELTRAN – BOGOTA, COLOMBIA

RESUMEN: En el siguiente artículo, se pretende mostrar las características principales de la minería de datos (Data Mining) y ejemplificar con árboles de decisión (técnica de Data Mining) un caso de la vida real para comprender su uso más práctico, mostrando la información de manera gráfica y totalmente comprensible.

PALABRAS CLAVE: Arboles de decisión, Minería de datos, Data Mining y decision trees.

ABSTRACT: In the following article, is to show the main characteristics of data mining (Data Mining) and exemplify with decision trees technique (Data Mining) a case of real life to understand more practical use, displaying the information in a graphic and completely understandable.

KEY WORDS: Decision trees, Data Mining, Data Mining and decision trees.

1. INTRODUCCION

La minería de datos o Data Mining en inglés, es un campo de estudio de las Ciencias computacionales, en donde también se encuentra como etapa del (KDD) en la inteligencia artificial (IA). La minería de datos básicamente es un proceso donde se pretende descubrir patrones en grandes volúmenes de datos prominentes de Bases de datos que aporten una influencia para la toma de decisiones. Esta de igual forma utiliza los métodos de la (IA), de forma automática o semiautomática para analizar las grandes cantidades de datos en busca de patrones interesantes que se desconocen.

Los arboles de decisión son un modelo predictivo, que construye diagramas de construcciones lógicas a partir de una base de datos. Esta una técnica utilizada por la minería de datos para el análisis de datos con el fin de tomar decisiones convenientes.

2. ARBOLES DE DESICION

Los arboles de decisión, son representaciones gráficas y analíticas de datos introducidos por medio de una base de datos ya establecida. Estos ayudan en la toma de decisiones, desde un punto de vista probabilístico con el fin de elegir la opción más conveniente. Los arboles de decisión se caracterizan por ser una técnica utilizada por la minería de datos, en donde se busca

solucionar problemas de predicción, clasificación y segmentación, una vez analizados todos los datos.

Existen algoritmos para realizar el análisis de los datos como; Algoritmo ID3 y C4.5 (evolución del ID3), de igual forma existen algoritmos que no son de decisión, sino utilizados para problemas de regresión, para este tipo se utiliza el algoritmo CART.

2.1 CARACTERTISTCAS Y VENTAJAS DE LOS ARBOLES DE DECISION:

Terminología:

- Nodo de decisión: indica que debe tomarse una

decisión en ese punto del proceso y su re prestación se da por un cuadrado.

- Nodo de probabilidad: indica que en ese punto del

proceso ocurre un evento aleatorio. Representado por un círculo.

- Rama: Indica distintos caminos por donde se puede

emprender cuando se toma una decisión o sucede un evento aleatorio.

- Ventajas de los árboles de decisión:

Facilitan la interpretación de la decisión tomada

Facilita la comprensión del conocimiento utilizando la toma de decisiones.

Reduce el número de variables independientes

Explica el comportamiento respecto a una determinada decisión.

2.2 DEMOSTRACION DE ARBOL DE DECISIÓN

Ejemplo: Préstamo de Crédito:

Cliente Moroso Antiguedad Ingresos Trabajo Fijo Conceder Credito?

1 si >5 600 − 1200 si no

2 no <1 600 − 1200 si si

3 si 1 − 5 >1200 si no

4 no >5 >1200 no si

5 no <1 >1200 si si

6 si 1 − 5 600 − 1200 si no

7 no 1 − 5 >1200 si si

8 no <1 <600 si no

9 no >5 600 − 1200 no no

10 si 1 − 5 <600 no no

Tabla 1. BD Préstamo de Crédito

Page 2: Ejemplo de Arboles de decision aplicados a la Minería de Datos.

En la tabla 1 se relacionan 10 clientes a los que se evaluara de acuerdo a unos factores establecido si se les puede o no conceder un crédito bancario.

Árbol:

3. REFERENCIAS:

[1] (2013, Febrero 5) Wikipedia [En línea]. Disponible en http://es.wikipedia.org/wiki/Miner%C3%ADa_de_datos

[2] (2013, Junio) Slideshare [En línea]. Disponible en: http://www.slideshare.net/04071977/mineria-de-datos

[3] (2012, Octubre 11) Diposit.ub.edu [En línea]. Disponible en: http://diposit.ub.edu/dspace/bitstream/2445/43762/1/618361.pdf

[4] (2007) it.uc3m.es [En línea]. Disponible en: http://www.it.uc3m.es/jvillena/irc/practicas/03-04/18.mem.pdf

[5] (2012) utm.mx [En línea]. Disponible en: http://www.utm.mx/~jahdezp/archivos%20estructuras/DESICION.pdf