Software de Mineria de Datos

5
SOFTWARE’S DE MINERIA DE DATOS La minería de datos tiene varios significados dependiendo del el foque que le de uno. Por ejemplo, la minería de datos en forma general se podría definir como la extracción de patrones a partir de datos. Y desde el punto de vista de los negocios o empresarial, es la integración de áreas que tienen como propósito la identificación de datos a partir de las base de datos que aporten el rumbo o curso de un negocio y así tomar una buena decisión. La minería de datos es una tecnología compuesta por etapas que integran varias áreas y no se debe confundir con un gran software. Durante el desarrollo de un proyecto de minería de datos se usan diferentes aplicaciones como pueden ser de estadística, de visualización de datos o de inteligencia artificial, que es la que más se usa principalmente. Actualmente existen muchas aplicaciones de minería de datos muy poderosas que contienen un sinfín de utilerías que facilitan el desarrollo de un proyecto y es ampliamente utilizado en prácticas de perfil como vigilancia, comercialización, descubrimientos científicos y detección de fraudes. Hay cuatro tipos de tareas que normalmente se involucran en la minería de datos: Clasificación: generalizar una estructura familiar `para utilizarla en nuevos datos. Agrupamiento: encontrar grupos y estructuras en los datos que son lo mismo, sin necesidad de utilizar las estructuras observadas en los datos. Aprendizaje de reglas de asociación: busca relaciones entre las variables

description

algunos programas de mineria de datos

Transcript of Software de Mineria de Datos

SOFTWARES DE MINERIA DE DATOSLa minera de datos tiene varios significados dependiendo del el foque que le de uno.Por ejemplo, la minera de datos en forma general se podra definir como la extraccin de patrones a partir de datos. Y desde el punto de vista de los negocios o empresarial, es la integracin de reas que tienen como propsito la identificacin de datos a partir de las base de datos que aporten el rumbo o curso de un negocio y as tomar una buena decisin.La minera de datos es una tecnologa compuesta por etapas que integran varias reas y no se debe confundir con un gran software. Durante el desarrollo de un proyecto de minera de datos se usan diferentes aplicaciones como pueden ser de estadstica, de visualizacin de datos o de inteligencia artificial, que es la que ms se usa principalmente.Actualmente existen muchas aplicaciones de minera de datos muy poderosas que contienen un sinfn de utileras que facilitan el desarrollo de un proyecto y es ampliamente utilizado en prcticas de perfil como vigilancia, comercializacin, descubrimientos cientficos y deteccin de fraudes. Hay cuatro tipos de tareas que normalmente se involucran en la minera de datos:Clasificacin: generalizar una estructura familiar `para utilizarla en nuevos datos.Agrupamiento: encontrar grupos y estructuras en los datos que son lo mismo, sin necesidad de utilizar las estructuras observadas en los datos.Aprendizaje de reglas de asociacin: busca relaciones entre las variablesRegresin: encontrar una funcin que modele los datos con el menor error.TIPOS DE SOFTWARE DE MINERIA DE DATOS

RAPIDMINERPrograma informtico para el anlisis y minera de datos.Fue desarrollada en la universidad de Dortmund en 2001.Tiene edicin gratuita (Community Edition) y edicin de paga (Enterprise Edition, Big Data Edition, OEM Edition).

Por qu usarlo?Posibilita la obtencin de valiosa informacin sobre el consumidor como sus gustos e intereses, permitiendo personalizar la oferta de una empresa y lo que hace posible aumentar la productividad a travs de modelos que solucionan los problemas de prediccin, clasificacin y segmentacin de informacin.sea que nos amoldamos a lo que el cliente quiere.Se puede utilizar en:Investigacin y educacin.Creacin de un prototipo.Aplicaciones empresariales.

KNIMEEs totalmente gratuito.Fue desarrollado en la universidad de Constanza, Alemania.Esta desarrollado sobre la plataforma eclipse y programado en java.Es una herramienta grfica y dispone de una serie de nodos y flechas que se despliegan y combinan de manera grfica e iterativa. Los nodos implementan distintos tipos de acciones que pueden ejecutarse sobre una tabla de datos como:Manipulacin de filas, columnas, como muestreos, agrupaciones, transformaciones.Creacin de modelos estadsticos y de minera de datos, como rboles de decisin, mquinas de vector soporte, regresiones.Scoring o aplicacin de dichos modelos sobre conjuntos nuevos de datos.Como es open-source hace posible su extensin mediante la creacin de nuevos nodos que implementen algoritmos a la medida del usuario.KNIME es utilizado desde el 2006 en la investigacin farmacutica pero tambin se utiliza en otras reas como: anlisis de datos de clientes CRM (Customer Relationship Management), inteligencia de negocios y anlisis de datos financieros.

WEKAPlataforma para el aprendizaje automtico y minera de datos.Fue escrito en java y desarrollado en la universidad de Waikato.Contiene una coleccin de herramientas de visualizacin y algoritmos para anlisis de datos y modelado predictivo, unidos a una interfaz grfica de usuario para acceder fcilmente a sus funcionalidades.Puntos a favor de WEKA:Est disponible libremente bajo la licencia pblica general de GNU.Es muy portable porque est completamente implementado en Java y puede correr en casi cualquier plataforma.Contiene una extensa coleccin de tcnicas para pre-procesamiento de datos y modelado.

Es fcil de utilizar por un principiante gracias a su interfaz grfica de usuario.WEKA proporciona acceso a bases de datos va SQL gracias a la conexin JDBC (Java Database Connectivity) y puede procesar el resultado devuelto por una consulta hecha a la base de datosCOMO TRABAJAR CON WEKA1.-Simple CLI: Intrprete de comandos o consola.

2. Explorer: Interfaz grfico principal Proporciona acceso a las distintas funcionalidades a travs de mens y formularios de datos.

3. Experimenter: Automatiza el proceso de ejecucin de varios filtros y clasificadores con diferentes parmetros sobre un conjunto de datos y proporciona estadsticas de dicho proceso.*Permite comparar rendimientos y distribuir la carga de trabajo entre varias mquinas (experimentos grandes).

4. KnowledgeFlow: Similar al funcionamiento interno del programa, permite crear una secuencia o circuito que recoge todo el experimento.