Unidad 1 Inteligencia de Negocios
-
Upload
gloria-morales -
Category
Documents
-
view
66 -
download
3
Transcript of Unidad 1 Inteligencia de Negocios
ÍNDICE GENERAL
1. UNIDAD1: INTRODUCCIÓN A LA INTELIGENCIA DE NEGOCIOS.
1.1 Tipos de sistemas de información.
1.1.1 Sistemas OLTP.
1.1.2 Sistemas OLAP.
1.2 Inteligencia de Negocios.
1.2.1 Definición.
1.2.2 Importancia.
1.2.3 Componentes de la inteligencia de negocios.
1.2.3.1 Aplicaciones Analíticas.
1.2.3.2 Sistemas de reportes.
1.2.3.3 Bases de Datos Multidimensionales y Data Warehouse.
1.2.3.4 Data Mining.
1.2.3.5 Administración del Conocimiento.
1.3 Principales herramientas de la Inteligencia de Negocios.
Capítulo 1.
Unidad1: Introducción a la Inteligencia de Negocios.
Competencia específica a desarrollar
Identificar los conceptos básicos, herramientas y componentes de la inteligencia de
negocios.
La Inteligencia de Negocios (Business Intelligence) se ha visto marcada por una clara
evolución que lo destaca como un mercado maduro en los últimos años.
La inteligencia de negocios es la habilidad para transformar los datos en información, y la
información en conocimiento, de forma que se pueda optimizar el proceso de toma de
decisiones en los negocios.
Se ha producido un fortalecimiento mediante la compra de empresas pequeñas por
parte de los principales agentes del mercado (SAP, IBM, Microsoft).
Se ha enriquecido con soluciones open source que cubren la gama de necesidades
de una organización para la explotación de la información.
Han aparecido nuevas empresas enfocadas en la innovación cubriendo nuevos
nichos en el mercado de la inteligencia de negocio como la visualización, y el análisis
predictivo.
1.1TIPOS DE SISTEMAS DE INFORMACIÓN.
La introducción de los sistemas de información (SI), en las empresas a contribuido al
proceso de toma de decisiones, facilitan el logro de ventajas competitivas y automatizan los
procesos operativos de las empresas.
Para poder entender que es un sistema de información, primeramente se definen algunos
conceptos relacionados al tema como son:
Sistema: Conjunto de elementos que interactúan para realizar un conjunto de
funciones específicas.
Datos: Representación formal de hechos, conceptos o instrucciones adecuada para
su comunicación, interpretación y procesamiento por seres humanos o medios
automáticos.
Información: El significado que un ser humano le asigna a los datos.
Existen varios tipos de Sistemas de Información, desde el punto de vista administrativo
éstos se pueden clasificar como se muestra en la siguiente imagen.
Nivel operativo
Apoyan a los gerentes operativos en el seguimiento de las actividades y transacciones
elementales de la organización como ventas, ingresos, depósitos en efectivo, nomina,
decisiones de crédito y flujo de materiales en una fábrica.
Ejemplo: Un sistema para registrar los depósitos realizados en un cajero automático o uno
que lleve el registro del número de horas trabajadas cada día por los empleados de una
fábrica.
Sistema de Procesamiento de Transacciones (TPS)
Recolectan, almacenan, modifican y recuperan la información generada por las
transacciones producidas en una organización. Si durante una transacción se produce un
error, el TPS debe ser capaz de deshacer las operaciones realizadas hasta ese momento.
Es muy útil para el procesamiento de transacciones on-line.
Nivel de conocimiento
Se utilizan para el mejoramiento de la calidad de los servicios de la organización y aporte
de nuevos conocimientos, además de incrementar la productividad de los usuarios del
sistema.
Sistemas de Conocimiento (KWS) (Knowledgeworksystem) (Sistemas del
trabajo del conocimiento)
Auxilian a los trabajadores en la creación e integración de nuevo conocimiento en la
organización. Están diseñados para aumentar la productividad de los trabajadores.
Ejemplo: aplicaciones como Photoshop con la que diseñadores pueden crear arte
publicitario.
Sistemas de Automatización de Oficina (OAS)
Aplicaciones destinadas a ayudar al trabajo diario del administrativo de una organización,
forman parte de este tipo de software los procesadores de textos, las hojas de cálculo, los
editores de presentaciones, los clientes de correo electrónico, etc.
Ejemplo: Microsoft Office.
Nivel administrativo
Son utilizados por los administradores de nivel medio en la toma de decisiones. Tratan y
comparan resultados notables para la compañía, y estudian sus trayectorias.
Sistemas de Información Gerencial (MIS)
Son el resultado de interacción participativa entre personas, tecnologías y procedimientos.
Apoyan a nivel administrativo entregando información útil para el planteamiento, control y
toma de decisiones.
Ejemplo: sistema que reúna información de sistemas de información de nivel productivo
sobre los productos (pedidos, costos y gastos) y genere reportes para la toma de
decisiones. La mayoría de los informes para control administrativo están basados en
resúmenes de las transacciones.
Sistemas de Apoyo a la Toma de Decisiones (DSS)
Herramienta para realizar el análisis de las diferentes variables de un negocio con la
finalidad de apoyar el proceso de toma de decisiones. Su principal característica es la
capacidad de análisis multidimensional (OLAP)(Procesamiento Analítico en Línea) que
permite profundizar en la información hasta llegar a un alto nivel de detalle, analizar datos
desde diferentes perspectivas, realizar proyecciones de información para pronosticar lo que
puede ocurrir en el futuro, análisis de tendencias, análisis prospectivo, etc.
Ejemplo: el sistema implantado por la New York State Office of General Services que
permite que los ejecutivos verifiquen el estado por programa, comparando presupuestos y
gastos y mostrando el gasto estimado hasta el final del año fiscal.
Nivel estratégico
Están basados en los resultados estratégicos a largo plazo de la compañía, son útiles para
poder hacer frente a los impactos producidos por cambios en los negocios.
Sistemas de Soporte Gerencial (SSG)
Trabajan con información interna y externa a la organización y están diseñados para
abordar la toma de decisiones que requieren juicio, evaluación y comprensión.
Ejemplo: un ejecutivo puede utilizar el sistema para conocer las ventas por país, línea de
producto y, además, obtener el crecimiento esperado del segmento para los próximos 5
años en bases de datos externos.
Sistemas Expertos (SE)
Es una aplicación informática capaz de solucionar un conjunto de problemas que exigen un
gran conocimiento sobre un determinado tema. Imitan el comportamiento de un experto en
un dominio concreto y en ocasiones son usados por éstos. Con los sistemas expertos se
busca una mejor calidad y rapidez en las respuestas dando así lugar a una mejora de la
productividad del experto.
Ejemplo: un sistema MRP (ManufacturingResourePlanning; Fabricación y Planificación de
Recursos) diseñado para reducir el desperdicio en el proceso productivo.
Los Sistemas de Planificación de Recursos Empresariales (ERP)
Los ERP son sistemas que integran y manejan todo lo asociado con las operaciones de
producción y aspectos de distribución y que son necesarios para el funcionamiento de los
procesos de negocio de una organización, es decir, permiten la disponibilidad de toda la
información para todo el mundo todo el tiempo. Son también llamados back office ya que
no se involucra directamente a clientes y público general.
1.1.1 Sistemas OLTP
OLTP es la sigla en inglés de Procesamiento de Transacciones En Línea
(OnLineTransactionProcessing) es un tipo de procesamiento que facilita y administra
aplicaciones transaccionales, usualmente para entrada de datos y recuperación y
procesamiento de transacciones (gestor transaccional).
Los Sistemas de tipo OLTP lo conforman todos los sistemas de información que ejecutan
datos operacionales del día a día y aumentar la capacidad de procesamiento de
transacciones.
Estos sistemas realizan principalmente 3 tipos de acciones sobre una Base de Datos, las
cuales son: INSERT, DELETE y UPDATE que se manejan a nivel de transacciones
Entre algunos ejemplos de sistemas OLTP de tienen los siguientes:
SAP Business One de la compañía SAP SAP R3 de la compañía SAP E-Business Suite de la compañía Oracle JD Edwards Enterprise One de la compañía Oracle PeopleSoft ERP de la compañía Oracle ERP O7/Solution
Estos tipos de sistema consisten principalmente de transacciones de tipo DML (Data ManipulationLanguage(Lenguaje de Manipulación de Datos), sentencias de tipo insert, update o delete para el manejo de datos) dentro de la Base de Datos.
En la imagen de abajo se puede observar el flujo principal dentro de un sistema OLTP
Algunas de las características más comunes de este tipo de transacciones podrían ser:
Altas/Bajas/Modificaciones
Consultas rápidas, escuetas y predecibles
Poco volumen de información e información disgregada
Transacciones rápidas
Gran nivel de concurrencia
Modo de actualización on-line
Baja redundancia de datos
Algunos ejemplos de este tipo de aplicaciones son:
Compras
Ventas
Inventario
Sueldos
La tecnología OLTP se utiliza en innumerables aplicaciones, como en banca electrónica,
procesamiento de pedidos, comercio electrónico, supermercados o industria.
Requisitos.
El proceso de transacciones en línea cada vez necesita más recursos para las
transacciones que se transmiten por una red y que pueden integrar a más de una empresa.
Por esta razón, el software actual para sistemas OLTP utiliza procesamiento cliente-
servidor y software de intermediación (middleware) que permite a las transacciones correr
en diferentes plataformas en una red.
Middleware: Es un software que asiste a una aplicación para interactuar o comunicarse con
otras aplicaciones, software, redes, hardware y/o sistemas operativos.
En grandes aplicaciones, la eficiencia del OLTP puede depender de lo perfeccionado que
sea el software de gestión de transacciones (como CICS en plataformas IBM) o de que
tácticas de optimización se utilizan para facilitar la gran cantidad de actualizaciones
concurrentes que se pueden producir en una base de datos orientada a OLTP.
En los sistemas de bases de datos descentralizados más exigentes, los programas de
intermediación OLTP distribuyen el procesamiento de transacciones entre varios
ordenadores en una red. A menudo OLTP se integra en una arquitectura orientada a
servicios o en un servicio Web.
El OLTP emplea una estrategia de consignación o recuperación para asegurar que cada
transacción sea procesada de manera correcta. Esta estrategia es esencial, porque las
transacciones requieren una secuencia de pasos, y cada paso debe de llevarse a cabo de
manera correcta para que se concluya la transacción.
Función de la Consignación o Recuperación
Se explica por medio del siguiente ejemplo:
Si una persona retira efectivo de un cajero automático, la computadora del banco verifica
que su cuenta contenga fondos suficientes antes de deducir el retiro de su cuenta y permitir
que el cajero entregue el efectivo. Sin embargo, si el cajero no tiene efectivo, la transacción
no procede, y el retiro no se deduce de su cuenta. Un TPS (sistema de procesamiento de
transacciones) manda (consigna) una transacción y actualiza de manera permanente los
registros de una base de datos solo si cada paso de la transacción se procesa de manera
satisfactoria. Si falla un paso, fracasa toda la transacción y una recuperación devuelve los
registros a su estado original.
En la siguiente imagen se muestran los procesos que ocurren en un TPS
Un sistema de procesamiento de transacciones (TPS) se caracteriza por su capacidad para:
Recopilar, exhibir y modificar transacciones.
Guardar transacciones.
Enlistar transacciones.
Limitaciones de un TPS
Su capacidad para generar informes es limitada.
Solo genera informes de detalles que ofrecen solo un registro básico de las
transacciones concluidas.
1.1.2 Sistemas OLAP
OLAP es la sigla en inglés de Procesamiento Analítico en Línea (On-Line
AnalyticalProcess).
Son aplicaciones que se encargan de analizar datos del negocio para generar información
táctica y estratégica que sirve de soporte para la toma de decisiones. Mientras que las
transacciones OLTP utilizan Bases de Datos Relacionales u otro tipo de archivos, OLAP
logra su máxima eficiencia y flexibilidad operando sobre Bases de datos
Multidimensionales.
Podemos nombrar las siguientes características como las más sobresalientes de estas
aplicaciones:
Estructura de datos transparente al usuario.
Solo Consulta, trabajan sobre la información operacional generada por los sistemas
OLTP.
Consultas sobre grandes volúmenes de datos no predecibles.
Información histórica.
Modo de actualización Batch.
Alta redundancia de datos para facilitar la generación de consultas y obtener buenos
tiempos de respuesta.
Poderoso Back-end analítico para múltiples aplicaciones de usuarios.
Trabaja con resúmenes de miles de registros condensados en una sola respuesta.
Su objetivo es agilizar la consulta de grandes cantidades de datos. Para ello utiliza
estructuras multidimensionales (o Cubos OLAP) que contienen datos resumidos de grandes
Bases de Datos (un data warehouse, por ejemplo).
Estos tipos de sistemas analíticos buscan facilitar la creatividad, centrándose en la
estrategia a largo plazo y la ventaja competitiva dentro del negocio de una empresa.
Diferencias entre sistemas OLTP y OLAP
Sistemas OLTP Sistemas OLAP
Datos Valores actuales Datos históricos y/o
calculados
Organización Por aplicación Por áreas de la empresa
Acceso Muy frecuente
(lectura/escritura)
Baja frecuencia
Actualizaciones Actualizaciones de campo No se actualiza se
manipula
Tiempo de respuesta Medido por el tiempo de la
transacción (del orden de
segundos)
Medido por el tiempo de la
consulta (del orden de
minutos)
Tamaño de la BD 100 MB – GB 100 GB – TB
Usuarios Miles Cientos
Unidad de Trabajo Transacciones Consultas complejas
Ventajas de OLAP
Es un poderoso paradigma de visualización.
Proporciona tiempos de respuesta rápidos.
Permite realizar consultas de manera interactiva.
Es bueno para analizar grupos de datos organizados por series de tiempo.
Permite identificar semejanzas y diferencias en la data.
Permite realizar Pivot.
Permite realizar Slice&Dice.
Permite realizar Drill&Down.
1.2 INTELIGENCIA DE NEGOCIOS
1.2.1 Definición
Se entiende por inteligencia de negocios (Business Intelligence) al conjunto de
metodologías, aplicaciones, prácticas y capacidades enfocadas a la creación y
administración de información que permite tomar mejores decisiones a los usuarios de una
organización.
Algunas de las tecnologías que forman parte de la inteligencia de negocios
son:
Data warehouse:Es una colección de datos que es extraída desde diferentes fuentes
de información a lo largo de la empresa
Reporting:Herramientas para la elaboración de informes y listados, tanto en detalle
como sobre información agregada
Análisis OLAP (On-Line AnalyticalProcessing):Herramientas que manejan
cuestiones complejas de bases de datos relacionales, proporcionando un acceso
multidimensional a los datos
Análisis visual: Permite comunicar complejos datos de negocios de forma
rápida e intuitiva.
Análisis predictivo:Es el proceso de seleccionar, explorar, y modelar grandes
volúmenes de datos que develen información previamente desconocida para
beneficio del negocio.
Cuadro de mando: Es un conjunto de indicadores que aportan información
sumarizada e inteligente al usuario.
Cuadro de mando integral: Es un instrumento o metodología de gestión que facilita
la implantación de la estrategia de la empresa de una forma eficiente
Minería de datos:Es una técnica orientada a extraer información desde grandes
volúmenes de datos.
Gestión del rendimiento: Describe la metodología, las métricas, los procesos y
sistemas empleados para supervisar y gestionar el rendimiento de una compañía
Reglas de negocio: Son un componente clave en cómo se toman las decisiones en
una empresa.
Dashboards: Son resúmenes visuales de información del negocio, que muestran de
una mirada la comprensión del global de las condiciones del negocio mediante
métricas eIndicadores Clave de Desempeño (KPIs).
Integración de datos (que incluye ETL,Extraccion, Transformacion y
Carga):Permiten operar con fuentes de datos de cualquier tipo (integrando los datos
en una base de datos única (Datamart, Datawarehouse, etc.).
1.2.2 Importancia
Un sistema de inteligencia de negocios es de gran importancia para las empresas en la
actualidad ya que con su implantación proporciona diversos beneficios entre los que
podemos destacar:
Crear un circulo integro de la información, esto se lograría con la transformación de
los datos en información y esta genera un conocimiento que le permite a la empresa
tomar mejores decisiones que se traducen en mejores resultados y que generan
nuevos datos.
Permitir una visión única, conformada, histórica, persistente y de calidad de toda la
información.
Crear, manejar y mantener métricas, indicadores claves de rendimiento (KPI, Key
Performance Indicador) e indicadores claves de metas (KGI, Key GoalIndicator)
fundamentales para la empresa.
Aportar información actualizada tanto a nivel agregado como en detalle.
Reducir las diferencias de enfoque de negocio entre el departamento de TI y la
organización.
Mejorar la comprensión y documentación de los sistemas de información en el
contexto de una organización.
Mejora de la competitividad de la organización como resultado de ser capaces de:
Diferenciar lo relevante sobre lo innecesario.
Acceder más rápido a la información.
Tener mayor agilidad en la toma de decisiones.
Los beneficios de la inteligencia de negocios pueden clasificarse en tres categorías
principales, las cuales son:
Reducción de costos.
Incremento de ingresos.
Mejoramiento de la satisfacción de los clientes.
Y esta lista no es exhaustiva ni detallada, pues los usuarios continúan encontrando formas
nuevas de implementar inteligencia de negocios
1.2.3 Componentes de la Inteligencia de Negocios. Todas las soluciones de BI tienen funciones parecidas, pero deben de reunir al menos los siguientes componentes:
Multidimensionalidad: La información multidimensional se puede encontrar en hojas de cálculo, bases de datos, etc. Una herramienta de BI debe de ser capaz de reunir información dispersa en toda la empresa e incluso en diferentes fuentes para así proporcionar a los departamentos la accesibilidad, poder y flexibilidad que necesitan para analizar la información. Por ejemplo, un pronóstico de ventas de un nuevo producto en varias regiones no está completo si no se toma en cuenta también el comportamiento histórico de las ventas de cada región y la forma en que la introducción de nuevos productos se ha desarrollado en cada región en cuestión.
Data Mining (minería de datos): Las empresas suelen generar grandes
cantidades de información sobre sus procesos productivos, desempeño operacional, mercados y clientes. Pero el éxito de los negocios depende por lo general de la habilidad para ver nuevas tendencias o cambios en las tendencias. Las aplicaciones de data mining pueden identificar tendencias y comportamientos, no sólo para extraer información, sino también para descubrir las relaciones en bases de datos que pueden identificar comportamientos que no muy evidentes.
Agentes: Los agentes son programas que piensan. Ellos pueden realizar tareas a
un nivel muy básico sin necesidad de intervención humana. Por ejemplo: un agente pueden realizar tares un poco complejas, como elaborar documentos, establecer diagramas de flujo, etc.
Data Warehouse (almacén de datos): Es la respuesta de la tecnología de
información a la descentralización en la toma de decisiones. Coloca información de todas las áreas funcionales de la organización en manos de quien toma las decisiones. También proporciona herramientas para búsqueda y análisis.
1.2.3.1 Aplicaciones Analíticas.
Data Mining, herramientas para minería de datos.
OLAP, herramientas de procesamiento analítico de datos.
Herramientas de consulta y reporte de datos.
Herramientas de producción de reportes personalizados.
ELT, herramientas de extracción, traducción y carga de datos.
Herramientas de administración de sistemas.
Portales de información empresarial.
Sistemas de base de datos.
Sistemas de administración del conocimiento.
Simulación y predicción. Son aplicaciones para simular escenarios y predecir
tendencias en el futuro. “Si el precio de la materia prima crece un 5% a lo largo del año y en tres meses el dólar sube 10%, ¿cómo afecta a nuestra venta al final del año?” “Si invertimos 10% más en esta línea de productos, ¿cómo cambia nuestra productividad y ROI?”
Activity-BasedCosting (actividad basada en costos). La determinación de los costes basados en actividades descubre los costes reales de los productos, servicios o clientes más allá de la contabilidad tradicional y desvela que por ejemplo dos clientes aparentemente igual de rentables según sus compras, en realidad causan costes muy diferentes, o que 25% de la actividad de la empresa causa80% de los costes.
Minería de Datos. Sistemas basados en algoritmos matemáticos para descubrir
tendencias escondidas entre grandes volúmenes de datos. Aplicada desde la detección de fraude hasta el análisis de cesta de compra.
BalancedScorecard/Cuadro de Mando Integral. Un concepto de gestión de la
estratégica empresarial desarrollado por Norton y Kaplan. Permite ver la empresa no sólo bajo la perspectiva financiera, sino también bajo otras como clientes, procesos o potenciales. Los objetivos estratégicos de las empresas se definen y su alcance se mide constantemente con datos reales.
Gestión de riesgo. Especialmente las entidades financieras y las aseguradoras,
pero también otras empresas, necesitan calcular riesgos y simular escenarios. Las aplicaciones BI proporcionan todo el proceso.
Alertas y vigilancia. Ya no es necesario leer cada mañana muchas páginas de
informes o mirar cada hora una pantalla para detectar si existe una situación crítica en algún lugar de la empresa. Se pueden vigilar automáticamente los indicadores de la actividad empresarial y generar avisos por email o SMS si un indicador está fuera de su rango normal, a cualquier ritmo y hora del día.
Fidelización de Clientes. Las aplicaciones ayudan a identificar que son los mejores
o más rentables clientes y porque clientes abandonan la empresa. Proporcionan los datos para campañas y evalúan las respuestas y el impacto.
Consolidación. Automatización de consolidaciones contables entre empresas de
un mismo grupo oentre sucursales. También se aplican en fusiones de empresas y adquisiciones.
1.2.3.2 Sistemas de Reportes.
Consultas y reportes
Se usa con propósito analítico Manipular los datos Realiza un pedido de datos Realiza la carga de los datos Darle formato a los datos Presentar los datos
QueryTool (herramienta de consultas): Un tipo específico de herramientas de acceso a
datos por usuarios finales que invita al usuario a formas sus propias consultas manipulando
directamente las tablas relacionales y sus uniones.
Se diseñan Reportes de todo tipo incluyendo gráficos y parámetros de ingreso dejándolos
en una librería para ser accedidos, mediante permisos, por los usuarios que correspondan.
1.2.3.3 Base de Datos Multidimensionales y Data Warehouse.
Base de datos multidimensionales Modelos Multidimensionales Técnica de diseño lógico para diseño de Data Warehouses. Proporcionan los mejores resultados. Diseños de acuerdo a un estándar que es intuitivo y fácil de entender. Permite accesos de alto rendimiento. Formado por una tabla cuya clave es compuesta, TableFact (tabla de hechos) y un
conjunto de tablas más pequeñas denominadas Tablas de Dimensión. Su apariencia hace que se les denomine diagramas STAR.
Data Warehouse
Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones.
Un sistema de DW apunta a disponer de una visión única de los clientes y proveer la mayor cantidad posible de información a los usuarios de la empresa, facilitándose el monitoreo del negocio.
Los datos del DW poseen algunas cualidades fundamentales. La primera de ellas es que están orientados a temas, diferenciándose así de los sistemas transaccionales que estructuran los datos en procesos funcionales.
Por otro lado, se trata de datos integrados, es decir, están consolidados, lo cual supone un proceso previo de depuración y homogeneización, etapa que puede ser una de las más complejas al implementar un DW. Por último, los datos son historiados, ya que mantienen el registro histórico de sus valores, lo cual redunda en que, a diferencia de los sistemas transaccionales, no sean “volátiles”.
1.2.3.4 Data Mining (minería de datos). Las técnicas de Data Mining son el resultado de un largo proceso de investigación y desarrollo de productos. Esta evolución comenzó cuando los datos de negocios fueron almacenados por primera vez en computadoras, y continuó con mejoras en el acceso a los datos, y más recientemente con tecnologías generadas para permitir a los usuarios navegar a través de los datos en tiempo real. Data Mining toma este proceso de evolución más allá del acceso y navegación retrospectiva de los datos, hacia la entrega de información prospectiva y proactiva. Data Mining está lista para su aplicación en la comunidad de negocios porque está soportado por tres tecnologías que ya están suficientemente maduras:
Recolección masiva de datos. Potentes computadoras con multiprocesadores. Algoritmos de Data Mining.
Principales características y objetivos de la Minería de Datos
Explorar los datos que se encuentran en las profundidades de las bases de datos, como los almacenes de datos, que algunas veces contienen información almacenada durante varios años.
En algunos casos, los datos se consolidan en un almacén de datos y en mercados de datos; en otros, se mantienen en servidores de Internet e Intranet.
El entorno de la minería de datos suele tener una arquitectura cliente servidor. Las herramientas de la minería de datos ayudan a extraer el mineral de la
información enterrado en archivos corporativos o en registros públicos, archivados.
El minero es, muchas veces un usuario final con poca o ninguna habilidad de programación, facultado por barrenadoras de datos y otras poderosas herramientas indagatorias para efectuar preguntas ad-hoc y obtener rápidamente respuestas.
Hurgar y sacudir a menudo implica el descubrimiento de resultados valiosos e inesperados.
Las herramientas de la minería de datos se combinan fácilmente y pueden analizarse y procesarse rápidamente.
Debido a la gran cantidad de datos, algunas veces resulta necesario usar procesamiento en paralelo para la minería de datos.
La minería de datos produce cinco tipos de información:
Asociaciones. Secuencias. Clasificaciones. Agrupamientos.
Pronósticos. Los mineros de datos usan varias herramientas y técnicas.
1.2.3.5 Administración del Conocimiento. De forma general, los datos son la materia prima bruta. En el momento que el usuario les atribuye algún significado especial pasan a convertirse en información. Cuando los especialistas elaboran o encuentran un modelo, haciendo que la interpretación de la información y ese modelo representen un valor agregado, entonces nos referimos al conocimiento. El objetivo fundamental del KDD es encontrar conocimiento útil, válido, relevante y nuevo sobre un fenómeno o actividad mediante algoritmos eficientes, dadas las crecientes órdenes de magnitud en los datos. Al mismo tiempo hay un profundo interés por presentar los resultados de manera visual o al menos de manera que su interpretación sea muy clara. Otro aspecto es que la interacción humano-máquina deberá ser flexible, dinámica y colaboradora. El resultado de la exploración deberá ser interesante y su calidad no debe ser afectada por mayores volúmenes de datos o por ruido en los datos. En este sentido, los algoritmos de descubrimiento de información deben ser altamente robustos. En la siguiente figura se ilustra la jerarquía que existe en una base de datos entre datos, información y conocimiento. Se observa igualmente el volumen que presenta en cada nivel y el valor que los responsables de las decisiones le dan en esa jerarquía. El área interna dentro del triángulo representa los objetivos que se han propuesto. La separación del triángulo representa la estrecha unión entre dato e información, no así entre la información y el conocimiento.
Jerarquía del Conocimiento. 1.3 PRINCIPALES HERRAMIENTAS DE LA INTELIGENCIA DE NEGOCIOS.
Herramientas Esenciales
Una solución de BI incluye la implementación de una serie de herramientas y técnicas orientadas a gestionar, explotar, distribuir y estructurar información. Entre ellas, destacan las siguientes:
Query&Report
Las herramientas de Query (consulta) y Report (reporte) son quizá las más conocidas en este ámbito, ya que son fundamentales para el desarrollo y manejo de listados e informes basados en la información presente en los almacenes de datos y Data Marts.
Data Warehouse
Un Data Warehouse (DW) o almacén de datos es una colección de datos que es extraída desde diferentes fuentes de información a lo largo de la empresa (bases de datos departamentales, intranet, sistemas transaccionales, etc.) con la finalidad de permitir la realización de consultas y análisis, fundamentalmente, para ayudar a la toma de decisiones.
Data Mart
Aunque para algunos se trata casi de un sinónimo de Data Warehouse, un Data Mart o cubo de datos puede entenderse como un subconjunto del repositorio de datos, que se orienta a un área específica del negocio, como recursos humanos, ventas o marketing, por ejemplo. En otras palabras, un Data Mart corresponde a un almacén de datos más restringido que un DW en cuanto al volumen de datos que contiene y al alcance dentro de la organización.
Herramientas OLAP
OLAP (On Line AnalyticalProcessing) son un conjunto de herramientas capaces de responder rápida y ágilmente a las solicitudes de información de los usuarios y que deben reflejar cualquier lógica de negocio por las que se consulte.
En contraste con los sistemas transaccionales, OLTP (On Line TransactionProcessing), las herramientas OLAP presentan información multidimensional, es decir, desde múltiples perspectivas. Del mismo modo, los sistemas analíticos, al igual que los datos del Data Warehouse, están orientados a temas, y no sólo operan con datos actuales, sino también con datos históricos.
Una de las principales cualidades de las herramientas de OLAP es identificar tendencias, es decir, permiten apoyar la toma decisiones considerando diversas variables, así como también permiten identificar cambios en las preferencias de los clientes. Sin embargo, aunque pueden responder consultas complejas y ratificar información, lo hacen siempre dependiendo del usuario, que es quien define las relaciones a considerar.
Data Mining
El Data Mining (DM) o minería de datos es una técnica orientada a extraer información desde grandes volúmenes de datos y corresponde a una de las claves de la inteligencia de negocios. El DM es un proceso conocido como KDD (KnowledgeDiscovery in Databases; Descubrimiento de Conocimiento en Bases de Datos) que consta de tres fases: preparación de los datos, extracción de información e interpretación de los resultados.
Normalmente, el DM se realiza con las llamadas “técnicas de verificación” -en donde se prueba una hipótesis del usuario- y los “métodos de descubrimiento” -búsqueda de patrones (incluyendo las técnicas de predicción)-. Lo anterior se traduce en análisis exploratorios, los cuales se apoyan en herramientas de visualización de datos y construcción de modelos, con el objetivo de realizar predicciones utilizando los patrones detectados en los datos conocidos con información del pasado.