Base De Datos Tecnologia De Negocios Electronicos

45
UNIVERSIDAD GALILEO UNIVERSIDAD GALILEO HERBERT PATZAN CARRILLO HERBERT PATZAN CARRILLO TECNOLOGIA DE NEGOCIOS ELECTRONICOS TECNOLOGIA DE NEGOCIOS ELECTRONICOS BASES DE DATOS BASES DE DATOS

description

Tecnologia de negocios electronicos Universidad Galileo Herbert Patzan Carrillo

Transcript of Base De Datos Tecnologia De Negocios Electronicos

Page 1: Base De Datos Tecnologia De Negocios Electronicos

UNIVERSIDAD GALILEOUNIVERSIDAD GALILEOHERBERT PATZAN CARRILLOHERBERT PATZAN CARRILLOTECNOLOGIA DE NEGOCIOS ELECTRONICOSTECNOLOGIA DE NEGOCIOS ELECTRONICOS

BASES DE DATOSBASES DE DATOS

Page 2: Base De Datos Tecnologia De Negocios Electronicos

CONCEPTOCONCEPTO

Es un conjunto de información no redundante en Es un conjunto de información no redundante en datos estructurados y organizados datos estructurados y organizados independientemente de su utilización y su independientemente de su utilización y su implementación, accesibles en tiempo real y implementación, accesibles en tiempo real y compatibles con usuarios concurrentes con compatibles con usuarios concurrentes con necesidad de información de diferente tipo y en necesidad de información de diferente tipo y en diferente momentodiferente momento

Page 3: Base De Datos Tecnologia De Negocios Electronicos

CONCEPTOCONCEPTO En este sentido, una biblioteca puede En este sentido, una biblioteca puede

considerarse una base de datos compuesta en considerarse una base de datos compuesta en su mayoría por documentos y textos impresos en su mayoría por documentos y textos impresos en papel e indexados para su consulta. En la papel e indexados para su consulta. En la actualidad, y debido al desarrollo tecnológico de actualidad, y debido al desarrollo tecnológico de campos como la informática y la electrónica, la campos como la informática y la electrónica, la mayoría de las bases de datos tienen formato mayoría de las bases de datos tienen formato electrónico, que ofrece un amplio rango de electrónico, que ofrece un amplio rango de soluciones al problema de almacenar datos. soluciones al problema de almacenar datos.

Page 4: Base De Datos Tecnologia De Negocios Electronicos

COMPONENTESCOMPONENTES

En informática existen los sistemas gestores de En informática existen los sistemas gestores de bases de datos (SGBD), que permiten almacenar bases de datos (SGBD), que permiten almacenar y posteriormente acceder a los datos de forma y posteriormente acceder a los datos de forma rápida y estructurada.rápida y estructurada.

son un tipo de software muy específico, dedicado son un tipo de software muy específico, dedicado a servir de interfaz entre la base de datos, el a servir de interfaz entre la base de datos, el usuario y las aplicaciones que la utilizan. Se usuario y las aplicaciones que la utilizan. Se compone de un lenguaje de definición de datos, compone de un lenguaje de definición de datos, de un lenguaje de manipulación de datos y de un de un lenguaje de manipulación de datos y de un lenguaje de consulta lenguaje de consulta

Page 5: Base De Datos Tecnologia De Negocios Electronicos

COMPONENTESCOMPONENTES

Entre los SGBD mas conocidos Entre los SGBD mas conocidos están:están: LibresLibres

MySQLMySQL PostgreSQLPostgreSQL FirebirdFirebird Apache DerbyApache Derby

GratuitosGratuitos Microsoft SQL Server Compact EditionMicrosoft SQL Server Compact Edition Sybase Express Edition para LinuxSybase Express Edition para Linux

Page 6: Base De Datos Tecnologia De Negocios Electronicos

COMPONENTESCOMPONENTES

ComercialesComerciales IBM DB2IBM DB2 IBM InformixIBM Informix Microsoft AccessMicrosoft Access Microsoft SQL ServerMicrosoft SQL Server OracleOracle Sybase IQSybase IQ

Page 7: Base De Datos Tecnologia De Negocios Electronicos

VENTAJAS DE LAS BD´sVENTAJAS DE LAS BD´s

Independencia de datos y tratamientoIndependencia de datos y tratamiento Coherencia de resultadosCoherencia de resultados Mayor disponibilidad de datosMayor disponibilidad de datos Cumplimiento de normasCumplimiento de normas Facilidad de manejoFacilidad de manejo Seguridad de la informaciónSeguridad de la información No hay duplicidad de datosNo hay duplicidad de datos Integridad referencialIntegridad referencial

Page 8: Base De Datos Tecnologia De Negocios Electronicos

DESVENTAJAS DE LAS BD´sDESVENTAJAS DE LAS BD´s

Los costos de actualización de hardware y Los costos de actualización de hardware y software pueden ser elevados.software pueden ser elevados.

El costo o remuneración para un El costo o remuneración para un administrador de base de datos puede ser administrador de base de datos puede ser muy grande.muy grande.

Los registros muy grandes pueden ser Los registros muy grandes pueden ser difíciles de leer en pantalla.difíciles de leer en pantalla.

Page 9: Base De Datos Tecnologia De Negocios Electronicos

JERARQUIA DE DATOSJERARQUIA DE DATOS

CarácterCarácter Unidad de construcción básica de información Unidad de construcción básica de información

representada por un byterepresentada por un byte CampoCampo

Grupo de caracteresGrupo de caracteres RegistroRegistro

Conjunto de campos relacionadosConjunto de campos relacionados ArchivoArchivo

Grupo de registros relacionadosGrupo de registros relacionados

Page 10: Base De Datos Tecnologia De Negocios Electronicos

JERARQUIA DE DATOSJERARQUIA DE DATOS Base de DatosBase de Datos

Conjunto de archivos integrado y Conjunto de archivos integrado y relacionados.relacionados.

EntidadEntidad Tipos generalizados de personas, lugares o Tipos generalizados de personas, lugares o

cosas (objetos), para los cuales se recopilan, cosas (objetos), para los cuales se recopilan, almacenan y mantienen datos.almacenan y mantienen datos.

AtributoAtributo Los atributos, tanto de entidades como de Los atributos, tanto de entidades como de

relaciones, toman sus valores posibles de un relaciones, toman sus valores posibles de un conjunto llamado dominio. El dominio es, conjunto llamado dominio. El dominio es, entonces, el conjunto de valores posibles que entonces, el conjunto de valores posibles que puede tomar un atributo dado de un conjunto puede tomar un atributo dado de un conjunto de entidades.de entidades.

Page 11: Base De Datos Tecnologia De Negocios Electronicos

JERARQUIA DE DATOSJERARQUIA DE DATOS

ALMACENAMIENTO DE DATOALMACENAMIENTO DE DATO Valor especifico de un atributo.Valor especifico de un atributo.

CLAVECLAVE Campo o grupo de campos en un registro que Campo o grupo de campos en un registro que

se usa para identificar a este ultimo.se usa para identificar a este ultimo. CLAVE PRIMARIACLAVE PRIMARIA

Campo o grupo de campos que identifica Campo o grupo de campos que identifica exclusivamente el registro.exclusivamente el registro.

Page 12: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL Éste es el modelo más utilizado en la actualidad Éste es el modelo más utilizado en la actualidad

para modelar problemas reales y administrar para modelar problemas reales y administrar datos dinámicamente. Tras ser postulados sus datos dinámicamente. Tras ser postulados sus fundamentos en 1970 por Edgar Frank Codd, de fundamentos en 1970 por Edgar Frank Codd, de los laboratorios IBM en San José (California), no los laboratorios IBM en San José (California), no tardó en consolidarse como un nuevo paradigma tardó en consolidarse como un nuevo paradigma en los modelos de base de datos. Su idea en los modelos de base de datos. Su idea fundamental es el uso de "relaciones". Estas fundamental es el uso de "relaciones". Estas relaciones podrían considerarse en forma lógica relaciones podrían considerarse en forma lógica como conjuntos de datos llamados "tuplas". como conjuntos de datos llamados "tuplas".

Esto es pensando en cada relación como si Esto es pensando en cada relación como si fuese una tabla que está compuesta por fuese una tabla que está compuesta por registrosregistros (las filas de una tabla), que representarían las (las filas de una tabla), que representarían las tuplas, y tuplas, y camposcampos (las columnas de una tabla). (las columnas de una tabla).

Page 13: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL

El lenguaje más habitual para construir las El lenguaje más habitual para construir las consultas a bases de datos relacionales es SQL, consultas a bases de datos relacionales es SQL, Structured Query Language o Lenguaje Structured Query Language o Lenguaje Estructurado de Consultas, un estándar Estructurado de Consultas, un estándar implementado por los principales motores o implementado por los principales motores o sistemas de gestión de bases de datos sistemas de gestión de bases de datos relacionales. Durante la elaboración de una base relacionales. Durante la elaboración de una base de datos relacional pasa por un proceso de de datos relacional pasa por un proceso de normalizaciónnormalización

Page 14: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL

Ente las ventajas del modelo relacional están:Ente las ventajas del modelo relacional están: Garantizar herramientas para evitar la Garantizar herramientas para evitar la

duplicidad de registros, a través de campos duplicidad de registros, a través de campos claves o llaves. claves o llaves.

Garantiza la integridad referencial: Así al Garantiza la integridad referencial: Así al eliminar un registro elimina todos los eliminar un registro elimina todos los registros relacionados dependientes. registros relacionados dependientes.

Favorece la normalización por ser más Favorece la normalización por ser más comprensible y aplicable. comprensible y aplicable.

Page 15: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL El proceso de El proceso de normalización de bases de normalización de bases de

datosdatos consiste en aplicar una serie de reglas a consiste en aplicar una serie de reglas a las relaciones obtenidas tras el paso del modelo las relaciones obtenidas tras el paso del modelo entidad-relación al modelo relacional. Las bases entidad-relación al modelo relacional. Las bases de datos relacionales se normalizan para:de datos relacionales se normalizan para:

Evitar la redundancia de los datos. Evitar la redundancia de los datos. Evitar problemas de actualización de los datos Evitar problemas de actualización de los datos

en las tablas. en las tablas. Proteger la integridad de los datos. Proteger la integridad de los datos.

Page 16: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL Las relaciones que describe Codd al definir su Las relaciones que describe Codd al definir su

modelo relacional, son transformadas en tablas modelo relacional, son transformadas en tablas al momento de trabajar con una base de datos. al momento de trabajar con una base de datos. Las Formas Normales buscan optimizar estas Las Formas Normales buscan optimizar estas estructuras eliminando básicamente la estructuras eliminando básicamente la redundancia utilizando como medio principal las redundancia utilizando como medio principal las dependencias funcionales. Las Formas Normales dependencias funcionales. Las Formas Normales son un pequeño numero de reglas que de son un pequeño numero de reglas que de cumplirse hacen que las estructuras posean la cumplirse hacen que las estructuras posean la menor cantidad de redundancia posible.menor cantidad de redundancia posible.

Primera Forma Normal (1NF): No hay Primera Forma Normal (1NF): No hay campos múltiples (todo los campos son campos múltiples (todo los campos son atómicos). Todas las filas deben tener el atómicos). Todas las filas deben tener el mismo numero de columnas. mismo numero de columnas.

Page 17: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL Segunda Forma Normal (2NF): Todo campo Segunda Forma Normal (2NF): Todo campo

que no sea clave debe depender por completo que no sea clave debe depender por completo de toda la clave. de toda la clave.

Tercera Forma Normal (3NF): No hay Tercera Forma Normal (3NF): No hay dependencias transitivas. Un campo debe dependencias transitivas. Un campo debe depender de la clave y no de otro campo. depender de la clave y no de otro campo.

Forma Normal de Boyce-Codd (BCNF): Todos Forma Normal de Boyce-Codd (BCNF): Todos los determinantes de la tabla son clave los determinantes de la tabla son clave candidata. candidata.

Cuarta Forma Normal (4NF): Una fila no debe Cuarta Forma Normal (4NF): Una fila no debe contener dos o más campos multi-valorados contener dos o más campos multi-valorados (aquellos que pueden contener más de un (aquellos que pueden contener más de un valor simultáneamente) sobre una entidad. valor simultáneamente) sobre una entidad.

Page 18: Base De Datos Tecnologia De Negocios Electronicos

MODELO RELACIONALMODELO RELACIONAL

Quinta Forma Normal (5NF): Una tabla puede Quinta Forma Normal (5NF): Una tabla puede almacenar atributos dependientes a la clave almacenar atributos dependientes a la clave sólosólo por unión. por unión.

Page 19: Base De Datos Tecnologia De Negocios Electronicos

ORIENTADAS A OBJETOSORIENTADAS A OBJETOS

En una base de datos orientada a objetos, la En una base de datos orientada a objetos, la información se representa mediante objetos información se representa mediante objetos como los presentes en la programación orientada como los presentes en la programación orientada a objetos. Cuando se integra las características a objetos. Cuando se integra las características de una base de datos con las de un lenguaje de de una base de datos con las de un lenguaje de programación orientado a objetos, el resultado es programación orientado a objetos, el resultado es un sistema gestor de base de datos orientada a un sistema gestor de base de datos orientada a objetos (ODBMS, objetos (ODBMS, Object Database Management Object Database Management SystemSystem). Un ODBMS hace que los objetos de la ). Un ODBMS hace que los objetos de la base de datos aparezcan como objetos de un base de datos aparezcan como objetos de un lenguaje de programación en uno o más lenguaje de programación en uno o más lenguajes de programación a los que dé soporte. lenguajes de programación a los que dé soporte.

Page 20: Base De Datos Tecnologia De Negocios Electronicos

ORIENTADAS A OBJETOSORIENTADAS A OBJETOS

Un ODBMS extiende los lenguajes con datos Un ODBMS extiende los lenguajes con datos persistentes de forma transparente, control de persistentes de forma transparente, control de concurrencia, recuperación de datos, consultas concurrencia, recuperación de datos, consultas asociativas y otras capacidades.asociativas y otras capacidades.

Las bases de datos orientadas a objetos se Las bases de datos orientadas a objetos se diseñan para trabajar bien en conjunción con diseñan para trabajar bien en conjunción con lenguajes de programación orientados a objetos lenguajes de programación orientados a objetos como Java, C#, Visual Basic.NET y C++. Los como Java, C#, Visual Basic.NET y C++. Los ODBMS usan exactamente el mismo modelo que ODBMS usan exactamente el mismo modelo que estos lenguajes de programación.estos lenguajes de programación.

Page 21: Base De Datos Tecnologia De Negocios Electronicos

ORIENTADAS A OBJETOSORIENTADAS A OBJETOS

HerenciaHerencia

Las clases en un sistema orientado a objetos Las clases en un sistema orientado a objetos se representan en forma jerárquica, así que se representan en forma jerárquica, así que las propiedades o características del elemento las propiedades o características del elemento persona las contendrán (heredaran) los persona las contendrán (heredaran) los elementos alumno y maestro. Se puede decir elementos alumno y maestro. Se puede decir que tanto la entidad Alumno y maestro son que tanto la entidad Alumno y maestro son subclases de la clase personasubclases de la clase persona

Page 22: Base De Datos Tecnologia De Negocios Electronicos

ORIENTADAS A OBJETOSORIENTADAS A OBJETOS

En base de datos orientados a objetos pueden En base de datos orientados a objetos pueden existir los siguientes cambios: existir los siguientes cambios:

Adición de una nueva clase: Para realizar este Adición de una nueva clase: Para realizar este proceso, la nueva clase debe colocarse en la proceso, la nueva clase debe colocarse en la jerarquía de clase o subclase cuidando las jerarquía de clase o subclase cuidando las variables o métodos de herencia variables o métodos de herencia correspondientes. correspondientes.

Eliminación de una clase: Se requiere la Eliminación de una clase: Se requiere la realización de varias operaciones, se debe de realización de varias operaciones, se debe de cuidar los elementos que se han heredado de cuidar los elementos que se han heredado de esa clase a otras y reestructurar la jerarquía. esa clase a otras y reestructurar la jerarquía.

Page 23: Base De Datos Tecnologia De Negocios Electronicos

MULTIDIMENCIONALESMULTIDIMENCIONALES Las bases de datos multidimensionales se Las bases de datos multidimensionales se

utilizan principalmente para crear utilizan principalmente para crear aplicaciones OLAP y se puede decir que aplicaciones OLAP y se puede decir que son bases de datos de una sola tabla, su son bases de datos de una sola tabla, su peculiaridad es que por cada dimensión peculiaridad es que por cada dimensión tienen un campo y otro campo por cada tienen un campo y otro campo por cada métrica o hecho es decir tienen n-tuplas de métrica o hecho es decir tienen n-tuplas de campos. campos.

Page 24: Base De Datos Tecnologia De Negocios Electronicos

MULTIDIMENCIONALESMULTIDIMENCIONALES EJEMPLO:EJEMPLO: Dimensión (Tiempo,Productos) Dimensión (Tiempo,Productos) Jerarquía (Año->Semestre->Mes->Semana),(Categoría->Línea-Jerarquía (Año->Semestre->Mes->Semana),(Categoría->Línea-

>Marca)>Marca) Elementos(2006,2007 Ó Máquinas caras, Máquinas Baratas) Elementos(2006,2007 Ó Máquinas caras, Máquinas Baratas) Hecho Hecho FactFact (Ventas, Inventario, Defectos, Devoluciones) (Ventas, Inventario, Defectos, Devoluciones) Métrica (PD:=Devoluciones/Ventas, Ventas, Cantidad de Métrica (PD:=Devoluciones/Ventas, Ventas, Cantidad de

Defectos)Defectos)

tabla            

tiempo productos ventas inventario defectos devolucionesdevoluciones ventas

2006 todos 1000 200 10 1--100 5%

Page 25: Base De Datos Tecnologia De Negocios Electronicos

MULTIDIMENCIONALESMULTIDIMENCIONALES Las estructuras multidimensionales permiten que Las estructuras multidimensionales permiten que

el usuario analice los datos de acuerdo a como el usuario analice los datos de acuerdo a como quiera mirar el negocio, resumido por línea de quiera mirar el negocio, resumido por línea de producto, u otras perspectivas claves para su producto, u otras perspectivas claves para su negocio. El server de Data Mining debe estar negocio. El server de Data Mining debe estar integrado con el data warehouse y el server integrado con el data warehouse y el server OLAP para insertar el análisis de negocios OLAP para insertar el análisis de negocios directamente en esta infraestructura. directamente en esta infraestructura.

Page 26: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSINGDATA WAREHOUSING En el contexto de la informática, un En el contexto de la informática, un almacén de almacén de

datosdatos ( (data warehousedata warehouse) es una colección de ) es una colección de datos orientados a un dominio, integrado y datos orientados a un dominio, integrado y variable que ayuda a la toma de decisiones de la variable que ayuda a la toma de decisiones de la empresa u organización.empresa u organización.

Se trata, sobre todo, de un expediente de una Se trata, sobre todo, de un expediente de una empresa más allá de la información transaccional empresa más allá de la información transaccional y operacional, almacenado en una base de datos y operacional, almacenado en una base de datos diseñada para favorecer el análisis y la diseñada para favorecer el análisis y la divulgación eficientes de datos (especialmente divulgación eficientes de datos (especialmente OLAP, procesamiento analítico en línea). OLAP, procesamiento analítico en línea).

Page 27: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSINGDATA WAREHOUSING

Data warehousing es el centro de la arquitectura Data warehousing es el centro de la arquitectura para los sistemas de información en la década de para los sistemas de información en la década de los '90. Soporta el procesamiento informático al los '90. Soporta el procesamiento informático al proveer, una plataforma sólida, a partir de los proveer, una plataforma sólida, a partir de los datos históricos para hacer el análisis. Facilita la datos históricos para hacer el análisis. Facilita la integración de sistemas de aplicación no integración de sistemas de aplicación no integrados. Organiza y almacena los datos que integrados. Organiza y almacena los datos que se necesitan para el procesamiento analítico, se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de informático sobre una amplia perspectiva de tiempo. tiempo.

Page 28: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSINGDATA WAREHOUSING

Base de Datos Operacional

Data Warehouse

Datos OperacionalesDatos del negocio para

Información

Orientado a la aplicación

Orientado al sujeto

Actual Actual + histórico

DetalladaDetallada + más

resumida

Cambia continuamente

Estable

Page 29: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSINGDATA WAREHOUSING

Sistemas EstratégicosSistemas Estratégicos, orientados a soportar la toma de , orientados a soportar la toma de decisiones.decisiones.

Sistemas TácticosSistemas Tácticos, diseñados para soportar las actividades de , diseñados para soportar las actividades de coordinación y manejo de documentación y definidos para facilitar coordinación y manejo de documentación y definidos para facilitar consultas sobre información almacenada en el sistema y asi consultas sobre información almacenada en el sistema y asi proporcionar informes.proporcionar informes.

Sistemas Técnico-Operativos,Sistemas Técnico-Operativos, que cubren el núcleo de que cubren el núcleo de operaciones tradicionales de captura masiva de datos y servicios operaciones tradicionales de captura masiva de datos y servicios básicos de tratamiento de datos básicos de tratamiento de datos

Page 30: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSINGDATA WAREHOUSING

Sistemas InterinstitucionalesSistemas Interinstitucionales, este último nivel , este último nivel de sistemas de información recién está de sistemas de información recién está surgiendo, es consecuencia del desarrollo surgiendo, es consecuencia del desarrollo organizacional orientado a un mercado de organizacional orientado a un mercado de carácter global, el cual obliga a pensar e carácter global, el cual obliga a pensar e implementar estructuras de comunicación más implementar estructuras de comunicación más estrechas entre la organización y el mercado estrechas entre la organización y el mercado

Page 31: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSEDATA WAREHOUSE En un almacén de datos lo que se quiere es En un almacén de datos lo que se quiere es

contener datos que son necesarios o útiles para contener datos que son necesarios o útiles para las empresas.las empresas.

Un almacén de datos debe entregar la Un almacén de datos debe entregar la información correcta a la gente indicada en el información correcta a la gente indicada en el momento adecuado en el formato correcto. El momento adecuado en el formato correcto. El almacén de datos da respuesta a las almacén de datos da respuesta a las necesidades de usuarios conocedores, utilizando necesidades de usuarios conocedores, utilizando Sistemas de Soporte de Decisiones (DSS) Sistemas de Soporte de Decisiones (DSS)

El ambiente de un Data Warehouse queda El ambiente de un Data Warehouse queda definido por la suma de los diferentes DataMarts definido por la suma de los diferentes DataMarts integrados, no sólo a nivel físico sino también a integrados, no sólo a nivel físico sino también a nivel lógico.nivel lógico.

Page 32: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSEDATA WAREHOUSE

CARACTERISTICAS:CARACTERISTICAS: Orientado al temaOrientado al tema IntegradoIntegrado De tiempo varianteDe tiempo variante No volátilNo volátil

Page 33: Base De Datos Tecnologia De Negocios Electronicos

DATA WAREHOUSEDATA WAREHOUSE

Page 34: Base De Datos Tecnologia De Negocios Electronicos

DATA MININGDATA MINING Bajo el nombre de Bajo el nombre de minería de datosminería de datos se se

engloban un conjunto de técnicas encaminadas a engloban un conjunto de técnicas encaminadas a la extracción de "conocimiento" procesable la extracción de "conocimiento" procesable implícito en las bases de datos. Las bases de la implícito en las bases de datos. Las bases de la minería de datos se encuentran en la inteligencia minería de datos se encuentran en la inteligencia artificial y en el análisis estadístico. Mediante los artificial y en el análisis estadístico. Mediante los modelos extraídos utilizando técnicas de minería modelos extraídos utilizando técnicas de minería de datos se aborda la solución a problemas de de datos se aborda la solución a problemas de predicción, clasificación y segmentación predicción, clasificación y segmentación

Page 35: Base De Datos Tecnologia De Negocios Electronicos

DATA MININGDATA MINING Un proceso típico de minería de datos parte de la Un proceso típico de minería de datos parte de la

selección del conjunto de datos, tanto en lo que selección del conjunto de datos, tanto en lo que se refiere a las variables dependientes, como a se refiere a las variables dependientes, como a las variables objetivo, como posiblemente al las variables objetivo, como posiblemente al muestreo de los registros disponibles.muestreo de los registros disponibles.

El ejemplo clásico de la minería de datos tiene El ejemplo clásico de la minería de datos tiene que ver con la detección de que ver con la detección de hábitos de compra hábitos de compra en supermercadosen supermercados. Un estudio muy citado . Un estudio muy citado detectó que los viernes había una cantidad detectó que los viernes había una cantidad inusualmente elevada de clientes que adquirían a inusualmente elevada de clientes que adquirían a la vez pañales y cerveza. la vez pañales y cerveza.

Page 36: Base De Datos Tecnologia De Negocios Electronicos

DATA MININGDATA MINING

Se detectó que se debía a que dicho día Se detectó que se debía a que dicho día solían acudir al supermercado padres solían acudir al supermercado padres jóvenes cuya perspectiva para el fin de jóvenes cuya perspectiva para el fin de semana consistía en quedarse en casa semana consistía en quedarse en casa cuidando de su hijo y viendo la televisión cuidando de su hijo y viendo la televisión con una cerveza en la mano. El con una cerveza en la mano. El supermercado pudo incrementar sus supermercado pudo incrementar sus ventas de cerveza colocándolas próximas a ventas de cerveza colocándolas próximas a los pañales para fomentar las ventas los pañales para fomentar las ventas compulsivascompulsivas..

Page 37: Base De Datos Tecnologia De Negocios Electronicos

DATA MININGDATA MINING

LA MINERIA DE DATOS SE BASA EN LA LA MINERIA DE DATOS SE BASA EN LA ESTADISTICA Y TOMA LA SIGUIENTE ESTADISTICA Y TOMA LA SIGUIENTE INFORMACION:INFORMACION: Análisis de la VarianzaAnálisis de la Varianza: mediante el cual : mediante el cual

se contrasta la existencia de diferencias se contrasta la existencia de diferencias significativas entre las medidas de una o significativas entre las medidas de una o más variables continuas en grupo de más variables continuas en grupo de población distintos. población distintos.

RegresiónRegresión: define la relación entre una o : define la relación entre una o más variables.más variables.

Page 38: Base De Datos Tecnologia De Negocios Electronicos

DATA MININGDATA MINING

Análisis clusterAnálisis cluster: permite la clasificación de : permite la clasificación de una población en un número determinado una población en un número determinado de grupos, en base a semejanzas y de grupos, en base a semejanzas y desemejanzas de perfiles existentes. desemejanzas de perfiles existentes.

Análisis discriminanteAnálisis discriminante: permite la : permite la clasificación de individuos en grupos que clasificación de individuos en grupos que previamente se han establecido, permite previamente se han establecido, permite encontrar la regla de clasificación de los encontrar la regla de clasificación de los elementos de estos grupos, y por tanto una elementos de estos grupos, y por tanto una mejor identificación.mejor identificación.

Page 39: Base De Datos Tecnologia De Negocios Electronicos

DATA MININGDATA MINING

TENDENCIASTENDENCIAS La Minería de Datos ha sufrido La Minería de Datos ha sufrido

transformaciones en los últimos años de transformaciones en los últimos años de acuerdo con cambios tecnológicos, de acuerdo con cambios tecnológicos, de estrategias de marketing, la extensión de los estrategias de marketing, la extensión de los modelos de compra en línea, etc. Los más modelos de compra en línea, etc. Los más importantes de ellos son:importantes de ellos son: La importancia que han cobrado los La importancia que han cobrado los datos datos

no estructuradosno estructurados (texto, páginas de (texto, páginas de Internet, etc.) Internet, etc.)

La La necesidad de integrarnecesidad de integrar los algoritmos y los algoritmos y resultados obtenidos en sistemas resultados obtenidos en sistemas operacionales, portales de Internet, etc. operacionales, portales de Internet, etc.

Page 40: Base De Datos Tecnologia De Negocios Electronicos

BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE

Business Intelligence suele definirse como la Business Intelligence suele definirse como la transformación de los datos de la compañía en transformación de los datos de la compañía en conocimiento para obtener una ventaja conocimiento para obtener una ventaja competitiva. competitiva.

Business Intelligence puede ser el conjunto de Business Intelligence puede ser el conjunto de metodologías, aplicaciones y tecnologías que metodologías, aplicaciones y tecnologías que permiten reunir, depurar y transformar datos de permiten reunir, depurar y transformar datos de los sistemas transaccionales e información los sistemas transaccionales e información desestructurada (interna y externa a la desestructurada (interna y externa a la compañía) en información estructurada, para su compañía) en información estructurada, para su explotación directa (análisis OLAP.) o para su explotación directa (análisis OLAP.) o para su análisis y conversión en conocimiento soporte a análisis y conversión en conocimiento soporte a la toma de decisiones sobre el negocio.la toma de decisiones sobre el negocio.

Page 41: Base De Datos Tecnologia De Negocios Electronicos

BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE

COMPONENTES DE BICOMPONENTES DE BI Diseño conceptual de los sistemasDiseño conceptual de los sistemas. Para . Para

resolver el diseño de un modelo BI, se deben resolver el diseño de un modelo BI, se deben contestar a tres preguntas básicas: contestar a tres preguntas básicas: cuál es la cuál es la información requerida para gestionar y tomar información requerida para gestionar y tomar decisiones; cuál debe ser el formato y decisiones; cuál debe ser el formato y composición de los datos a utilizar; y de composición de los datos a utilizar; y de dónde proceden esos datos y cuál es la dónde proceden esos datos y cuál es la disponibilidad y periodicidad requeridadisponibilidad y periodicidad requerida..

Page 42: Base De Datos Tecnologia De Negocios Electronicos

BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE

Herramientas de explotación de la Herramientas de explotación de la informacióninformación: : es el área donde más avances se han producido en los es el área donde más avances se han producido en los

últimos años. Sin embargo, la proliferación de últimos años. Sin embargo, la proliferación de soluciones soluciones y su aplicación coyuntural para solucionar y su aplicación coyuntural para solucionar aspectos puntuales ha llevado, en ocasiones, a una aspectos puntuales ha llevado, en ocasiones, a una situación de desánimo en la organización respecto a situación de desánimo en la organización respecto a los beneficios de una solución BI.los beneficios de una solución BI.

Query & reportingQuery & reporting: : herramientas para la elaboración de informes y herramientas para la elaboración de informes y

listados, tanto en detalle sobre información agregada, a listados, tanto en detalle sobre información agregada, a partir de la información de los datawarehouses partir de la información de los datawarehouses

Page 43: Base De Datos Tecnologia De Negocios Electronicos

BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE

OLAP OLAP ((on-line analytical processingon-line analytical processing): ): herramientas que manejan interrogaciones herramientas que manejan interrogaciones

complejas de bases de datos relacionales, complejas de bases de datos relacionales, proporcionando un acceso multidimensional a proporcionando un acceso multidimensional a los datos, capacidades intensivas de cálculo y los datos, capacidades intensivas de cálculo y técnicas de indexación especializadas. técnicas de indexación especializadas. Permiten a los usuarios trocear sus datos Permiten a los usuarios trocear sus datos planteando queries sobre diferentes atributos planteando queries sobre diferentes atributos o ejes.o ejes.

Page 44: Base De Datos Tecnologia De Negocios Electronicos

BUSINESS INTELLIGENCEBUSINESS INTELLIGENCE

BENEFICIOS:BENEFICIOS: Cualitativamente, los beneficios se derivan, Cualitativamente, los beneficios se derivan,

obviamente, del incremento de la eficiencia en obviamente, del incremento de la eficiencia en el proceso de toma de decisiones: mayor el proceso de toma de decisiones: mayor información, de mejor calidad, más fiable, información, de mejor calidad, más fiable, compartida por toda la organización, menores compartida por toda la organización, menores tiempos de respuesta en su obtención, mejora tiempos de respuesta en su obtención, mejora de la comunicación en la empresa y creación de la comunicación en la empresa y creación de un lenguaje homogéneo.de un lenguaje homogéneo.

Page 45: Base De Datos Tecnologia De Negocios Electronicos