Bases de Datos Espaciales

110
M.Sc . Melvin Lizano Araya Setiembre 2015

description

Bases de Datos

Transcript of Bases de Datos Espaciales

M.Sc. Melvin Lizano ArayaSetiembre 2015

Una definición bastante generalizada de modelo, originada en ámbitos geográficos,es “una representación simplificada de la realidad en la que aparecen algunas desus propiedades”

De la definición se deduce que la versión de la realidad que se realiza a través de unmodelo pretende reproducir solamente algunas de las propiedades del objeto osistema original que queda representado por otro objeto o sistema de menorcomplejidad.

A este proceso le conocemos como modelización.

De un objeto cotidiano, podemos crear diferentes modelos, por ejemplo:

Realidad

Modelo 1Modelo 2

Modelo 3

CASA

Material

Área

Precio

Color

“En un modelo los elementos esenciales son resaltados,mientras que los detalles no esenciales son eliminados”

• Estos símbolos, su significadoy las reglas de usoconstituyen un lenguaje

• Un lenguaje formalvoluntariamente restringidoen función de un objetivopreciso de modelado se llamaun formalismo.

• Una misma realidad puede ser representada simultáneamente por muchosmodelos

• Cada modelo es construido con un objetivo preciso

• La pérdida de detalles• La dependencia con relación al objetivo perseguido• La dependencia con relación al contexto• Las limitaciones ligadas a las estimaciones:

– 1. Identificación– 2. Medida

• 2.1 Cualitativa• 2.2 Cuantitativa.

• Experiencia• Conocimientos• Valores• Personalidad• Normas profesionales• Otras

• 1. Escala nominal.– Los valores son nombres en los cuales el orden no tiene incidencia sobre elvalor de la propiedad.– Ejemplo: residencial, comercial, industrial, agrícola.

• 2. Escala Ordinal.– Los valores son nombres clasificados según un orden riguroso que correspondea una progresión del valor tomado por la propiedad.– Ejemplo: clasificación de los suelos agrícolas en pobres, medios, buenos, ricos.

3. Escala de intervalo.– Esta escala da un valor numérico utilizando una unidad de medida referidaa un cero arbitrario.– Ejemplo: elevación "h" sobre el nivel medio del mar "nmm".

• 4. Escala de razón o proporción.– Esta escala, con relación a la precedente, agrega un cero significativo, noarbitrario, con lo cual todas las operaciones aritméticas (+,-,*,/) sobre losvalores de las propiedades son posibles y el resultado es independiente de launidad de medida utilizada.– Ejemplo: valor de una casa. Casa A = $30,000.00; casa B = $25,000.00.

• Objetivos:• Definir lo que es un dato.• Definir lo que es un tratamiento.• Comprender porque se modelan los datos• Comprender lo que es un formalismo

• Dato: contenido de una base de datos.

• Tratamiento: lo que se hace con el contenido de la base de datos.

• Tres tipos de tratamientos sobre los datos:

• 1. El ensamblaje– Los reagrupamientos de los datos individuales con información transpuesta– Ejemplo: el lote 121 del municipio X vale $10,000.00.

2. La transformación– La utilización de un dato y de ciertos procedimientos para obtener unainformación derivada que no contiene al dato en bruto– Ejemplo: cálculo de la tasa de crecimiento de la población a partir de dosdatos de población tomado en diferente año. Tasa = (Pob_año2 – Pob_año1) /Pob_año1 * 100.

• 3. Puesta en contexto– La comunicación de un dato suficientemente significativo para que el usuariodeduzca de él una información que depende del contexto (una interpretación)– Ejemplo: Clase de edificio = 4. Donde 4 significa "3 o más pisos, paredes ydivisiones de cemento, menos de 10 años".

• Para comprender el conjunto de los datos con los cuales elusuario desea trabajar.

• Un medio de comunicación entre los actores de un proyecto.

• Para documentar bien el sistema a fin de poderlo hacer evolucionar yactualizar más fácilmente.

• Para facilitar la programación.

• Sirve igualmente para reanalizar los datos con los cuales trabaja laorganización.

• Los tipos de datos utilizados por la organización representan los elementosmás estables (más que los tratamientos, los equipamientos y las personas).

El UML(Lenguaje Unificado de Modelado): Es una herramienta que permite a

los creadores de sistemas generar diseños que capturen sus ideas en forma

convencional y fácil de comprender para otras personas.

¿Por que es necesario?

¿La concepción del UML?

Diagramas del UML

¿Para qué tantos Diagramas?

Grady Booch , James Rumbaug, e Ivar Jacobson. (1980 - 1990).

1994 -> Rumbaug se incorpora en la Empresa Rational Software

Corporation.

1995 ->Jacobson.

Se crea el consorcio del UML conformado por: Intellicorp, DEC, Hwelett

Packard, Microsoft, Oracle,Texas Instruments y Rational.

1997 -> versión 1.0 del UML ->OMG (Grupo de administración de objetos)

para generar un lenguaje estándar de modelado.

UML 1.1-1.2-1.3-1.4-1.5

2004 -> versión 2.0 del UML.

Diagrama de Clases.

Diagrama de Objetos.

Diagramas de Casos de Uso.

Diagrama de estados.

Diagrama de Secuencias.

Diagrama de Actividades.

Diagrama de Colaboraciones.

Diagrama de Componentes.

Diagrama de Distribución.

Los Diagramas UML,están compuestos porelementos gráficos, queunidos conformandiagramas.

• Diagramas de clases: conjunto de clases, interfaces y colaboraciones, y las relaciones entre ellas.

• Diagramas de objetos: instantáneas de las instancias de los elementos encontrados en los diagramas de clases.

• Diagramas de componentes: conjunto de componentes y sus relaciones.

• Diagramas de despliegue: conjunto de nodos y sus relaciones.

• Diagramas de casos de uso: conjunto de casos de uso y actores y sus relaciones. Son importantes para organizar y modelar el sistema.

• Diagramas de interacción:

– Diagramas de secuencia: conjunto de objetos y los mensajes enviados y recibidos por ellos. Resalta ordenación temporal de los mensajes.

– Diagramas de colaboración: Resalta organización estructural de objetos que envían y reciben mensajes.

• Diagramas de estados: representan máquinas de estados, construida por estados, transiciones, eventos y actividades.Útiles para modelar sistemas reactivos.

• Diagramas de actividades: muestran el flujo de actividades de un sistema. Importantes para modelar la función de un sistema, así como para resaltar el flujo de control entre objetos.

Vista de

diseño

Vista de

implementación

Vista de

procesos

Vista de

despliegue

Vista de

casos de uso

• Vista de casos de uso: comportamiento del sistema tal y como espercibido por usuarios, analistas y encargados de pruebas.

• Vista de diseño: comprende el vocabulario del problema y su solución, ysoporta los requisitos funcionales del sistema (servicios que el sistemadebería proporcionar a los usuarios finales).

• Vista de procesos: hilos y procesos que forman mecanismos desincronización y concurrencia del sistema. Se hace mayor énfasis en lasclases activas.

• Vista de implementación: componentes y archivos que se utilizan paraensamblar y hacer disponible el sistema físico.

• Vista de despliegue: nodos que forman la topología hardware sobre laque se ejecuta el sistema. Distribución, entrega e instalación de las partes.

Vista de casos de uso Diagramas de casos de uso

Diagramas de actividades

Vista de diseño Diagramas de clases

Diagramas de interacción

Diagramas de estados

Vista de procesos Diagramas de clase

Diagramas de interacción

Vista de implementación Diagramas de componentes

Vista de despliegue Diagrama de despliegue

Visibilidad

+ público

- privado

# protegido

Responsabilidades

Descripción de lo que

tiene que realizar la clase

NombreClase

[visibilidad] atributo1: tipo [=valordefecto]

[visibilidad] atributo2: tipo [=valordefecto]

[visibilidad] operación1(args): retorno

[visibilidad] operación2(args): retorno

Responsabilidades

-- responsabilidad1

-- responsabilidad2

• Notación general

Clase1

Plantilla

…[0..*] [0..*]

Rol 1 Rol 2Relación 1-2

{Restricción}

Clase

• Relación de dependencia

• Relación de asociación

• Relación de agregación

• Relación de composición

Clase1 Clase2 Clase1 Clase2

Clase1 Clase2Clase1 Clase2

Realizar llamada

telefónica

Recibir llamada

telefónica

Usar

Agenda

Realizar llamada

de conferencia

Recibir llamada

adicional

Teléfono móvil

«extend»

«extend»

Usuario

Red

telefónica

Diagrama de secuencia

En la actualidad el enfoque de bases de datos es extensamente utilizado porser la única solución posible para manejar grandes volúmenes de datos, lacomplejidad de la extracción de datos y la concurrencia de datos (accesossimultáneos).

Las bases de datos se han extendido por la disminución de los costos de losservidores y las necesidades de exploración de datos.

Los sistemas integrados de gestión, paquetes contables o aplicaciones (comoel SGB Sistema General de Bedelías y el Sistema de Recursos Humanos de laUdelaR) almecenan los datos en bases de datos.

“Base de Datos es un conjunto de datosrelacionados entre sí y que tienen un

significado implícito”.

La definición presentada anteriormente hacereferencia a dos elementos para que un conjuntode datos constituya una Base de Datos:

1) Relaciones entre datos, tema que se trata en laspróximas transparencias.

2) Significado implícito de los datos que se atribuyedependiendo del contexto en que se utilizan losmismos.

Cada entidad tiene una clave primaria o campo llave que identifica unívocamente al conjunto de datos.Cuando en una entidad figura la clave primaria de otra entidad, ésta se denomina clave foránea.

Las entidades se relacionan entre sí a través de las claves foráneas.

CLAVES PRIMARIASCódigo de Cliente es la clave primariade Cliente. A cada cliente se le asocia uncódigo y a cada código le corresponde uncliente. Asimismo, Número de Factura yCódigo de Producto son claves primariasde Facturas y Productos respectivamente.

CLAVES FORÁNEAS

Son claves foráneas en Facturas Códigode Cliente y Código de Producto.Clientes se relaciona con Facturas através del Código de Cliente que figuraen ambas tablas y con Productosmediante el Código de producto.

Hace referencia a todo tipo de información relativa a un punto o a un conjuntode puntos con referencia espacial, sobre la superficie de la Tierra

Abstracción del Entorno físico através de técnicas como laCartografía, Geodesia yPercepción Remota entre otras.

LA BASE DE DATOS LOCALIZADA (geobase)

GEOMETRIA TOPOLOGIA ATRIBUTOS

T1

T2

T3

LINEA

AREA

VOLUMEN

PUNTO

RELACIONES

GEOMETRICAS

DE

VECINDAD

A1 POSICION

A2 ELEVACION

A3 SUELO

A4 CLIMA

A5 # HABITANTES....An

METADATOS

•Fuente de los datos•Fecha•Proyección•Método y escala denumerización,•Precisión•Formato delarchivo•Etc.

REDES

VIAS

BARRIOS

LOTES

SUELOS

AREAS DE ACTIVIDAD

HIDROLOGIA

TOPOGRAFIA

LINEAS AREAS

POLIGONOSSUPERFICIES

FORMATO

•Un par de

coordenadas

EJEMPLOS

Postes de luz

Pozos

Nodos

FORMATO

•Varios pares

de

coordenadas

•Longitud sin

área

EJEMPLOS

Vías

Ríos

FORMATO

Varios pares de

coordenadas

EJEMPLOS

Predios

Lagos

Suelos

FORMATO

•Areas con

coordenadas z

Contiene área,

longitud y

elevación

EJEMPLOS

Pendientes

perfiles

Paso Cuestionamientos Productos Involucrados

1. Evaluaciónde necesidades

¿Cuáles son las necesidades actuales y futuras del Sistema de Información Geográfico?¿Cómo es que personas actualmente usan la información geográfica y cómo es que ellos deberían utilizarlo?

Reporte de evaluación de necesidades

Usuarios potenciales

2. Planestratégico

¿Cómo es que el SIG promueve la misión de la organización?¿Cómo es que un SIG Empresarial calza dentro de la organización?

Plan estratégico con cronograma macro aprobado por los involucrados y la administración

Administración

Proceso de diseño e implementación

Paso Cuestionamientos Productos Involucrados

3. Plan de implementación

¿Qué pasos necesitamos contemplar para implementar un SIG Empresarial para que cumpla nuestras necesidades y nos permita alcanzar nuestros objetivos?

Plan de implementación con un cronograma detallado

Comité de SIG

4. Fase de diseño

¿Qué tablas, campos y aplicaciones iniciales son requeridas para lograr cumplir las necesidades de los usuarios y cómo deben ser organizadas?

Esquema de bases de datos, diccionario de datos, aplicaciones, diagramas de flujo

Equipo técnico

Proceso de diseño e implementación

Paso Cuestionamientos Productos Involucrados

5. Fase de implementación

¿Qué procesos necesitamos usar para popular el esquema e implementar las aplicaciones iniciales?

Base de datos SIG y aplicaciones seleccionadas

Equipo técnico

6. Proyecto piloto

¿Dónde y cuándo podemos probar el sistema?

Resultados del proyecto piloto

Usuariosseleccionados

7. Desarrollo de aplicaciones

¿Qué nuevas aplicaciones pueden ser desarrolladas y cómo podemos mejorar las existentes?

Manuales de procedimientosactualizados

Equipo técnico

Proceso de diseño e implementación

Paso Cuestionamientos Productos Involucrados

8. Plan de mantenimiento y actualización

¿Cómo vamos a mantener los datos, hardware y software actuales?

Equipo técnico

9. Entrenamiento ¿Quién necesita entrenamiento y en qué lo necesita?

Equipo técnicoUsuarios potenciales

10. Evaluación ¿El sistema está trabajando como debería?

Todos los usuarios

Proceso de diseño e implementación

• Un formalismo es un lenguaje– 1. Riguroso– 2. Restringido a algunas nociones.– 3. Semi-gráfico o exclusivamente literario.

• Un formalismo comprende:– 1. Componentes semánticas– 2. Notaciones– 3. Reglas de utilización

Formalismos literales

• Necesidades expresadas en formato literal– 1. Tengo datos sobre los hidrantes y las casas.– 2. Para los hidrantes necesito el número y la presión.– 3. Para las casas necesito su dirección y el número de pisos.– 4. Necesito saber si hay un hidrante cerca de una casa.• Necesidades expresadas en formato gráfico

Objetivos:

• Identificar los diferentes niveles de modelado• Enunciar las características y los objetivos de los modelos utilizados a cada nivel• Identificar los formalismos utilizables a cada nivel• Establecer un paralelo entre los niveles del modelado de datos y del modelado de tratamientos

Los tipos de modelos de datos utilizados en los SIG

• Durante el desarrollo de un SIG, la comunicación debe establecerse a variosniveles:

– 1. Comunicación entre el diseñador o analista y los futuros usuarios del SIG– 2. Comunicación entre el analista y el programador– 3. Comunicación entre el programador y el sistema informático

• Nivel conceptual:– Responde a la pregunta del ¿Qué?– Es independiente de la tecnología.– Minimiza la redundancia de los datos.– Herramienta de trabajo del analista o diseñador.

• Nivel lógico:– Responde a la pregunta del ¿Cómo?– Es dependiente del tipo de tecnología escogida.– Es un modelo optimizado para obtener el máximorendimiento.– Herramienta de trabajo para el programador.

• Nivel físico:– Consiste en la realización.– Depende de la herramienta escogida y de sulenguaje de programación– Herramienta de trabajo para el computador

Ligamen entre el modelado de los datos y elmodelado de los tratamientos

El Modelo Conceptual de Datos (MCD):

• El MCD es una representación de la realidad en función de un propósitoestablecido, es independiente del tipo de tecnología que será utilizada durantela implantación del SIG y no está optimizado desde el punto de vista delrendimiento de los tratamientos.

• Este modelo es ante todo una herramienta de diálogo entre el diseñador oanalista y los diversos actores de un proyecto.

• Se construye a partir de un lenguaje riguroso y muy restringido que resultaintuitivo y fácil de comprender.

• No incluye las limitaciones técnicas que harían pesada la lectura del modelo.

• Es un modelo intermedio entre el MCD y el MFD. (A veces se produce más deun MLD).

• Es dependiente del tipo de "software" escogido (SGBD relacional, GISorientado a los objetos, CAD ligado a un SGBD, ...) o del programa particularseleccionado.

• Permite efectuar una optimización de la estructura de datos elaborada en elMCD teniendo en cuenta los principales tratamientos, los puntos fuertes y lasdebilidades de un tipo de "software", así como la arquitectura informática de laorganización.

• CASA (Num_casa, Nom_calle, Num_aposentos)

• PERSONA_POSEER_CASA (Cédula, Num_casa, Nom_calle)

• PERSONA (Cédula, Apellido1, Apellido2, Nombre, Fecha_nacim)

• PERSONA_POSEER_LOTE (Cédula, Num_lote)

• LOTE (Num_lote, Superficie, Frente)

• CASA_SITUAR_SOBRE_LOTE (Num_casa, Nom_calle, Num_lote)

• El MFD es una herramienta esencialmente informática

• Representa, en el sistema informático, el contenido del MLD

• Es específico de la herramienta "software“ escogida.

Objetivos:

• 1. Conocer las componentes del formalismo individual• 2. Saber manipular estas componentes• 3. Aprender a leer un modelo conceptual de datos utilizando este formalismo

• El formalismo individual es una variante del formalismo Entidad-Relación,variante desarrollada en Francia por los diseñadores del método MERISE. Lafamilia de formalismos de tipo Entidad-Relación (E/R) es la más utilizada paramodelar los datos a nivel conceptual.

Las entidades o individuos:• Todo objeto, persona, concepto o evento de la realidadsobre el cual se desea información.

Los atributos o propiedades:• Las características de una entidad o de una relación que nos interesan enfunción del objetivo de nuestra aplicación. Existe un tipo particular de atributo:el identificador.

Las relaciones:• Asociaciones entre las entidades.

Las cardinalidades:• Los número máximo y mínimo de veces que una relación puede producirseentre las ocurrencias de dos entidades.

• Entidad ó individuo• Un rectángulo que contiene elnombre único de la entidad enletras mayúsculas.• Distinción importante entreentidad y ocurrencia• Una entidad está compuesta demuchos atributos y representa elconjunto ocurrencias del mismotipo.• Una ocurrencia es una entidadespecífica que posee unconjunto de valores quedescriben a esta entidad enparticular.

Atributo o propiedad:

• Los atributos sirven para describir o para localizaruna entidad. Uno representa un atributo donándoleun nombre único en el seno de la entidad que élcaracteriza.• El identificador es un tipo de atributo particular elcual permite identificar de forma única (o casi única)toda ocurrencia de una entidad particular.• Cuando la identificación no es única sino quedepende del identificador de otra entidad, se hablaentonces de dependencia funcional.

Relación:

• Una relación se representa mediante una elipse en la cualse sitúa el nombre de la relación en mayúscula y sus atributos en minúscula sifuera del caso.

Cardinalidad

• Una relación posee cardinalidades. Para comprender bien la noción decardinalidad, uno puede descomponer la relación en dos asociaciones, una encada dirección de la relación. Cada asociación posee una cardinalidad, i.e. elnúmero mínimo y máximo de veces que la asociación puede producirse entre dosentidades.

La cardinalidad total de una relación se obtiene a partir de los máximos de las dosasociaciones. En el ejemplo precedente, la cardinalidad total de la relación HABITAR es1,N. Es esta cardinalidad total la que servirá para construir el MLD.

1. Asociación simple: sólo una pero es obligatoria (1,1)

2. Asociación condicional: sólo una, pero es facultativa (0,1)

3. Asociación múltiple: muchas posibles, pero al menos una es obligatoria (1,N)

4. Asociación múltiple condicional: muchas posibles, pero podría que hallaninguna (0,N)

5. Asociación especial: i.e. con un número mínimo específico y un númeromáximo específico (diferente de 1) (2,4).

La cardinalidad total de una relación puede entonces ser (1,1), (1,N), (N,N) óespecial (ej.: 4,N).

El formalismo individual (tipos de asociacionesy cardinalidad total)

El formalismo individual (número de relaciones)

Relaciones:• Pueden existir dos o aún muchas relaciones de diferente naturalezaentre dos entidades.• Ej.: las relaciones entre PERSONA y CASA.El formalismo individual acepta ciertas relaciones particulares.Ej. Relaciones recursivas.

• Existen diferentes formalismos de tipo E/R, uno de entre ellos es el formalismo individual. Otro formalismo muy utilizado es el de Chen.

La notación gráfica de sus componentes:

Las entidades:• Un rectángulo dentro del cual se colocaúnicamente el nombre en letrasmayúsculas.

Los atributos:• Una elipse que contiene el nombre delatributo en minúsculas la cual está ligadapor una curva o una recta al rectánguloque corresponde a la entidadcaracterizada por tal atributo.

Las relaciones:• Un romboide conteniendo el nombre dela relación en mayúsculas.

Las cardinalidades:• Las cardinalidades se leen al inverso queen el formalismo individual, i.e., laprimera entidad, la relación, lacardinalidad y la segunda entidad.

Objetivos:

• 1. Aprehender la necesidad de normalización de un MCD

• 2. Conocer las cuatro formas normales

• 3. Conocer los peligros de la sobrenormalización

• 4. Aplicar estas reglas a un MCD

• Con el propósito de eliminar la redundancia de los datos, el MCD deberespetar cuatro formas normales.

Carácter elemental de las propiedades o atributos:• Todos los atributos deben ser elementales (significativos e indivisibles)con relación a los deseos del cliente.• Ejemplo, para un edificio:

Dependencia plena del identificador:

• No deben haber valores de atributos que no dependan de la ocurrencia de laentidad a la cual ellos son atribuidos, i.e. que sean automáticamente losmismos para algunas ocurrencias diferentes.

El atributo "margen de retiro mínimo" no dependedel lote, sino de una zona definida por elreglamento de zonificación municipal.

Dependencia transitiva.

• Si un atributo C depende del atributo A por medio del atributo B, este no está conforme con la tercera forma normal.

Forma normal de Boyce-Codd:

• Si, para un identificador compuesto de muchos atributos, uno de estos atributosdepende directamente de una propiedad que no es el identificador, la formanormal de Boyce-Codd no es respetada.

• Las reglas de normalización tienen un carácter obligatorio más o menosmarcado, i.e. que en la práctica, uno deja generalmente de aplicarlas cuandoellas hacen la lectura de un modelo menos intuitiva.

• "Es asunto del analista percibir hasta donde conviene normalizar el modelo(...). Un modelo muy normalizado permitirá iniciar la validación sobre una baseclara; el esquema más descompuesto será menos legible." Collonge et al., 1986.Merise, méthode de conception.

Sus componentes:

• Entidad ó tabla• Nombre en mayúsculas, a veces con recuadro, situado por encima y a laizquierda del rectángulo que contiene los atributos• Atributos ó columnas• Nombre en minúsculas, todos los atributos en recuadro y adyacenteshorizontalmente; los identificadores se convierten en las llaves de acceso y sesubrayan.• Relación ó tabla• Similar a las entidades.

En su nivel más básico, una geodatabase de ArcGIS es una colección dedatasets geográficos de varios tipos contenida en una carpeta de sistema dearchivos común, una base de datos de Microsoft Access o una base de datosrelacional multiusuario DBMS (por ejemplo Oracle, Microsoft SQL Server,PostgreSQL, Informix o IBM DB2).

Todos los usuarios de SIG trabajarán con tres tipos de datasets fundamentalessea cual sea el sistema que utilicen. Tendrán un conjunto de clases de entidad(muy similar a una carpeta llena de shapefiles de ESRI); tendrán varias tablasde atributos (archivos de dBase, tablas de Microsoft Access, hojas de cálculode Excel, DBMS, etc.); y, la mayor parte del tiempo, también tendrán un granconjunto de datasets de imágenes y ráster con los que trabajar.

El lenguaje SQL está compuesto por comandos, cláusulas, operadores yfunciones de agregado. Estos elementos se combinan en las instrucciones paracrear, actualizar y manipular las bases de datos.

Las cláusulas son condiciones de modificación utilizadas para definir los datos que desea seleccionar o manipular.

Las funciones de agregado se usan dentro de una cláusula SELECT en grupos de registros para devolver un único valor que se aplica a un grupo de registros.

Los operadores lógicos soportados por SQL son: AND, OR, XOR, Eqv, Imp, IsyNot. A excepción de los dos últimos todos poseen la siguiente sintaxis:

<expresión1> operador <expresión2>

expresión1 y expresión2 son las condiciones a evaluar, el resultado de laoperación varía en función del operador lógico.

La tabla adjunta muestra los diferentes posibles resultados:

SELECT * FROM Empleados WHERE Edad > 25 ANDEdad < 50;

SELECT * FROM Empleados WHERE

(Edad > 25 ANDEdad < 50)ORSueldo = 100; SELECT * FROM Empleados WHERE

NOTEstado = 'Soltero'; SELECT * FROM Empleados WHERE

(Sueldo > 100 ANDSueldo < 500)OR(Provincia = 'Madrid' ANDEstado = 'Casado');

El Motor de base de datos es el servicio principal para almacenar, procesar yproteger los datos. El Motor de base de datos proporciona acceso controlado yprocesamiento de transacciones rápido para cumplir con los requisitos de lasaplicaciones consumidoras de datos más exigentes de su empresa.

Es un sistema administrador de bases de datos que maneja datos existentes enun espacio o datos espaciales. El espacio establece un marco de referenciapara definir la localización y relación entre objetos. El que normalmente seutiliza es el espacio físico que es un dominio manipulable, perceptible y quesirve de referencia.

En la geodatabase, los atributos se administran en tablas sobre la base de una serie deconceptos sobre datos relacionales simples, aunque esenciales:

•Las tablas contienen filas.•Todas las filas de una tabla tienen las mismas columnas.•Cada columna tiene un tipo de datos, tal como número entero, número decimal,

carácter y fecha.•Hay una serie de funciones relacionales y de operadores (tales como SQL) disponibles

para operar sobre estas tablas y sus elementos de datos.

Los tipos de datos que pueden ser agregados como atributos en las entidades y que soncompatibles con la geodatabase incluyen los siguientes elementos:

•Números•Texto•Fecha•BLOB

•Identificadores globales

Números

Puede almacenar números en uno de los cuatro tipos de datos numéricos:•Enteros cortos•Enteros largos•Números de punto flotante de precisión simple, a los cuales generalmente se los

denomina flotantes•Números de punto flotante de precisión doble, comúnmente llamados dobles

Al elegir el tipo de datos, primero considere la necesidad de los números enteros versuslos números fraccionarios. Si sólo necesita almacenar números enteros, como 12 ó12.345.678; especifique si es un entero corto o largo. Si necesita almacenar númerosfraccionarios que tienen lugares decimales, como 0,23 ó 1234,5678; especifique si es unflotante o un doble.

Tipo de datosRango de

almacenamientoTamaño (Bytes) Aplicaciones

Entero corto -32.768 a 32.767 2

Valores numéricos sin valores fraccionales dentro de un rango específico; valores codificados

Entero largo-2.147.483.648 a 2.147.483.647

4

Valores numéricos sin valores fraccionales dentro de un rango específico

Número de punto flotante de precisión simple (flotante)

aproximadamente -3,4E38 a 1,2E38

4

Valores numéricos con valores fraccionales dentro de un rango específico

Número de punto flotante de precisión doble (doble)

aproximadamente -2,2E308 a 1,8E308

8

Valores numéricos con valores fraccionales dentro de un rango específico

Rango Tipo de datosPrecisión (longitud

del campo)Escala (posiciones

decimales)

0 a 99 Entero corto 2 0

-99 a 99* Entero corto 3 0

0 a 32.767* Entero corto 5 0

32.768 a 99.999 Entero largo 5 0

0,001 a 0,999 Punto flotante 4 3

1.000,00 a 9.999,99 Punto flotante 6 2

-123.456,78 a 0* Doble 9 2

0 a 1.234,56789 Doble 9 5

Ejemplos de rangos de números, tipos de datos, precisión y escala*Los números negativos requieren precisión adicional para almacenar el signo negativo.

Un campo de texto representa una serie de símbolos alfanuméricos. Esto puede incluirnombres de calles, propiedades de atributos u otras descripciones textuales. Unaalternativa para el uso repetido de atributos textuales es establecer un valor codificado.Una descripción textual se codificará con un valor numérico. Por ejemplo, puede codificartipos de carreteras con valores numéricos asignándole un 1 a las carreteras de pavimentomejoradas, un 2 a las carreteras de lastre, y así sucesivamente.

En el tipo de datos de fecha se pueden almacenar fechas, horas o fechas y horas. Elformato predeterminado en el cual se presenta la información es mm/dd/aaaa hh:mm:ssy una especificación para a.m o p.m. Cuando introduzca campos de fecha en la tabla, seconvertirán a este formato.

Un BLOB es simplemente datos almacenados en la geodatabase como una secuencia largade números binarios. En ArcGIS, las anotaciones y dimensiones se almacenan como BLOBy los elementos, como imágenes, multimedia o bits de código, se pueden almacenar eneste tipo de campo. Es necesario que utilice un cargador o un visualizador personalizado,o una aplicación de terceros, para cargar elementos en un campo BLOB o para visualizar elcontenido de un campo BLOB.

Los diccionarios de datos como documentos normativos contienen lasespecificaciones particulares que rigen los procesos de producción de los datosespaciales. La base para elaborar los diccionarios de datos de los diferentestemas y escalas lo constituye el modelo de datos espaciales

1.1 OBJETO ESPACIALSe presentan en el Diccionario de Datos en forma ordenada alfabéticamente ycada uno con su respectiva descripción. A cada objeto se le asigna un nombre yuna definición.

1.1.1 Nombre. Corresponde a la denominación que se le da al objeto espacial.1.1.2 Definición. Es una explicación en la que se expresan las característicasesenciales del objeto, las cuales permiten diferenciarlo de los demás.

1.2 GEOMETRÍASe refiere a la representación vectorial del objeto, cuyas opciones son punto,línea y polígono. Un objeto espacial puede tener más de un tipo derepresentación geométrica.

Por ejemplo:Polígono / LíneaPolígono / Punto

1.3 ATRIBUTOSConstituyen las características cualitativas y/o cuantitativas del objeto espacial.Cada atributo tiene un nombre, una definición, el dominio de valores, y susrestricciones en caso de ser necesario.

1.3.1 Nombre. Corresponde a la denominación que se le da al atributo1.3.2 Definición. Es una explicación breve del atributo. No todos los atributostienen una definición ya que frecuentemente, el nombre del atributo essuficiente para definirlo.1.3.3 Tipo de atributo. Es la clasificación que se le da al atributo en función desu composición, origen y número de valores. De acuerdo con el número devalores el atributo puede ser único (que tiene un solo valor) o multivaluado(que puede tener un conjunto de valores).1.3.4 Tipo de dato definen el tipo y la longitud del atributo. Para los objetos deeste diccionario los tipos pueden ser: caracter y numérico.

La minería de datos espaciales posee la base teórica y metodológica para laidentificación de patrones sobre los datos y tiene como objetivo descubrir de formaautomatizada patrones inesperados potencialmente útiles en SDBMS y que seránvalidados por expertos del área en cuestión. Se puede definir como el procesoautomático o semiautomático de seleccionar, explorar, modificar, visualizar y valorargrandes volúmenes de datos espaciales con el objetivo de descubrir conocimientos.

Basados en la generalización: requieren de la implementación de jerarquías deconceptos, bien temática o espacial. Dentro de las temáticas se incluyen los datos noespaciales; de ellos se colectan sus características más importantes para la búsqueda, secaracterizan por regiones y se agrupan como datos no espaciales generalizados. Para elcaso de los espaciales esta generalización puede ser presentada como la partición enregiones y su posterior fusión dependiendo de los atributos espaciales de los datos.

Basados en el reconocimiento de patrones: son utilizados en la clasificación deinformación que pueden ser imágenes de satélites, fotografías, textos o cualquierfuente de datos.

De agrupamiento: permiten agrupar los objetos de una base de datos en gruposllamados conglomerados, conformados por elementos tan similares como sea posible.

De exploración de asociaciones espaciales: permiten descubrir reglas de asociaciónespacial que relacionen a uno o más objetos espaciales.

Mediante el uso de aproximación y agregación: permiten descubrir conocimiento a partir de las características representativas de los objetos.

Cuando hablamos de Big Data nos referimos a la acumulación masiva de datos y a lossistemas que manipulan estas grandes cantidades de datos. O dicho de otra forma, BigData es en el sector de tecnologías de la información y la comunicación una referencia alos sistemas que manipulan inmensos conjuntos de datos.

Sin embargo, el concepto no hace referencia simplemente al tamaño de la información,como su nombre podría indicar, sino también a la variedad del contenido y a lavelocidad con la que los datos se generan, almacenan y analizan. Estas dimensiones sonlas tres «V» que definen el Big Data, es decir volumen, velocidad y variedad.

¿Cómo se generan tantos datos?

Estamos continuamente generando datos. Cada día se crean más 3 trilllones de bytesde datos, y la capacidad tecnológica per cápita para almacenar datos a nivel mundial sedobla cada cuarenta meses. Las fuentes a través de las cuales generamos todos estosdatos son muy diversas, entre otros mensajes en redes sociales, ubicacionesgeográficas, señales de móvil, archivos de audio, sensores, imágenes digitales, comprasen internet, programas de fidelización, apps, señales GPS, datos de formularios, emails,datos de encuestas, entre otros.

Big data y GIS

Si partimos de la base de la problemática del Big Data, como lo son la gestión, análisis yvisualización de los datos, estamos seguros de que las tecnologías asociadas a losSistemas de Información Geográfica jugarán un papel destacado en ese mecanismo deanálisis.

http://www.tweetping.net/#

http://onemilliontweetmap.com/

• Arce, R. 2005. Curso sobre el modelado de datos georeferenciados. Escuela de Geografía, UCR. San Pedro, Costa Rica.

• Arctur, D. y M. Zeiler. 2004. Designing Geodatabases: case studies in GIS data modelling. ESRIPress. Redlands, California. EE UU. 467-470

• Evitts, P. 2000. A UML Pattern Language. Macmillan Technical Publishing. Indianapolis, EEUU.

• Larman, C. 2001. Applying UML and Patterns An Introduction to Object-Oriented Analysis and Design Second Edition. Prentice Hall. New Jersey, EEUU.

• Zeiler, M. 1999. Modeling our World, The ESRI Guide to Geodatabase Design. ESRI, Press. Redlands, California. EE UU.

• ESRI.2012. Geodatabases.ArcGIS Resource Center. Redlands, California. EEUU. Consultado el30 de Agosto de 2012. http://help.arcgis.com/es/arcgisdesktop/10.0/help/index.html#/na/003n00000002000000/

Nota Aclaratoria. Las imágenes y otra documentación adicional se utiliza con fines educativos y nunca comerciales.