Instalar, configurar y usar Cassandra en Windows
DARWIN LALA
3ERO INFORMÁTICA
¿Qué es Cassandra?
Apache Cassandra es una base de datos NoSQL distribuida y basada en un modelo de almacenamiento de «clave-valor», escrita en Java. Permite grandes volúmenes de datos en forma distribuida. Por ejemplo, lo usa Twitter para su plataforma. Su objetivo principal es la escalabilidad lineal y la disponibilidad. La arquitectura distribuida de Cassandra está basada en una serie de nodos iguales que se comunican con un protocolo P2P con lo que la redundancia es máxima.
¿Qué es NoSQL?
Una base de datos NoSQL proporciona un mecanismo para el almacenamiento y recuperación de datos que emplea modelos de consistencia menos limitadas que las bases de datos relacionales tradicionales.
¿Quiénes usan cassandra?
Facebook, twitter, etc.
Desarrollo
Entre las caracteristicas de Cassandra destacan.
- NoSql - Modelo Clave – Valor - Distribuida - Escalabilidad Lineal - Disponibilidad - Rendimiento
- Tolerancia a Fallos
Instalación y Configuración
Primero que nada vallamos al portal donde se descarga cassandra:Una vez descargado el programa:
tenemos un archivo .tar el cual descomprimimos y movemos a C: ó D:, renombramos la carpeta a “cassandra” para mayor comodidad
Ahora editamos las variable de entorno del sistema y agregamos una nueva variable del sistema cuyo nombre sea “CASSANDRA_HOME” y su valor sea “C:\cassandra”
Modifica el archivo C:\cassandra\conf\cassandra.yaml
Reemplaza:
Código: [Seleccionar]
# commit logcommitlog_directory: /var/lib/cassandra/commitlog
por:
Código: [Seleccionar]
# commit logcommitlog_directory: C:/cassandra/commitlog
Citar
Nosotros hemos creado el directorio commitlog en C:/cassandra/
y también hay que reemplazar en elmismo archivo:
Código: [Seleccionar]
data_file_directories: - /var/lib/cassandra/data
Por:
Código: [Seleccionar]
data_file_directories: - C:/cassandra/data
Citar
Una vez mas nosotros hemos creado el directorio data en C:/cassandra/
Ahora vamos a el directorio C:\cassandra\bin y ejecutamos el archivo cassandra.bat
Si todo fue bien veremos que el servidor de apache cassandra esta a la espera de clientes Thrift.
¿Qué es Thrift?
Es un framework para el desarrollo de servicios escalables entre los distintos lenguajes de programacion.
¿Cómo funciona?
Primero que nada abrimos otra ventana de ms-dos y nos vamos a la carpeta bin dentro de cassandra y ejecutamos ahora el siguiente bat:
*Código: [Seleccionar]
*cassandra-cli.bat
Les deberá de aparecer algo como esto:
Código: [Seleccionar]
C:\cassandra\bin>cassandra-cli.batStarting Cassandra ClientConnected to: "Test Cluster" on 127.0.0.1/9160Welcome to Cassandra CLI version 2.0.1
Please consider using the more convenient cqlsh instead of CLICQL3 is fully backwards compatible with Thrift data; see http://www.datastax.com/dev/blog/thrift-to-cql3
Type 'help;' or '?' for help.Type 'quit;' or 'exit;' to quit.
[default@unknown]
¿Qué es Keyspace?
En un almacén de datos NoSQL es un objeto que mantiene unidos a todas las familias de columna de un diseño. Es la más exterior agrupación de los datos en el almacén de datos.
Una Keyspace puede contener familias columna o super columnas. Cada columna súper contiene uno o más familiares columna, familia en al menos una columna de cada columna.
Ejemplo:
* Para crear una base de datos el primer paso es el siguiente código
EN EL EJEMPLO BANCO ES EL NOMBRE DE LA BASE A CREAR EN CQL CASSANDRA
Una vez creada la base de datos se crea las tablas dentro mediante el código mostrado y se añade la clave principal.