Visualización de Datos con R y Neo4j
Rubén Tejera Cordero
Christian López Falcón
¿QUÉ ES R?
- Lenguaje de programación con un enfoque estadístico.
- Uno de los lenguajes más utilizados en investigación por la comunidad
estadística
- Apareció en 1993, se basa en el lenguaje S desarrollado a finales de 1970.
- Software Libre, se distribuye bajo licencia GNU GPL
- Proyecto colaborativo y abierto que los usuarios pueden publicar paquetes.
- El repositorio oficial supera la cifra de 2000 paquetes.
Lenguajes Mejor Pagados
http://www.1000tipsinformaticos.com/2016/08/los-5-lenguajes-de-programacion-mejor-pagados-en-2016.html
https://www.genbetadev.com/trabajar-como-desarrollador/las-diez-tecnologias-mejor-pagadas-que-un-programador-puede-aprender
BASES DE DATOS ORIENTADA A GRAFOSVENTAJAS
- Rendimiento- Agilidad- Flexibilidad y escalabilidad- Ayudan a encontrar relaciones entre los datos.
DESVENTAJAS
- Requiere un cambio conceptual para los desarrolladores
¿Que es NEO4j?
- Base de Datos Orientada a Grafos(BDOG)
- Lanzada por Neo Techonology, una startup sueca, en 2010.
- Dos tipos de licencia:AGPL y una Licencia Comercial
- Empresas que la usan: eBay, Walmart, Telenor, UBS, Cisco, HP,Lufthansa
Características del Neo4j- No se define ningún esquema. Cada nodo o relación puede tener una
estructura de datos diferente, lo que favorece la escalabilidad.
- Transacciones ACID (Atomicidad, Consistencia, Aislamiento y Durabilidad)
- Límites:
- 34000 millones de nodos
- 34000 millones de relaciones entre esos datos
- 68000 millones de propiedades
- 32000 tipos de relaciones
Posibles Aplicaciones para Neo4j- Búsqueda de enormes cadenas de conexión
- Análisis y búsqueda de patrones
- Soluciones tipo Red Social
- Sistemas de Recomendación
- Mapas Topográficos, para averiguar el camino más corto entre dos puntos.
Rendimiento de Neo4jVolker Pacher, desarrollador de eBay y cliente de Neo4j, dice:
“Nuestra solución Neo4j es literalmente mil veces más rápida que la solución anterior MySQL, con búsquedas que requieren entre 10 y 100 veces menos código”.
https://bbvaopen4u.com/es/actualidad/neo4j-que-es-y-para-que-sirve-una-base-de-datos-orientada-grafos
CypherLas consultas de la base de datos se realizan con Cypher.
- Es un lenguaje bastante intuitivo y fácil de entender. - Para representar las relaciones se utilizan flechas y para representar los
nodos, paréntesis, consiguiendo así que el lenguaje sea muy gráfico.
Reference Card de Cypher
EJEMPLO DE TWITTER
VISTA GENERAL DEL PROYECTO
ShinyFramework
para construir
webs usando R
ShinyDashboardPaquete para Shiny para la creación de
paneles
RNeo4jDriver de
Neo4j para R
visNetworkPaquete
para R para visualizar
redes
RLenguaje de
Programación
RStudioEntorno de
Desarrollo Integrado (IDE) para R
Neo4jBase de Datos Orientada
a Grafos
Datos del Patronato de Turismo
de Gran Canaria
http://www.grancanaria.com/patronato_turismo/Listados-de-establecimientos.26171.0.html
Listado de Restaurantes y Bares-Cafeterías de Gran Canaria
Datos Tratados y Pasados a .csv
Arrancamos la BBDD Neo4j
Importación del archivo .csv al Neo4j
Establec
Isla Municip.
Localid.Pertenece a la localidad de
Pertenece al municipio de
Pertenece a la isla de
MODELO DE DATOS
Ejemplo de Datos Creados
CONSULTAS CON CYPHER
Exportación de Datos a Json
TEJEDA
AGÜIMES
MOYA
SAN BARTOLOMÉ DE TIRAJANA
MOGÁN
TELDE
LAS PALMAS DE G.C.
Arrancamos el RStudio con el proyecto creado
Web Resultante del Proyecto con Diseño Responsive
Representación Datos en Forma de Tabla
Representación de los Datos en Forma de Nodos
Datos Generales de la Consulta
Gráficas según el Municipio
Top Related