Post on 29-Jan-2015
description
API InnovaChallenge
API Innova Challenge
¿En qué consiste la API de Datos de Innova Challenge?
La API de Datos Innova Challenge ofrece estadísticas agregadas de consumo por zona geográfica, periodo temporal y categoría de comercio, accesibles a través de una API de servicios REST.
API Innova Challenge
¿De dónde se obtienen los datos? (1/2)
Las estadísticas que expone la API de Datos de Innova Challenge se han obtenido a partir del procesamiento Big Data de un Dataset de transacciones con tarjetas BBVA anonimizadas y agregadas.
Contexto:• Provincias de Madrid y Barcelona.• Profundidad temporal: Nov’12 – Abr’13.• Diferenciadas por sector / categoría de comercio.
En total, en esta muestra se han considerado:• Más de 30 millones de transacciones.• Más de 2 millones de tarjetas.• Más de 200.000 comercios.
BBVA tiene visibilidad sobre el 15-20% de la actividad comercial con tarjeta.
API Innova Challenge
¿De dónde se obtienen los datos? (2/2)
Cada transacción tiene asociados una serie de parámetros que describen el contexto de la compra:
• Importe de la transacción.• Momento de la compra (timestamp).• Localización del comercio (coordenadas).• Categoría del comercio.• Segmento demográfico del poseedor de la tarjeta.• Código postal de procedencia del comprador.
Estos datos procesados y agregados alimentan los servicios de la API, a través de la cual podemos conocer estadísticas muy relevantes de la actividad comercial en una zona geográfica, para un determinado sector, en un periodo temporal concreto y para un segmento dado de clientes.
La API de InnovaChallenge ofrece estadísticas sobre zonas a dos niveles:
-Códigos postales (en las provincias de Madrid y Barcelona).
-Celdas zoom=2 (450x550m) (en las provincias de Madrid y Barcelona).
• Estas celdas tienen una amplitud de media centésima en coordenadas decimales (en paralelos y meridianos). Los centros de las celdas tienen coordenadas cuyo tercer dígito es 0 o 5.
Ej: (40.415, -3.705), (40.420, -3.705), (40.415, -3.710), (40.420, -3.710)
• Para solicitar una celda, basta con especificar un punto contenido en ella.
Estadísticas: Granularidad espacial
API Innova Challenge
-Rango temporal: de Nov’12 a Abr’13
-Estadísticas agregadas por semanas y meses.
• Por convenio, se considera como la semana 1 del año a aquélla que tiene más de 4 días dentro de ese año.
• Para solicitar las estadísticas de una semana o mes concreto, basta con indicar un día que pertenezca a ese periodo.
Estadísticas: Granularidad temporal
API Innova Challenge
41
40
42
43
44
-En la API Innova Challenge se han definido 16 categorías de comercio:
• Viajes• Alimentación• Hipermercados• Hoteles• Inmobiliaria• Automoción• Bares y restaurantes• Cuidado personal
Estadísticas: Categorías de comercio
• Deportes y juguetes• Tecnología• Hogar• Contenidos• Moda• Ocio• Salud• Transporte
-Existen así mismo estadísticas para el agregado de todas las categorías.
API Innova Challenge
Servicios de estadísticas disponibles
Categorías
Agrupaciones temporales
Zonas
API Innova Challenge
Las estadísticas de los servicios están siempre referidas a una zona, una categoría de comercio y una agrupación temporal.
Servicio 1: Estadísticas de segmentos
Dada una zona, una categoría de comercio y una agrupación temporal, devuelve:
-Gasto medio-Número de transacciones-Número de tarjetas distintas que las han realizado
particularizados para 14 segmentos demográficos y un segmento de tarjetas de empresa.
Permite conocer cómo consume cada uno de los segmentos de clientes.
Restricción: no devuelve estadísticas basadas en menos de 3 tarjetas por segmento o menos de 5 comercios de una misma categoría.
API Innova Challenge
Servicios de estadísticas disponibles
API Innova Challenge
Servicios de estadísticas disponibles
Servicio 2: Patrones de consumo
Dada una zona, una categoría de comercio y un mes determinado, devuelve:
-Gasto medio, mínimo, máximo, desviación y moda.-Número de transacciones.-Número de tarjetas distintas que las han realizado.
para cada hora del día y cada día de la semana. (patrones acumulados a lo largo del mes).
Permite extraer perfiles típicos de consumo.
Restricción: no devuelve estadísticas basadas en menos de 3 tarjetas o menos de 5 comercios de una misma categoría.
API Innova Challenge
Servicios de estadísticas disponibles
Servicio 3: CPs de procedencia de clientes
Dada una zona, una categoría de comercio y una agrupación temporal determinada, devuelve la lista de los 100 CPs de mayor procedencia de clientes que compran en esa zona, ordenados por:
-Gasto agregado total.-Número de transacciones.-Número de tarjetas distintas que las han realizado.
así como los valores de estas estadísticas.
Permite conocer el área de influencia de los comercios de una determinada zona.
Restricción: no devuelve estadísticas basadas en menos de 3 tarjetas por CP o menos de 5 comercios por categoría.
API Innova Challenge
Servicio de información
Servicio de información de categorías
Este servicio de información detalla el árbol de categorías de comercio que se pueden especificar en los servicios de la API, su identificador específico y su descripción literal en castellano e inglés.
Su función es la de servir de apoyo al desarrollo de aplicaciones.
API Innova Challenge
¿Cómo acceder a la API?
Los datos están accesibles a través de una API REST con los tres servicios de datos y el servicio de información.
Para obtener la autorización para utilizarla es necesario registrarse en el BBVA Developer Center:
http://developer.bbva.com
Una vez registrada la aplicación, el Developer Center facilita un app_key y app_secret que permiten autenticarse como participante para consumir los servicios.
Gracias