Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de...

12
Protocolo de Datos Abiertos Dirección General de Proyectos de Ciudad inteligente y Gobierno abierto Subsecretaría de Innovación y Ciudad lnteligente. Ministerio de Modernización, Innovación y Tecnología. Gobierno de la Ciudad de Buenos Aires.

Transcript of Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de...

Page 1: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

Protocolo deDatos Abiertos

Dirección General de Proyectos de Ciudad inteligente y Gobierno abierto

Subsecretaría de Innovación y Ciudad lnteligente.Ministerio de Modernización, Innovación y Tecnología.Gobierno de la Ciudad de Buenos Aires.

Page 2: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

¿Cómo surge la iniciativa?

Misión, visión y valores.

¿Qué es el portal de datos abiertos?

¿Cuál es el proceso de creación de un dataset?

¿A qué iniciativa responde?

¿Cuál es la vinculación con los usuarios?

Beneficios de los datos abiertos.

Algunas definiciones.

¿Cómo está conformado?

Tratamiento de datos personales.

03

05

10

02

03

09

06

Índice

Page 3: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

¿Cómo surge la iniciativa? El portal de datos abiertos (data.buenosaires.gob.ar) es una iniciativa que comenzó en 2012 en

la Ciudad de Buenos Aires mediante la sanción del Decreto 156/12 con el objetivo de favorecer

la transparencia de la administración pública. Con la posterior sanción del Decreto 478/13 el

Ministerio de Modernización, Innovación y Tecnología se establece como encargado de

publicar en el portal todos los datos producidos a través de medios digitales por las distintas

áreas de gobierno, con excepción de aquella información que esté excluida por normas

específicas. Además se establece la obligación de todos los Ministerios, Secretarías, Organismos

Descentralizados y Entidades Autárquicas del Gobierno de la Ciudad a presentar un Plan de Datos Abiertos donde se explicite un cronograma de publicación gradual de información en los

formatos correspondientes.

Actualmente la Gerencia Operativa de Datos Abiertos perteneciente a la Dirección General de Proyectos de Ciudad Inteligente y Gobierno Abierto de la Subsecretaría de Innovación y Ciudad Inteligente es la encargada de gestionar el portal de datos abiertos y asesorar a las

diferentes áreas en la tarea.

I Protocolo de Datos Abiertos 02

Page 4: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

Misión, visión y objetivos del portal de datos

abiertosMisión

Visión

La misión del Portal de Datos Abiertos es ser un

canal de comunicación entre las múltiples áreas que

conforman el Gobierno de la Ciudad y los ciudadanos.

A través de la publicación de datos en formato abierto

se busca transparentar la gestión pública, empoderar

a los ciudadanos con información y fomentar la

participación y la opinión pública. Asimismo se busca

presentar análisis comunicacionales para ejemplificar

posibles lecturas de los datos.

El gobierno debe ejecutar políticas públicas de manera

transparente y ser proactivo en la publicación de

información de su gestión. Para ello se propone un

portal de datos con información completa, consistente

y exhaustiva que se encuentre alineada con los

requerimientos ciudadanos y los compromisos de la

Ciudad de Buenos Aires

I Protocolo de Datos Abiertos 03

Page 5: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

ObjetivosEL PORTAL DE DATOS ABIERTOS TIENE COMO OBJETIVO CONCRETAR LAS INICIATIVAS DE GOBIERNO ABIERTO QUE LLEVA A CABO LA CIUDAD DE BUENOS AIRES A TRAVÉS DEL TRABAJO CON OTRAS ÁREAS.

EN CUANTO A LOS OBJETIVOS ESPECÍFICOS EL PORTAL DE DATOS ABIERTOS BUSCA:

En relación a la administración pública:Visibilizar el trabajo de las diferentes áreas

de gobierno.

Ejecutar iniciativas de Gobierno Abierto.

Potenciar el uso de los datos públicos.

Cumplir con la Agenda de Transparencia.

En relación a la ciudadanía:Dar a conocer iniciativas privadas basadas

en datos abiertos.

Involucrar a los ciudadanos mediante

la participación.

Promover el desarrollo económico a través

de datos públicos.

Impulsar el análisis y la opinión ciudadana a partir

de los datos.

Utilizar recursos didácticos para mejorar la

comprensión y la lectura de la información.

ValoresTodas las iniciativas de datos abiertos que lleva a

cabo la Ciudad de Buenos Aires están ancladas en

los principios del Gobierno Abierto tales como la

Transparencia, Rendición de Cuentas, Colaboración

y Participación Ciudadana.

Quienes conformamos el equipo de datos

abiertos creemos fielmente que la información

es empoderamiento y por ello buscamos

constantemente mejorar en términos de calidad y

cantidad, la información que se encuentra disponible

en el portal de datos abiertos. Para ello consideramos

crucial el compromiso de cada uno de los miembros

del equipo con las iniciativas de Gobierno Abierto.

Consideramos que para cumplir nuestra labor es

necesario estar atentos y dispuestos frente a las

necesidades tanto de los ciudadanos como del

gobierno para poder lograr, progresivamente, el

cambio cultural que requiere el gobierno abierto.

I Protocolo de Datos Abiertos 04

Page 6: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

¿Qué es el portal de datos abiertos?

El catálogo de datos es una herramienta que fomenta

la transparencia, la colaboración y la reutilización de información por parte de la ciudadanía. Está

conformado por información de todos los ministerios

de la ciudad, organizada en diferentes conjuntos de

datos abiertos denominados datasets. Para permitir

la reutilización de la información se emplea el formato

dato abierto que implica que la información esté

dispuesta en formatos digitales, estándar y abiertos.

El portal no contiene datos estadísticos ni análisis sino

que se trata de un sitio que funciona como nexo entre

las múltiples áreas gubernamentales y el ciudadano.

Algunas definiciones: ¿Cómo está conformado?Los datasets en portales de datos abiertos

representan carpetas con información anexada.

Dentro de ellas se pueden encontrar uno o más

recursos que hacen referencia a las bases de datos

que lo componen. Un recurso puede ser generado

a partir de un archivo o un servicio web.

Para cumplir con los estándares internacionales

los datasets publicados deben estar alineados con

principios universales tales como: ser completos,

El catálogo de datos abiertos se encuentra

conformado por 190 datasets proporcionados por todos los Ministerios de la Ciudad de Buenos Aires. Cada uno contiene uno o más recursos asociados,

como la Guía de Datos que busca contextualizar

y describir la información que incluye cada recurso.

públicos, actualizados, accesibles, libres de todo

uso, no discriminatorios y no sujetos a licencias y/o

normativas específicas.

Además deben encontrarse en formatos específicos

como son el csv (valores separados por comas), XML

(lenguaje etiquetado extensible), RDF (infraestructura

para descripción de recursos), RSS (sindicalización

realmente sencilla), ODATA (open data protocol).

I Protocolo de Datos Abiertos 05

Page 7: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

¿Cuál es el proceso de creación de un dataset?

PARA EL CONTACTO Y ASESORAMIENTO A LAS DIFERENTES REPARTICIONES DEL GOBIERNO EN LA CREACIÓN DE CONJUNTOS DE DATOS CON EL FORMATO CORRESPONDIENTE A LA INICIATIVA DE DATOS ABIERTOS, LA GERENCIA OPERATIVA DE DATOS APLICA EL SIGUIENTE PROTOCOLO:

1- Selección de Información: Los datasets que

conforman el portal pertenecen a todos los Ministerios

del Gobierno de la Ciudad y se originan a partir de

diversos motivos:

Incluir temas de la Agenda de Transparencia Compromisos de gobierno.

Formar parte de los Planes de Apertura por

Ministerio (como indica el decreto 478/13).

El área se acerca proactivamente a publicar

información.

Se encuentra dentro del Plan de Transparencia Activa.

Los usuarios solicitan nuevas aperturas

contactandose directamente a través de la

cuenta de Twitter del Laboratorio de Gobierno

(@LABgcba), el mail oficial (gobiernoabierto@

buenosaires.gob.ar), o a través del portal de datos

por el canal de comentarios o la asistente que

lleva a un formulario específico.

1Selecciona la info

3Privacidad de la info

Formato abierto

2Recibir y comprender

el universo

4

Cheqeo de calidad

7

Recepción de datos Calidad de datos

5 6

Asignación de categoríasy etiquetas

8Asignación de fuente

y productor

9

Visualizaciones

10Notificación

11Difusión

122 - Recepción y comprensión del universo de la información: antes de publicar los datos se hace

un primer contacto con el área en el que se solicita una

breve descripción de la información, usándola como

referencia para que el contenido del dataset y sus recursos,

Page 8: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

5- Recepción de la base de datos: a esta instancia se

puede llegar vía mail o ser extraída de algún servidor

indicado por el área.

Los formatos de recepción de la información son:

CSV

XLS (que luego será transformado a formato CSV).

SHP

RAR

ZIP

3 - Privacidad de la información: en esta instancia

se evalúa que la información que se recibe no infringe

ninguna normativa relativa a datos personales y/o

sensibles. En caso de que ocurra, se procede a un

tratamiento especial de la información (Ver apartado

de Datos Personales).

4 - Formato abierto : en conjunto con el área productora

se establece la información necesaria para generar

el formato abierto en cada uno de los recursos que

conforman el dataset. Entre los pasos que componen

este punto se encuentran:

A- Nombre del dataset y de cada uno de los

recursos: Se buscar un nombre sencillo y que sea

representativo al contenido del dataset y de las

bases de datos.

B- Frecuencia de actualización: Se refiere a la

periodicidad con la cual el área envía información.

Se pacta teniendo en cuenta el movimiento de

los datos y siempre intentando que los plazos

sean lo más corto posibles. Un dataset podrá

tener recursos con diferentes frecuencias de

actualización. Actualmente éstas contemplan

desde diaria a bianual.

C- Descripción: Para facilitar la comprensión de

la información se le solicita al área que envíe una

breve descripción del dataset y de cada uno de los

recursos que explique en contexto la información.

Acá se incluye normativa que regule el tema,

aclaraciones específicas, sitios web de referencia,

entre otros puntos.

D- Descripción de las variables que componen los

recursos: Al igual que el punto anterior se solicita al

área que elabore una pequeña descripción de cada

uno de los campos que componen la base de datos

a publicar (en caso de que se trate de un archivo

CSV). Luego de ser procesados por el equipo de

datos estos se transformarán en la Guía de datos del

Recurso que acompaña a cada uno de los datasets.

1

2

3

sean claros procurando que cualquier ciudadano,

independientemente de su previo conocimiento en el

tema, se involucre con los datos abiertos.

Asimismo existen recursos que extraen información de APIs

o se conectan a Web Services. En estos casos el área envía la

ruta correspondiente para anexar al dataset.

6- Calidad de datos: se realizan procesos de análisis de

coherencia y consistencia de los datos. Dentro de ellos se

incluyen algunas de las siguientes operaciones:

Corroborar que la cantidad de registros sea coherente

con previas entregas.

Eliminar tildes, símbolos y transformar las bases

a mayúscula.

Asignar la codificación UTF8 sin BOM a todos

los archivos.

I Protocolo de Datos Abiertos 07

Page 9: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

7- Chequeo de calidad: Una vez terminado el archivo

a publicar será enviado al área para confirmar que los

datos sean los correctos. Si todo cumple con lo pactado

el dataset será subido al portal conteniendo como

mínimo dos archivos que se identifican como Recursos.

Los mismos serán:

8- Asignación de Categorías y Etiquetas: Luego de

corroborar que la información sea consistente y esté

lista para la publicación, se le asigna al dataset una o más

categorías y etiquetas con el objetivo de que los usuarios

puedan buscar información sobre un área específica

mediante la ayuda del filtro.

Asimismo, existen algunos recursos que se publican en

otros formatos como son XML, RAR y SHP cuyo trabajo

se realiza de la misma forma que el CSV.

NOTA: Los puntos 6 y 7 se realizan únicamente cuando el archivo es recibido vía mail o a través de un servidor indicado por el área.

Verificar que no existan campos vacíos donde

corresponda completar información.

Asegurar que los formatos de las celdas sean

los correspondientes a los datos que allí se

contienen.

En el caso de archivos que cuenten con ejes de

coordenadas, se corrobora que las mismas se

encuentren bien geocodificadas para que se

pueda mapear la base de datos.

Normalizar las direcciones y agregar datos

de Código Postal, Código postal argentino,

barrio y comuna.

Normalizar los campos.

Actividad Económica.

Administración Pública y Normativa.

Ambiente.

Cultura y Turismo.

Educación.

Infraestructura y Obra Pública.

Movilidad y Transporte.

Salud y Servicios Sociales.

Seguridad.

Urbanismo y Territorio.

Guía de datos del Recurso (En formato PDF).

Un archivo, en su mayoría es CSV, que contenga

la base. En caso de que el dataset se encuentre

conformado por más de una base de datos estas

serán agregadas como nuevos recursos.

En cuanto a las etiquetas, éstas consisten en palabras

claves que ayudan a la hora de buscar información

dentro del sitio. Como ya se mencionó estas se asignan a

datasets y no a recursos.

Para conocer otra forma de cómo se puede estructurar la

información en formatos abiertos recomendamos consultar la “Guía

para la publicación de datos en formatos abiertos” producida por el

Ministerio de Modernización de la Nación en: http://paquete-apertura-

datos.readthedocs.io/es/stable/guia_abiertos.html

En el caso de archivos muy pesados las diferentes áreas envían la

información en formatos comprimidos para agilizar el proceso de

publicación. Asimismo cuando se trata de información que cuenta con

archivos de diferentes extensiones (como ser por ejemplo html, prj,

shp) también se envían de esta forma. Como ejemplo de esto último

podríamos citar el dataset Barrios.

Idem 2.

1

2

3

Las categorías disponibles son:

9- Asignación de la Fuente del Dato/Productor: dentro de la plataforma se asigna una organización que

figure como Fuente de la información. Ésta se encuentra

generalmente compuesta por información del Ministerio,

Secretaría (SEC) o Subsecretaría (SS) y Dirección General

(DG) a la que pertenece.

I Protocolo de Datos Abiertos 08

Page 10: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

11- Notificación: una vez publicado el dataset con sus

respectivos recursos se envía un email al área para dejar

constancia de que el conjunto de datos ha sido publicado

y/o actualizado.

12- Difusión de la publicación: con el objetivo de

mantener informados a los usuarios se utiliza el canal

de Twitter (@LABgcba) para anunciar la actualización

o publicación de nueva información en el portal.

Usualmente se realizan publicaciones escritas o imágenes

representativas a la información.

10- Producción de Visualizaciones: una

vez finalizada la carga del recurso se elaboran

visualizaciones. Entre ellas, mapas y/o gráficos que

pueden ser realizados desde la misma plataforma o ser

embebidos de otro sitio web. Actualmente los mapas

embebidos pertenecen al repositorio de la Unidad de

Sistemas de Información Geográfica (USIG) y los gráficos

son realizados con herramientas de visualización tanto

internas como externas. Las mismas que se presentan

en el portal funcionan a modo de ejemplo para mostrar

cómo se pueden graficar los datos del recurso.

Existen casos en los que la fuente de información

no coincide con el Productor de la misma. Por

ejemplo, cuando se trata de un dataset que es posible

geocodificar, el productor será la Unidad de Sistemas

de Información Geográfica (USIG) y la fuente del dato

será el área que elabora la información. Los recursos de

un mismo dataset podrán tener diferentes fuentes de

información en caso de que los datos tengan origen en

diferentes áreas.

Tratamiento de datos personales

En el caso de que las bases contengan datos sensibles,

realizamos un tratamiento particular de la información

teniendo en cuenta la normativa existente sobre protección

de datos personales expresada en la Ley Nº 25.326.

En la misma, se establecen como datos personales la

información de cualquier tipo referida a personas físicas o

de existencia ideal determinadas o determinables. Por su

parte los datos sensibles son aquellos datos personales

que revelan origen racial y étnico, opiniones políticas,

convicciones religiosas, filosóficas o morales, afiliación

sindical e información referente a la salud o a la vida sexual.

La primera parte del proceso es la que ya se mencionó en

el apartado ¿Cuál es el proceso de creación de un dataset?,

aunque a la hora de realizar el proceso de Calidad de

Datos (ítem 6) se procede de la siguiente forma:

Existen casos en los cuales se encuentran publicados datos

como nombre, apellido y DNI porque se trata de datos que

ya están incluídos en un registro público, como es el caso de

los inspectores de las diversas reparticiones de la ciudad.

Aplicar técnicas de disociación para evitar la

identificación de la persona. Los datos que

habitualmente se eliminan son el nombre y

apellido de una persona aunque no excluye

anonimizar otro tipo de información pertinente.

Asignar un número de identificación (ID) para que

se entienda que se trata de información del mismo

sujeto aunque se desconozca quién es.

Realizar los procedimientos de calidad de datos como

cualquier otro dataset.

I Protocolo de Datos Abiertos 09

Page 11: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

¿A qué iniciativa responde?

¿Cuál es la vinculación con los usuarios?Beneficios de los datos

abiertos

La política de datos abiertos del Gobierno de la Ciudad

responde a iniciativas transversales vinculadas al

paradigma del gobierno abierto y la transparencia. Entre

ellas, la presencia de la Ciudad de Buenos Aires en la

Alianza para el Gobierno Abierto, las políticas de

Transparencia Activa y las iniciativas de Modernización

e Innovación en la Gestión Pública. En este sentido, el

paradigma de los datos abiertos debe enmarcarse en

prácticas de gobierno que buscan afianzar la confianza

de los ciudadanos hacia el mismo, a través de la proactiva

rendición de cuentas de lo que se realiza dentro de la

administración pública. Asi como también en llevar a

cabo políticas públicas que puedan basarse en evidencias

y una gestión de la información que genere una mejora

en la calidad de los servicios públicos.

Los datos abiertos son una de las tantas herramientas

con las que cuenta el Gobierno de la Ciudad para

transparentar las actividades y acciones que realiza

y así generar confianza en la ciudadanía a través de

la rendición de cuentas. Asimismo, la publicación de

información representa un gran insumo para muchos

investigadores, periodistas, desarrolladores y otros

profesionales que buscan darle un valor agregado a

los datos que produce la ciudad. Es por ello que el área

de datos abiertos está en permanente contacto con

diversas ONGs, universidades y empresas que con sus

Muchas veces los pedidos de información que

se realizan a las diversas áreas de gobierno

provienen de compromisos de transparencia.

Otras, de los usuarios con los que el área de

datos tiene permanente contacto a través del

mail [email protected], vía Twitter (@LABgcba) o mediante el espacio de

sugerencias incluído en el portal. El área de datos

abiertos busca además de ampliar la cantidad

de datasets publicados, mejorar la calidad de la

información, haciéndola más sencilla e inclusiva

para una comunidad más amplia y participativa.

inquietudes y requerimientos que ayudan a aumentar la

calidad y cantidad de datos publicados.

La apertura también significa una oportunidad para el

Gobierno que puede beneficiarse del conocimiento de

los ciudadanos a partir de las iniciativas privadas que

surjan (como son las investigaciones o desarrollos de

aplicaciones). Asimismo es una gran herramienta para

poder emprender modelos de gestión cuyas decisiones

se encuentren basadas en datos ya que permite poner

en contacto a los diversos poderes y áreas de gobierno y

así fomentar la interoperabilidad dando como resultado

una mayor eficiencia en el funcionamiento de la

administración pública.

I Protocolo de Datos Abiertos 10

Page 12: Protocolo de Datos Abiertos - buenosaires.gob.ar · Protocolo de Datos Abiertos ... Formar parte de los Planes de Apertura por Ministerio (como indica el decreto 478/13). El área

@labgcba @labgcba

[email protected]

labgcba