Estado de situación del acceso abierto en Argentina: gestión de datos científicos

34
Estado de situación del Acceso Abierto en Argen3na: Ges3ón de Datos Cien8ficos Fernando Ariel López @fernando__lopez | [email protected] Quién es Quién 2016 “Creando futuro: tecnologías e innovación en las bibliotecas universitarias” 7 de octubre de 2016

Transcript of Estado de situación del acceso abierto en Argentina: gestión de datos científicos

Page 1: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

 Estado  de  situación  del  Acceso  Abierto  en  Argen3na:  Ges3ón  de  Datos  Cien8ficos  

 

Fernando  Ariel  López  @fernando__lopez  |  [email protected]  

Quién  es  Quién  2016  “Creando  futuro:  tecnologías  

e  innovación  en  las  bibliotecas  universitarias”  

7  de  octubre  de  2016  

Page 2: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

¿Qué  es  el  Acceso  Abierto?  El   acceso   libre,   gratuito,   inmediato   y   sin  restricciones  a  la  literatura  cienMfica,  a  través  de  Internet.    Cualquier  persona  puede  leer,  descargar,  copiar,  distribuir,   imprimir,   comparQr   y   enlazar   los  textos   completos   de   producción   cienMfica,   sin  barreras  financieras,  legales  o  técnicas.    La  única  limitación  es  citar  al  autor  y  respetar  la  integridad  de  la  obra.  

Page 3: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

Caminos  para  lograr  el  Acceso  Abierto  

vía  DORADA  

REVISTAS  CIENTÍFICAS    

•  Portales  de  Revistas  CienMficas:  –  Regionales  –  TemáQcos  –  InsQtucionales  

vía  VERDE    

REPOSITORIOS      

•  InsQtucionales  •  TemáQcos  •  Cosechadores  •  de  Datos  …  

 

Page 4: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

vía  DORADA  

•  LaQndex  =  3774  revistas  en  Directorio      =  670  revistas  en  Catálogo  

•  SciELO  =  126  revistas  (118  vigentes)  •  NBR  =  217  revistas    •  Redalyc  =  75  revistas  (22.640  arMculos  y  1872  fascículos)  •  DOAJ  =  128  revistas  (en  proceso  de  reevaluación)    

Portales  de  Facultades  y  Universitarios  

Page 5: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

vía  VERDE  SNRD  (MINCYT):  *  Datos  al  14/06/2016  

-­‐  40  repositorios  digitales  adheridos  al  SNRD  (proyectos,  en  desarrollo  e  implementados)  

-­‐  18  repositorios  digitales  adheridos  e  integrados  al  Portal  SNRD.  

-­‐  74.391  objetos  digitales  disponibles  en  Acceso  Abierto  a  través  del  Portal  SNRD.  

-­‐  9  proyectos  financiados  por  el  SNRD.  

-­‐  $  2.310.626  es  el  monto  total  aprobado  para  los  proyectos  de  financiamiento.    

Ley  26.899  Creación  de  Repositorios  Digitales  Ins3tucionales  de  Acceso  Abierto,  Propios  o  Compar3dos  (noviembre  de  2013)  

•  producción  cienMfico-­‐tecnológica:  arMculos  de  revistas,  trabajos  técnico-­‐cienMficos,  tesis  académicas,  entre  otros.  

•  6  meses  después  de  la  fecha  de  su  publicación  oficial  o  de  su  aprobación.  •  DATOS  PRIMARIOS:  5  años  del  momento  de  su  recolección.  

Page 6: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

Los  DATOS  son  el  petróleo…      

…  pero  si  no  se  ges3onan  NO  SIRVEN  

Page 7: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

BIG  DATA  à  REDES  SOCIALES  +  IOT  +  Smart  City  

Page 8: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

CIENCIA  à  Ciencia  Abierta  GOBIERNO  à  Gobierno  Abierto  

Page 9: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

LEGISLACIÓN  •  LEY  26.899  (2013)  

Creación  de  Repositorios  Digitales  InsQtucionales  de  Acceso  Abierto,  Propios  o  ComparQdos  

•  RESOLUCIÓN  538  de  JFG    (2013)  Sistema  Nacional  de  Datos  Públicos  

•  DECRETO  117  (2016)    Plan  de  Apertura  de  Datos  

•  Ley  Acceso  a  la  Información  Pública  (2016)  Acceso  a  la  Información  Pública  

Page 10: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

¿De  qué  DATOS  me  hablas?  LEY  26.899  (2013)  

•  Datos  Primarios  (data  set)  •  Plan  de  Ges3ón  de  Datos  (DMP)  •  Deposito  “data  set”  en  Repositorio  de  Datos  •  Fecha:  Diciembre  de  2018  

 DECRETO  117  (2016)  •  Datos  Públicos  (organigramas  del  EjecuQvo;  declaraciones  juradas  de  funcionarios;  personal  contratado;  escalafones  y  escalas  salariales;  contrataciones  públicas;  y  las  solicitudes  de  AIP).  

•  Relanzamiento  del  “Portal  Nacional  de  Datos  Públicos”  •  Fecha:  11  de  Julio  de  2016  

Page 11: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

→ hechos, observaciones o experiencias (basado argumento, teoría o prueba)

→ pueden ser numéricos, descriptivos o visuales.

→ pueden ser en estado bruto o analizado, → pueden ser experimentales u observacionales.

→ pueden ser abiertos o cerrados

¿Qué  son  los  datos  de  invesQgación?    ¿Qué son los datos de investigación?

Page 12: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

Los datos incluyen: cuadernos de laboratorio, cuadernos de campo, datos de investigación primaria (incluidos los datos en papel o en soporte informático), cuestionarios, cintas de audio, videos, desarrollo de modelos, fotografías, películas, y las comprobaciones y las respuestas de la prueba.

Las colecciones datos para la investigación pueden incluir diapositivas; diseños y muestras.

En la información sobre la procedencia de los datos también se podría incluir: el cómo, cuándo, donde se recogió y con que (por ejemplo, instrumentos). El código de software utilizado para generar, comentar o analizar los datos también pueden ser considerados datos.”

¿Qué  son  los  datos  de  invesQgación?    ¿Qué son los datos de investigación?

Page 13: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

Observacionales: datos capturados en tiempo real, comúnmente únicos e Experimentales: datos provenientes de resultados experimentales Ej: Aquellos que provienen de aparatos de medición en laboratorios, comúnmente reproducibles, pero caros. Simulación: datos generados de modelos de prueba donde el modelo y los metadatos pueden ser mas importantes que los datos de salida del modelo. Ej: Modelos económicos o climáticos. Desarrollados o compilados: resultado de procesar y/o combinar datos “crudos”, comúnmente reproducibles pero caros. Ej. Bases de datos compiladas,Resultados de text mining, Datos de censos

consolidados. Reference or canonical: Una (estática u orgánica) conglomeración o colección de datasets mas pequeños (revisados por pares), la mayor parte de ellos publicados y “curados” Ej. Bancos de datos genéticos, bases de datos cristalográficas.

¿Qué  son  los  datos  de  invesQgación?    Tipos de Datos Científicos

Page 14: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

●  Es  una  colección  de  datos  reunidos  durante  la  ejecución  de  un  proyecto  de  invesQgación.  

●  Son  objetos  digitales  compuestos  y  heterogéneos.  ●  ConsQtuye  la  base  de  la  invesQgación  y  va  asociado  a  una  publicación  

cienMfica  (resultado  de  la  invesQgación).  ●  Se  almacena  y  gesQona  en  Repositorios  Interoperables  conforme  a  

estándares  internacionales.  

Es el objeto específico de control, organización,

descripción y preservación de datos científicos

DATASET

Page 15: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

BENEFICIOS  #DatosAbiertos  

●  Ayuda  a  verificar  los  resultados.  ●  Evitar  la  fabricación  y  falsificación  de  datos.  ●  Diferentes  interpretaciones  o  enfoques  aplicados  a  datos  existentes  contribuyen  a  los  avances  cienMficos.  

●  OpQmización  en  el  uso  de  recursos.  ●  Preservación  a  largo  plazo  bien  gesQonada,  permite  mantener  la  integridad  de  los  datos.  

 TenopirC, Allard S, Douglass K, AydinogluAU, et al. (2011) Data Sharing by Scientists: Practices and

Perceptions. PLoSONE 6(6): e21101. doi:10.1371/journal.pone.0021101 http://www.plosone.org/article/info:doi/10.1371/journal.pone.0021101

Page 16: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

ACTORES  INVOLUCRADOS  Bibliotecario  embebido  Curador  de  Datos  Bibliotecarios  de  Datos  /  DataLabririan    

Page 17: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

CIENCIA

Líneas  de  Trabajo:  

1.  POLÍTICA  DE  DATOS  CIENTÍFICOS    2.  CICLO  DE  VIDA  DE  LOS  DATOS  CIENTÍFICOS  3.  PLAN  DE  GESTIÓN  DE  DATOS  CIENTÍFICOS  

4.  E-­‐INFRAESTRUCTURAS  

Page 18: Estado de situación del acceso abierto en Argentina: gestión de datos científicos
Page 19: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

1.  Diseño  y  planificación  de  la  creación/extracción  de  datos  

2.  Creación/Extracción  de  Datos  3.  Limpieza,  Normalización  y  Descripción  de  Datos    

4.  Almacenamiento  y  Preservación  de  Datos  

5.  Exploración,  Explotación  y  Visualización  de  Datos  6.  DataMining  &  Knowledge  Discovery  

CICLO  DE  VIDA  DE  LOS    DATOS  CIENTÍFICOS  

Page 20: Estado de situación del acceso abierto en Argentina: gestión de datos científicos
Page 21: Estado de situación del acceso abierto en Argentina: gestión de datos científicos
Page 22: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

¿Qué  es  un  PGD?  Un  plan  de  ges3ón  de  datos  cien8ficos  (Data  Management  Plan  -­‐  DMP)  es  un  documento  elaborado  por  el  invesQgador  o  grupo  de  invesQgación  donde  se  define:    

•  qué  datos  van  a  ser  creados  y  cómo,    

•  cómo  se  van  a  describir,  organizar,  almacenar  y  gesQonar  los  datos    

•  de  qué  forma  van  a  ser  comparQdos,  explicando  cualquier  restricción  de  uso    

•  que  pueda  ser  aplicada.    

•  Quién  o  quiénes  serán  los  responsables  de  realizar  cada  una  de  estas    

•  acQvidades.    

•  de  qué  forma  van  a  ser  comparQdos,  explicando  cualquier  restricción  de  uso    

•  que  pueda  ser  aplicada.  

Page 23: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

DMP  ArgenQna  (CAICYT-­‐CONICET)  

Propuesta  para  Proyecto  de  InvesQgación:  •  Bloque  de  Datos  administraQvos  •  Bloque  de  Recolección  de  datos  •  Bloque  de  Documentación  y  metadatos  •  Bloque  de  Almacenamiento  y  copias  de  

seguridad    •  Bloque  de  Selección  y  preservación  •  Bloque  de  Re-­‐uso  de  Datos  

Page 24: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

e-­‐INFRAESTRUCTURAS    Repositorio Interoperable de Datos•  Datos Públicos Argentina (CKAN, OKF),•  Zenodo (Invenio, CERN)•  DRYAD, PLICSS, LAGOS (DSpace, MIT & HP),•  Harvard DATAVERSE (Eprints)

Plataforma de Trabajo para Investigadores•  OSF, HubZero, MyExperiment.org, etc.

Cluster de Almacenamiento y/o Procesamiento

Page 25: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

NUEVOS  PERFILES  

Page 26: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

La  profesión  del  futuro.    Es  el  encargado  en  extraer  el  conocimiento  de  los  datos.  Para  ello  deber  tener  sólidos  conocimientos   estadísQcos,   poseer  destrezas   para   resolver   problemas,   hacer  preguntas   y   explicar   los   resultados  obtenidos.  

Data  Scien3st  /  Cien8ficos  de  Datos  

Page 27: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

Bibliotecari@  de  Datos  /  Data  Librarian  

Es un término ad-hoc, es la aplicación de los principios y las prácticas tradicionales de los bibliotecarios a los datos.El perfil del bibliotecario de datos requiere:•  Competencias informáticas•  Conocimiento de la disciplina (corpus, prácticas de

investigación y flujos de trabajo)•  Gestión de datos:

q  adquisición (desarrollo de la colección),q  organización (catalogación y metadatos),q  preservación y conservación a largo plazoq  implementación de servicios adecuados para los

usuarios.

Page 28: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

NUEVAS  COMPETENCIAS  

Page 29: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

COMPETENCIAS

•  Estadística, Algebra y Programación•  Tecnologías y Formatos Abiertos•  XML, PYTHON, R, etc.•  Herramientas de normalización, procesamiento

y visualización.•  Comunicación (visual y audiovisual)

•  Diseño Centrado en el Usuario (UX)

Page 30: Estado de situación del acceso abierto en Argentina: gestión de datos científicos
Page 31: Estado de situación del acceso abierto en Argentina: gestión de datos científicos
Page 32: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

OPORTUNIDADES  Comunidad  Cien8fica:  

•  Acordar  estándares  de  trabajo,  normalización  y  ges3ón  de  datos  

•  Empoderar  en  Ges3ón  de  Datos  Cien8ficos    

•  Contribuir  al  avance  de  la  ciencia,  maximizando  la  visibilidad  y  el  

impacto  de  la  inversión  en  Inves3gación  

•  Financiamiento  y  Desarrollo  de  e-­‐infraestructuras  para  el  

aprovechamiento  de  la  Big  Data  Cien8fica  

•  Encuentro  con  otras  comunidades  de  Gobierno  Abierto,  Periodismo  

de  Datos,  HackAcQvismo  Cívico,  IoT,  etc.  

•  Repensar  formas  de  producción,  medición  e  impacto  cien8fico  

 

Page 33: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

¿PREGUNTAS?  

Page 34: Estado de situación del acceso abierto en Argentina: gestión de datos científicos

MUCHAS  GRACIAS!!!  Fernando   Ariel   López  

@fernando__lopez    [email protected]  

+