Datos masivos en Educación y Cultura - cervantes.es · •Conexión de recursos educativos de...

27
CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE Piqueras 31, 4ª planta · E26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab Ricardo Alonso Maturana © RIAM I+L Lab © RIAM I+L Lab Piqueras 31, 4ª planta · E26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab Ricardo Alonso Maturana © RIAM I+L Lab © RIAM I+L Lab Piqueras 31, 4ª planta · E26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab Datos masivos en Educación y Cultura Ricardo Alonso Maturana © RIAM I+L Lab Ricardo Alonso Maturana © RIAM I+L Lab © RIAM I+L Lab Piqueras 31, 4ª planta · E26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab Ricardo Alonso Maturana. Datos masivos en educación y cultura Organiza: Departamento de Bibliotecas y Documentación Dirección de Cultura. Instituto Cervantes

Transcript of Datos masivos en Educación y Cultura - cervantes.es · •Conexión de recursos educativos de...

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Datos masivos en Educación y CulturaRicardo Alonso Maturana

© RIAM I+L LabRicardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana. Datos masivos en educación y cultura

Organiza: Departamento de Bibliotecas y Documentación

Dirección de Cultura. Instituto Cervantes

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Nuestra historia: 10 años contribuyendoa la contrucción de la web semántica

RIAM I+L Lab y

comienza a

trabajar en

el proyecto

GNOSS.

Ap

r 2

00

2

2002

2014Equipo

GNOSS

desarrolla un sistema de interoperabilidad con una solución semántica usando OWL/RDF.

Ag

os 2

00

6

Publicac

ión de la

platafor

ma

social y

semánti

ca

Gnoss

Fe

b 2

00

9

Los datos de gnoss.com se enlazan con Freebase.

No

v 2

01

0

GNOSS y Didactalia aparecen en la LOD Cloud 2011

Se

p 2

011

Oct

20

12

GNOSS presenta su proyecto en la

the Semantic Technology and Business Conference en New York

Fe

b 2

011 Puesta en

marcha del

generador de buscadores/razonadores facetados

Mismuseos.net finalista enVeni Competition 2013. Ginebra, Open Knowledge Conference

Se

p

20

13Ganadores del

Learning

Analytics

Knowledge

(LAK) Challenge

2013 promovido por SOLAR

Society for Learning Analytics Research

Ab

r 2

01

3

Ju

n 2

01

3

Mismuseos.netfinalista en el LODLAM Challenge 2013. Montreal. Canadá.

Ma

r 2

01

4

Didactalia.netPremio Zapping a la mejor iniciativa en internet para menores

Oct

20

14

Didactalia.net 2º PREMIOVici Competition 2014. Italia 13th International Semantic Web Conference

Ag

os

20

14

GNOSS : 2º mayor publicador de Dataset en españolLOD Cloud 2014

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

La Web Semántica entendida como Web de Datos enlazados proporciona la posibilidad de un nuevo relato educativo y cultural.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Los datasets no son la web semántica,sino una de sus condiciones.

La web semántica debe ser capaz de ofrecer soluciones y aplicaciones para diversos grupos de usuarios: hay que pensarla desde esa perspectiva.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Las tres dimensiones de un proyecto semántico de datos masivos

Procesos HCI. Human Computer Interaction

Ingeniería Ontológica e Integración de datos

Computación y arquitectura

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Principales procesos semánticos HCI

HCIR. Human Computer Information Retrival•Buscadores facetados

CCIR. Computer-Computer Information Retrieval •Enriquecimiento de información•Generación de contextos

KWD. Knowledge Discovery •Sistemas de inferencia. Posibilidades educativas•Knowledge Hub. Posibilidades educativas

SR. System Recomendation•Algoritmos sociales de recomendación

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Durante los últimos años, la confluencia de estudios en las áreas de IR (Information Retrieval) y HCI (Human Computer Interaction) ha generado un área de estudio específica, HCIR (Human–Computer Information Retrieval), que se ocupa de las técnicas de recuperación de información que introducen la inteligencia humana en el proceso de búsqueda.

Human–Computer Information Retrieval (HCIR)

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Algunas de las ideas generadas, que ya se están aplicando en los buscadores más avanzados, son:

•Dar la responsabilidad y el control de la búsqueda a la persona. Le requiere esfuerzo, pero se le recompensa.•No adivinar las intenciones, sino mejorar la comunicación.•Soportar refinamiento y exploración.•Responder con un conjunto de resultados ordenado y adecuado, lo que incluye ofrecer diferentes formas de presentación según el tipo de resultados: listas, mosaicos, mapas, timeline, etc.

Una de las propuestas concretas es el uso, como interfaz, de buscadores facetados. Han sido pioneros, en el uso de este tipo de interfaz, sitios web como Amazon o Ebay.

HCIR

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Debe disponerse de un motor de búsqueda facetadabasado en el uso de los estándares de la websemántica, (dada la mayor expresividad y laextensibilidad de los datos aportados por estosestándares), que permite a construir potentes,flexibles y evolutivos sistemas de búsqueda para losseres humanos .

El motor de búsqueda facetada debe ser capaz deexplotar un grafo semántico expresado en triplesRDF y también hacer uso de estos grafos a través debúsquedas razonadas o basadas en inferencias (¡ysiempre sumarizando!)

Semantic HCIR

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

HCIR

Los buscadores facetados deben :•Ofrecer una sumarización basada en propiedades quecaracterizan específicamente a los resultados mostrados.(P.ej: si se trata de mostrar obras de arte, podrían serautor, museo, época, estilo, escuela, técnica, etc.)•Cada posible valor de la propiedad debe presentarsecomo una opción de refinamiento de la búsqueda.•Las opciones de refinamiento ofrecen resultados posibles(existentes).

Estas características hacen del buscador un instrumento en símismo educativo- formativo (que colabora en los procesospersonales de descubrimiento de conocimiento)Veamos el caso de uso de Mismuseos.net.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Computer-Computer Infomation Retrival (CCIR)

Uno de los beneficios que aparecen cuando las máquinas“entienden” el contenido y los recursos digitales estánrepresentados de acuerdo con los estándares de la websemántica, es la posibilidad de vincular los datos entre sí ygenerar de ese modo contextos significativos para la informacióno información enriquecida con contextos pertinentes.

El sistema debe disponer de un Sistema de Generación deContextos Semánticos que explote un grafo semántico (triplesRDF) y que genere dinámicamente contextos enriquecidos apartir de los datos contenidos en el mismo grafo o a partir dedatos contenidos en grafos externos (expresadossemánticamente).

Veamos de nuevo el caso de uso de MisMuseos.net

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Kwnoledge Discovery (KWD)Otro de los beneficios de representar semánticamente la información con losestándares de la web semántica es que permite desarrollar sistemas deinferencia y de descubrimiento de conocimiento que conectansignificativamente silos de información previamente no conectados.

Caso de uso: Didactalia Educational Knowledge Graph

•Conexión de recursos educativos de Didactalia con entradas de la Wikipediaa través de DBpedia•Reconocimento de entidades DBpedia contenidas en los recursos deDidactalia•Integración en Didactalia de entidades DBpedia invocadas desde susrecursos y construcción de un grafo de conocimiento expresado en unavisualización gráfica

La ontología de DBpedia contiene más de 685 clases y 2.975 propiedades. Eldataset de DBpedia contiene más de 4 millones de instancias de los que sehan invocado en Didactalia unas 30.000 entidades

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

System Recomendation (SR)

Si los contenidos representados semánticamente se integran enun espacio social, es posible desarrollar sistemas derecomendación para ofrecer a los usuarios contenidos en funciónde sus intereses.

Los sistemas de recomendación pueden tener en cuenta:•Áreas de interés del usuario•Intereses de usuarios afines•Identificación y priorización de contenidos más valorados por lared•Contenidos interesantes en función de ubicaciones geográficas•Etc.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Museos CIDOC-CRM

Archivos: CNEDABibliotecas: FRBR

6 entidades, 17 subclases y 10 tipos de relaciones

6 entidades

EUROPEANA

90 entidades

148

propiedades

Un Modelo Digital representa un conjunto de hechos acotado. Un Modelo Digital representa el modo en el que sabemos que un conjunto de entidades de nuestro mundo y sus atributos

interactúan y se relacionan entre sí.

¿Qué es un modelo digital?

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Cumplir con las promesas de la Web Semántica relativas al desarrollo de aplicaciones orientadas a mejorar la experiencia del usuario final dependerá, en última instancia, de cómo se resuelva en la práctica el proceso de construcción y la evolución de los Modelos de Representación del conjunto de entidades que conforman el mundo ordinario (personal y profesional) en el que vivimos y con el que interactuamos las personas.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Los Modelos Digitales permiten trabajar en dos niveles de agregación: Metaespacios y Metamodelos.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Nivel de agregación I: METAESPACIOS o agregaciones de objetos de conocimiento homogéneos Así por ejemplo, podemos agregar en un

metamuseo el conjunto de contenidos de N

museos cuyo contenido esté representado conCIDOC, en una metabliblioteca digital elconjunto de los contenidos de las bibliotecasrepresentados con FRBR, etc...Esto haceposible dos cosas:

• Descubrir conocimiento en lo contextosimplícitos en el grafo y que de ordinarioson difíciles de conocer para el públicoincluso especializado (contextos delestilo, quién estaba pintando qué cuandoel autor X pinto tal obra, etc...)

• Semantic Dynamic Publishing: Publicarpartes del grafo que incluyen informaciónagregada sobre algún tema específico (elgrafo de Goya implícito en el grafoagregado de MisMuseos puede incluir másinformación sobre Goya que la quepueden ofrecer cada una de las partes, lomismo puede ocurrir con el grafo querepresenta cierta técnica pictórica encierta época, etc ...)

Museo El Greco

Museo del Prado

Arte en la BNEMuseo Lázaro Galdiano

Museo Reina Sofía

Museo de Bellas

Artes de Bilbao

Museo Sorolla

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Nivel de agregación II: METAMODELOS o enlazado de objetos de conocimiento heterogéneos

Modelo digital de MisMuseos.net: CIDOC-CRM + EFBR + LOM-ES

Ficha de obra de Arte en MisMuseos.net

La conexión de modelos permite un enriquecimiento superior de los datos primarios; también construir espacios de conocimiento ampliados sobre a base de información valorizada para nuevos fines

Contexto educativo con LOM-ES

Datos CIDOC + FRBR

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

19

Una comunidad educativa global en internet

para profesores, padres y alumnos.

Más de 100.000 recursos educativos

Más de 195.000 usuarios

Más de 7,8 millones de visitas en 2013

DIDACTALIA

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

IterLibrisIter

Libris

La Otra EscuelaLa Otra Escuela

Más Cine Por FavorMás Cine Por Favor

Fundación Lázaro

Galdiano

Fundación Lázaro

Galdiano

GeonamesGeonames

Freebase

Freebase

Dbpedia

Dbpedia

PaperToys

Mapas Interactivos

BNE Escolar

BNE EscolarResidencia

EstudiantesGeneración 27

Residencia Estudiantes

Generación 27

MisMuseos(Meta-museo)

MisMuseos(Meta-museo) Museos

de EspañaMuseos

de España

NYTNYT

17.000 Obras de arte17.000 Obras de arte17.000 Obras de arte17.000 Obras de arte

2.500 Artistas2.500 Artistas2.500 Artistas2.500 Artistas

8.500 Obras culturales8.500 Obras culturales8.500 Obras culturales8.500 Obras culturales

Cuadernos IluminadosCuadernos Iluminados

Cuadernos Cuadernos Cálculo

Lecciones

4.000 Mapas 4.000 Mapas 4.000 Mapas 4.000 Mapas

100.000 Recursos educativos100.000 Recursos educativos100.000 Recursos educativos100.000 Recursos educativos

190.000 Miembros190.000 Miembros190.000 Miembros190.000 Miembros

didactalia

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

21

El Ecosistema Didatalia trabaja con las siguientes nueve ontologías y vocabularios :

• Dbpedia• LOM (Learning Object Meta-data)• CIDOC (Conceptual Reference Model)• FRBR (Functional Requirements for Bibliographic Records)

• GeoNames• FOAF• SIOCSKOS• DC (Dublin Core)

DIDACTALIA: un espacio Liked Open Data

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Los Modelos Semánticos Digitales deben considerar ab initio las posibles necesidades y usos de los usuarios finales no profesionales (o no pertenecientes a un determinado grupo profesional) y no sólo en las necesidades de los grupos profesionales que los promueven y crean.

De ese modo, la Web Semántica se convertirá en tecnología invisible y útil en muchos ámbitos de la vida.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

• Diseño de modelos digitales y metamodelos

• Programación de ontologías en OWL e hibridación de ontologías reutilizando vocabularios estándar

• Representación semántica de contenidos y construcción de espacios y metaespacios para la explotación de los contenidos útiles para los usuarios finales.

Capacidades necesarias en Ingeniería ontológica

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

24

Proceso de representación semántica,integración y publicación de datos

IdentificaciónIdentificaciónIdentificaciónIdentificación RepresentaciónRepresentaciónRepresentaciónRepresentación IntegraciónIntegraciónIntegraciónIntegración PublicaciónPublicaciónPublicaciónPublicación ConfiguraciónConfiguraciónConfiguraciónConfiguración PresentaciónPresentaciónPresentaciónPresentación

1. Identificación: de las fuentes de datos internas y/o, externas o de terceros accesibles, abiertas y/o semánticas que se incorporaran al site.

2. Representación: definición ontológica de los Objetos de Conocimiento y entidades vinculadas (Modelo Digital Semántico e ingeniería ontológica).

3. Integración: carga de datos procedente de las fuentes que pueden estar estructurados o desestructurados en origen. En el segundo caso, debemos activar un proceso de Anotación Semántica.

4. Publicación: primera puesta en marcha del conjunto de datos semánticos, primeros modelos de recuperación de la información, generación de contextos, activación del CMS y SEM CMS...

5. Configuración: identificación de los modelos y estrategias de enlazado de los datos contenidos en el conjunto entre sí y con otros posibles conjuntos de datos de la Link Open Data.

6. Presentación: la arquitectura y modelos de navegación y presentación de los contenidos en página web.

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

25

Semantic Big Data

DBpedia 3.640 .000 de objetos, 1.200 M de triplesFreebase Open database, 337 M de triplesBio2RDF::Pubmed Artículos de biomedicina, 5.000 M

de triplesBritish Museum Collection Colección Online, 105 M de

triples

Los proyectos exitosos, sobre los grandes datasets semánticos actuales, provocarán su replicación sobre volúmenes cada vez mayores. Big Data + Semantic Web = Smarter Big Data

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

26

Semantic Big Data / Educational Big Data. • Computación de grafos del orden de magitud de

miles de millones de Triples � Un grafo con 5millones de recursos heterogéneos expresados através de un metamodelo con ontologías complejasequivale a 1.000 millones de triples

Business Analytics

• Nuevas formas de exploración de los grafos y devisualización de los datos (Caso de uso: LearningAnalytics Research - LAK Data Challenge)

Ricardo Alonso Maturana. Datos masivos en educación y cultura

CONFIDENTIAL- DO NOT COPY OR DISTRIBUTE

Piqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Ricardo Alonso Maturana

© RIAM I+L Lab© RIAM I+L LabPiqueras 31, 4ª planta · E�26006 Logroño · T/F (+34) 941 248 905 · [email protected] · www.gnoss.com Ricardo Alonso Maturana © RIAM I+L Lab

Gracias

Ricardo Alonso Maturana. Datos masivos en educación y cultura