rNews - Parte I: Conociendo la ontología

27
rNews Parte I: Conociendo la ontología martes 27 de noviembre de 12

Transcript of rNews - Parte I: Conociendo la ontología

Page 1: rNews - Parte I: Conociendo la ontología

rNewsParte I: Conociendo la ontología

martes 27 de noviembre de 12

Page 3: rNews - Parte I: Conociendo la ontología

martes 27 de noviembre de 12

Page 4: rNews - Parte I: Conociendo la ontología

HISTORIA

FOTO

Componentes de la historia que son obvios para una persona…

martes 27 de noviembre de 12

Page 5: rNews - Parte I: Conociendo la ontología

HISTORIA

FOTO

...no son tan obvios para una máquina.

martes 27 de noviembre de 12

Page 6: rNews - Parte I: Conociendo la ontología

El Problema de los Datos Estructurados

Sitios Web Modernos construidos con una Arquitectura de 3 Capas

Capa de Datos: BD donde reside el Contenido.

Capa de Presentación: Documento HTML que se le envía al usuario.

Capa de Lógica: Software que lee de la Capa de Datos y produce la Capa de Presentación. Data

Tier

Logic Tier

Display Tier

Capa de Visualización

Capa Lógica

Capa de Datos

martes 27 de noviembre de 12

Page 7: rNews - Parte I: Conociendo la ontología

Label Type Value

id number 1248069162607

Headline text New Web Code Draws Concern...

Byline text By TANZINA VEGA

Date date 20101010

Body text In the next few years, a powerful...

Length number 1123

Tag text Privacy

Tag text Computers and the Internet

Tag text Web Browsers

<html> <head>

<title> New Web Code Draws Concern...

</title> </head> <body> <div>

New Web Code Draws Concern... </div> <div>

By TANZINA VEGA </div> <div>

October 10, 2010 </div> <div>

In the next few years, a powerful... </div> </body></html>

Capa de Datos Capa de VisualizaciónCapa Lógica

Contenido muy bien estructurado en la Capa de Datos, pero toda esta estructura se pierde en la traducción a la Capa de Visualización.

El Problema de los Datos Estructurados

martes 27 de noviembre de 12

Page 8: rNews - Parte I: Conociendo la ontología

<html> <head>

<title> New Web Code Draws Concern...

</title> </head> <body> <div>

New Web Code Draws Concern... </div> <div>

By TANZINA VEGA </div> <div>

October 10, 2010 </div> <div>

In the next few years, a powerful... </div> </body></html>

Capa de Visualización

=?

Motores de Búsqueda, Redes Sociales y otros sitios web sólo ven la Capa de Visualizacion, y no pueden hacer uso de la estructura de los datos subyacente.

El Problema de los Datos Estructurados

martes 27 de noviembre de 12

Page 9: rNews - Parte I: Conociendo la ontología

Microformats RDFa Microdata JSON

§ Oficial

§ Complejo

§ OpenGraph

§ No oficial

§ Flexible

§ Schema.org

§ Oficial

§ Desarrolladores

§ External

Estándares de Marcado Semántico

§ Primero

§ Simple

§ Rígido

martes 27 de noviembre de 12

Page 10: rNews - Parte I: Conociendo la ontología

rNews Definido

rNews es un modelo de datos para embeber metadatos legibles por máquinas en documentos web y un conjunto de implementaciones sugeridas.

martes 27 de noviembre de 12

Page 11: rNews - Parte I: Conociendo la ontología

rNews: modelo de datos

ImageObjectVideoObjectAudioObject

Article

Comment

OrganizationPerson Location

NewsItem

comment

associatedMedia

Concept

about

PostalAddress

addressaddress

mentions

address

creatoreditorcontributorprovidercopyrightHolderaccountablePerson

creatoreditor

contributorprovider

copyrightHoldersourceOrganization

name

associatedArticle

GeoCoordinates

geoCoordinates

martes 27 de noviembre de 12

Page 12: rNews - Parte I: Conociendo la ontología

HeadlineBylineTags

Creator...

para embeber metadatos legibles por máquinas en

documentos web

martes 27 de noviembre de 12

Page 13: rNews - Parte I: Conociendo la ontología

RDFa Microdata

Hoy Hoy

y un conjunto de implementaciones sugeridas

martes 27 de noviembre de 12

Page 14: rNews - Parte I: Conociendo la ontología

rNews - Ejemplo

martes 27 de noviembre de 12

Page 15: rNews - Parte I: Conociendo la ontología

123456789

10111213141516171819202122232425262728293031323334353637383940414243444546474849505152

<!DOCTYPE4html4PUBLIC4">//W3C//DTD4XHTML41.04Transitional//EN"44"http://www.w3.org/TR/xhtml1/DTD/xhtml1>transitional.dtd">44<html><head></head><body>444<div>4444<div>4444444<div>Allies4Are44Split...</div>444444<div>NATO4Takes44Command</div>444444<div>44444444<img44src="img/libya_sample_reuters.jpg"/>44444444<div>Credit:4Goran4Tomasevic/Reuters</div>444444444<div>Rebel4fighters44take...</div>444444</div>444444<div>By4STEVEN4LEE44MYERS</div>444444<div>WASHINGTON44|4March424,42011</div>444444<div>44444444<p>Having44largely4succeeded...</p>444444</div>444444<div>44444444<p><a44href="http://www.nytimes.com/content/help/rights/copyright/copyright>notice.html">44444444444©4Copyright442011444444444</a><span>The4New4York44Times44Company</span></p>44444444<p><a44href="http://www.nytimes.com/ref/membercenter/help/agree.html">44444444444Disclaimer444444444</a></p>4444444</div>4444</div>44444<div>444444<div>44444444<div>Section</div>44444444<div>World</div>444444</div>444444<div>Tags</div>4444444<div>44444444<div>4444444444<div>People</div>4444444444<div>Qaddafi,4Muammar44el></div>44444444</div>444444</div>444444444444<div>44444444<div>Discussion44(3)</div>44444444<div>4444444444<div>So4the4question44is..."</div>4444444444<div>4444444444<a44href="http://timespeople.nytimes.com/view/user/27242827/activities.html">Chuck</a></div>4444444444<div>March425th,44201148:274am</div>44444444</div>444444</div>4444</div>444</div></body></html>

martes 27 de noviembre de 12

Page 16: rNews - Parte I: Conociendo la ontología

HTML 5 Microdata<!DOCTYPE HTML><html itemscope itemtype="http://schema.org/NewsArticle" ><head>! <style type="text/css">@import url(css/iptc_times2.css);</style>! <meta itemprop="dateCreated" content="2011-03-23"/>! <meta itemprop="description" content="The questions about the command..."/>! <meta itemprop="inLanguage" content="en-US"/>! <meta itemprop="thumbnailUrl" content="http://graphics8.nytimes.com/images/common/icons/t_wb_75.gif"/>! <meta itemprop="genre" content="Current"/>! <meta itemprop="id" content="1248069687395"/>! <meta itemprop="version" content="2"/>! <meta itemprop="publishingPrinciples" content="http://www.nytco.com/press/ethics.html"/>! <meta itemprop="wordCount" content="879"/>!</head><body>! <div style="height:900px" class="article">! ! <div class="a_column">! ! ! <div itemprop="headline" class="headline">Allies Are Split on Goal and Exit Strategy in Libya</div>! ! ! <div itemprop="alternativeHeadline" class="rider">NATO Takes Command</div>! ! ! <div itemprop="associatedMedia" itemscope itemtype="http://schema.org/ImageObject">! ! ! ! <img itemprop="URL" class="image" src="img/libya_sample_reuters.jpg"/>! ! ! ! <div class="image_credit">Credit:! ! ! ! ! <span itemprop="creator" itemscope itemtype="http://schema.org/Person"> ! ! ! ! ! ! <span itemprop="name">Goran Tomasevic</span>! ! ! ! ! </span> ! ! ! ! ! /! ! ! ! ! <span itemprop="sourceOrganization" itemscope itemtype="http://schema.org/Organization">! ! ! ! ! ! <span itemprop="name">Reuters</span>! ! ! ! ! ! <meta itemprop="tickerSymbol" content="NYSE TRI"/>! ! ! ! ! </span>! ! ! ! </div>

martes 27 de noviembre de 12

Page 17: rNews - Parte I: Conociendo la ontología

RDFa<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML+RDFa 1.0//EN" "http://www.w3.org/MarkUp/DTD/xhtml-rdfa-1.dtd"><html xmlns:rnews="http://dec.iptc.org/rnews/0.1/"><head>! <style type="text/css">@import url(css/iptc_times2.css);</style></head><body>! <div class="article" style="height:623px">! ! <div class="a_column">! ! ! <div property="rnews:headline" class="headline">Allies Are Split on Goal and Exit Strategy in Libya</div>! ! ! <div class="rider">NATO Takes Command</div>! ! ! <div class="main_image">! ! ! ! <img class="image" src="img/libya_sample_reuters.jpg"/>! ! ! ! <div class="image_credit">Credit: Goran Tomasevic/Reuters</div>! ! ! ! <div class="image_caption">! ! ! ! ! Rebel fighters take cover during a shelling near Ajdabiyah, Libya on Thursday.! ! ! ! </div>! ! ! </div>! ! ! <div rel="rnews:createdBy" class="byline">By ! ! ! ! <span about="http://demo.iptc.org/per/steven_lee_myers" typeof="rnews:Person">! ! ! ! ! <span property="rnews:name">STEVEN LEE MYERS</span>! ! ! ! </span>! ! ! </div>! ! ! <div class="publication_date">! ! ! ! <span property="rnews:dateline">WASHINGTON</span>! ! ! ! | ! ! ! ! <span property="rnews:dateCreated" content="2011-03-24">March 24, 2011</span>! ! ! </div>

martes 27 de noviembre de 12

Page 18: rNews - Parte I: Conociendo la ontología

ImageObjectVideoObjectAudioObject

Article

Comment

OrganizationPerson Location

NewsItem

comment

associatedMedia

Concept

about

PostalAddress

addressaddress

mentions

address

creatoreditorcontributorprovidercopyrightHolderaccountablePerson

creatoreditor

contributorprovider

copyrightHoldersourceOrganization

name

associatedArticle

GeoCoordinates

geoCoordinates

martes 27 de noviembre de 12

Page 19: rNews - Parte I: Conociendo la ontología

NewsItem

identifiergenreversiondatelineinteractionCountdiscussionUrlalternativeHeadlinepublishingPrinciplescopyrightYear

headlinedescriptiondateCreateddateModifieddatePublished

inLanguagethumbnailUrl

usageTermscopyrightNotice

martes 27 de noviembre de 12

Page 20: rNews - Parte I: Conociendo la ontología

ImageObjectVideoObjectAudioObject

heightwidthencodingFormattranscriptduration

martes 27 de noviembre de 12

Page 21: rNews - Parte I: Conociendo la ontología

Article

articleBodyarticleSection

wordCountprintPage

printColumnprintEditionprintSection

martes 27 de noviembre de 12

Page 22: rNews - Parte I: Conociendo la ontología

Comment

commentTextcommentTimereplyToUrl

martes 27 de noviembre de 12

Page 23: rNews - Parte I: Conociendo la ontología

OrganizationPlace

PostalAddress

addressaddress

honorificPrefixgivenNameadditionalNamefamilyNamehonorificSuffix address

streetAddresspostOfficeBoxNumberaddressLocalityaddressRegionaddressCountry

tickerSymbol

pointcircleelevationpolygonboxline

name

GeoCoordinates

featureCode

urlemail

faxNumbertelephonepostalCode

geoCoordinates

martes 27 de noviembre de 12

Page 24: rNews - Parte I: Conociendo la ontología

rNews - España La mayor parte de medios no tienen un etiquetado semántico:

El País, El Mundo, Canal 9, ...

Los que lo tienen sólo tienen la parte de multimedia (no se puede recuperar info de noticias):

RTVE, As, ...

martes 27 de noviembre de 12

Page 25: rNews - Parte I: Conociendo la ontología

Sesión 1: Protégé

martes 27 de noviembre de 12

Page 26: rNews - Parte I: Conociendo la ontología

Sesión 1: ProtégéGuardar el fichero que estáis generando con Protégé con el nombre Noticias_rNews.owl en la carpeta Public de vuestro Dropbox.

Copiar el enlace público de dicho fichero.

martes 27 de noviembre de 12

Page 27: rNews - Parte I: Conociendo la ontología

Elegid un periódico español con edición digital, y extraer las 10 noticias que más os interesen.

Generar las instancias adecuadas de la ontología rNews para almacenar dichas noticias.

Guardar vuestro fichero.

Publicar como un comentario a la noticia sobre rNews del blog de la asignatura el enlace público de vuestro fichero.

Incluir todos los enlaces de todos los compañeros de forma similar a la usada para incluir la ontología rNews.

Sesión 1: Protégé

martes 27 de noviembre de 12