Download - Articulo 2

File/

Nadie sabe muy bien de qué se trata, pero, como dijo recientemente Scott Prevost, director de desarrollo del motor de búsqueda Bing, de Microsoft, “sea lo que sea, la Web 3.0 ya está aquí”. Mientras apenas empezamos a enten-

der qué es la Web 2.0, gurús, tecnólogos, científicos y em-prendedores debaten acerca de las aplicaciones y tecnolo-gías que facilitarán y acelerarán el desarrollo de la tercera generación de la Web: una Web abierta, ubicua, inteligente, conectada con el mundo físico, capaz de comprender el len-guaje natural, reconocer el contexto, y razonar e interpretar las necesidades del usuario para ofrecerle una experiencia personalizada, más productiva e intuitiva.

“Imagine —sugiere Jeffrey Pollock, autor de Semantic Web For Dummies (Wiley, 2009), ex ingeniero de software del Departamento de Defensa de los Estados Unidos y ac-tual director de la división de middleware de Oracle— que el texto, los gráficos, las fotos que ve en el navegador no corresponden a una página estática sino que provienen de diferentes sitios de la red y fueron combinados de manera única para sus ojos. Esa es la naturaleza de la Web semán-tica: la reutilización y la mezcla. Las ideas, los conceptos o datos pueden ser recopilados y reorganizados de infinitas formas para darles nuevo significado según las necesida-des de cada persona.”

Yihong Ding, investigador de la Web semántica y colabo-rador en el sitio de noticias de tecnología ZDNet, coincide con Pollock. “Estamos en un momento de transición; pasando de una Web definida por el editor a otra determinada por el usuario —argumenta—. En su versión 1.0 (1990-1999), los espacios web eran páginas que representaban la visión de la empresa u organización propietaria del dominio. En la 2.0 (2000-2009), los espacios pasaron a ser las cuentas perso-nales de los usuarios, aunque alojadas en sitios pensados y diseñados por un editor. Y en la 3.0 (2010-2019), los espacios web serán una colección de recursos de diferentes sitios que

Foto: Istock

La era deL razonamiento artificiaL

LaS NUEvaS tEcNOLOgíaS EStáN caMBIaNDO La EStrUctUra DE La WEB, OrDENáNDOLa EN tOrNO DE

EStáNDarES Para traNSFOrMarLa EN UNa graN BaSE DE DatOS

INtErcONEctaDa cON EL MUNDO rEaL, Y DOtáNDOLa DE INtELIgENcIa Para

cOMPrENDEr EL SIgNIFIcaDO DE La INFOrMacIóN E

INtEractUar cON LOS USUarIOS.

Por Florencia Lafuente, periodista especializada en negocios.

se organizarán en tiempo real, de acuerdo con la visión del usuario.”

el sueño posmodernoaunque la Web semántica —como defi-

nen los especialistas a esta red dinámica y pensante— todavía está en una fase preli-minar, la idea no es nueva; ha sido tema de discusión desde 1999, cuando timothy Ber-ners-Lee, director del World Wide Web con-sortium (W3c), organización que promueve los estándares de la Web, acuñó el término. Berners-Lee, creador del lenguaje de hi-pertexto HtML, el protocolo HttP y el sis-tema de localización de objetos (UrL), dijo en ese entonces: “tengo un sueño para la Web en el que las computadoras serán ca-paces de analizar el contenido y entender las transacciones entre las personas y las máquinas. Se llama ‘Web semántica’, pero aún debe desarrollarse. cuando se convier-ta en realidad, nuestras vidas serán mane-jadas por computadoras. El agente inteli-gente que tanto ha buscado la humanidad finalmente se materializará”.

Berners-Lee estimó que su sueño se concretaría en 2020, más o menos la fecha en que la versión 5 del lenguaje de progra-mación de la Web, el HtML, estará comple-ta (hoy pueden usarse algunas de sus espe-cificaciones).

Junto con la evolución de las tecnologías 2.0, las funcionalidades sintácticas simplifi-cadas del HtML 5 para codificar contenido multimedia están cumpliendo las promesas de la Web. Este lenguaje establece estánda-res para la programación y fija reglas para el uso de, por ejemplo, etiquetas de video, audio y canvas (elemento para generar gráficos di-námicos en la misma página, sin necesidad de recurrir a aplicaciones complementa-rias), con lo que no sólo resuelve los proble-mas de interoperabilidad entre sitios y apli-caciones, sino que también facilita el diseño y manejo del contenido 3D y abre las puertas al maravilloso mundo de la realidad virtual, en el que las redes como SecondLife y el uso de avatares serán aplicaciones comunes.

Pollock se explaya: “con las nuevas tec-nologías de procesamiento del lenguaje natural (o NLP, sigla de Natural Language Processing), la noción de búsquedas por In-ternet cambiará radicalmente: en lugar de hacer consultas por palabras clave se po-

File/

drán buscar ideas o conceptos, porque las máquinas enten-derán el significado de la palabra escrita”.

Los sistemas de NLP se usan hoy en actividades que de-mandan el procesamiento de grandes cantidades de datos, como en detección de fraudes, prevención del lavado de dine-ro y terrorismo, análisis de inteligencia de negocios, marke-ting y publicidad, investigación científica y medicina. Mediante la aplicación de complejos algoritmos al texto desordenado, los motores de NLP son capaces de generar datos estructurados o modelos de datos. Sostienen los expertos que estos sistemas son la única tecnología viable para automatizar la extracción de información valiosa del actual caos de la Web. Y, según la organización worldwidewebsize.com, la anarquía es extensa: en enero de 2011 había 12.830 millones de sitios registrados.

Peer39 y ad Pepper, dos start-ups que hacen uso de la tec-nología semántica para diseñar soluciones de marketing y publicidad, están cosechan-do los beneficios del NLP. ambas ofrecen servicios de análisis contextual para la colocación de anuncios online persona-lizados. Peer39, por ejemplo, empleó tecnologías de NLP y aprendizaje computacional para desarro-llar una serie de algoritmos que escanean la Web y anali-zan el contenido de las páginas en busca del contexto adecuado y preciso para cada anuncio.

Por su parte, para crear la red pu-blicitaria semántica iSense, ad Pepper armó un equipo de 40 lingüistas y lexicó-grafos que, diccionario en mano, se dedica-ron durante cuatro años a asignar palabras a una serie de categorías de conocimiento, con el objeto de crear un marco concep-tual que permitiera al sistema analizar y entender los términos y temas conteni-dos en una página web.

Sin duda, el potencial de la Web semántica es enorme. Puede cambiar todos los aspectos de la vida humana, la forma de operar de las empresas, la investigación y el desa-rrollo, el acceso a los productos y servicios, la información y la noción de privacidad. No obstante, todavía hay obstáculos significativos por sortear.

Juego abierto En el centro del ecosistema 3.0 se unen los dos extre-

mos de la cadena tecnológica. Por un lado, el front-end, o las aplicaciones que interactúan con el usuario. Por el otro, el back-end, o los sistemas de administración y procesamien-to de datos que manejan las aplicaciones. El navegador, por ejemplo, es la aplicación front-end por excelencia de la Web; y, aunque hoy estos programas ofrecen innumerables ex-tensiones o componentes (plug-ins) que mejoran la nave-

gación, el sistema no tiene aún la inteligencia para entender u organizar la información que maneja el usuario. a medida que las aplicaciones y el contenido web se ordenen en torno de estándares semánticos, un gran paso hacia la red inteli-gente habrá sido dado.

apple fue pionera en adoptar estándares y funcionalidades semánticas provistas por el HtML 5 para su navegador Safari. también lo hicieron google, para chrome, Mozilla, para Fire-fox, y Opera. En 2009, además, google lanzó google Squared, una herramienta de categorización semántica de datos que, en segundos, analiza la información de la Web, selecciona y presenta los resultados de la búsqueda en una hoja de cálculo.

corporaciones como Oracle, IBM, Microsoft, Salesforce y SaP están integrando la tecnología semántica a sus paque-tes de software corporativos. apple también avanza para do-

minar el espacio móvil. En abril de 2010 compró Siri, un asistente personal móvil inteligente que usa tecnología semántica, de re-

conocimiento de voz e inteligencia artificial. Se trata de una aplicación

gratuita conectada a un ecosistema rico en servicios web. ¿Le cayó mal la comida en el restaurante? con sólo pedirle a Siri que lo lleve a su casa, el sistema llamará a un taxi y se encar-gará de que lo dejen en la puerta.

Decenas de start-ups intentan posicionarse con novedosos pro-

ductos y servicios para la nueva Web. Una lista rápida de ejem-

plos: el innovador buscador de respuestas Wolfram alpha; la red social de co-

nocimiento twine; Meaning-tool, la herramienta de búsqueda que aprende del usuario, de Propego; el buscador de personas ZoomInfo, y la base de metadatos Freebase, de Metaweb, construida por una co-munidad de usuarios online y adquirida por google en 2010. al momento de esta compra, Freebase contaba con más de 12 millones de “cosas” catalogadas en su base de datos y relacionadas semánticamente entre sí. Poco antes de que-darse con Freebase, google había adquirido la empresa de publicidad móvil adMob y al servicio social de búsquedas aardvark, que permite a los usuarios hacer una pregunta cualquiera (por ejemplo: “Querría visitar algunos lugares no turísticos en Berlín. ¿alguna sugerencia?”) y obtener una respuesta en tiempo real por parte de los miembros conectados a la red.

Foursquare, creada en 2009, es una red social para dis-positivos inalámbricos basada en la localización geográfica. Mediante aplicaciones móviles que hacen uso de sistemas de gPS, los usuarios se “registran” en la red cada vez que entran a un establecimiento, ya sean tiendas, restaurantes,

en lugar de hacer consultas por palabras

clave se podrán buscar ideas o

conceptos, porque las máquinas entenderán

el significado de la palabra escrita.

hoteles o museos. Si envían información y comentarios del lugar en el que están, pueden ganar puntos y premios. La red también funciona como un servicio publicitario que mues-tra anuncios según el contexto, como promociones especia-les de determinados productos. Foursquare está integrada a twitter y Facebook, de modo que todos los contactos del usuario pueden agregar sus propios comentarios.

Otra aplicación de redes sociales, getglue, una barra de herramientas para navegadores desarrollada por la red de entretenimiento adaptiveBlue, brinda a los usuarios la posibilidad de saber si el contenido por el que están nave-gando ya fue consultado antes por sus amigos y si emitie-ron opiniones al respecto. getglue también hace recomen-daciones sobre tópicos que podrían ser de interés para el navegante de acuerdo con el perfil de búsqueda. a su vez, Meaningtool, de Propego, es una aplicación inteligente que

permite a los navegantes crear sus propios árboles semán-ticos y “enseñarle” al sistema nuevos conceptos para filtrar y categorizar texto, sitios y personas.

La comunidad KDE (K Desktop Environment), un grupo internacional de expertos en tecnología, creó una platafor-ma gráfica abierta y una serie de aplicaciones con capaci-dades semánticas que funcionan sobre sistemas operativos tan diversos como Linux, Windows, Mac OS X y Solaris. El grupo apunta a transformar el “escritorio” de la computa-dora en una aplicación semántica en sí misma. Entre otras funcionalidades, KDE permite al usuario indexar todos los archivos de su computadora en la Web para consultarlos de manera más inteligente —por medio de herramientas se-mánticas online—, y además posibilita que otros usuarios también etiqueten esos archivos y creen una ontología del contenido de su computadora. En la jerga, “ontología” hace

LAS ERAS DE LA TECNOLOGÍA

El siguiente gráfico muestra la evolución de los ecosistemas tecnológicos (plataformas, protocolos, lenguajes, técnicas de desarrollo) y la riqueza social de sus aplicaciones, de la PC a la Web 3.0.

Fuente: Semantic Web For Dummies, de Jeffrey Pollock. Basado en un gráfico creado por Nova Spivack.

Era de la PC

Era de la WWW

Era de la Web semántica

Computaciónde escritorio

Web 1.0

Web 2.0

Web 3.0

Riqu

eza

de la

s co

nexi

ones

de

dato

s

Riqueza de las conexiones sociales

FTP

E-mail

SGMSQL

Gopher

HTTP/HTML

00/Java

XML/J2EE

SOAP/WSDLAJAX/JSON

ATOMRDF/OWL

SPARQL

Rule Interchange Linked Data(formato para intercambio

de reglas entre lenguajes y datos)

Sistemas de archivos

1980-1990

Servidores

Bases de datos1990-2000

Trabajo en equipoIntranets

Portales2000-2010

Blogs/Wikis

Redes socialesComputación en la “nube” y SaaS

2010-2020

Web como base de datos

Agentes personalesinteligentes

File/

referencia al vocabulario de metadatos que permite a la gente organizar la información a través de etiquetas, de forma tal de eliminar la ambigüedad del lenguaje para que los agentes inteligentes de software —por ejemplo, un buscador semántico— interpreten los datos con precisión.

La principal barrera para que la Web 3.0 se desarrolle tiene que ver, justamente, con la organización de los datos. cuanta mayor densidad de información, cuantos más datos interconectados y etiquetados se-mánticamente, y cuantos más metada-tos relacionados con los modelos con-ceptuales, más significados podrán extraerse del contenido. Blogs, wikis, sitios, anuncios publicitarios, resul-tados de búsquedas, videos, servi-cios de noticias, de reservas de via-jes, pronóstico del tiempo, datos demográficos, mensajes en twit-ter, e-mails, actualizaciones de Facebook, fotos de Flickr, perfi-les de usuarios; todo el conteni-do de la Web debe estar codifica-do con los mismos estándares y dispuesto en formatos legibles por las computadoras.

igualdad para todosLos primeros desarrollos que

hoy pueden definirse como los están-dares de la Web 3.0 surgieron del pro-grama agent Markup Language (DaML) de la agencia de Proyectos de Investigación avanzada de Defensa (DarPa), el esfuerzo se-creto del Departamento de Defensa estadouni-dense por construir su propia versión de la Web, en 2000. El proyecto, finalmente terminado, dio a luz los es-tándares rDF (resource Description Framework), el len-guaje semántico usado para describir datos, metadatos e incluso otros lenguajes; a OWL (Web Ontology Language), una extensión del modelo rDF diseñada para representar conocimientos ricos y complejos sobre las cosas, grupos de cosas y relaciones entre ellas, y a SParQL (Protocol and rDF Query Language), el lenguaje de consulta para rDF, más poderoso que SQL.

Uno de los primeros pasos hacia los estándares semánti-cos fue dado por un jugador impensado: Microsoft. En enero de 2010, durante una conferencia sobre la Web 3.0 en ca-lifornia, Scott Prevost confirmó los planes de la compañía de concentrarse en el desarrollo de capacidades para la nueva generación de la Web. Prevost ingresó a la empre-sa en 2008, cuando Microsoft compró por US$ 100 millones la firma de software de NLP que el tecnólogo había funda-

do en 2006: Powerset. La organización había creado un motor de búsqueda semántico sólo para Wikipedia, tec-

nología que, en última instancia, Microsoft integró a su propio buscador, Bing.

Otro jugador que estableció un mojón con su desarro-llo de vanguardia fue Wolfram research, del físico británi-co Stephen Wolfram, creador de Wolfram alpha, un nove-doso buscador de respuestas semántico lanzado en 2009. El sistema trabaja sobre la base de algoritmos matemá-

ticos y estadísticos para responder con precisión a las preguntas del usuario. Sus respuestas provienen de

una base de datos propia, construida por in-vestigadores y equipos de especialistas cuya labor parece infinita: su meta es sistematizar

la totalidad del conocimiento humano.twine, la “red social de conocimiento”, así

definida por su creador, Nova Spivack, era el producto estrella de radar Networks, hoy parte del sitio de búsquedas semánticas Evri, que adquirió la firma en 2010. radar Net-works fue fundada por Spivack en 2003. Em-prendedor serial, promotor de la Web 3.0 y nieto de Peter Drucker, Spivack relata que

su abuelo lo ayudó a imaginar la Web del futuro, un espacio donde todo se rela-

ciona con todo. twine, a diferencia de otras redes sociales, no sólo vincula

personas, sino cualquier elemento que sea de interés para el usua-

rio: lugares, compañías, pro-ductos, sitios, videos, fotos, mensajes. Pero, además de

su interés por twine, Evri quería a radar Networks por su producto “t2”, un pro-

yecto tan ambicioso como el de Stephen Wolfram: construir un índice semántico de la Web.

En otro plano está calais, de thomson reuters. El buscador facilita la consulta de noticias por ideas o conceptos definidos por el propio usuario, y después

las relaciona con otros recursos semánticos disponi-bles en la Web para categorizarlas de acuerdo con ontolo-gías de conceptos, personas, lugares, eventos o cualquier otra cosa. El servicio de calais apunta a las corporaciones. Muchas empresas lo usan para detectar tendencias y com-portamientos del mercado.

Un competidor de calais es Extractiv, que sirve para escanear la Web en busca de datos “sentimentales”; es decir, información acerca de lo que siente la gente sobre los productos y servicios.

con más de 45 millones de personas y cinco millones de compañías registradas en su base de datos, ZoomInfo se po-sicionó como un buscador de individuos e información de ne-gocios. Su motor semántico está constantemente hurgan-do la Web para detectar datos sobre personas, compañías,

todo eL

coNteNido de La Web

debe estar codificado

con los mismos estándares y dispuesto

eN formatos legibles

por las computadoras.

productos, servicios e industrias, con el propósito de orga-nizarlos en perfiles que puedan ser consultados por todos.

La red “socialista” Según la organización internacional Internet World Stats,

hoy hay 1.971 millones de individuos conectados a Internet; y uno de cada cinco son usuarios activos de la Web. Usuarios que de a poco dejarán de ser sólo un nombre para convertirse en entidades con características específicas —año de nacimien-to, estado civil, estudios, profesión, domicilio, hobbies, amigos, intereses— y conexiones precisas a los lugares en los que tra-bajan, estudian y viven, los sitios por los que han pasado y los lu-gares exactos en los que se encuentran, las personas con quie-nes se relacionan, las cosas en las que están interesados o las tareas que se encuentran realizando en tiempo real.

En 2010, varias empresas estadounidenses de rastreo de datos online se unieron para crear Open Data Partner-ship, un servicio que permite a los consumidores consul-tar la información que las compañías manejan sobre ellos, editar sus perfiles y hasta seleccionar la opción de no ser rastreados. BlueKai, Lotame Solutions y eXelate son algu-nas de las que abrieron sus bases de datos al público. Blue-Kai solamente maneja información de más de 200 millones de usuarios de Internet.

también en 2010, un estudio de Pew research center y Elon University sobre la Web 3.0, realizado entre expertos en tecnología de diversos países y público en general, reveló que la privacidad es un tema importante pero no preocupan-te. El 42 por ciento de los expertos y el 41 por ciento del total de los encuestados creen que el uso de sistemas de identifi-cación como el escaneo de la retina, de las huellas digitales o el aDN se popularizará entre una gran cantidad de servi-cios online hacia 2020. Y el 54 por ciento de los expertos y el 55 por ciento del total de los participantes creen también que la mayoría de las actividades online se seguirán ejecutando de manera anónima.

Ben ramsey, ingeniero de software de la agen-cia de marketing interactiva Schematic y colabo-rador de varias revistas especializadas, sostiene que a medida que la gente se acostumbre a alma-cenar sus datos en “la nube” y a compartirlos, los conceptos y leyes sobre la propiedad intelectual y la privacidad cambiarán drásticamente. “El soft-ware que se instala en la computadora será cada vez menos importante cuando el escritorio se transforme en un cliente para acceder a los servicios libres de la Web”, dice.

Imagine las posibilidades. En Seman-tic Web For Dummies, Pollock lo ilustra con un ejemplo sencillo. Una com-pañía X crea un servicio a partir de su ventaja competitiva específi-ca. Una segunda empresa ve la oportunidad de explotar ese

servicio enriqueciéndolo mediante una nueva oferta que parte de su propia ventaja competitiva. Una tercera firma decide hacer lo mismo. Y luego, también algún usuario. al compartir estándares, todos los productos y servicios on-line se convertirán en facilitadores de nuevos servicios, y consumidores y empresas se beneficiarán de estas mejo-ras continuas. Quizá, para el fin de la década, la propiedad digital pase a ser de bien público o colectiva. acaso la Web esté evolucionando de una red a un estado social. <

© Gestión

aL compartir estáNdares,

todos los productos y servicios online se convertirán en facilitadores

de nuevos servicios, y coNsumidores y empresas se beNeficiaráN

de estas mejoras continuas.

¿Qué hace posibLe La Web 3.0?

n Tecnologías abiertas: código abierto para desarro-llo de plataformas y aplicaciones; técnicas abiertas para compartir datos (datos como servicio); identidad perso-nal “portátil” (de un sitio a otro y de un dispositivo a otro). n Inteligencia computacional: estándares de la Web se-mántica; sistemas de procesamiento del lenguaje natural (NLP); inteligencia artificial; agentes de software (aplica-ciones con capacidad de razonamiento que trabajan para el usuario).n Conectividad ubicua: conexión de banda ancha a Internet en cualquier momento y lugar; sistemas de lo-calización geográfica; desarrollo de aplicaciones y dis-positivos móviles.n Computación en red: interoperabilidad de los servi-cios web; computación en “nube” (SaaS o software como servicio). n Tecnologías de realidad virtual: portales y navegado-res 3D; avatares.