Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Post on 02-Feb-2016

232 views 0 download

Transcript of Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Búsqueda P2P: Comunidades Semánticas

Búsqueda Centralizada

WWWWWW

Motivación búsqueda P2P

Problema de escalabilidad de los sistemas centralizados.

Aún los buscadores tradicionales utilizan sistemas distribuidos.

Búsqueda a nivel desktop. Performance

escalabilidad tolerancia a falla calidad de servicio tráfico de red

Búsqueda P2P

WWWWWW

INTERNETINTERNET

Búsqueda P2P

INTERNETINTERNET

Búsqueda P2P

Modelo de Buscador P2P

No se asume la presencia de índices o directorios centralizados.

Cada peer es un directorio hub (limitado) y un proveedor de contenido.

Crawler propio. Buscador propio. Bases de datos e índices propios.

Modelo de Colaboración P2P

Problemas Interesantes

Cómo enterarse de la existencia de otros peers. Como mantener información sobre otros peers. Cómo elegir un peer a quien reenviar la

consulta. Cuándo dejar de reenviar una consulta Cómo ordenar los resultados. …otros?

Comunidades Semánticas

Cuando los peers están agrupados en base a su similitud semántica, la calidad del servicio mejora.

¿Cómo determinar si ha emergido una comunidad semántica? topología de mundo pequeñosimilaridad semántica

Topología Regular: Anillos

Topología Regular: Retículos

Topología Regular: Estrella

Topología Regular: Grafo Completo

Topología Irregular: Red Aleatoria

¿Cuál es la topología ideal?

Caminos cortos Sin congestión Robusta

Topología de Mundo Pequeño

Mundo Pequeño

Origen de la ideaSeis grados de separación (experimentos

realizados por Stanley Milgran en los años sesenta)

Modelo de mundo pequeño (Duncan J. Watts y Steve Strogatz, 1998)

Se observa en varios fenómenos de la naturaleza (¿ventaja evolutiva?)

Mundo Pequeño: Sitios Web

fuente Mark Newman

Mundo Pequeño: Red de Terroristas

fuente www.firstmonday.org

red de terroristas

fuente www.firstmonday.org

Mundo Pequeño: Red de Citas Bibliográficas

fuente http://wwwcsif.cs.ucdavis.edu/~mcpherso/largegraph.html

Mundo Pequeño: Red de Co-autoría

fuente Lothar Krempel

Mundo Pequeño

Diámetro Pequeño A pesar de existir un

gran número de nodos, es posible encontrar sendas cortas que conecten a dos nodos cualesquiera.

Cuando aumentan de tamaño, su diámetro aumente lentamente.

también ocurre con las redes aleatorias

Mundo Pequeño

Coeficiente de Clustering alto Existen comunidades

altamente conectadas.

no ocurre con las redes aleatorias

Coeficiente de clustering

El coeficiente de clustering es la proporción entre el número de nodos en un vecindario y el número total de nodos que podrían existir en dicho vecindario

6Search: Descubriendo peers

peer vecino delpeer

vecino delvecino delpeer

(consulta 1, peer ID)(consulta 1, peer ID)

(respuesta, ID del peer vecino del vecino)(respuesta,

ID del peer vecino del vecino)

(consulta 2, peer ID)

6Search: Características

Los peers son independientes. Los peers pueden ingresar o abandonar la

red en cualquier momento. Un peer no debería sufrir sobrecarga. Una consulta no debería propagarse

indefinidamente. Un peer puede optar por no reenviar una

consulta. Arquitectura robusta.

6Search: Interacción con peers

Nuevos peers son buscado sólo en caso de ser necesario.

Cada peer tiene un número fijo de slots para información sobre otros peers.

Nuevos peers se descubren gracias a peers ya conocidos.

Un peer buscará nuevos peers cuando tenga slots libres o cuando quiera encontrar peers mejores a los que ya conoce.

Estigmergia (Stigmery)

Colaboración a través del medio físico. En sistemas descentralizados, tales como las colonias de hormigas, los diferentes componentes colaboran a través de pautas o hitos dejados en el medio: feromonas, acumulación de objetos o cualquier otro tipo de cambio físico, como la temperatura.

6Search: Ruteo adaptativo de consultasRandom-Known

Las consultas son enviada a vecinos aleatorios. Los peers actualizan sus tablas de peers conocidos

en base a quienes responden.Aprendizaje Greedy

Lista de términos asociada a cada peer conocido. Las consultas son enviadas a los vecinos con mayor

similitud entre consulta y términos.Aprendizaje por refuerzo

Lista de términos básica y expandida en base a los documentos recuperados.

Se combina perfil básico y expandido para seleccionar a quienes enviar consultas.

6Searcg: Crear un índice

6Search: Buscar

6Search: Crawler Temático

6Search: Topología Emergente

inicial final

Similaridad Semántica

d2

d1

Similaridad Semántica: Taxonomía

t0

d2

d1

D. Lin (1998)

)]2(Pr[log)]1(Pr[log

)]2,1(Pr[log2)2,1( 0

dtdt

ddtddT

s

Taxonomía

Simbólico

Relacionado

t2t2

t1t1

t4t4t3t3

t5t5 t6t6

t7t7 t8t8

T

S

R

tipos de enlacetipos de enlace

Similaridad Semántica

Bibliografía

Emerging Semantic Communities in Peer Web Search. R. Akavipat, L.-S. Wu, F. Menczer, A. Maguitman. P2PIR 2006: International Workshop on Information Retrieval in Peer-to-Peer. ACM Press. Arlington, USA,  November 2006.  

Adaptive Peer to Peer Social Networks for Distributed Content Based Web Search. L.-S. Wu, R. Akavipat, A. Maguitman, F. Menczer.  Social Information Retrieval Systems: Emergent Technologies and Applications for Searching the Web Effectively, IGI Global. September 2007.