Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

45
Búsqueda P2P: Comunidades Semánticas

Transcript of Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Page 1: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Búsqueda P2P: Comunidades Semánticas

Page 2: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Búsqueda Centralizada

WWWWWW

Page 3: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Motivación búsqueda P2P

Problema de escalabilidad de los sistemas centralizados.

Aún los buscadores tradicionales utilizan sistemas distribuidos.

Búsqueda a nivel desktop. Performance

escalabilidad tolerancia a falla calidad de servicio tráfico de red

Page 4: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Búsqueda P2P

WWWWWW

Page 5: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

INTERNETINTERNET

Búsqueda P2P

Page 6: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

INTERNETINTERNET

Búsqueda P2P

Page 7: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Modelo de Buscador P2P

No se asume la presencia de índices o directorios centralizados.

Cada peer es un directorio hub (limitado) y un proveedor de contenido.

Crawler propio. Buscador propio. Bases de datos e índices propios.

Page 8: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Modelo de Colaboración P2P

Page 9: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Problemas Interesantes

Cómo enterarse de la existencia de otros peers. Como mantener información sobre otros peers. Cómo elegir un peer a quien reenviar la

consulta. Cuándo dejar de reenviar una consulta Cómo ordenar los resultados. …otros?

Page 10: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Comunidades Semánticas

Cuando los peers están agrupados en base a su similitud semántica, la calidad del servicio mejora.

¿Cómo determinar si ha emergido una comunidad semántica? topología de mundo pequeñosimilaridad semántica

Page 11: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Topología Regular: Anillos

Page 12: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Topología Regular: Retículos

Page 13: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Topología Regular: Estrella

Page 14: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Topología Regular: Grafo Completo

Page 15: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Topología Irregular: Red Aleatoria

Page 16: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

¿Cuál es la topología ideal?

Caminos cortos Sin congestión Robusta

Page 17: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Topología de Mundo Pequeño

Page 18: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño

Origen de la ideaSeis grados de separación (experimentos

realizados por Stanley Milgran en los años sesenta)

Modelo de mundo pequeño (Duncan J. Watts y Steve Strogatz, 1998)

Se observa en varios fenómenos de la naturaleza (¿ventaja evolutiva?)

Page 19: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño: Sitios Web

fuente Mark Newman

Page 20: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño: Red de Terroristas

fuente www.firstmonday.org

Page 21: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

red de terroristas

fuente www.firstmonday.org

Page 22: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño: Red de Citas Bibliográficas

fuente http://wwwcsif.cs.ucdavis.edu/~mcpherso/largegraph.html

Page 23: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño: Red de Co-autoría

fuente Lothar Krempel

Page 24: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño

Diámetro Pequeño A pesar de existir un

gran número de nodos, es posible encontrar sendas cortas que conecten a dos nodos cualesquiera.

Cuando aumentan de tamaño, su diámetro aumente lentamente.

también ocurre con las redes aleatorias

Page 25: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Mundo Pequeño

Coeficiente de Clustering alto Existen comunidades

altamente conectadas.

no ocurre con las redes aleatorias

Page 26: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Coeficiente de clustering

El coeficiente de clustering es la proporción entre el número de nodos en un vecindario y el número total de nodos que podrían existir en dicho vecindario

Page 27: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Descubriendo peers

peer vecino delpeer

vecino delvecino delpeer

(consulta 1, peer ID)(consulta 1, peer ID)

(respuesta, ID del peer vecino del vecino)(respuesta,

ID del peer vecino del vecino)

(consulta 2, peer ID)

Page 28: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Características

Los peers son independientes. Los peers pueden ingresar o abandonar la

red en cualquier momento. Un peer no debería sufrir sobrecarga. Una consulta no debería propagarse

indefinidamente. Un peer puede optar por no reenviar una

consulta. Arquitectura robusta.

Page 29: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Interacción con peers

Nuevos peers son buscado sólo en caso de ser necesario.

Cada peer tiene un número fijo de slots para información sobre otros peers.

Nuevos peers se descubren gracias a peers ya conocidos.

Un peer buscará nuevos peers cuando tenga slots libres o cuando quiera encontrar peers mejores a los que ya conoce.

Page 30: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Estigmergia (Stigmery)

Colaboración a través del medio físico. En sistemas descentralizados, tales como las colonias de hormigas, los diferentes componentes colaboran a través de pautas o hitos dejados en el medio: feromonas, acumulación de objetos o cualquier otro tipo de cambio físico, como la temperatura.

Page 31: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Ruteo adaptativo de consultasRandom-Known

Las consultas son enviada a vecinos aleatorios. Los peers actualizan sus tablas de peers conocidos

en base a quienes responden.Aprendizaje Greedy

Lista de términos asociada a cada peer conocido. Las consultas son enviadas a los vecinos con mayor

similitud entre consulta y términos.Aprendizaje por refuerzo

Lista de términos básica y expandida en base a los documentos recuperados.

Se combina perfil básico y expandido para seleccionar a quienes enviar consultas.

Page 32: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Searcg: Crear un índice

Page 33: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Buscar

Page 34: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Crawler Temático

Page 35: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

6Search: Topología Emergente

inicial final

Page 36: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.
Page 37: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.
Page 38: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Similaridad Semántica

d2

d1

Page 39: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Similaridad Semántica: Taxonomía

t0

d2

d1

D. Lin (1998)

)]2(Pr[log)]1(Pr[log

)]2,1(Pr[log2)2,1( 0

dtdt

ddtddT

s

Page 40: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Taxonomía

Page 41: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Simbólico

Page 42: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Relacionado

Page 43: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

t2t2

t1t1

t4t4t3t3

t5t5 t6t6

t7t7 t8t8

T

S

R

tipos de enlacetipos de enlace

Page 44: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Similaridad Semántica

Page 45: Búsqueda P2P: Comunidades Semánticas. Búsqueda Centralizada WWW.

Bibliografía

Emerging Semantic Communities in Peer Web Search. R. Akavipat, L.-S. Wu, F. Menczer, A. Maguitman. P2PIR 2006: International Workshop on Information Retrieval in Peer-to-Peer. ACM Press. Arlington, USA,  November 2006.  

Adaptive Peer to Peer Social Networks for Distributed Content Based Web Search. L.-S. Wu, R. Akavipat, A. Maguitman, F. Menczer.  Social Information Retrieval Systems: Emergent Technologies and Applications for Searching the Web Effectively, IGI Global. September 2007.