Post on 02-Feb-2016
Búsqueda P2P: Comunidades Semánticas
Búsqueda Centralizada
WWWWWW
Motivación búsqueda P2P
Problema de escalabilidad de los sistemas centralizados.
Aún los buscadores tradicionales utilizan sistemas distribuidos.
Búsqueda a nivel desktop. Performance
escalabilidad tolerancia a falla calidad de servicio tráfico de red
Búsqueda P2P
WWWWWW
INTERNETINTERNET
Búsqueda P2P
INTERNETINTERNET
Búsqueda P2P
Modelo de Buscador P2P
No se asume la presencia de índices o directorios centralizados.
Cada peer es un directorio hub (limitado) y un proveedor de contenido.
Crawler propio. Buscador propio. Bases de datos e índices propios.
Modelo de Colaboración P2P
Problemas Interesantes
Cómo enterarse de la existencia de otros peers. Como mantener información sobre otros peers. Cómo elegir un peer a quien reenviar la
consulta. Cuándo dejar de reenviar una consulta Cómo ordenar los resultados. …otros?
Comunidades Semánticas
Cuando los peers están agrupados en base a su similitud semántica, la calidad del servicio mejora.
¿Cómo determinar si ha emergido una comunidad semántica? topología de mundo pequeñosimilaridad semántica
Topología Regular: Anillos
Topología Regular: Retículos
Topología Regular: Estrella
Topología Regular: Grafo Completo
Topología Irregular: Red Aleatoria
¿Cuál es la topología ideal?
Caminos cortos Sin congestión Robusta
Topología de Mundo Pequeño
Mundo Pequeño
Origen de la ideaSeis grados de separación (experimentos
realizados por Stanley Milgran en los años sesenta)
Modelo de mundo pequeño (Duncan J. Watts y Steve Strogatz, 1998)
Se observa en varios fenómenos de la naturaleza (¿ventaja evolutiva?)
Mundo Pequeño: Sitios Web
fuente Mark Newman
Mundo Pequeño: Red de Terroristas
fuente www.firstmonday.org
red de terroristas
fuente www.firstmonday.org
Mundo Pequeño: Red de Citas Bibliográficas
fuente http://wwwcsif.cs.ucdavis.edu/~mcpherso/largegraph.html
Mundo Pequeño: Red de Co-autoría
fuente Lothar Krempel
Mundo Pequeño
Diámetro Pequeño A pesar de existir un
gran número de nodos, es posible encontrar sendas cortas que conecten a dos nodos cualesquiera.
Cuando aumentan de tamaño, su diámetro aumente lentamente.
también ocurre con las redes aleatorias
Mundo Pequeño
Coeficiente de Clustering alto Existen comunidades
altamente conectadas.
no ocurre con las redes aleatorias
Coeficiente de clustering
El coeficiente de clustering es la proporción entre el número de nodos en un vecindario y el número total de nodos que podrían existir en dicho vecindario
6Search: Descubriendo peers
peer vecino delpeer
vecino delvecino delpeer
(consulta 1, peer ID)(consulta 1, peer ID)
(respuesta, ID del peer vecino del vecino)(respuesta,
ID del peer vecino del vecino)
(consulta 2, peer ID)
6Search: Características
Los peers son independientes. Los peers pueden ingresar o abandonar la
red en cualquier momento. Un peer no debería sufrir sobrecarga. Una consulta no debería propagarse
indefinidamente. Un peer puede optar por no reenviar una
consulta. Arquitectura robusta.
6Search: Interacción con peers
Nuevos peers son buscado sólo en caso de ser necesario.
Cada peer tiene un número fijo de slots para información sobre otros peers.
Nuevos peers se descubren gracias a peers ya conocidos.
Un peer buscará nuevos peers cuando tenga slots libres o cuando quiera encontrar peers mejores a los que ya conoce.
Estigmergia (Stigmery)
Colaboración a través del medio físico. En sistemas descentralizados, tales como las colonias de hormigas, los diferentes componentes colaboran a través de pautas o hitos dejados en el medio: feromonas, acumulación de objetos o cualquier otro tipo de cambio físico, como la temperatura.
6Search: Ruteo adaptativo de consultasRandom-Known
Las consultas son enviada a vecinos aleatorios. Los peers actualizan sus tablas de peers conocidos
en base a quienes responden.Aprendizaje Greedy
Lista de términos asociada a cada peer conocido. Las consultas son enviadas a los vecinos con mayor
similitud entre consulta y términos.Aprendizaje por refuerzo
Lista de términos básica y expandida en base a los documentos recuperados.
Se combina perfil básico y expandido para seleccionar a quienes enviar consultas.
6Searcg: Crear un índice
6Search: Buscar
6Search: Crawler Temático
6Search: Topología Emergente
inicial final
Similaridad Semántica
d2
d1
Similaridad Semántica: Taxonomía
t0
d2
d1
D. Lin (1998)
)]2(Pr[log)]1(Pr[log
)]2,1(Pr[log2)2,1( 0
dtdt
ddtddT
s
Taxonomía
Simbólico
Relacionado
t2t2
t1t1
t4t4t3t3
t5t5 t6t6
t7t7 t8t8
T
S
R
tipos de enlacetipos de enlace
Similaridad Semántica
Bibliografía
Emerging Semantic Communities in Peer Web Search. R. Akavipat, L.-S. Wu, F. Menczer, A. Maguitman. P2PIR 2006: International Workshop on Information Retrieval in Peer-to-Peer. ACM Press. Arlington, USA, November 2006.
Adaptive Peer to Peer Social Networks for Distributed Content Based Web Search. L.-S. Wu, R. Akavipat, A. Maguitman, F. Menczer. Social Information Retrieval Systems: Emergent Technologies and Applications for Searching the Web Effectively, IGI Global. September 2007.