Sistemas de Búsqueda de Información

29
Sistemas de Búsqueda de Información Maestria en Ingenieria de Sistemas y Cumputación Pontificia Universidad Javeriana November 2010 Diego Alberto Rincón Yáñez [email protected]

description

Sistemas de Búsqueda de Información. Diego Alberto Rincón Yáñez [email protected]. Maestria en Ingenieria de Sistemas y Cumputación Pontificia Universidad Javeriana November 2010. Agenda. Conceptualización Casos de Estudio Conclusiones Bibliografía. - PowerPoint PPT Presentation

Transcript of Sistemas de Búsqueda de Información

Page 1: Sistemas de Búsqueda de Información

Sistemas de Búsqueda de Información

Maestria en Ingenieria de Sistemas y CumputaciónPontificia Universidad Javeriana

November 2010

Diego Alberto Rincón Yáñ[email protected]

Page 2: Sistemas de Búsqueda de Información

Agenda

1. Conceptualización

2. Casos de Estudio

3. Conclusiones

4. Bibliografía

Page 3: Sistemas de Búsqueda de Información

CONCEPTUALIZACIÓN

1. Filtros Colaborativos y Sistemas de Recomendación

2. Algoritmos

3. Sistemas Híbridos

4. Software Disponible

Page 4: Sistemas de Búsqueda de Información

Filtro Colaborativo y Sistemas de Recomendación

• Técnicas para filtrar información.• Crea perfiles de usuario.• Están representados por dominios, donde un dominio

equivale a un tema en especifico.• Busca predecir el ranking o peso de una característica.

Métodos de Creación de Perfil de usuario

1. Explicita: Teniendo en cuenta calificadores para las características el usuario le asigna un “peso” con aquellas que ha interactuado.

2. Implícita: Se retroalimenta con la misma interacción del usuario con el sistema sin que este se de cuenta.

Page 5: Sistemas de Búsqueda de Información

Técnicas de Recomendación

• Colaborativa: Acumula recomendaciones de los usuarios y crea relaciones recomendación-usuario.

• Demográfica: Clasifica grupos y recomienda dependiendo el grupo.

• Basada en Contenido: Aprende del perfil usando características jerarquizadas y crean modelos a largo plazo.

• Basada en Utilidad: Compara necesidad del usuario con opciones disponibles en el sistema.

• Basada en Conocimiento: Relaciona ítems – necesidades – usuarios y establece un cruce entre necesidad y recomendación.

Page 6: Sistemas de Búsqueda de Información

Algoritmos de Sistemas de Recomendación

Basados en VecinosMedir los parecidos de todos los usuarios con el

usuario actual.

1) Coeficiente de Relación de Pearson.2) Selección de Vecinos.

Basados en ElementosSeleccionar los elementos votados de un usuario y

comprobar similaridades con el resto de elementos del sistema.

1) Similitudes Basadas en Coseno2) Similitudes Basadas en Coseno Ajustado3) Similitudes Basadas en Correlación4) Calculo de Predicción 5) Suma con Pesos

Predictores Slope – OnePartiendo de Arrays de longitud se toma la información

de los elementos con sus pesos respectivos.

1) Con Pesos2) Bi-Polar

Page 7: Sistemas de Búsqueda de Información

Sistemas Híbridos

Usan características de sistemas basados en contenido y sistemas colaborativos para apoyar la toma de mejores decisiones y obtener mejores recomendaciones.

• Combinación Lineal

• Combinación Secuencial

Page 8: Sistemas de Búsqueda de Información

Software Disponible – Open Source

1. Java1. Taste – Java Beans2. SlopeOne3. La Cofi

2. PHP1. Vogoo2. OpenSlopeOne

3. C#1. Kuber

4. Haskell1. Implementación hecha por Brian Sullivan

5. Erlang1. Implementación hecha por Philip Robinson.

Page 9: Sistemas de Búsqueda de Información

CASOS DE ESTUDIO

•Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes.

•Framework Multiagente basado en exploración colaborativa para mecanismos de consulta con filtrado basado en términos.

•Agentes ubicuos para el acceso a la información en ambientes nómadas (PUMAS).

Page 10: Sistemas de Búsqueda de Información

Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes

Universidad de Rio de Janeiro

Flexibilidad

Transparencia

Precisión

Basado meta-data y Ontología

relacionada con el dominio

Page 11: Sistemas de Búsqueda de Información

Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes

Problema

Las aproximaciones eran basadas en palabras claves, no consideran la semántica y el contexto para la búsqueda y recuperación

Proposición

Proveer un nuevo acercamiento para el acceso a componentes de software por medio de agentes, ontologías, técnicas de inferencia y mediadores

Page 12: Sistemas de Búsqueda de Información

Odyssey-Search, Sistema Multiagente para la búsqueda y recuperación de componentes

Soluciones Técnicas para la recuperación de componentes

1. Usar técnicas de Hipermedia adaptativa, basándose en un modelo (perfiles) pueden decidir como representar la información, teniendo en cuenta.

1. Ajustando el Nivel de Conocimiento, esto agrega mas semántica al proceso.

2. Identificar el nivel de abstracción que el usuario esta buscando (conceptual, arquitectural o implementación).

2. Recolectando meta data de búsquedas anteriores y creando patrones basados en previas experiencias con el tipo de información relevante para el usuario.

3. Usando capa intermedia, donde no necesita preocuparse de la representación de la información (aumenta complejidad cuando hay diferentes formatos de archivo)

4. Aumentando las ontologías de dominio. Algunas veces la búsqueda no es suficiente y se debe incluir otro dominio para obtener información relevante.

Page 13: Sistemas de Búsqueda de Información

• Agente Interfaz

• Interfaz de Usuario adaptativa donde la información se despliega dependiendo de las preferencias capturadas en el modelo.

• Agente de Filtro

• Permite adaptar la información teniendo en cuenta su comportamiento y navegación para filtrar la información del dominio que será desplegada por el AI.

• Agente de Recuperación

• Busca de manera distribuida y heterogénea en los repositorios, teniendo en cuenta la información de búsqueda proporcionada por el AF que a su vez realiza un filtrado y sube a través de las capas

Descripción de Agentes en Odyssey-Search

Page 14: Sistemas de Búsqueda de Información

Arquitectura de Odyssey-Search

Page 15: Sistemas de Búsqueda de Información

Framework Multi-agente basado en exploración colaborativa para mecanismos de consulta con

filtrado basado en términos

Universidad Técnica de Berlín. Alemania

1. Búsqueda por consultas

similares

2. Usar consultas similares

3. Adaptación de consulta actual

Modelo Matemático Cooperación Adaptación Integración con mas Modelos

Page 16: Sistemas de Búsqueda de Información

Contextualización

(U) Usuario

(M) Manejador

(Fn) Filtro Utilizado

1. Definición Atributo : ai es un vector de 2 dimensiones conformado por (vi,wi), donde vi representa su valor y wi representa su importancia.

2. Definición Consulta: Q = Q(ai1, . . . ,aik), serie de atributos k.

Page 17: Sistemas de Búsqueda de Información

Búsqueda por Consultas Similares

Uso de función distancia y función de similaridad

Creación de Consultas Pasadas• Correctamente procesadas• “Suficientemente” similares a la actual

¿Como se calcula “Suficientemente”?

1. Distancia Euclidiana, para medir la distancia entre 2 puntos o entre Q(l) y Q(k). Pero para esta aproximación se comporta de manera opuesta para este problema.

Page 18: Sistemas de Búsqueda de Información

Búsqueda por Consultas Similares

2. Índice de Jaccard

Intercepta las similaridades de 2 consultas dadasLos atributos de los valores son totalmente ignorados

Función de Similaridad Combinada

Tamaño de intercepción absoluta

Garantiza que las intercepciones pequeñas no influyen en el resultado

Page 19: Sistemas de Búsqueda de Información

Usar Consultas Similares

Usan vecindarios para la agrupación de consultas, donde al menos un dato de (vi,wi) aparece en un vecindario

Una colección de atributos (valor – importancia) computados en pares puede describirse como el centroide un vecindario similar a la consulta vecindario

Page 20: Sistemas de Búsqueda de Información

Adaptación de Consulta Actual

Cuando la consulta actual Q(a), tiene un atributo ak el atributo par de esa consulta (vk(a)),wk(a)) se mueve a el resultado esperado (vk(e)),wk(e))

Page 21: Sistemas de Búsqueda de Información

Adaptación de Consulta Actual

Dados los atributos a1, a7 y a8

Tasa de Exploración:

Page 22: Sistemas de Búsqueda de Información
Page 23: Sistemas de Búsqueda de Información

Agentes ubicuos para el acceso a la información en ambientes nómadas

LSR-IMAG Laboratory, Francia

Altamente AdaptableAltamente DistribuidoCooperaciónGenerico

Page 24: Sistemas de Búsqueda de Información
Page 25: Sistemas de Búsqueda de Información

Enrutamiento de Consultas

Interacción entre sistemas de información, usuarios y Dispositivos móviles, teniendo como base un contexto y una meta especifica.

Ejemplo:1.Un paciente genera una alarma debido a un problema de salud2.La alarma le llega a su doctor de cabecera3.El doctor consulta la información en su dispositivo móvil.4.El doctor lanza una consulta de historial medico, que corresponde a:

1. Datos Generales del paciente2. Historia clínica completa3. Tratamiento realizado a el paciente en esa situación4. Causas que generaron la alarma5. Consulta de historial de incidentes similares en historial del

hospital5.El doctor recibe la consulta completa y da un diagnostico.6.El doctor pide asesoría, y el sistema envía el mensaje a doctores

especialistas en el área y devuelven diagnostico.7.El doctor toma una decisión y la envía a el personal que tiene que ver

con el paciente.

Page 26: Sistemas de Búsqueda de Información

Cuadro Comparativo entre casos de Estudio

Odyssey Filtrado de Terminos PUMAS

Adaptación + + +

Distribuido - + +

Cooperación + + +

Modelo Matemático - + -

Enrutamiento de Consultas + - +

Especialización de Agentes + +/- +

Movilidad + - +

Ubiquidad + - +

Pervasividad - - +

+ Aplica- No Aplica+/- Aplica Parcialmente

Page 27: Sistemas de Búsqueda de Información

Conclusiones

• El uso de los Sistemas de Información existentes junto con un sistema adaptativo basado en búsqueda de información, ofrece la posibilidad de brindarle a un usuario un alto porcentaje de obtener la información requerida en un ambiente como conocido.

• La concepción inicial de creación de un sistema adaptativo basado en búsqueda de información se debe centrar en ayudar a el usuario a explorar la información requerida dejando a un lado servicios como la velocidad de respuesta de dicho sistema.

• El diseño de un sistema adaptativo basado en búsqueda de información utilizando SMA busca crear una solución distribuida mejorando un poco ese cuello de botella existente en la velocidad de respuesta.

• Técnicas como Información Retrieval (IR), se pueden implementar junto a un sistema adaptativo basado en búsqueda de información , teniendo en cuenta los principios de cada modelo apoyando en la toma de deciciones uno del otro

Page 28: Sistemas de Búsqueda de Información

¿ PREGUNTAS ?

Page 29: Sistemas de Búsqueda de Información

Referencias

• Sergio Manuel Galán Nieto, Filtrado Colaborativo y Sistemas de Recomendación, Universidad Calos III de Madrid.

• G.Huecas, J Salvachua, Filtros Colaborativos y Sistemas de Recomendacion

• Regina M.M. Braga, Claudia M.L. Werner, Marta Mattoso, Odyssey-Search: A multi-agent system for component information search and retrieval, Computer Science Department, Federal University of Rio de Janeiro, 27 June 2005.

• Lidia Fuentes, Jose M. Troya y Antonio Vallecillo, Desarrollo de Software Basado en Componentes, Universidad de Malaga.

• Sahin Albayrak, Dragan Milosevic, Multi-domain collaborative exploration mechanisms forquery expansion in an agent-based filtering framework, Technical University Berlin, Berlin, Germany, 21 December 2006.

• B. Smyth, P. McClave, Similarity vs. diversity, case-based reasoning research and development, Lecture Notes in Artificial Intelligence2080 (2001) 347–361.

• Angela Carrillo-Ramos, Marlène Villanova-Oliver, Jérome Gensel and Hervé Martin, Knowledge management for adapted information Retrieval in ubiquitous environments, LSR Laboratory,