Estudiante:JuanPabloSalazarFernández
Profesor:Dr.DenisParraSantander
Pontificia Universidad Católica de Chile Escuela de Ingeniería Departamento de Ciencia de la Computación
PRESENTACIÓNCURSOSISTEMASRECOMENDADORES
SISTEMASRECOMENDADORES
BASADOSENGRAFOS
05denoviembrede2015
1. A Graph-based Recommender System for DigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen. InProceedings of the 2ndACM/IEEE-CS joint conference onDigital libraries (JCDL'02).ACM,NewYork,NY,USA,65-73.
2. A Graph-based mode l f o r con tex t-awarerecommendation using implicit feedback data. Yao,W.,He,J.,Huang,G.,Cao,J.,&Zhang,Y.WorldWideWeb(2015)18:1351–1371
› Artículosincluidos
2
1. Introducción.2. Incorporacióndeinformacióndecontexto.3. SolucióndeHuanget.al.(2002)• Problemaaresolver.• Modeloutilizado.• Evaluaciónyresultados.
4. SolucióndeYaoet.al.(2015)• Problemaaresolver.• ModeloMulti-LayerContextGraph(MLCG)• Evaluaciónyresultados.
5. Conclusionesycomentarios.
› Agenda
3
1. Aporteaproblemade“informationoverload”.
2. Feedbackexplícito,matricesusuario-itemrelativamentedensas.
3. Necesidaddemejorarresultadossintenerpreferenciasexplícitas.
4. Feedbackimplícito.1. Informaciónacercadelítem.2. Informaciónacercadelusuario.3. Informaciónacercadelatransacción–contextodedecisión.
› Introducción
4
1. Descripcióndecadaproducto.2. Especificaciones.3. Características.4. Pertenenciaagrupos/jerarquías/tipos.
› Informaciónacercadelosítemes.
6
1. Género.2. Edad.3. Educación.4. Estadocivil.5. Númerodehijos.6. Edadesdeloshijos.7. País,ciudadderesidencia.8. Trabajo.
› Informaciónacercadelosusuarios.
7
1. Lugar/Actividad.2. Día/hora.3. Métododepago.4. Métododeenvío/entrega.
› Informaciónacercadelatransacción.
8
AGraph-basedRecommenderSystemforDigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen.(2002).
• 163citasenGoogleScholar(4/11/2015).• 9citasel2015.• Artículos más antiguos que lo citan (anteriores a 2007), son
muchomáscitadosquelosnuevos,variosconmásde100citas.
AGraph-basedRecommenderSystemforDigitalLibrary.ZanHuang,WingyanChung,Thian-HuatOng,andHsinchunChen.(2002).
10
• RecomendacióndelibrosaclientesdeunalibreríadigitaldeTaiwán.
• Integracióndetécnicasbasadasencontenidocontécnicasdefiltradocolaborativo.
• Desarrollodesolucióngeneral,aplicableenotroscontextos.
› Problemaaresolver.
11
› ModeloUtilizado
12
Libros
Historial de compras
Clientes
Características:• Flexible.• Integrador.• Modular.
Dosetapas:1. Creacióndevectoresde
característicasparalibrosyclientes.
2. Construccióndelgrafo,calculandosimilaridades(aristas).
› Modelo-Representación
13
Representacióndelibros:• Generacióndelistasdetérminosmediante
métododeinformaciónmutua.Análisisdeco-ocurrenciadepalabrasyfrases.
Representacióndeclientes:• Vectordecaracterísticas.
› Modelo–Representación–Etapa1
14
• Cálculodesimilaridadentrelibros(basadaen(TF-IDF):
• Importanciadetérminoenunlibro.
• Importanciadeltérminoenamboslibros.• Similaridad(asimétrica)
› Modelo–Representación–Etapa2
15
Low-degreeassociation.• Recomendacióndelibrosmás
similaresalosyacompradosporelcliente(1salto).
High-degreeassociation.• Recomendaciónutilizandoredde
Hopfield(múltiplessaltos).
› Recomendaciónenbasealmodelo
17
ReddeHopfield• Inicialización: 𝑢↓𝑖 (0)=1paralibros
compradosanteriormente.• Iteración:
• Criteriodeconvergencia:
› Recomendaciónenbasealmodelo
18
Hold-out(validacióncruzada).• 100clientes,escogidos
aleatoriamente.• Paracadacliente:• 50%comprasmásantiguas,
usadasparatraining.• 50%comprasmásnuevas,
usadasparatesting.
› Evaluaciónyresultados
19
Evaluacióndeusuariosexpertos• 2ciudadanostaiwanesescon
estudiosdepostgrado.
› Evaluaciónyresultados
20
AGraph-basedmodelforcontext-awarerecommendationusingimplicitfeedbackdata.
Yao,W.,He,J.,Huang,G.,Cao,J.,&Zhang,Y.
• Recomendacióncuandosecuentasóloconfeedbackimplícito.• Contextodelusuario,delítemydeladecisión.• Frameworkgenéricoderecomendaciónbasadoengrafos.
› Problemaaresolver.
22
1. ConstruccióndelgrafoMLCG.
2. Asignacióndepesosdelosenlaces.
3. Generacióndelrankingpersonalizado(usuario,contexto).
› Tareas.
24
Donde:• j es un nodo • α es un parámetro. • 𝑛↓𝑐 (𝑗) representa la cantidad de elementos contextuales de j • 𝑁↓𝑠 (𝑗)eselconjuntodenodosdelamismacapadej• 𝑁↓𝑑 (𝑗)eselrestodenodosconectadosconj• f(j,k)esunafunciónquemidelaimportanciadelarelación.
› 2.1Asignacióndepesosalosenlaces› dentrodelamismacapa.
26
Donde:• j es un nodo • α es un parámetro. • 𝑛↓𝑐 (𝑗) representa la cantidad de elementos contextuales de j • 𝑁↓𝑠 (𝑗)eselconjuntodenodosdelamismacapadej• 𝑁↓𝑑 (𝑗)eselrestodenodosconectadosconj
› 2.2Asignacióndepesosalosenlaces› entrecapas.
27
Donde:• M es la matriz de probabilidad de transición. • µ es el factor de damping (normalmente 0.85). • desunvector,talque𝑑↓𝑘 = 1/𝑛 ,k=1..n;neselnúmerodenodos.Problema:PageRanknoespersonalizado,nodependedelcontexto.
› 3.CálculodeRanking(PageRank).
28
Donde:• ueselusuarioalquesedeseahacerlarecomendación.• 𝐶↓𝑑 eselcontextodedecisión.• λesunparámetrodeajustedelpesodelcontexto&preferencias.• Φeselconjuntodeítemesqueelusuarioucomprópreviamente.
› Context-awarePersonalizedRandomWalk› (CPRW)
29
ElPathSemánticorepresentaelprocesodedecisión,permite“dirigirlaenergía”,actúacomorestriccióndeloscaminosaleatorios.Ejemplos:Búsquedadelusuario:U–D–I- 𝐶↓𝐼 -IÍtemesenpromoción:I- 𝐶↓𝐼 -I-D-U
› SemanticPath-BasedRandomWalk› (SPRW)
31
Matrices de transición de cada paso del Path Semántico
• Datasets:Last.fmyCiteULike• Métricasutilizadas:• HitRatio@K• MeanReciprocalRank(MRR@K)• Recall@K
• Métodoscontralosquesecompararonresultados:• FreMax:Popularidad.• UserCF:FiltradoColaborativoUB.• ItemRank:RandomWalksobregrafodeítemes.• GFREC:Métodobasadoengrafobipartito,similaralpresentadoalinicio.• PageRank-M(PR-M):AlgoritmooriginaldePageRank.
› Evaluación
32
• Primer modelo presentado (2 capas) intenta ser general, pero fueprobadosóloenuncontextoespecífico(bibliotecavirtualdeTaiwán).
• Segundomodeloincorporaexplícitamenteelcontextodeladecisión.
• ModeloSPRW (Semantic Path-BasedRandomWalk) se vepromisorio,por las posibilidades de ajustarlo al problema y por los resultadosobtenidos,noobstantenoseanalizasuescalabilidad.
• Aun cuando el segundo artículo entrega parámetros utilizados en laspruebas,nodadirectricesrespectodecómofijarlosnihaceunanálisisdesensibilidaddeéstos.
• Ambos artículos tienenerroresmenoresen fórmulas y algoritmos, quedificultansucomprensión.
37
Top Related