Reordenació i agrupament d'imatges d'una cerca de vídeo

50
Reordenació i agrupament d’imatges resultants d’una cerca de vídeo Mónica Alfaro Vendrell Tutors: Xavier Giró (UPC) Xavier Vives (CCMA)

description

Defensa del Project de Final de Carrera de la Mónica Alfaro, en els estudis d'Engineria Tècnica en Telecomunicacions, especialitat en So i Imatge. Co-dirigit per en Xavier Giró-i-i-Nieto (UPC) i Xavier Vives (CCMA) Escola d'Enginyeria de Terrassa, Universitat Politècnica de Catalunya. Gener 2011. Més detalls: https://imatge.upc.edu/web/publications/reordenacio-i-agrupament-dimatges-duna-cerca-de-video

Transcript of Reordenació i agrupament d'imatges d'una cerca de vídeo

Page 1: Reordenació i agrupament d'imatges d'una cerca de vídeo

Reordenació i agrupament d’imatges

resultants d’una cerca de vídeo

Mónica Alfaro Vendrell

Tutors:

Xavier Giró (UPC)

Xavier Vives (CCMA)

Page 2: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Escenari

» del volum dels repositoris

» Cerques eficients

Repositori

2

Page 3: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Proposta: tècniques de reordenació i agrupament

3

Eclipse

Page 4: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

4

Page 5: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC

5

Page 6: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC

6

•Motors de reordenació i agrupament

•Motor de reordenació

•Motor d’agrupament

•Client web

•Desenvolupament

•Entorn de desenvolupament

•Conclusions

•Treball realitzat

•Assoliment dels requeriments

•Treball futur

Page 7: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Els continguts audiovisuals

s’emmagatzemen formant

assets

• Els keyframes són imatges claus

que s’extreuen del vídeo

• Metadades:

• Caràcter general: a nivell d’asset

• Estrats: segments temporals del vídeo

7

Page 8: Reordenació i agrupament d'imatges d'una cerca de vídeo

Mo

ntilla

En

tre

vis

ta

Tele

no

tíc

ies

Mo

ntilla

• Anotacions textuals a nivell d’asset.

Reordenació

8

Page 9: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Reptes que es plantegen:

» Prioritzar els keyframes rellevants

» Mostrar diversitat d’assets

Montilla

Reordenació

9

Page 10: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Rellevància similar Vídeos similars

• No requereix un llistat inicial ordenat

• Basats en:

Reordenació

Pseudo-retroacció de

rellevància

Similitud

10

Page 11: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

11

Page 12: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Importància d’un keyframe Número de keyframes semblants

Pas 1 Graf de similitud

Reordenació

node =

imatge

aresta = similitud visual

0.8

0.7

1.0

0.6

distancia

visual

Graf de similitud

12

Page 13: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Solució final:

» Distància visual mínima per cada descriptor visual:

» Número màxim d’arestes per node

Pas 1 Graf de similitud

Reordenació

Descriptor visual Distancia mínima

Color layout 0.7

Color dominant 0.7

Color structure 0.5

Texture edge histogram 0.7

13

Page 14: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

14

Page 15: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Evitar la influència dels assets

Pas 2 Filtrat

Reordenació

Resultat:

NOU

15

Page 16: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Evitar keyframes similars del mateix asset

Pas 2 Filtrat

Reordenació

Resultat:

NOU

16

Page 17: Reordenació i agrupament d'imatges d'una cerca de vídeo

Les imatges d’un mateix asset no es poden enllaçar entre elles.

Filtrat intra-asset

Pas 2 Filtrat

Reordenació

NOU

17

Page 18: Reordenació i agrupament d'imatges d'una cerca de vídeo

Limitació a 1 aresta (màx. similitud) entre cada imatge i un altre

asset.

Filtrat inter-asset

Pas 2 Filtrat

w1

w2

w3

w 1 < w2 < w3

Reordenació

NOU

18

Page 19: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

4 grafs de similitud

visual filtrats

19

Page 20: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Assigna puntuacions als keyframes basant-se en:

» Número de arestes

» Pes de cada aresta

Pas 3 Passejada aleatòria

a: factor de pes de cada expressió

Reordenació

20

Page 21: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

4 grafs de similitud

visual filtrats

4 llistes

reordenades

21

Page 22: Reordenació i agrupament d'imatges d'una cerca de vídeo

Pas 4 Fusió de probabilitats

Reordenació

Fusió de

probabilitats

Fusió de distàncies

visuals

NOU

44332211 ····)( PPPPkeyframePuntuació

22

Page 23: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Esquema general:

0.9

0.7

0.6

0.5

0.2

Fusió de prob.

FiltratPassejada aleatòria

12 3 4

Graf de similitud

Reordenació

4 grafs de

similitud visual

4 grafs de similitud

visual filtrats

4 llistes reordenades

1 llista final

23

Page 24: Reordenació i agrupament d'imatges d'una cerca de vídeo

Reordenació

• Consultes seleccionades:

• Estudi de la influència dels modes de filtratge: intra-asset, inter-asset,

intra&inter-asset, baseline.

• Avaluació:

» Rellevància dels keyframes Average precision

» Diversitat d’assets. Average asset diversity

Consulta #assets #KFs

Tennis de taula 3 1.116

Formula 1 6 3.441

Parlament 12 2.841

Accident 8 66

Futbol 16 416

24

Page 25: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Reordenació

• Resultat general

Estudi de la rellevància Estudi de la diversitat

Baseline Sense Filtrat Intra-asset Inter-asset Intra&Inter-asset

25

Page 26: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC

26

•Motors de reordenació i agrupament

•Motor de reordenació

•Motor d’agrupament

•Client web

•Desenvolupament

•Entorn de desenvolupament

•Conclusions

•Treball realitzat

•Assoliment dels requeriments

•Treball futur

Page 27: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Agrupament

• Definir grups de keyframes visualment semblants a nivell d’asset.

Asset A

Grup 1 Grup 2

Keyframes representants

27

Page 28: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Famílies:

» Supervisat: requereix el número de grups finals

» No supervisat: no requereix el coneixement previ del número de grups

• Tècniques:

Agrupament

Supervisat Càlcul Nous centroides

K-Means

Canopy

Quality Threshold

28

Page 29: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Agrupament

• Esquema general

QualityThreshold

2

Keyframe 1 0.9

Keyframe 2 0.8

Keyframe 3 0.7

Keyframe 4 0.6

Keyframe 5 0.5

Keyframe 6 0.4

Keyframe 7 0.3

Keyframe 8 0.2Keyframe 9 0.1

Grafs de similitud pre-

calculats

Graf de similitud truncat i

fusionat

1

Grup 1 0.9Grup 2 0.8Grup 3 0.7Grup 4 0.6Grup 4 0.5Grup 5 0.4Grup 7 0.3Grup 8 0.2Grup 9 0.1

Keyframe 1 0.9

Keyframe 2 0.8

Keyframe 3 0.7

Keyframe 5 0.5

Keyframe 6 0.4

Keyframe 7 0.3

Keyframe 9 0.1

Resultats

Dins del grup

Per cada asset

• Paràmetres:

» Valor màxim del radi dels grups

» Mínim número de resultats

» Valor de la puntuació final del grup

29

Page 30: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

30

Page 31: Reordenació i agrupament d'imatges d'una cerca de vídeo

CCMA

31

Page 32: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Incorporar les tècniques de reordenació i agrupament

• Integració de l’eina dins del Digition

32

Page 33: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Digition

33

Page 34: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Google Swirl

34

Page 35: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Google Swirl

35

Page 36: Reordenació i agrupament d'imatges d'una cerca de vídeo

• iGroup

36

Page 37: Reordenació i agrupament d'imatges d'una cerca de vídeo

37

Page 38: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Estructura client-servidor

• Comunicació entre els clients i els servidors: protocol HTTP

• Arquitectura REST pels servidors.

Servidor CCMA

Servidor UPC

Client 1

Client 2

Client 3

38

Page 39: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

39

Page 40: Reordenació i agrupament d'imatges d'una cerca de vídeo

40

Page 41: Reordenació i agrupament d'imatges d'una cerca de vídeo

UPC CCMA

• JAMA• JFreeChart

41

Page 42: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motors de reordenació i agrupament

• Motor de reordenació

• Motor d’agrupament

• Client web

• Desenvolupament

• Entorn de desenvolupament

• Conclusions

• Treball realitzat

• Assoliment dels requeriments

• Treball futur

UPC

CCMA

42

Page 43: Reordenació i agrupament d'imatges d'una cerca de vídeo

43

Page 44: Reordenació i agrupament d'imatges d'una cerca de vídeo

Reordenador Agrupador

Servei web upseek

Servidor CCMA

Comunicacions

Interfície gràfica d’usuari

Disseny i implementació

Disseny

Disseny i implementació per

part d’altres membres

44

Page 45: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Motor de reordenació i agrupament

» El pas de filtrat és una tècnica vàlida

» Comunicació per ICMR 2011

• Client

» Interfície gràfica integra els algoritmes

» No rep resultats del servidor

45

Page 46: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Reordenació Agrupament

• Creació de grafs de similitud textual

UPC

• Integració del servei web

• Integració del client al Digition

CCMA

46

Page 47: Reordenació i agrupament d'imatges d'una cerca de vídeo
Page 48: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Average Precision:

• on m és el número de documents rellevants

• Precisió:

Avaluació de la rellevància

m

kkecision

mecisionAverage

1)(Pr

1Pr

48

1

2

3

4

5

6

1

1)1(P2

1)2(P3

2)3(P

73.0)3

2

2

1

1

1(

3

1AP

recuepratstotalsdocuments

recuperatsrellevantsdocumentsP

Page 49: Reordenació i agrupament d'imatges d'una cerca de vídeo

• Average Asset-Diversity:

• on m és el número total d’assets diferents

• Asset-Diversity:

• on d(k) correspon al número d’assets diferent en les posicions 1...k

Avaluació de la diversitat

49

1

2

3

4

5

6

012

11)2(AD

39.0)3

2

2

10(

14

1AAD

m

kkAD

mAADdiversityAsset

2)(

1

1

1

1)()(

k

kdkADdiversityAsset

2

1

13

12)3(AD3

2

14

13)4(AD

Page 50: Reordenació i agrupament d'imatges d'una cerca de vídeo

αε

Reordenació

• Resultat desglossat per cada consulta:

Estudi de la rellevància Estudi de la diversitat

Baseline Sense Filtrat Intra-asset Inter-asset Intra&Inter-asset

50