Pyxel, una llibreria per a l’anotació automàtica de fotografies

Pyxel, una llibreria per a l’anotació automàtica de fotografies

Irene Gris Sarabia

Supervisat perXavier Giró i Nieto

Agraïments

Amaia Salvador

Xavi Giró

Sergi ImedioEva Mohedano

Daniel Manchón

IndexIntroducció

RequerimentsEstat de l’art

Disseny Desenvolupament

Avaluació i resultatsConclusions

IndexIntroducció

Motivació

Introducció Pyxel

Pyxel ja està disponible a la plataforma de control de versions Bitbucket

URL: https://bitbucket.org/emohe/pyxel/src

IndexIntroducció

DesenvolupamentDisseny i Implementació

Requeriments

Crear un sistema complert i genéric d’anotació d’imatges

Extracció de característiques; visuals i textuals

Entrenament i Detecció

Avaluació de la qualitat de les

anotacions automàtiques

Usuaris potencials → Estudiants universitaris

● Facilitar l’accés a llibreries externes als usuaris que s’inicien en la materia

● Proporcionar eines per obtenir el sistema complert de forma sencilla i ràpida.

Que es demana?

Requeriments

Crear un sistema complert i genéric d’anotació d’imatges

Que es demana?

Manual Annotations Model

Trainer

New Image New Annotation

Detector

Bloc: http://bitsearch.blogspot.com/search/label/classification

Requeriments

Extracció de característiques visuals

Extracció de característiques SIFT

Generació d’un vocabulari visual

Obtenció dels vectors de característiques BoF

Requeriments

w4w1 w2 w3 w4

Clusterització

Paraules visuals

Requeriments

2 3 3 0

w1 w2 w3 w4

Vector de caraterístiques

Requeriments

Extracció de característiques textuals

Obtenir les metadades de la imatge; etiquetes

Generació d’un vocabulari textual

Obtenció dels vectors de característiques TF-IDF

[ I, love, surf ]

Títol: “I love university concerts”

Metadades

Títol: “I love surf”

[ I, love, university, concerts ]

Requeriments

Obtenir les metadades de la imatge; etiquetes

Obtenció dels vectors de característiques TF-IDF

TF-IDF → [ 0 , 0 , 0.3 , 0.3 , 0.3 ] [ I , love, university, concerts, surf ]

[ university, concerts, surf, I, love ]

[ 0.3 , 0.3 , 0.3 , 0, 0 ]

Vocabulari/Diccionari → [ university, concerts, surf ]

Requeriments

Obtenir les metadades de la imatge; etiquetes.

Obtenció dels vectors de característiques TFIDF

Vocabulari/Diccionari → [ university, concerts, surf ]

[ I, love, surf ]

[ I, love, university, concerts ] [ 1 , 1 , 0 ]

[ 0 , 0 , 1 ]

Requeriments

Mesures de qualitat

Que es demana?

docId1 Label1docId2 Label1docId3 Label2docId4 Label3

.docIdn Labeln

Avaluació F1

docId1 Label1docId2 Label4docId3 Label2docId4 Label3

.docIdn Labeln

cp = certs positius

fp = falsos positius

fn = falsos negatius

itat T

IndexIntroducció

Estat de l’artExtracció de característiques

visuals

NLTKNatural LanguageToolKit

Extracció de característiques textuals Reconeixement de patrons

IndexIntroducció

Disseny

Extracció de característiques; visuals i textuals

Classificació

Avaluació de la qualitat de les

anotacions automàtiques

Disseny general de classificació

Imatge Metadades

BofExtractor

Trainer

TFIDFExtractorVisualVocabulary

Trainer

Visual Model Textual ModelTRAIN

TEST Imatge Metadades

BofExtractor TFIDFExtractor

DetectorDetectorVisual Model Textual Model

PredictedAnnotation PredictedAnnotation

TextualVocabulary

Evaluator

Extracció de característiquesDisseny

Imatge Metadades

BofExtractor

Trainer

TextualVocabulary

Evaluator

EntrenamentDisseny

Classe Semantica + + Classe Semantica

Són la mateixa classe

Imatge Metadades

BofExtractor

Trainer

Model Visual Model TextualTRAIN

TextualVocabulary

Evaluator

EntrenamentDisseny

Imatge Metadades

BofExtractor

Trainer

TextualVocabulary

Evaluator Evaluator

DeteccióDisseny

Imatge Metadades

BofExtractor

Trainer

TextualVocabulary

Evaluator Evaluator

DeteccióDisseny

Imatge Metadades

BofExtractor

Trainer

TextualVocabulary

Evaluator Evaluator

AvaluacióDisseny

26GroundTruth GroundTruth

Imatge Metadades

BofExtractor

Trainer

TextualVocabulary

Evaluator Evaluator

Disseny

IndexIntroducció

Disseny DesenvolupamentAvaluació i resultats

Conclusions

Llenguatge de programacióDesenvolupament

Entorn de desenvolupamentDesenvolupament

Té llicencia per estudiants

IndexIntroducció

Contribució a Pyxel

20 % 40 % 90 %60 %

Dataset, Annotation, AnnotatedSemanticClass, Ontology

VisualVocabulary, SiftExtractor, BofExtractorTextualVocabulary, TfidfExtractor

100 % 100 %

Metadata, GroundTruth

Trainer

DetectorEvaluator

Avaluació i resultats

Documentació

Avaluació i resultats Detecció de productes de supermercat en vídeos

egocèntrics

Sergi Imedio, “An investigation of eye gaze tracking utilities in image object recognition”. Dublin City University 2014.

Avaluació i resultats

Amb Pyxel es poden obtenir aquests resultats

Avaluació i resultatsDetecció d’esdeveniments en

fotografies d’Instagram

Els estudiants de GDSA han utilitzat Pyxel per fer un clasificador d’imatges de tipus d’esdeveniments.

IndexIntroducció

Conclusions

Objectius del projecte

Sistema complert d’anotacions d’imatges● Extracció de característiques● Anotació● Avaluació

Utilització d’altres usuaris

● Han aconseguit dur a terme el que se'ls demanava utilitzant Pyxel● Han extès la llibreria per ajustar-la a les eines amb les que han volgut fer el

processat

Conclusions

Participació al ICMR

Detalls: https://imatge.upc.edu/web/publications/photo-clustering-social-events-extending-phototoc-rich-context

Conclusions

Participació al MediaEval2014

Manchon-Vizuete, D., Gris-Sarabia, I., Giro-i-Nieto, G. “UPC at MediaEval 2014 Social Event Detection Task”. Working Notes Proceedings of the MediaEval 2014 Workshop, Barcelona, Catalunya, Spain, October 16-17, 2014, CEUR-WS.org, online ceur-ws.org/Vol-1263/mediaeval2014_submission_58.pdf

Moltes gràcies!

Pyxel, una llibreria per a l’anotació automàtica de fotografies

Technology

Transcript of Pyxel, una llibreria per a l’anotació automàtica de fotografies

Fotografies que mostren diferències

Fem fotografies a

Fotografies patinatge

50 fotografies mítiques

fotografies UD2

Fotografies del procés

Fotografies de David González - Tarragonad onze milions de sirians a fugir de casa seva. Darrere de les xi- fres, les fotografies de David González busquen els rostres, les per-

IMPRESSIÓ FINE ART DE FOTOGRAFIES PRODUCCIÓ GRÀFICA … · per a fotografies de bode-gó, moda i publicitat. Hahnemühle és una empresa alemana fundada l’any 1584 com a “Relliehäusische

Fotografies més boniques

36 fotografies

àLbum de fotografies

FIra - Fragmenta Editorial · LLIBRERIA PAU VADLLIBRES LLIBRERIA CATALANA LLIBRERIA SA CATÒLICA JUGUETTOS LLIBRERIA JOCS SA LLIBRERIA ESPAI 14 s n i DL: ME - 785/2019 ... tres actes

Fotografies: Marlon Martínez Algaba - Interactuem valencia.pdfEscrivim aquests contes per ells. Per la defensa dels drets dels infants, per la sensibilització dels més menuts i

LLIBRERIA D APLICACIONS DE PROCESSAMENT DIMATGES ...

Fotografies escola_Ramón Peña

Llibreria Sant Vicenç

Totes les fotografies

Llibreria Anglada

fotografies cultura audiovisual

Bases del concurs de fotografies am BICIa’t 2013 · fotografies que no es considerin adequades bé per la imatge, bé per la frase que les acompanyi, o bé per absència d’aquesta,