Tema 5: Evaluación de Modelos de Clasicación Supervisada · Algoritmo Inductor M 4 M 2 M 3 1er...

Tema 5: Evaluación de Modelos deClasificación Supervisada

Pedro Larranaga, Inaki Inza, Abdelmalik Moujahid

Departamento de Ciencias de la Computacion e Inteligencia Artificial

Universidad del Paıs Vasco

http://www.sc.ehu.es/isg/

Tema 5: Evaluacion de Modelos de Clasificacion Supervisada– p. 1/20

Evaluación de Modelos de Clasificación Supervisada

• Introducción• Estimación de la probabilidad de clasificación

correcta• Brier score• La curva ROC

Introducción

Clasificación Supervisada

X1 . . . Xn C

(x(1), c(1)) x(1)1 . . . x

(1)n c(1)

(x(2), c(2)) x(2)1 . . . x

(2)n c(2)

. . . . . . . . .

(x(N), c(N)) x(N)1 . . . x

(N)n c(N)

x(N+1) x

(N+1)1 . . . x

(N+1)n ???

IntroducciónClasificación Supervisada

X1 . . . Xn C CM

(x(1), c(1)) x(1)1 . . . x

(1)n c(1) c

(x(2), c(2)) x(2)1 . . . x

(2)n c(2) c

. . . . . . . . . . . .

(x(N), c(N)) x(N)1 . . . x

(N)n c(N) c

Número de aciertos:∑N

i=1 δ(c(i), c(i)M )

δ(c(i), c(i)M ) =

1 si c(i) = c(i)M

0 si c(i) 6= c(i)M

Introducción

C Clase real+ -

+ a bCM Clase predicha

• Tasa de acierto: a+da+b+c+d

• Tasa de error: c+ba+b+c+d

• Proporción de verdaderos positivos (sensibilidad): aa+c

• Proporción de verdaderos negativos (especifidad): db+d

• Proporción de falsos positivos: ba+c

• Proporción de falsos negativos: cb+d

Estimación de la probabilidad de clasificación correcta

Algoritmo Inductor M p ˆ 1

1 X n X C M C 1 X n X C

δ(c(i) = c(i)M )

Método no honesto de estimación

Testeo

Entrenamiento

M p ˆ

N 1 1 N

1 X n X C M C

1 X n X C

Entrenamiento Algoritmo Inductor M

N − N1

N−N1∑

δ(c(N1+i) = c(N1+i)M )

Método H de estimación basado en entrenamiento ytesteo

1 ˆ p 1

1 X n X C Algoritmo Inductor

1 X n X C B M C

1 X n X C 1 M C

1 X n X C

Algoritmo Inductor B M

B p ˆ

1 X n X C 1ª partición

B-ésima partición M

Algoritmo inductor

Método de estimación H repetidas veces

Algoritmo Inductor 1 M

Algoritmo Inductor

Algoritmo Inductor 4 M

1er fold

2º fold

3er fold 4º fold

1 X n X C

Algoritmo inductor

Método de estimación basado en k rodajas (k–fold crossvalidation). Si k = N leave one out

1 X n X C Algoritmo Inductor

1 X n X C B M C

1 X n X C 1 M C

1 X n X C

Algoritmo Inductor B M

1 X n X C

1 X n X C B M C

1 \ D D

B D D \

a p , 1

0 , ˆ B p

0 , 1 p

a B p , ˆ

Algoritmo inductor

1ª muestra con reemplazamiento

B-esima muestra con reemplazamiento

pa = 1B

i=1 pi,a p0 = 1B

i=1 pi,0

pM = p0,632Bo = (0,368pa + 0,632p0)

Método de estimación 0,632 booststrapingTema 5: Evaluacion de Modelos de Clasificacion Supervisada– p. 10/20

Sobre los distintos métodos:

• Método H: utilizarlo con N grande

• Método H repetidas veces: no hay control sobre loscasos usados como entrenamiento (testeo)

• Método de estimación basado en k rodajas (k–foldcross validation): estimación insesgada de laprobabilidad de acierto, pero con alta varianza

• Método de estimación 0,632 booststraping: insesgadaen el límite y con baja varianza

Brier score

X1 . . . Xn C p(CM = 0|x) p(CM = 1|x)

(x(1), c(1)) x(1)1 . . . x

(1)n 1 0, 18 0, 82

(x(2), c(2)) x(2)1 . . . x

(2)n 0 0, 51 0, 49

. . . . . . . . . . . .

(x(N), c(N)) x(N)1 . . . x

(N)n 1 0, 55 0,45

[p(CM = c|x(i)) − δ(c(i), c(i)M )]2

B = 1N

[(0, 18− 0)2 + (0, 82− 1)2 + (0,51− 1)2 + (0,49− 0)2 +

... + (0, 55 − 0)2 + (0,45 − 1)2]

Brier score

• Medida de la calibración para un clasificador queasigne, para cada patrón, probabilidades a posteriori acada valor de la clase

• Suponiendo que la clase real del patrón x es 0, setrata de distinguir:

p(CM = 0|x) = 0,51 y p(CM = 0|x) = 0,97

• Interesa clasificadores con bajo valor de Brier(bastante seguros en sus predicciones)

• Para problemas con 2 clases: 0 ≤ B ≤ 2

La curva ROCEvaluación sensible al coste

• En muchas situaciones los dos tipos de error que puede cometer un clasificadorno tienen las mismas consecuencias• Dejar cerrada una válvula en una central nuclear, cuando es necesario

abrirla, puede provocar una explosión, mientras que abrir una válvula cuandopuede mantenerse cerrada, puede provocar una parada de la central

• Matriz de costes

C Clase realabrir cerrar

ABRIR 0 100 eCM Clase predicha

CERRAR 2000 e 0

• Lo importante no es obtener un clasificador que falle lo menos posible, sino unoque tenga coste menor

La curva ROC

La curva ROC• En muchas situaciones es difícil estimar la matriz de

costes

• Análisis ROC (Receiver Operating Characteristic)

• Usado por vez primera para evaluar radares en lasegunda guerra mundial

• Posteriormente se usó para el análisis de respuestade transistores

• A partir de 1970 se usa para aplicaciones dediagnóstico médico

• A finales de los 90 se comienza a usar en mineríade datos

La curva ROC•

La curva ROC

• Convex hull (casco convexo) a partir de la poligonaluniendo varios puntos (FPR, TPR)

• Dichos puntos pueden provenir de variosclasificadores o de un mismo clasificador (variando elumbral)

La curva ROCSeleccionando el mejor clasificador

• Si cada punto de la curva ROC representa un clasificador:escoger el que tenga mayor valor de: FPcost

FNcost· Neg

• Si cada punto de la curva ROC corresponde a un umbral con elque se toma la decisión: seleccionar el clasificador con mayorárea bajo la curva (AUC)

Tema 5: Evaluación de Modelos de Clasicación Supervisada · Algoritmo Inductor M 4 M 2 M 3 1er...

Documents

Transcript of Tema 5: Evaluación de Modelos de Clasicación Supervisada · Algoritmo Inductor M 4 M 2 M 3 1er...

40.009 MKM3 Gkerz Fold sp - tallerdemecanica.com · Duraterm Ceramix Bosch, los motores Diesel arrancan de forma más rápida, segura y menos contaminante. ... Todo en ESI[tronic],

Rocas miloníticas indicadoras de la deformación progresiva ... · dirección de flujo hacia ... en formaciones pelíticas son de tipo «Kink-fold» y «chevron» de planos ... en

Definición y clasificación de las avenidas torrenciales y su ...Denición y clasicación de las avenidas torrenciales y su impacto en los Andes colombianos 245 ante avenidas torrenciales.

040207-2019-CLO-Guia Canales-8.5x11-3 FoldTitle: 040207-2019-CLO-Guia Canales-8.5x11-3 Fold Created Date: 5/20/2019 6:40:17 PM

Please fold you card in half “hotdog style”

Técnicas Multivariadas Avanzadasclopez/Tecnicas/Remuestreo.pdf · Validación cruzada Bootstrap Conjunto de entrenamiento y validación Validación cruzada K-fold Validación cruzada

fold - Amazon Simple Storage Services3.amazonaws.com/reeve-assets-production/AD-GuideSP_adultweb-5 … · *ATENCIÓN DOCTOR* Las siguientes recomendaciones de tratamiento son pertinentes

PINCEL - Alberto Muñoz - Almacenes de ferretería· Filtro RECAMbIO Campos · 7L · 10L · 16L · 25L · 32L · 42L · Mod. Fold´n Clásica · 13L · Porta bOtELLAS · 1,5L · 12v

MAKE ADJUSTMENTS FOR ROLL FOLD. MAKE ADJUSTMENTS …

SCOTTISH FOLD€¦ · SCOTTISH FOLD (pág. 10) PROBLEMAS CON EL ARENERO (pág. 18) PROTAGONISTAS DE DON GATO (pág. 21) CONSEJOS DE SALUD (pág. 22) (pág.23) NOTICIAS Y SUGERENCIAS

IDENTIFICACIÓN Y CLASICACIÓN DE LOS DISTINTOS TIPOS DE … · principalmente relacionadas con la factibilidad de su recolección, con lo que se determinó ... Para efectos de este

Puerta Plegable MERIK- FOLD - Soy Merik - Inicio sesión · 2013-06-20 · plegable MERIK-FOLD ® sirve para un uso: • De ahorro de energía medioambiental • De salud en el trabajo

Manual de usuario de Igo Fold - Accessible Madrid

Sumario - UNAM · 2018. 5. 16. · 484 . Curso de Derecho Internacional bajo esta clasicación. Por otro lado, se argumenta que ste trmino debe ser interpretado de acuerdo con la

SLID FOLD · 2021. 7. 26. · 7 Cerramientos Exteriores / Exterior Doors / Portes Extérieures / Aussentüren ESP FRA DEU ENG SLIDFOLD Ref. Descripción U. Img. 2822 PFS. SLIDFOLD

LA PANTALLA CON MARCO DESARMABLE FAST FOLD, AMERICAN SCREENS,ESTA COMPUESTA POR UNA TELA PLASTICA ESPECIAL PARA RETROPROYECCION O PROYECCION FRONTAL,

PORTA A LIBRO BI-FOLD DOOR FALTTüR PORTE PLIANTE PUERTA PLEGABLE · 2020-07-08 · universal 198h istruzioni di montaggio & manuale di cura e manutenzione porta a libro bi-fold door

C es para la...los objetos de grupo (que es casi 3). La primera vez que realmente le introdujo en el concepto de clasicación o clasicación estaba con hojas y semillas . Le tomó

IDENTIFICACIÓN Y CLASICACIÓN DE LOS DISTINTOS TIPOS …

©2011 Tina Garceau Happy Halloween! · 10/31/2011 · Happy Halloween! ©2011 Tina Garceau fold fold. Created Date: 10/13/2011 8:49:14 PM ...

fold - Amazon Simple Storage Services3.amazonaws.com/reeve-assets-production/AD-GuideSP_adultweb-5 … · ATENCIÓN DOCTOR Las siguientes recomendaciones de tratamiento son pertinentes