SUPPORT VECTOR MACHINE-BorjaNunez.pdf

Post on 20-Oct-2015

71 views 1 download

Transcript of SUPPORT VECTOR MACHINE-BorjaNunez.pdf

SUPPORT VECTOR MACHINE

En grupos de 2 personas desarrolla los siguientes ejercicios:

INTRODUCCIÓN

1. Usar Support Vector Machines para construir un clasificador de spams. Se necesitará bajar el

código inicial (starter code) y desempaquetar su contenido al directorio donde se desee completar

el ejercicio. Si es necesario, usar el comando cd en Octave para cambiar al directorio antes de

empezar los ejercicios. Además se puede encontrar instrucciones de instalación de Octave en la

página Octave Installation.

Archivos incluidos en este ejercicio:

Ex6.m – script en Octave para la primera mitad del ejercicio.

Ex6data1.mat – Conjunto de datos ejemplo 1.

Ex6data2.mat – Conjunto de datos ejemplo 2.

Ex6data3.mat – Conjunto de datos ejemplo 3.

svmTrain.m – Función de entrenamiento de SVM

svmPredict.m – Función de predicciónn SVM

plotData.m – Datos ploteados en 2D

visualizeBoundaryLinear.m – Límites lineales ploteados

visualizeBoundary.m – Límites no lineales ploteados

linearKernel.m – kernel lineal para SVM

gaussianKernel.m – Kernel gausiano para SVM.

dataser3Params.m – Parámetros para usar con el conjunto de datos 3.

Ex6_spam.m – Script en Octave para la segunda mitad del ejercicio.

spamTrain.mat – Conjunto de entrenamiento Spam

spamTest.mat – Conjunto de test Spam

emailSample1.txt – email de ejemplo 1

emailSample2.txt – email de ejemplo 2

spamSample1.txt – ejemplo de Spam 1

spamSample2.txt – ejemplo de Spam 2

vocab.txt – lista de vocabulario

getVocabList.m – cargar la lista de vocabulario

porterStemmer.m – Función stemming

readFile.m – lee un archivo en un string de caracteres.

processEmail.m – preprocesamiento de emails.

emailFeatures.m – Extracción de características desde emails.

indica archivos que necesitas completar

A través de este ejercicio, usarás los scripts ex6.m.

Este script configura el conjunto de datos para los problemas y hacen llamadas a funciones que tu

escribirás. No necesitas modificar ninguno de ellos. Solo requieres modificar las funciones en los

otros archivos, siguiendo estas instrucciones.

Los ejercicios usan Octave, un lenguaje de programación de alto nivel para computaciones

numéricas. Puedes referirte a la página de ayuda para la instalación del mismo.

(https://class.coursera.org/ml/wiki/view?page=OctaveInstallation)

SUPPORT VECTOR MACHINES

En la primera mitad de este ejercicio, se usará support vector machines (SVMs) con varios

ejemplos de conjuntos 2D. Al ir probando estos conjuntos nos ganaremos una intuición de cómo

SVM trabaja y cómo se usa el kernel gausiano con SVMs. En la siguiente mitad del ejercicio se

usará support vector machines para construir un clasificador de spam.

El archivo ex6.m ayudará paso a paso a desarrollar la primera mitad de esta práctica.