UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor:...
Transcript of UNIVERSIDAD CENTRAL DEL ECUADOR FACULTAD DE … · Autor: Luis Felipe Torres Luzon´ Tutor:...
UNIVERSIDAD CENTRAL DEL ECUADOR
FACULTAD DE INGENIERIA, CIENCIAS FISICAS Y MATEMATICA
CARRERA DE INGENIERIA INFORMATICA
DISENO E IMPLEMENTACION DE UN MODELO DE INTENCION DE VOTO EN EL
PROCESO DE ELECCIONES PRESIDENCIALES 2017
TRABAJO DE GRADUACION PREVIO A LA OBTENCION DEL TITULO DE
INGENIERO INFORMATICO
AUTOR: LUIS FELIPE TORRES LUZON
TUTOR: ING. JEFFERSON TARCISIO BELTRAN MORALES
QUITO - 01 DE NOVIEMBRE
2016
AUTORIZACION DE LA AUTORIA INTELECTUAL
Yo, TORRES LUZON LUIS FELIPE en calidad de autor del trabajo de titulacion, modalidad
proyecto integrador: “Diseno e implementacion de un modelo de intencion de voto en el
proceso de elecciones presidenciales 2017”, autorizo a la Universidad Central del Ecuador
hacer uso de todos los contenidos que me pertenecen o parte de los que contiene esta obra, con
fines estrictamente academicos o de investigacion.
Los derechos que como autor me corresponden, con excepcion de la presente autorizacion,
seguiran vigentes a mi favor, de conformidad con lo establecido en los artıculos 5, 6, 8; 19 y
demas pertinentes de la Ley de Propiedad Intelectual y su Reglamento.
Asimismo, autorizo a la Universidad Central del Ecuador para que realice la digitalizacion
y publicacion de este trabajo de investigacion en el repositorio virtual, de conformidad a lo
dispuesto en el Art. 144 de la Ley Organica de Educacion Superior.
En la ciudad de Quito, al 01 dıa del mes de noviembre de 2016.
Luis Felipe Torres Luzon
CC. 1718122706
Telefono: 0991911389
lucho [email protected]
ii
CERTIFICACION DEL TUTOR
Yo, Jefferson Tarcisio Beltran Morales en calidad de tutor del trabajo de titulacion: Diseno e
implementacion de un modelo de intencion de voto en el proceso de elecciones presidencia-
les 2017, elaborado por la estudiante Torres Luzon Luis Felipe de la Carrera de Informatica,
Facultad de Ingenierıa Ciencias Fısicas y Matematica de la Universidad Central del Ecuador,
considero que el mismo reune los requisitos y meritos necesarios en el campo metodologico y
en el campo epistemologico, para ser sometidos a la evaluacion por parte del jurado examinador
que se designe, por lo que lo APRUEBO, a fin de que el proyecto integrador sea habilitado para
continuar con el proceso de titulacion determinado por la Universidad Central del Ecuador.
Telefono: 0998014043
iii
INFORME DE LOS REVISORES
iv
v
DEDICATORIA
A mis padres
Mercy Luzon y Luis Torres
AGRADECIMIENTOS
Yo agradezco a mis padres que han dado todo el esfuerzo para que yo ahora este culminando
esta etapa de mi vida.
A la Universidad Central del Ecuador, facultad de Ingenierıa Ciencias Fısicas y Matematica,
alma master de la ciencia que me formo como Ingeniero Informatico.
A mi tutor Ing. Jefferson Beltran por su vision crıtica, por sus conocimientos, su rectitud como
docente, por los consejos que me ayudo para el desarrollo de este proyecto integrador.
De igual manera al docente universitario, guıa academico e impulsador de buenas practicas pro-
fesionales y actitudes frente a la vida y la sociedad ecuatoriana.
A mi grupo Scout por ensenarme a ser un hombre responsable y fiel a mis principios ensenando-
me que la palabra imposible no existe, “Todo cuanto de mi dependa”.
Como olvidarme de mis companeros y amigos que compartimos buenos y malos momentos
demostrando que la verdadera amistad existe.
Gracias ...
vii
CONTENIDO
pag.
AUTORIZACION DE LA AUTORIA INTELECTUAL ii
CERTIFICACION DEL TUTOR iii
INFORME DE LOS REVISORES iv
DEDICATORIA vi
AGRADECIMIENTOS vii
LISTA DE CONTENIDO viii
LISTA DE TABLAS xi
LISTA DE FIGURAS xii
LISTA DE ANEXOS xiii
GLOSARIO xiv
RESUMEN xvi
ABSTRACT xvii
INTRODUCCION 1
1 MARCO TEORICO 3
1.1 Redes Sociales . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 Redes sociales en la actualidad . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Reglas en la Red . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.3 Polıtica en Redes Sociales . . . . . . . . . . . . . . . . . . . . . . . . 5
viii
1.1.4 Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.5 APIs de Twitter . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.2 Procesamiento de lenguaje natural . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2.1 Problematica del procesamiento del lenguaje natural . . . . . . . . . . 8
1.3 Minerıa de opinion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.4 Polaridad de opinion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.5 Funciones para la estimacion de sentimientos . . . . . . . . . . . . . . . . . . 11
1.5.1 classify polarity . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5.2 score.sentiment . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 Analisis factorial de correspondencias . . . . . . . . . . . . . . . . . . . . . . 12
2 METODOLOGIA DE DESARROLLO 14
2.1 Metodologıas para Minerıa de Datos . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 CRISP-DM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.3 Fase de Comprension del Negocio . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.1 Objetivos del negocio . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.2 Valoracion de la situacion . . . . . . . . . . . . . . . . . . . . . . . . . 25
2.3.3 Definicion de objetivos de Minerıa de Datos . . . . . . . . . . . . . . . 26
2.3.4 Plan de proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.4 Fase de Comprension de los datos . . . . . . . . . . . . . . . . . . . . . . . . 29
2.4.1 Recoleccion de datos iniciales . . . . . . . . . . . . . . . . . . . . . . 29
2.4.2 Datos para el modelo de popularidad . . . . . . . . . . . . . . . . . . . 30
2.4.3 Exploracion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . 30
2.4.4 Verificacion de la calidad de los datos . . . . . . . . . . . . . . . . . . 31
2.5 Fase de Preparacion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.1 Seleccion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.2 Limpieza de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.5.3 Construccion de nuevos datos . . . . . . . . . . . . . . . . . . . . . . 35
2.5.4 Integracion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2.6 Fase de Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6.1 Generacion de plan de pruebas . . . . . . . . . . . . . . . . . . . . . . 37
ix
2.6.2 Generacion del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 39
2.6.3 Evaluacion del Modelo . . . . . . . . . . . . . . . . . . . . . . . . . . 41
2.7 Fase de Implementacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.7.1 Plan de Implementacion . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.7.2 Mantenimiento y Monitorizacion . . . . . . . . . . . . . . . . . . . . . 43
3 RESULTADOS 44
3.1 Modulo de Popularidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
3.2 Modulo Candidatos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.3 Modulo de Seleccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.4 Modulo Comentarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.5 Modulo Tuiteros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.6 Modulo Palabras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
3.7 Modulo Mapa Tuitero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
4 CONCLUSIONES 59
5 RECOMENDACIONES 61
6 BIBLIOGRAFIA 62
7 ANEXOS 65
x
LISTA DE TABLAS
pag.
1 Problemas y soluciones en la limpieza de datos . . . . . . . . . . . . . . . . . 20
2 Plan de proyecto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
3 Cuentas de Twitter de precandidatos . . . . . . . . . . . . . . . . . . . . . . . 29
4 Descripcion de los Datos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
5 Datos obtenidos con TwitteR. . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
6 Dimensiones geograficas del mapa de Ecuador . . . . . . . . . . . . . . . . . 34
7 data.frame del modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
8 Matriz de confusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
9 Parametros de score.sentiment . . . . . . . . . . . . . . . . . . . . . . . . . . 40
10 Modelo de popularidad . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
11 Matriz de confusion para evaluacion . . . . . . . . . . . . . . . . . . . . . . . 42
12 Resultados de evaluacion del modelo . . . . . . . . . . . . . . . . . . . . . . . 42
13 Cuentas de Twitter y acronimo de precandidatos . . . . . . . . . . . . . . . . 44
14 Numero de seguidores de precandidatos agosto 2016 . . . . . . . . . . . . . . 45
15 Numero de tuiteros que han comentado por precandidato en diferentes fechas . 47
16 Numero de comentarios (+, -, N) por precandidato en diferentes fechas . . . . . 52
17 Tuiteros que comentan con mayor frecuencia por precandidato . . . . . . . . . 53
18 Palabras positivas y negativas con mayor frecuencia en los precandidatos . . . . 56
xi
LISTA DE FIGURAS
pag.
1 Esquema general para detectar la polaridad de las opiniones . . . . . . . . . . . 11
2 Proceso KDD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
3 Modelo de proceso CRISP-DM . . . . . . . . . . . . . . . . . . . . . . . . . . 15
4 Fases de la metodologıa SEMMA . . . . . . . . . . . . . . . . . . . . . . . . 16
5 Variables P3TQ . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
6 Fase de Comprension del negocio . . . . . . . . . . . . . . . . . . . . . . . . . 18
7 Fase de Comprension de los datos . . . . . . . . . . . . . . . . . . . . . . . . 19
8 Fase de Preparacion de los datos . . . . . . . . . . . . . . . . . . . . . . . . . 21
9 Fase de Modelado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
10 Fase de Evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
11 Fase de Distribucion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
12 Tabla de localizacion despues de la limpieza . . . . . . . . . . . . . . . . . . . 34
13 Tuitero y resultado de sus comentarios . . . . . . . . . . . . . . . . . . . . . . 35
14 Tabla de localizacion por tuitero . . . . . . . . . . . . . . . . . . . . . . . . . 36
15 Frecuencia de palabras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
16 Tuitero y polaridad de sus comentarios . . . . . . . . . . . . . . . . . . . . . . 41
17 Tuits de evaluacion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
18 Grafica de seguidores en Twitter . . . . . . . . . . . . . . . . . . . . . . . . . 45
19 Comparacion de numero de tuiteros que comentan . . . . . . . . . . . . . . . 46
20 AFC de precandidatos Fecha 1 . . . . . . . . . . . . . . . . . . . . . . . . . . 48
21 AFC de precandidatos Fecha 2 . . . . . . . . . . . . . . . . . . . . . . . . . . 48
22 Modulo de seleccion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
23 Comparacion de comentarios por precandidato N◦1 . . . . . . . . . . . . . . . 50
24 Comparacion de comentarios por precandidato N◦2 . . . . . . . . . . . . . . . 51
25 Modulo de Tuiteros frecuentes . . . . . . . . . . . . . . . . . . . . . . . . . . 52
xii
26 Modulo Palabras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
27 Modulo Mapa Tuitero . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
LISTA DE ANEXOS
pag.
Anexo A: Diccionario de palabras Positivas y Negativas . . . . . . . . . . . . . . . . . . 65
xiii
GLOSARIO
@: se usa para indicar nombres de usuario en los Tweets, por ejemplo: ”¡Hola, @twitter!”. Los
usuarios utilizan tu @nombredeusuario para mencionarte en Tweets, enviarte mensajes o
proporcionar un vınculo a tu perfil.
@nombredeusuario: el nombre de usuario es lo que te identifica en Twitter y va siempre
directamente precedido por el sımbolo @. Por ejemplo, el nombre de usuario de Katy
Perry es @katyperry.
#: consulta etiqueta
ETIQUETA: es cualquier palabra o frase precedida directamente por el sımbolo #. Cuando
hagas clic en una etiqueta, veras todos los demas Tweets que incluyen esa palabra clave
o tema.
RETWEET, RT: se denomina Retweet a un Tweet que reenvıas a tus seguidores. Generalmen-
te se usan para compartir noticias y demas contenido interesante publicado en Twitter, y
siempre mantienen su atribucion original.
RETWITTEAR: se refiere al acto de compartir el Tweet de otro usuario con todos tus segui-
dores haciendo clic en el boton Retwittear.
SEGUIDOR: se trata de otro usuario de Twitter que te sigue para ver tus Tweets en su crono-
logıa de Inicio.
SEGUIDORES: este numero indica cuantas personas te siguen y a cuantas personas sigues.
Las cifras aparecen en tu perfil de Twitter.
SEGUIR: la suscripcion a una cuenta de Twitter se denomina ”seguimiento”. De este modo,
podras ver sus nuevos Tweets apenas se publiquen. Cualquier usuario de Twitter puede
seguir o dejar de seguir a otros en cualquier momento, con la excepcion de las cuentas
bloqueadas.
xiv
TWEET: tambien llamado tuit tiene un lımite de 140 caracteres y puede contener vınculos,
fotos y videos.
xv
RESUMEN
TEMA: “DISENO E IMPLEMENTACION DE UN MODELO DE INTENCION DE VOTO
EN EL PROCESO DE ELECCIONES PRESIDENCIALES 2017”.
Autor: Luis Felipe Torres Luzon
Tutor: Jefferson Tarcisio Beltran Morales
Este proyecto tiene como finalidad crear un modelo para medir la popularidad de un candidato
en las elecciones presidenciales de Ecuador para el ano 2017, utilizando Twitter como la red
social para el analisis.
En el desarrollo de este proyecto como paso primario es la eleccion de personalidades polıticas
mas sonadas del paıs en el mes de mayo de 2016, por cada uno de ellos se extrae los tuits don-
de los mencionan, consecutivamente someterlos a la limpieza de su texto para poder emplear
minerıa de opinion mediante un metodo supervisado, sirviendose de la funcion score.sentiment
de R para determinar la polaridad de cada tuit, ası generar el modelo de popularidad a traves de
la clasificacion de opiniones generadas por un tuitero. Con los datos obtenidos del modelo se
realiza varios analisis que muestran graficamente la aceptacion que tiene cada precandidato.
Este proyecto sigue la metodologıa CRISP-DM para proyectos de Minerıa de datos y la utiliza-
cion de R como lenguaje de programacion que tiene un enfoque estadıstico siendo muy popular
en el campo de la Minerıa de datos, ademas de la visualizacion de resultados mediante la li-
brerıa Shiny que permite realizar aplicaciones web.
PALABRAS CLAVE: RED SOCIAL TWITTER / METODOLOGIA CRISP-DM /
MINERIA DE OPINION / LENGUAJE DE PROGRAMACION R / FUNCION
SCORE.SENTIMENT / SHINY PAQUETE DE R
xvi
ABSTRACT
TOPIC: “DESIGN AND IMPLEMENTATION OF A VOTING INTENTION MODEL FOR
THE PRESIDENTIAL ELECTIONS OF 2017”.
Author: Luis Felipe Torres Luzon
Tutor: Jefferson Tarcisio Beltran Morales
The purpose of this Project is to create a model to measure the popularity of a candidate in
the presidential elections to be held in Ecuador in 2017, using Twitter as the social media for
the analysis. The first step for the development of this project was to choose the most relevant
political personalities in the country during May 2016. Tweets related to each one of them
were extracted in order to clean them up and be able to establish their opinions of the users
through the score.sentiment function of R, so the trend of each tweet could be determined, and
generating therefore the popularity model classifying the general opinions generated by a user
of Twitter. With the data obtained several analysis are performed, which graphically show the
acceptance each candidate has. This project follows the methodology CRISP-DM for projects
of Data Mining, and the use of R as a programming language, which has a statistic approach and
is very popular in Data Mining; also, the library Shiny, which allows to make web applications,
was used to visualize the results.
KEY WORDS: SOCIAL NETWORK TWITTER / CRISP-DM METHODOLOGY / DATA
MINING / PROGRAMMING LANGUAGE R / FUNCTION SCORE.SENTIMENT / SHINY
PACKAGE OF R
xvii
INTRODUCCION
En la actualidad las redes sociales forman una interaccion social permanente que involucra a
personas, grupos y organizaciones; conectados por diferentes tipos de relaciones tales como
gustos, aficiones, polıtica, etc., que proporcionan informacion para la toma de decisiones.
Polıticos estan tomando en serio las publicaciones en diferentes redes sociales para enterarse de
su popularidad y ası realizar adecuadamente sus acciones de campana.
La falta de un Analizador de Sentimientos que permita catalogar opiniones mediante tecnicas
de minerıa de datos en redes sociales que se considera costoso y trabajoso, hace que necesiten
herramientas de minerıa de texto que permita alcanzar resultados sobre la opinion de una per-
sona hacia un polıtico.
Profundizar en Twitter por la brevedad de sus mensajes, facilidad de publicacion y ademas
de la simplicidad de extraccion de informacion, nos hace inclinarnos por tratar de conocer el
contexto de cada tuit por personalidad polıtica.
El objetivo principal es crear un modelo que permita medir la popularidad de un polıtico utili-
zando Twitter como la red social para el analisis. El interes de hacer un modelo es comprender
de que manera los tuiteros escriben hacia una personalidad polıtica y conocer su popularidad a
traves del valor de cada tuit que puede ser positivo, negativo o neutral.
Al analizar los tuits se emplea minerıa de opinion para clasificar su polaridad con aproxima-
ciones supervisadas al necesitar a priori un diccionario de palabras positivas y negativas.
Se aprovecha el lenguaje de programacion R para: extraccion, limpieza y procesamiento del
modelo por cada polıtico, ademas de la utilizacion de la librerıa ShinyR con la finalidad de
crear una aplicacion web para la presentacion de resultados.
Las limitaciones al momento de extraer la informacion de un tuitero estan sujetas a Twitter
1
y para las coordenadas geograficas por Google Maps. Como una limitacion al analizar el lexico
de los tuits se encuentra las reglas gramaticales que tiene el idioma espanol. La aplicacion no
contara con un analisis en lınea, se propone en proyectos futuros la realizacion de ella.
Para abordar la tematica, este proyecto de titulacion se estructuro en tres capıtulos:
En el capıtulo I contiene los fundamentos teoricos que sustenta este proyecto, se conocera la
importancia de las redes sociales en el ambiente polıtico. Se adentrara en el ambiente de minerıa
de opinion y sus diferentes funciones que proporciona R para realizar este tipo de analisis.
En el capıtulo II se encuentra la descripcion del modelo de popularidad, ademas de la meto-
dologıa de minerıa de datos a utilizar en el proceso de desarrollo del proyecto definiendo los
objetivos y el plan de proyecto.
En el capıtulo III los resultados expuestos en una aplicacion web que tiene como modulos
al analisis de cada agente polıtico como: frecuencia de palabras positivas y negativas, tuite-
ros frecuentes y mapa de tuiteros. Se encuentra graficas comparando a todos los precandidatos
segun: numero de seguidores, numero de tuiteros que comentan y la relacion entre los niveles
de opinion mediante analisis factorial de correspondencia (AFC).
Para finalizar se presenta las conclusiones y recomendaciones de acuerdo a los resultados obte-
nidos en el proceso.
2
1. MARCO TEORICO
El presente trabajo analiza la construccion de un modelo que permita medir la popularidad de
un polıtico utilizando Twitter. En este sentido, es conveniente explicar algunos conceptos. En
primer termino, el abordaje de las redes sociales en la actualidad y el porque de la utilizacion
de twitter en este proyecto. Se necesita comprender la problematica del lenguaje espanol para
el procesamiento de lenguaje natural en los tuits, para emplear minerıa de opinion o tambien
llamado analisis de sentimiento que ayudara averiguar que tipo de polaridad tiene cada tuit
empleando un tipo de aproximacion. Al tener muestras diferentes, producto del resultado de
la polaridad de cada tuit para diferentes polıticos se determino realizar el analisis factorial de
correspondencia (AFC), se resumira su funcionamiento y como ayudo al momento de evaluar a
cada actor polıtico.
1.1. Redes Sociales
Freeman et al. (1992) afirman.“Una red social consiste, en esencia, de dos elementos: una po-
blacion de actores y por lo menos una relacion que sea medible, definida para cada par de
actores”. Los actores pueden ser entidades sociales en cualquier nivel de agregacion (personas
u otros organismos individuales, o colectividades, como unidades familiares, organizaciones o
paıses). Las relaciones pueden comprender cualquier accion, actividad, transaccion, obligacion,
sentimiento u otro tipo de conexiones entre pares, o entre subgrupos de actores. (Schmidt, 2002)
1.1.1. Redes sociales en la actualidad
“Con las redes sociales ahora todos podemos ser reporteros callejeros, denunciantes, trolls y
hasta estrellas en Internet”(AMERICATV, 2009 May 21).
La importancia de las redes sociales en la actualidad es indiscutible, al darles la herramienta de
la expresion a las personas para que puedan comunicarse de manera inmediata y dar dominio a
sus opiniones y contenidos. Esto convierte a la red social en un potente instrumento social. Su
funcionalidad y presencia tiene una repercusion en la sociedad, su impacto, global como local,
se incrementa y desarrolla a cada minuto, que dan lugar a cambios trascendentales para grupos
e individuos.
3
Segun Alcazar (2016) del blog de Formacion General, las redes sociales mas utilizadas en Ecua-
dor (actualizacion al 6 de enero 2016) son: YouTube, Facebook, Ask y Twitter.
YouTube encargado de subir y compartir videos, Facebook basada en compartir actualizacio-
nes de estado, enlaces y contenido multimedia, ASK permite hacer preguntas en anonimato y
por otro lado se encuentra Twitter compartiendo mensajes de 140 caracteres donde los usuarios
estan en una especie de chat universal.
1.1.2. Reglas en la Red
Christakis et al. (2010) propone algunas reglas en la red que explican por que los vınculos
pueden hacer que el todo sea mayor que la suma de las partes. Las reglas que sugiere son:
Somos nosotros quienes damos forma a nuestra red Depende de nosotros con que persona
queremos relacionarnos, si son familia, conocidos, partidarios, proveedores, etc. Depende
de nosotros que lugar queremos que ocupemos en ellas.
Nuestra red nos da forma a nosotros Nuestro lugar en la red nos afecta, el numero de con-
tactos de nuestros amigos y de nuestra familia tambien es relevante, somos susceptibles a
las influencias de la red.
Nuestros amigos nos influyen Aquello que fluye por las conexiones tambien es crucial, las
redes sociales transportan todo tipo de cosas de una persona a otra. Lo normal es que toda
persona mantenga muchos vınculos directos con una gran variedad de gente incluida la
familia, vecinos, amigos hasta partidos polıticos y cada uno de estos vınculos nos ofrece
oportunidades de influir y de recibir influencias.
Los amigos de los amigos de nuestros amigos tambien nos influyen Resulta que las perso-
nas no solo copian a sus amigos, sino que tambien copian a los amigos de sus amigos y a
los amigos de los amigos de sus amigos.
La red tiene vida propia Las redes sociales pueden tener propiedades y funciones que sus
miembros ni controlan ni perciben.
4
1.1.3. Polıtica en Redes Sociales
Muchas de las personalidades publicas tienen su blog1, pagina web2, canal en YouTube3, su
fanpage4 en las redes sociales mas utilizadas, esto permite que esten conectados con su gente,
ademas de ser participativos interactuando o brindando una opinion en breves segundos en sus
cuentas. Un ejemplo de esto es el polıtico Guillermo Lasso que tiene actividad en diferentes
sitios y de manera actualizada en cada una de ellas:
Canal de YouTube: https://www.youtube.com/user/LassoGuillermo
Fanpag Facebook:https://www.facebook.com/LassoGuillermo
Twitter: https://twitter.com/LassoGuillermo
Blog: http://guillermolasso.ec/blog
Pagina Web: http://guillermolasso.ec/
Tener presencia en las redes sociales es importante y mas aun si son en epocas de elecciones,
los polıticos aumentan sus movimientos en sus cuentas de Facebook y Twitter sobre todo en
la ultima donde el debate polıtico es mas profundo por las caracterısticas de su red. Segun
Domınguez (2009) no hay que ponderar la importancia de una figura polıtica segun la cantidad
de seguidores que tenga en una red social. Esta herramienta es util solamente si se usa como
medio de comunicacion alternativo, no como una encuesta de afiliacion ciudadana.
Para Trivinho (2011) la visibilidad en los medios se caracteriza cada vez mas por la interme-
diacion, en que rapidamente texto, imagenes y sonidos pasan de un contexto local a otro y en
la circularidad de tiempo real: la escena publica de masas se transformo en escenario publi-
co interactivo. Con esto, cada usuario de una red social puede dar sus comentarios e interactuar
con personalidades polıticas dando a conocer su punto de vista de lo que ocurre en la actualidad.
1generalmente de caracter personal, con una estructura cronologica que se actualiza.2documento o informacion electronica capaz de contener texto, contenido multimedia, programas, enlaces, y
muchas otras cosas que puede ser accedida mediante un navegador.3pagina principal para una cuenta de YouTube, se muestra los videos publicos que han subido.4es visible para todos, no esta condicionada a la incorporacion del usuario en tu relacion de amigos. La pagina
estara visible para todo el que acceda a ella a traves de un simple me gusta.
5
Al tener varias redes sociales en la actualidad, se elige Twitter para el desarrollo de este pro-
yecto, al ser una red donde el debate polıtico es mas profundo por la caracterıstica de sus tuits
(texto de 140 caracteres) donde todos se encuentran en un chat virtual, ademas de la facilidad
de extraccion de datos que proporciona Twitter.
1.1.4. Twitter
Twitter es la red social favorita de todos los usuarios de medios de comunicacion y de los co-
municadores en sentido general. Es un medio sumamente veloz, agil y versatil al cual puedes
sacarle muchısimo provecho en todo el sentido de la palabra. Twitter recibe un estimado de 250
millones de visitas al mes. (Comohackear, 2016)
Twitter proporciona diferentes formas para la extraccion de sus datos, a continuacion, se men-
ciona las diferentes maneras que se puede utilizar con la intervencion de sus APIs.
1.1.5. APIs de Twitter
Una API (siglas de ’Application Programming Interface’) es un conjunto de reglas (codigo) y
especificaciones que las aplicaciones pueden seguir para comunicarse entre ellas: sirviendo de
interfaz entre programas diferentes de la misma manera en que la interfaz de usuario facilita la
interaccion humano-software. (TICbeat, 2014)
Como Twitter no puede ser la excepcion esta nos permite que cualquiera pueda crear aplicacio-
nes que comunique con el servicio de Twitter.
Twitter tiene tres tipos de APIs: REST API, Search API y Streaming API que son para las
diferentes necesidades que se los requiera.
REST API ofrece a los desarrolladores el acceso al core de los datos de Twitter. Todas las
operaciones que se pueden hacer vıa web son posibles realizarlas desde el API. Soporta
los formatos: xml, json, rss, atom
Search API suministra los tweets con una profundidad en el tiempo de 7 dıas que se ajustan
a la query solicitada. Es posible filtrar por, cliente utilizado, lenguaje y localizacion. No
requiere autenticacion y los tweets se obtienen en formato json o atom.
6
Streaming API Se establece una conexion permanente por usuario con los servidores de Twit-
ter y mediante una peticion http se recibe un flujo continuo de tweets en formato json.
Para el blog (Barriblog, 2010) Las APIs de Twitter tienen algunas limitaciones, en el Streaming
API el flujo es continuo y la velocidad de recepcion de tweets tuvo fluctuaciones que dependie-
ron del ancho de banda de los dos extremos de la conexion y la sobrecarga de los servidores de
Twitter. En el Search API y en el REST API existio una limitacion de 150 peticiones a la hora
por usuario o por IP si la llamada no estuvo autenticada.
“Tenga en cuenta que el ındice de busqueda tiene un lımite de siete dıas. En otras palabras, no
hay tweets que se pueden encontrar para una fecha mas de una semana”(Twitter, 2016).
1.2. Procesamiento de lenguaje natural
Cortez et al. (2009) dice que una de las tareas fundamentales de la Inteligencia Artificial (IA) es
la manipulacion de lenguajes naturales usando herramientas de computacion, en esta, los len-
guajes de programacion juegan un papel importante, ya que forman el enlace necesario entre los
lenguajes naturales y su manipulacion por una maquina. El PLN consiste en la utilizacion de un
lenguaje natural para comunicarnos con la computadora, debiendo esta entender las oraciones
que le sean proporcionadas, el uso de estos lenguajes naturales, facilita el desarrollo de progra-
mas que realicen tareas relacionadas con el lenguaje o bien, desarrollar modelos que ayuden a
comprender los mecanismos humanos relacionados con el lenguaje. El uso del lenguaje natural
(LN) en la comunicacion hombre-maquina presenta a la vez una ventaja y un obstaculo con
respecto a otros medios de comunicacion.
Para ventaja de la persona, no tiene que trabajar en aprender el medio de comunicacion a dife-
rencia de otros medios de interaccion como las interfaces graficas o los lenguajes de comando.
Su uso todavıa presenta limitaciones pues la computadora tiene una limitada comprension del
lenguaje. Realmente, lo que constituye en ventaja para la comunicacion humana se convier-
te en problema en el tratamiento computacional, ya que implican conocimiento y procesos de
razonamiento.
7
1.2.1. Problematica del procesamiento del lenguaje natural
Al analizar los diferentes textos que generan usuarios en Twitter, se llega a la dificultad de pro-
cesar el lenguaje espanol por sus complejas leyes gramaticales. Vallez y Pedraza (2007) muestra
algunos problemas que se tiene al procesar el lenguaje natural.
A nivel morfologico una misma palabra puede adoptar diferentes variaciones y roles morfo-
sintacticos en funcion del contexto en el que aparece, ocasionando problemas de ambiguedad.
Ejemplo: “Los candidatos presidenciales apuntaron a la conformacion de sus binomios, co-
mo parte importante dentro de su agenda, apuntaron sus posibles nombres en los registros de
CNE.”
La palabra apuntar es ambigua morfologicamente ya que puede ser un verbo transitivo, utiliza-
do para indicar algo o puede ser utilizado indicando que se escribio algo.
A nivel sintactico, centrado en el estudio de las relaciones establecidas entre las palabras para
formar unidades superiores, sintagmas y frases, se produce ambiguedad a consecuencia de la
posibilidad de asociar a una frase mas de una estructura sintactica. Por otro lado, esta variacion
supone la posibilidad de expresar lo mismo, pero cambiando el orden de la estructura sintactica
de la frase.
Ejemplo: “La ministra de la Salud se pronuncio contra el uso del tabaco en el Congreso de
Diputados.”
La interpretacion de la dependencia de los dos, otorga diferentes significados a la frase: (i) La
ministra de Salud se pronuncio contra el uso del tabaco ante el Congreso de Diputados expo-
niendoles el tema o, (ii) La ministra de Salud se pronuncio contra el uso del tabaco por parte de
los miembros que conforman el Congreso de Diputados.
A nivel semantico, donde se estudia el significado de una palabra y el de una frase a partir
de los significados de cada una de las palabras que la componen. La ambiguedad se produce
porque una palabra puede tener uno o varios sentidos, es el caso conocido como polisemia.
Ejemplo: “El candidato presidencial es noble.”
El termino noble puede tener dos significados en esta frase, (i) tıtulo nobiliario y (ii) persona
8
de buen corazon. La interpretacion de esa frase va mas alla del analisis de los componentes que
forman la frase, se realiza a partir del contexto en que es formulada.
Hay que tener en cuenta la variacion lexica que hace referencia a la posibilidad de utilizar
terminos distintos a la hora de representar un mismo significado, es decir el fenomeno conocido
como sinonimia.
Ejemplo: “Coche / Vehıculo / Automovil.”
A nivel pragmatico, basado en la relacion del lenguaje con el contexto en que es utilizado, en
muchos casos no puede realizarse una interpretacion literal y automatizada de los terminos uti-
lizados.
En determinadas circunstancias, el sentido de las palabras que forman una frase tiene que inter-
pretarse a un nivel superior recurriendo al contexto en que es formulada la frase.
Ejemplo: “Se morıa de risa.”
En esta frase no puede interpretarse literalmente el verbo morirse si no que debe entenderse en
un sentido figurado.
Otra cuestion de gran importancia es la ambiguedad provocada por la anafora, es decir, por
la presencia en la oracion de pronombres y adverbios que hacen referencia a algo mencionado
con anterioridad.
Ejemplo: “El ministro indico las propuestas sobre el tema”
La interpretacion de esta frase tiene diferentes incognitas ocasionadas por la utilizacion de pro-
nombres y adverbios: ¿a quien?, ¿Que propuestas?, ¿sobre que tema? Por tanto, para otorgar un
significado a esta frase debe recurrirse nuevamente al contexto en que es formulada.
Con todos los ejemplos expuestos queda patente la complejidad del lenguaje y que su trata-
miento automatico no resulta facil.
9
1.3. Minerıa de opinion
Para Cortizo (2011) cuando hablamos de Minerıa de Opiniones (tambien llamado Analisis del
Sentimiento) nos estamos refiriendo a una serie de aplicaciones de tecnicas del procesamiento
del lenguaje natural y minerıa de textos, que tienen como objetivo la extraccion de informacion
a partir de contenidos generados por los usuarios, como puedan ser comentarios en blogs, re-
views de productos, etc. Con este tipo de tecnologıas podemos ser capaces de extraer un valor
tangible y directo, como pueda ser “positivo” / “negativo”, a partir de un comentario textual.
Regularmente los procesos de minerıa de opinion se dividen en tres fases: Representacion de
los datos, Normalizacion de los datos y Clasificacion.
Encontramos dos tipos de tareas relacionadas con la Minerıa de Opiniones:
Polaridad de una opinion: Determinar si una opinion es positiva o negativa. Se obtiene
un valor numerico dentro de un rango determinado, que de una forma senalada trate de
obtener un rating objetivo asociado a una opinion.
Basado en caracterısticas: Consta de dos etapas: detector de subjetividad y detector de
polaridad. La primera el porcentaje de textos clasificados como subjetivos y la segunda
respecto al porcentaje de texto clasificados como positivos o negativos. Las dos etapas
dependen a una entidad y de una revision humana.
Para el minado de opinion de mensajes con longitud similar a los tuits la clasificacion que
mejor se acopla es la tarea supervisada ası lo expone (Pang y Lee, 2008). Lo que se necesita
para esta tarea es un diccionario de palabras positivas y negativas en espanol que se obtiene de
diccionarios online. Todo este proceso se desarrolla en R por sus diferentes librerıa y funciones
en el ambito de la minerıa de datos.
1.4. Polaridad de opinion
Para Amores et al. (2015) una de las principales tareas de la minerıa de opinion es la clasifica-
cion de la polaridad de la opinion, que consiste en determinar si la opinion es positiva o negativa
con respecto a la entidad a la que se este refiriendo. En la figura 1 se muestra los pasos para
evaluar una opinion.
Cada termino tiene polaridad cuando esta porta informacion subjetiva, bien sea positiva o nega-
10
Figura 1. Esquema general para detectar la polaridad de las opiniones (Amores et al., 2015)
tiva. Para poder resolver la polaridad de un texto podemos utilizar dos metodos: el aprendizaje
automatizado supervisado y la aproximacion no supervisada (Orientacion semantica).
Las aproximaciones supervisadas para la clasificacion de la polaridad de las opiniones son de-
pendientes del dominio de conocimiento, ya que necesitan de datos etiquetados a priori con la
polaridad. En cambio, las aproximaciones no supervisadas generalmente pueden ser aplicadas
a cualquier dominio de conocimiento.
1.5. Funciones para la estimacion de sentimientos
Existen varias tecnicas al momento de estimar un texto y su posible valencia (positiva, negativa o
neutra). Al utilizar R para el desarrollo se encuentran diferentes funciones que nos ayuda para la
minerıa de opinion es este caso se encuentran dos funciones: classify polarity y score.sentiment.
1.5.1. classify polarity
Utiliza un marco probabilıstico, tiene sus fundamentos en el Teorema de Bayes para calcular
la probabilidad de una clase (positiva, negativa). Es una tecnica de clasificacion y prediccion
supervisada, entre sus ventajas esta que su implementacion es muy facil y obtiene buenos resul-
tados de clasificacion en la mayorıa de los casos.
El modelo de probabilidad para un clasificador es:
p(C|F1, ..., Fn) (1)
11
Donde C representa un valor positivo (+) o negativo (−) y F1, F2, ..., Fn factores que representa
las palabras de un tuit. Donde se busca establecer la probabilidad a priori de que un tuit sea
positivo o negativo.
1.5.2. score.sentiment
Es una funcion muy simple que asigna una puntuacion simplemente contando el numero de
ocurrencias de positivos y negativos en un tuit comparando con un diccionario de palabras.
La formula del score:
score = sum(PalabrasPositivas)− sum(PalabrasNegativas) (2)
El exito de esta funcion es tener la mayor cantidad de palabras positivas y negativas, existen al-
gunos diccionarios ya cargados con estas palabras uno de ellos es MPQA que se puede obtener
desde http://mpqa.cs.pitt.edu/corpora/mpqa corpus/
Al optar por una funcion de los planteados se decide tomar el score.sentiment ya que en pruebas
realizadas con la funcion classify polarity un tuit que se encuentre vacıo o no encuentra ningu-
na palabra en el diccionario el valor de la opinion siempre sera positivo y esto afectara en el
analisis al comparar con las opiniones negativas.
1.6. Analisis factorial de correspondencias
Al tener varias muestras por cada polıtico se encuentra problemas al querer compararlos a to-
dos, ya que tiene diferentes tamanos, por esa razon se estudia un metodo multivariante para la
ayuda del analisis.
El analisis factorial de correspondencias (AFC) esta especialmente disenado para evaluar las
interacciones entre categorıas de variables cualitativas. El analisis parte de la tabla de contin-
gencia y considera la matriz n x p dado por:
en filas las categorıas A1, A2, ..., An
en columnas las categorıas B1, B2, ..., Bp
12
en una celda de la matriz de contingencia, es el elemento kij que representa el numero de
casos de la categorıa i presente junto con la categorıa j.
Los marginales de fila, columna y total se definen como:
ki =
p∑j=1
kij el total de la fila i
kj =n∑
i=1
kij el total de la columna j
k =∑i
∑j
kij el total de la poblacion
Partiendo de k en AFC (simples en el caso de que la matriz sea 2x2 o multiples en el caso
general).
El metodo evalua la distancia entre filas y columnas.
d2(i, i′) =
p∑j=1
1
fj
(fijfi−
fi′jfi′
)2
(3)
donde f j =kik
de igual forma
d2(j, j′) =
n∑i=1
1
fi
(fijfj−
fij′
fj′
)2
(4)
donde f i =kik
Las cuales buscan establecer la similitud entre categorıa de la variable A o B para luego pro-
yectar la distancia en el plano factorial.
Para el caso de estudio se pretende visualizar la relacion entre los niveles de opinion (+,−, N)
en los diversos agentes polıticos considerados.
13
2. METODOLOGIA DE DESARROLLO
En este proyecto integrador se desarrolla una metodologıa para el desarrollo de proyectos en
Minerıa de Datos, puesto que el estudio, es el analisis de contenido de Twitter hacia una perso-
na involucrado en la polıtica.
2.1. Metodologıas para Minerıa de Datos
En minerıa de datos existen algunas metodologıas que permite hacer del proyecto mejor orga-
nizado, a continuacion, se vera algunas de ellas.
KDD La tecnologıa KDD esta basada en un bien definido proceso KDD de multiples pasos, pa-
ra el descubrimiento de conocimiento en grandes colecciones de datos. El proceso KDD
es iterativo por naturaleza, y depende de la interaccion para la toma de decisiones, de
manera dinamica.(Nigro et al., 2004)
Segun (Moine, 2013) KDD es un proceso iterativo e interactivo. Iterativo ya que la salida
de alguna de las fases puede retroceder a pasos anteriores y porque a menudo son nece-
sarias varias iteraciones para extraer conocimiento de alta calidad. Es interactivo porque
el usuario, o mas generalmente un experto en el dominio del problema, debe ayudar a la
preparacion de los datos y validacion del conocimiento extraıdo.
El modelo de proceso KDD se resume en las siguientes cinco fases de la figura (2)
Figura 2. Proceso KDD (Gonzalez, 2016)
CRISP-DM (CRoss Industry Standard Process for Data Mining) fue presentada en el ano 1999
por las empresas SPSS, Daimer Chrysler y NCR. Es una metodologıa abierta, no esta li-
gada a ningun producto comercial, y fue construida en base a la experiencia de sus crea-
14
dores, es decir desde un enfoque practico.
La metodologıa esta estructurada en un proceso jerarquico, compuesto por tareas descrip-
tas en cuatro niveles diferentes de abstraccion, que van desde lo general a lo especıfico.
CRISP-DM, propone en el nivel mas alto seis fases para el proceso de minerıa de datos
Figura(3) : entendimiento del negocio, entendimiento de los datos, preparacion de los da-
tos, modelado, evaluacion e implementacion. La sucesion de fases, no es necesariamente
rıgida. Cada una de estas fases generales se compone de un conjunto de tareas en las que
Figura 3. Modelo de proceso CRISP-DM (Wirth y Hipp, 2000)
se definen las salidas o entregables que se generan. Si bien la metodologıa no especifica
detalladamente como llevar a cabo cada tarea, los consejos de la seccion “Guıa de Usua-
rioresultan de mucha utilidad y orientacion al momento de ejecutarlas.(Moine, 2013)
SEMMA Creada por SAS Institute, fue propuesta especialmente para trabajar con el software
SAS Enterprise Miner. Si bien en la comunidad cientıfica se conoce a SEMMA como una
metodologıa, en el sitio de la empresa SAS se aclara que este no es el objetivo de la mis-
ma, sino mas bien la propuesta de una organizacion logica de las tareas mas importantes
del proceso de minerıa de datos.
SEMMA establece un conjunto de cinco fases para llevar a cabo el proceso de minerıa Fi-
gura 4: Sample (Muestreo), Explore (Exploracion), Modify (Modificacion), Model (Mo-
15
delado) y Assess (Evaluacion). Esta especialmente enfocada al desarrollo del modelo de
minerıa, y quedan fuera de su alcance otros aspectos del proyecto como el conocimiento
del problema en estudio o la planificacion de la implementacion.
SAS Enterprise Miner organiza sus herramientas (llamadas ?nodos?) en base a las distin-
tas fases que componen la metodologıa. Es decir, el software proporciona un conjunto de
herramientas especiales para la etapa de muestreo, otras para la etapa de exploracion, y
ası sucesivamente. Al igual que en KDD, SEMMA no proporciona una guıa de activida-
Figura 4. Fases de la metodologıa SEMMA (Britos, 2008)
des especıficas a realizar en cada una de sus etapas. Por este motivo existe una discusion
en la literatura acerca de si SEMMA deberıa ser considerada una metodologıa.(Moine,
2013)
Catalyst Pyle recomienda que el proceso de minerıa de datos siempre deberıa colaborar con
una situacion organizacional, como un problema u oportunidad. Recomienda no trabajar
directamente con los datos sino establecer de antemano la problematica que se aborda, el
personal involucrado y las expectativas y necesidades de los usuarios. Este punto resulta
de gran importancia para justificar la realizacion del proyecto, ya que difıcilmente una
organizacion compre una herramienta si no sabe la funcion que cumplira.
Para proyectos donde el problema u oportunidad de negocio no esta definido, se reco-
mienda comenzar analizando las relaciones P3TQ - Product (Producto), Place (Lugar),
Price (Precio), Time (Tiempo) y Quantity (Cantidad) - que existen en la cadena de valor
organizacional. Las relaciones P3TQ se refieren a tener el producto correcto, en el lugar
adecuado, en el momento adecuado, en la cantidad correcta y con el precio correcto.
16
Figura 5. Variables P3TQ (Mendez y Rodrıguez, 2009)
Para este proyecto se utilizo la metodologıa CRISP-DM por ser la mas utilizada (Moine, 2013)
y la que se acopla a las necesidades del presente proyecto.
2.2. CRISP-DM
Basada en el Manual CRISP-DM de IBM SPSS Modeler IBM (2012).
CRISP-DM, que son las siglas de Cross-Industry Standard Process for Data Mining, es un
metodo probado para orientar sus trabajos de minerıa de datos.
Como metodologıa, incluye descripciones de las fases normales de un proyecto, las tareas
necesarias en cada fase.
Como modelo de proceso, CRISP-DM ofrece un resumen del ciclo vital de minerıa de
datos.
En la grafica 3 se observa el ciclo vital del modelo que contiene seis fases con flechas que indi-
can las dependencias mas importantes y frecuentes entre fases. La secuencia de las fases no es
estricta. De hecho, la mayorıa de los proyectos avanzan y retroceden entre fases si es necesario.
A continuacion se describe las fases de la metodologıa.
Fase de Comprension del negocio
Debe dedicar tiempo a explorar las expectativas de su organizacion con respecto a la minerıa
17
de datos. Intente implicar a la mayor cantidad de personas que sea posible en estas discusiones
y documente los resultados. El paso final de la fase de CRISP-DM trata de como producir un
plan de proyecto utilizando la informacion que se contiene en esta documentacion.
Determinacion de los objetivos comerciales, su primera tarea es obtener la maxima infor-
macion posible de los objetivos comerciales de la minerıa de datos.
Valoracion de la situacion, inventario de recursos, requerimientos, supuestos, termino-
logıas propias del negocio
Determinacion de los objetivos de minerıa de datos, cuando trabaje con analistas comer-
ciales y de datos para definir una solucion tecnica al problema comercial, recuerde que
los objetivos deben ser concretos
Produccion de un plan de proyecto, en este punto, ya esta listo para producir un plan para
el proyecto de minerıa de datos. Las cuestiones que haya planteado hasta el momento y
los objetivos comerciales y de minerıa de datos que haya formulado formaran la base de
este plan.
Figura 6. Fase de Comprension del negocio (Wirth y Hipp, 2000)
Fase de Comprension de los datos
La fase de comprension de datos de CRISP-DM implica estudiar mas de cerca los datos dispo-
nibles de minerıa. Este paso es esencial para evitar problemas inesperados durante la siguiente
18
fase (preparacion de datos) que suele ser la fase mas larga de un proyecto.La comprension de
datos implica acceder a los datos y explorarlos con la ayuda de tablas y graficos que se pueden
organizar.
Recopilacion de datos iniciale, provienen de diferentes fuentes.
Descripcion de los datos, existen muchas formas de describir datos, pero la mayorıa de
datos se centra en la cantidad y calidad de los datos; la cantidad de datos disponible y el
estado de los datos.
Exploracion de datos, explorar los datos con las tablas, graficos y otras herramientas
de visualizacion disponibles. Estos analisis pueden ayudarle a describir los objetivos de
minerıa de datos generados durante la fase de comprension comercial.
Verificacion de calidad de datos, los datos no suelen ser perfectos. De hecho, la mayorıa
de los datos contienen errores de codificacion, valores perdidos u otro tipo de incohe-
rencias que hacen que los analisis resulten difıciles en algunas ocasiones. Una forma de
evitar posibles problemas es realizar un analisis de calidad de los datos disponibles antes
de proceder al modelado.
Figura 7. Fase de Comprension de los datos (Wirth y Hipp, 2000)
Fase Preparacion de datos
La preparacion de datos es uno de los aspectos mas importantes y con frecuencia que mas
19
tiempo exigen en la minerıa de datos. De hecho, se estima que la preparacion de datos suele
llevar el 50-70 % del tiempo y esfuerzo de un proyecto. Dedicar los esfuerzos adecuados a las
primeras fases de comprension comercial y comprension de datos puede reducir al mınimo los
gastos indirectos relacionados, pero aun debera dedicar una buena cantidad de esfuerzo para
preparar y empaquetar los datos para la minerıa.
Seleccion de datos, en funcion de la recopilacion de datos inicial realizada en la fase
CRISP-DM anterior, ahora puede comenzar a seleccionar los datos relevantes a sus obje-
tivos de minerıa de datos.
Limpieza de datos, la limpieza de datos implica observar mas de cerca los problemas en
los datos que ha seleccionado incluir en el analisis. En la tabla 1 se observa los tipos de
problemas.
Construccion de nuevos datos, con frecuencia, necesitara construir nuevos datos.
Integracion de datos, no es raro disponer de varios orıgenes de datos para el mismo con-
junto de cuestiones comerciales.
Formato de datos, como paso final antes de la construccion del modelo, es muy util com-
probar si algunas tecnicas requieren aplicar un formato concreto o la clasificacion de los
datos.
Tabla 1
Problemas y soluciones en la limpieza de datos
Problema de datos Solucion posibleDatos perdidos Excluya las filas o caracterısticas. O cumplimentelas con un
valor estimado.Errores de datos Utilice recursos logicos para descubrir errores manuales y
corrıjalos, o, excluya las caracterısticas.Incoherencias de codificacion Decida un esquema de codificacion simple y convierta y
sustituya los valores.Metadatos ausentes oerroneos
Examine manualmente los campos sospechosos y comprue-be el significado correcto.
Problemas que se pueden encontrar en los datos con sus soluciones posibles.
20
Figura 8. Fase de Preparacion de los datos (Wirth y Hipp, 2000)
Fase Modelado
Este es el punto donde todo el duro trabajo anterior comienza a tener sentido. Los datos que ha
preparado se incorporan a las herramientas y los resultados comenzaran a arrojar algo de luz al
problema planteado en Comprension del negocio.
El modelado se suele ejecutar en multiples iteraciones. Normalmente, los analistas de datos eje-
cutan varios modelos utilizando los parametros por defecto y ajustan los parametros o vuelven
a la fase de preparacion de datos para las manipulaciones necesarias por su modelo. Es extrano
que las cuestiones relativas a la minerıa datos de una empresa se solucionen satisfactoriamente
con un modelo y ejecucion unicos.
Seleccion de tecnicas de modelado, aunque pueda tener algunos conocimientos acerca de
los tipos de modelado que sean los mas adecuados para las necesidades de su organiza-
cion, es el momento de tomar la decision de los tipos de modelado que se van a utilizar.
Generacion de un diseno de comprobacion, como paso final antes de generar el modelo,
debe volver a tener en cuenta como se comprobaran los resultados del modelo.
Generacion de los modelos, en este punto, debe tener la preparacion suficiente para ge-
21
nerar los modelos que haya considerado. Tomese el tiempo necesario para experimentar
con diferentes modelos antes de llegar a conclusiones definitivas. La mayorıa de analistas
de datos suelen generar varios modelos y comparar los resultados antes de aplicarlos o
integrarlos.
Evaluacion del modelo, para cada modelo que se va a considerar, es una buena idea crear
un metodo de valoracion basado en los criterios generados en su plan de pruebas. En este
punto puede anadir el modelo generado a la ruta y utilizar graficos de evaluacion o nodos
de analisis para analizar la efectividad de los resultados. Tambien debe tener en cuenta
si los resultados tienen un sentido logico o si son demasiado simples para sus objetivos
comerciales.
Figura 9. Fase de Modelado (Wirth y Hipp, 2000)
Fase Evaluacion
En este punto, habra completado la mayor parte de su proyecto de minerıa de datos. Tambien
habra determinado, en la fase de modelado, que los modelos son tecnicamente correctos y efec-
tivos en funcion de los criterios de rendimiento de minerıa de datos que ha definido previamente.
Sin embargo, antes de continuar, debe evaluar los resultados de sus esfuerzos utilizando los cri-
terios de rendimiento comercial establecidos en el inicio del proyecto. Es la clave para asegurar
que su organizacion pueda utilizar los resultados que ha obtenido.
Evaluacion de los resultados, en esta etapa, formalizara su evaluacion en funcion de si
22
los resultados del proyecto cumplen los criterios del rendimiento comercial. Este paso
requiere una clara comprension de los objetivos comerciales, por lo que debe estar seguro
de incluir factores de toma de decisiones en la evaluacion del proyecto.
En primer lugar, debe registrar su evaluacion, indicando si los resultados de minerıa de
datos cumplen sus criterios de rendimiento comercial.
Proceso de revision, las metodologıas eficaces suelen incluir tiempo para reflexionar so-
bre los aciertos y errores del proceso que se acaba de completar. La minerıa de datos no
es muy diferente. Una parte fundamental de CRISP-DM es aprender de su propia expe-
riencia para que sus proyectos de minerıa de datos sean mas efectivos.
En primer lugar, debe resumir las actividades y decisiones de cada fase, incluyendo pasos
de preparacion de datos, generacion de modelos, etc.
Determinacion de los pasos siguientes, continuar con la fase de desarrollo o volver y
refinar o sustituir los modelos.
Figura 10. Fase de Evaluacion (Wirth y Hipp, 2000)
Fase Distribucion
La distribucion es el proceso que consiste en utilizar sus nuevos conocimientos para imple-
mentar las mejoras en su organizacion.Ademas, la distribucion puede significar que utilice los
conocimientos adquiridos en minerıa de datos para aplicar modificaciones en su organizacion.
Planificacion de distribucion, aunque pueda estar ansioso por compartir el fruto de sus
esfuerzos en minerıa de datos, dedique un tiempo a planificar una distribucion completa
y precisa de los resultados.
23
Planificacion del control y del mantenimient, en una distribucion e integracion completa
de los resultados de modelado, su trabajo de minerıa de datos puede ser continuado.
Creacion de un informe final, la escritura de un informe final no solo resuelve los cabos
sueltos de la documentacion previa, sino que tambien se puede utilizar para comunicar
los resultados. Aunque pueda parecer una tarea sencilla, es importante presentar los re-
sultados a las diferentes personas relacionadas con los resultados. Se pueden incluir a
los administradores tecnicos, que son responsables de la aplicacion de los resultados de
modelado, ası como el departamento de marketing y gestion, encargado de tomar las de-
cisiones en funcion de los resultados obtenidos.
Revision final del proyecto , Es el paso final del metodo CRISP-DM y le ofrece una opor-
tunidad de formular sus impresiones finales e incorporar los conocimientos adquiridos
durante el proceso de minerıa de datos.
Debe realizar una breve entrevista con las personas implicadas en el proceso de minerıa
de datos.
Figura 11. Fase de Distribucion (Wirth y Hipp, 2000)
24
2.3. Fase de Comprension del Negocio
2.3.1. Objetivos del negocio
Disenar e implementar un modelo que permita conocer de que manera se esta hablando de los
actores polıticos en un tiempo determinado aplicando minerıa de opinion, permitiendo analizar
las opiniones en los contenidos generados en la red social Twitter, utilizando algoritmos enfo-
cadas a la minerıa de datos para dividir las opiniones vertidas, y ası dar criterios de aceptacion.
La idea es encontrar un mecanismo de estudio polıtico para precandidatos presidenciales que
deseen conocer de que manera se esta hablando de ellos.
Criterios de exito
Modelo para el analisis de opinion sobre un candidato presidencial.
El porcentaje de asertividad que exista en la calificacion de polaridad dentro del analisis de
sentimientos.
2.3.2. Valoracion de la situacion
Al aproximarse las elecciones presidenciales, los jefes de campana necesitan conocer de que ma-
nera estan comentando los tuiteros de su candidato, ademas de saber en que lugares deben en-
focarse para realizar sus diferentes campanas, dando mas enfasis en lugares donde la opinion es
negativa.
Recursos y Requisitos
Para este proyecto se utilizo diferentes recursos:
Software para estadıstica y Minerıa de Datos: Excel, R, RStudio.
Librerıa para conexion entre R y Twitter: TwitteR.
Librerıa para autentificacion con Twitter: ROAuth.
Librerıas para graficas estadısticas: ggplot, network3D, wordcloud.
Librerıas para consultas de base de datos: sqldf.
25
Librerıa de conexion con Google Maps: ggmap.
Librerıa para implementacion Web: ShinyR.
Librerıa para implementacion de mapas: leaflet.
Librerıa para analisis factorial de correspondencias: ca.
Cuentas de precandidatos presidenciales en Twitter.
Tuits generados por los usuarios obtenidos vıa Streamming.
Equipos Computacionales.
2.3.3. Definicion de objetivos de Minerıa de Datos
Objetivo General
Analizar las opiniones generados en Twitter utilizando herramientas de minerıa de opinion y
realizando un modelo que permita identificar los comentarios positivos, negativos y neutros por
cada precandidato para conocer su popularidad.
Objetivos Especıficos
Seleccion de actores polıticos renombrados, Se escogera a los actores polıticos mas renom-
brados en la actualidad.
Extraer los tuits que mencionen a candidatos presidenciales, Extraer los tuits donde se en-
cuentren mencionados precandidatos presidenciales, teniendo en cuenta las limitaciones
que nos proporciona el API de Twitter.
Limpieza semantica de los comentarios, Realizar la limpieza semanticamente por cada co-
mentario.
Analizar sentimientos y opiniones, Con los datos obtenidos se procedera a clasificar senti-
mientos: positivos, negativos o neutros asociados a cada precandidato presidencial con el
algoritmo de score.sentiment.
26
Extraccion de la localizacion de Tuiteros, Extraer la longitud y latitud de cada tuitero para
plasmarlo en el mapa del Ecuador.
Analisis de Frecuencia de Palabras, Se analizara la frecuencia de palabras en los comentarios
positivos y negativos.
Comparacion de precandidatos, Con los datos obtenidos de cada precandidato se realizara una
comparacion entre ellos utilizando analisis factorial de correspondencias (AFC).
Presentacion de resultados en una aplicacion web, El resultado del modelo se presenta en
una aplicacion web que se realiza en ShinyR.
2.3.4. Plan de proyecto
Se utilizo el siguiente plan de proyecto:
Tabla 2
Plan de proyecto
Fases Tecnicas
Comprension del negocio
Objetivo del Negocio
Criterios de exito.
Valoracion de la Situacion.
Recursos y Requisitos.
Definicion de los Objetivos de Minerıa de Datos.
• Objetivo General.
• Objetivos Especıficos.
Comprension de los datos
Recoleccion de datos iniciales.
Descripcion de los datos.
Exploracion de los datos (Tuits).
Calidad de los datos.
(continuacion)
27
Tabla 2
Plan de proyecto
Fases Tecnicas
Preparacion de los Datos
Seleccion de los datos.
Limpieza de datos.
• Seleccion de tuits que hablen de los candidatos.
• Obtencion del tuitero.
• Limpieza de los tuits.
• Formacion de diccionarios de palabras positivas y negati-
vas.
Estructuracion de los datos.
Integracion de los datos.
Modelado
Seleccion del Modelado
• Analisis de Sentimientos.
Generacion de Plan de Pruebas.
• Indicadores de precision.
• Indicadores de Asertividad.
Generacion del Modelo.
Modelo de popularidad.
• Analisis de Sentimientos.
Evaluacion del Modelo.
Implementacion
Plan de Implementacion.
Mantenimiento y Monitorizacion.
Plan de proyecto con sus diferentes tecnicas que se aplicara para tener un orden en el proyecto.
28
2.4. Fase de Comprension de los datos
2.4.1. Recoleccion de datos iniciales
Los datos fueron extraıdos desde la API de Twitter con la herramienta RStudio empleando la
librerıa TwitterR que permite tener una conexion directa con la red social.
Se tuvo que elegir los precandidatos presidenciales mas sonados en el ambiente polıtico de
Ecuador.
Tabla 3
Cuentas de Twitter de precandidatos
Precandidato Cuenta de TwitterAlberto Acosta @AlbertoAcostaECynthia Viteri @CynthiaViteri6Dalo Bucaran @daloes10Gabriela Rivadeneira @GabrielaEsPaisJaime Nebot @CynthiaViteri6Jorge Glas @JorgeGlasGuillermo Lasso @LassoGuillermoLenin Hurtado @lenhurtadoLenin Moreno @LeninMorenoPAISRafael Correa @MashiRafaelMauricio Rodas @MauricioRodasECRamiro Gonzalez @RamiroGonzalezJ
Cuentas de Twitter que utilizan los precandidatos en la actualidad
Se obtuvo 12 precandidatos presidenciales, de los cuales se extrajo todos los tuits donde se
mencionen aquellos personajes.
En este proyecto se realizo dos partes de extraccion de los tuits que fue en dos fechas diferentes
para poder ser comparado los tipos de comentarios de cada precandidato.
Como dato importante se podrıa decir que el punto de equilibrio entre estas dos fechas serıa el
Terremoto en Ecuador el 16 de abril de 2016.
Se obtuvo la informacion de cada tuit para poder realizar el analisis, entre la informacion que
utilizamos se encuentra:
Nombre registrado en Twitter del usuario que realiza la publicacion.
29
Texto del tuit.
Datos de la ubicacion geografica (longitud y latitud) del tuitero.
Se debe tener en cuenta las limitaciones que nos proporciona el API de Twitter al momento de
extraccion de los tuits.
2.4.2. Datos para el modelo de popularidad
Tabla 4
Descripcion de los Datos
Variable Descripcion ContenidoUsuario Persona que nombra a un personaje
polıtico, realiza algun tipo de publi-cacion en la red social Twitter
Nombre con el que se encuen-tra registrado el usuario en laRed Social Twitter.
Tweet Publicacion o actualizacion de esta-do realizado por una persona.
Mensaje cuyo lımite de exten-sion son 140 caracteres.
Latitud Distancia angular entre la lıneaecuatorial y un punto determinadode la tierra. Segun en el hemisferioen el que se situe el punto puede sernorte o sur.
Latitud desde donde ha sidodetectado el tuitero .
Longitud Distancia angular entre un puntodado de la superficie terrestre y elmeridiano de Greenwich, medida alo largo del paralelo en el que se en-cuentra dicho punto.
Longitud desde donde ha sidodetectada el tuitero
Datos extraidos de Twitter que se utilizo para generar el modelo de popularidad.
2.4.3. Exploracion de los datos
Para este proyecto se necesito conocer en que se compone un tuit y toda la informacion que se
puede obtener de el.
En la estructura de un tuit encontramos:
Foto de perfil que la persona que tuitea.
Nombre de quien publica el tuit.
30
Nombre de usuario (@usuario).
Texto del tuit.
Fecha y hora exacta de publicacion del tuit.
Opcion para marcar el tuit como favorito.
Opcion para eliminar el tuit.
Opcion para responder al tuit.
Al extraer el contenido de un tuit con la librerıa twitteR, nos proporciono los siguientes datos.
Tabla 5
Datos obtenidos con TwitteR.
Nombre Variable Tipo de Variable Descripcionx int Contador de tuitstext Factor Texto del tuitfavorited logical reconocimiento hacia un tuit.created Factor Fecha de creacion del tuitid num Id del usuario del tuitscreenName Factor Nombre del usuarioretweetCount int Cuantas veces se ha re tuitea-
do un tuitlongitude num Longitud de donde se
realizo el tuitlatitude num Latitud de donde se realizo el
tuit
Tipos de datos que proporciona Twitter obtenidos con la librerıa TwitteR de R.
2.4.4. Verificacion de la calidad de los datos
La informacion que se necesito de los tuits para el analisis de sentimientos fue el texto y nombre
del usuario. Al obtener la longitud y latitud se tuvo que proceder a un trato especial ya que
algunos usuarios de la red social no tienen registrado su lugar de residencia.
31
2.5. Fase de Preparacion de los datos
2.5.1. Seleccion de los datos
Se realizo la busqueda de todos lo tuits que se menciona a un precandidato presidencial por su
cuenta de twitter, tomando en cuenta las limitaciones de la API de twitter que permite extraer
hasta una semana maximo.
Para cada precandidato se tuvo un maximo de 100000 tuits.
Los tuits extraıdos fueron de dos fechas diferentes para realizar la comparacion de actividad de
cada precandidato en la red social.
Fecha 1: 2016-03-26 / 2016-04-04
Fecha 2: 2016-06-06 / 2016-06-15
Para poder graficar el mapa de tuiteros se necesito las coordenadas geograficas (longitud y
latitud) de cada tuitero por cada precandidato.
2.5.2. Limpieza de los datos
La limpieza de los datos es una de las etapas mas importantes de este proyecto para obtener
mejores resultados al ejecutar el modelo.
Tratado de los tuits
Al momento de la extraccion de los tuits se encontro varios problemas para analizarlos poste-
riormente, por tal razon se ve la necesidad de realizar la siguiente limpieza en un tuit:
Remover el RT de los retweet.
Convertir todo el texto a minusculas.
Eliminar el @ y lo que tiene a continuacion
Remover signos de puntuacion.
Eliminar numeros.
Remover los links.
Eliminar las Tabulaciones.
32
Quitar los espacios en blanco del inicio del texto.
Quitar los espacios en blanco del final del texto.
Remover textos iguales.
Eliminar tildes.
A continuacion, se presenta un tuit y el resultado del tratamiento de el.
Tuit antes de la limpieza: “RT @RamiroGonzalez: Sin estar de acuerdo, seguimos apoyan-
do.Nuestro compromiso es con los ecuatorianos. # GabrielDiaz # EcuadorRenace http...”
Tuit despues de la limpieza: “sin estar de acuerdo seguimos apoyando nuestro compromiso es
con los ecuatorianos gabrieldiaz ecuadorrenace”
En este proyecto se creo una funcion llamada limpieza.texto el cual tuvo todas las caracterısti-
cas planteadas anteriormente para la limpieza del tuit.
Tratado de la localizacion
Al extraer la longitud y latitud del tuitero se tiene la dificultad de que algunos usuarios de esta
red social no tienen registrados su ubicacion, por lo que su localizacion tomara el valor de “NA”.
Al realizar su respectivo analisis por precandidato se notaba que no habıa una cantidad consi-
derable de tuiteros fuera del paıs, por esa razon los tuiteros de lugares distintos de Ecuador se
removieron para tener una mejor apreciacion al realizar el mapa de tuits.
Para obtener las dimensiones (longitud y latitud) del territorio ecuatoriano se decidio apoyarse
en el paquete ggmap de R.
33
Tabla 6
Dimensiones geograficas del mapa de Ecuador
DimensionLongitud Maxima −75,24961Longitud Mınima −91,65415Latitud Maxima 1,455371Latitud Mınima −4,990625
Dimensiones del territorio ecuatoriano obtenidos del paquete ggmap de R.
Para la limpieza de la localizacion del tuitero se realizo:
Eliminacion de tuitero que no tienen localizacion.
Mantener las dimensiones que se encuentran dentro de la Tabla 6.
Figura 12. Tabla de localizacion despues de la limpieza
Diccionario de palabras Positivas y Negativas
Al momento de realizar el analisis de sentimientos conociendo su polaridad para clasificar los
comentarios negativos, neutrales y positivos es necesario tener un diccionario de palabras positi-
vas y negativas que es obtenido de MPQA (Multi-Perspective Question Answering), disponible
bajo los terminos de la Licencia Publica General de GNU, el cual nos proporciona 2718 palabras
en categorıa positiva y 4912 en categorıa negativas en idioma ingles que posteriormente fueron
34
traducidas al idioma espanol obteniendo un diccionario de 7630 palabras que sera expuestas en
el ANEXO A.
2.5.3. Construccion de nuevos datos
Se necesito construir nuevos datos tras la derivacion de atributos y la generacion de nuevos re-
gistros.
Tipo de comentario por tuitero
Teniendo los tuits limpios se procedio a realizar el analisis de sentimiento, obteniendo un valor
de positivo (1), negativo (0) y neutral(2) por cada tuit, agrupando los mensajes por tuitero se
creo una nueva variable llamada “votofinal” el cual fue el resultado de los comentarios del
tuitero.
Figura 13. Tuitero y resultado de sus comentarios
Localizacion por tuitero
Teniendo los tuiteros y su tipo de comentarios hacia un precandidato se realizo la busqueda
y union con su diferente localizacion para graficar en el mapa las personas que comentan de
forma positiva y negativa.
35
Figura 14. Tabla de localizacion por tuitero
Diccionario de palabras positivas y negativas
Transformacion de ingles a espanol, de igual manera todas las palabras a minusculas para hacer
la comparacion con cada tuit.
Frecuencia de palabras
Con los tuits extraıdos de cada candidato se realizo el conteo de palabras de tuits positivos
y negativos, para eso se necesito construir una matriz con la frecuencia de las palabras mas
utilizadas.
Figura 15. Frecuencia de palabras
2.5.4. Integracion de los datos
La integracion de los datos se realizo en una estructura denominada data.frame
36
Tabla 7
data.frame del modelo
Data.frame DescripcionDf Datos obtenidos de la extraccion
por precandidatoResultados Tuitero con su tipo de comentarioubicacionTweetero Tuitero, tipo de comentario, longi-
tud y latitudDataAnalisis Tweet, tuitero y su tipo de comenta-
riodm Frecuencia de palabras.TablaFrecuenciass Tuitero que ha realizado mas tuits.
Tuitero, frecuencia y tipo de co-mentario.
Descripcion de cada data.frame utilizados para el modelo de popularidad.
2.6. Fase de Modelado
La tecnica de minerıa de datos se aplico al analisis de sentimientos en la polaridad de sus
publicaciones que se lo realiza mediante una clasificacion Score el cual estara definido como
Score = #palabraspositivas−#palabrasnegativas, que permite realizar una comparacion
de los tuits con el diccionario de datos. La funcion score en R se llama score.sentiment.
2.6.1. Generacion de plan de pruebas
El tamano del conjunto de datos para la prueba sera los tuits recolectados de un precandidato
presidencial para evaluar el desempeno del modelo.
Para evaluar el modelo se utilizo La Matriz de Confusion que contiene informacion acerca de las
predicciones realizadas por un metodo o Sistema de Clasificacion, comparando para el conjunto
de individuos en de la tabla de aprendizaje o de testing, la prediccion dada, versus la clase a la
que estos realmente pertenecen.(Rodriguez, 2015)
37
Tabla 8
Matriz de confusion (Rodriguez, 2015)
PrediccionNegativo Positivo
Valor RealNegativo a bPositivo c d
Los indicadores que se utilizaran para el modelo seran:
Precision Global: La precision global mide el total de opiniones positivas que son correctas
mas el total de opiniones negativas que son correctas y esta dado por la division la suma
entre el resto de parametros como Verdadero Positivos, Falsos Negativos, Falsos Positivos
y Verdaderos Negativos.
PG =a+ d
a+ b+ c+ d(5)
Precision Positiva (PP): Es la proporcion de casos positivos que fueron identificados correc-
tamente, tal como se calcula usando la ecuacion:
PP =d
c+ d(6)
Precision Negativa (PN): Es la proporcion de casos negativos que fueron identificados correc-
tamente, tal como se calcula usando la ecuacion:
PN =a
a+ b(7)
Falsos Positivos (FP): Es la proporcion de casos negativos que fueron clasificados incorrecta-
38
mente como positivos, tal como se calcula utilizando la ecuacion:
FP =b
a+ b(8)
Falsos Negativos (FN): Es la proporcion de casos positivos que fueron clasificados incorrec-
tamente como negativos, tal como se calcula utilizando la ecuacion:
FN =c
c+ d(9)
Asertividad Positiva (AP): Indica la proporcion de buena prediccion para los positivos, tal
como se calcula utilizando la ecuacion:
AN =d
b+ d(10)
Asertividad Negativa (AN): Indica la proporcion de buena prediccion para los negativos, tal
como se calcula utilizando la ecuacion:
AP =a
a+ c(11)
2.6.2. Generacion del Modelo
Se analizo la polaridad de cada tuit con los datos transformados y limpios para ser evaluados
con la funcion score.sentiment, cuya funcionalidad comparo el texto del tuit con el diccionario
de palabras positivas y negativas el cual dara una calificacion para definir una publicacion.
39
Tabla 9
Parametros de score.sentiment
Score PublicacionScore > 1 PositivoScore < 0 NegativoScore =0 Neutral
Parametros que se sigio para dar una valoracion a la publicacion.
Al tener la polaridad de cada texto se procedio a dar un valor a los tuits, positivos (1), negativos
(0) y neutros (2). Un tuitero puede tener varios tuits y en cada uno de ellos depende de su estado
de animo para realizar diferentes publicaciones en la red social. Se le asigno al tuitero el tipo
de comentario que tenga mas peso, si tiene los tres tipos de comentarios se le asigna como
comentario neutro.
Tabla 10
Modelo de popularidadCandidato Tuitero Texto/Tuit Polaridad Intencion Latitud Longitud
X
Tuitero 1t1 +
N LaT1 LoT1t2 -tn N
Tuitero 2t1 -
- LaT2 LoT2t2 -tn N
Tuitero nt1 +
+ LaTn LoTnt2 -tn +
Y
Tuitero 1t1 N
N LaT1 LoT1t2 Ntn +
Tuitero 2t1 +
+ LaT2 LoT2t2 +tn +
Tuitero nt1 -
- LaTn LoTnt2 -tn +
Parametros para el desarrollo del modelo.
Al obtener la intencion de agrado de cada tuitero que puede ser positivo, negativo o neutral hacia
40
un precandidato presidencial se puede obtener el nivel de popularidad por la cantidad de tuiteros
que comentan de manera positiva, con estos datos se realizo varios analisis para profundizar la
actividad que tiene cada polıtico en Twitter.
Figura 16. Tuitero y polaridad de sus comentarios
2.6.3. Evaluacion del Modelo
Garcıa (2016). “La evaluacion del modelo empezo con el calculo de los criterios, precision y
sensibilidad que se basan en la comparacion entre los resultados del modelo con los resultados
reales determinados por el usuario”(p.17).
Se obtuvo una muestra de todos los tuits del precandidato Ramiro Gonzalez que contaba con
396 tuits para poder evaluar el desempeno del algoritmo y establecer los indicadores sobre la
matriz de confusion.
Figura 17. Tuits de evaluacion
41
Al momento de analizarlo en el algoritmo y compararlo con los resultados anteriores en la
matriz de confusion se obtuvo los siguientes resultados.
Tabla 11
Matriz de confusion para evaluacion
RealModelo
Neutro Positivo NegativoNeutro 71 13 13Positivo 24 126 62Negativo 5 30 52
Valores obtenidos de la evaluacion.
Los resultados de la matriz de confusion son:
Tabla 12
Resultados de evaluacion del modelo
Indicador PorcentajePrecision Global 62.88 %Precision Positiva 59.43 %Precision Negativa 59.77 %Precision Neutral 73.19 %Asertividad Positiva 74.55 %Asertividad Negativa 40.94 %Asertividad Neutral 71.00 %
Resultados obtenidos de la matriz de confusion.
La precision del modelo es del 62.88 % que es aceptable pero podrıa mejorar dependiendo de
la calidad del texto y aumentando palabras al diccionario de palabras.
2.7. Fase de Implementacion
2.7.1. Plan de Implementacion
Con los resultados y datos que se obtiene del tuit y del usuario de Twitter se implemento una
aplicacion donde se visualice todo lo obtenido con ayuda de la librerıa de ShinyR de R que
42
permite crear facilmente aplicaciones web interactivas que ayuda a interactuar con los datos sin
necesidad de manipular el codigo.
2.7.2. Mantenimiento y Monitorizacion
La aplicacion necesitara estar en mantenimiento los meses que necesite un precandidato para
conocer su popularidad, de igual manera se tendra que monitorizar para saber en que ha cam-
biado segun los comentarios obtenidos.
Fases Futuras
Para trabajos futuros se analizara la relacion que tiene un tuitero con otros precandidatos dife-
rente al que lo tuiteo para formar grupos de interes polıtico.
Se analizara tuiteros que tuitean fuera de las dimensiones del paıs.
43
3. RESULTADOS
Los resultados se presentan en la aplicacion desarrollada en ShinyR en diferentes modulos para
su mejor entendimiento.
Tabla 13
Cuentas de Twitter y acronimo de precandidatos
Precandidato Nombre en Twitter AcronimoAlberto Acosta @AlbertoAcostaE AACynthia Viteri @CynthiaViteri6 CVDalo Bucaram @daloes10 DBGabriela Rivadeneira @GabrielaEsPais GRJaime Nebot @jaimenebotsaadi GRJorge Glas @JorgeGlas JNGuillermo Lasso @LassoGuillermo GLLenin Hurtado @LeninHurtado LHLenin Moreno @LeninMorenoPAIS LMRafael Correa @MashiRafael RCMauricio Rodas @MauricioRodasEC MRRamiro Gonzalez @RamiroGonzalezJ RG
Descripcion de cada precandidato segun su cuenta de Twitter y su respectivo acronimo para facilitar ladescripcion de graficas.
3.1. Modulo de Popularidad
En el modulo de popularidad se encuentran dos graficas para conocer la popularidad que tiene
un precandidato.
Grafica Seguidores
Esta grafica representa el numero de seguidores que tiene un precandidato, datos obtenidos de
Twitter del mes de agosto del 2016.
44
Figura 18. Grafica de seguidores en Twitter
Como se observa en el grafico 18 el que tiene mayor numero de seguidores es el precandidato
Rafael Correa y les lleva una gran diferencia al segundo precandidato que es Jaime Nebot. En
los dos ultimos puestos se encuentran Lenin Moreno Y Lenin Hurtado.
Se concluye que el Ec. Rafael Correa es el mas popular de todos los precandidatos en la red
social Twitter.
Tabla 14
Numero de seguidores de precandidatos agosto 2016
Precandidato SeguidoresAlberto Acosta 68.096Cynthia Viteri 90.291Dalo Bucaram 324.058Gabriela Rivadeneira 190.961Jaime Nebot 698.594Jorge Glas 246.530Guillermo Lasso 238.814Lenin Hurtado 2.744Lenin Moreno 9.303Rafael Correa 2.844.155Mauricio Rodas 386.937Ramiro Gonzalez 168.319
Seguidores obtenedios de Twitter del mes de agosto de 2016.
45
Grafica Tuiteros
Esta grafica representa el numero de tuiteros que han comentado sobre el precandidato presi-
dencial en las dos fechas senaladas anteriormente para conocer su actividad en la red social
Twitter.
Figura 19. Comparacion de numero de tuiteros que comentan
Para un jefe de campana lo importante es que su candidato se encuentre presente en los co-
mentarios que vierten en Twitter y que siempre este en constante crecimiento. Al observar la
grafica 19, no todos los precandidatos crecieron en publicaciones de tuiteros, como es el caso de
Ramiro Gonzalez, Alberto Acosta, Dalo Bucaram, Mauricio Rodas, Jaime Nebot y Jorge Glas.
Para estos precandidatos se tendrıa que mejorar sus actividades en sus diferentes cuentas.
46
Tabla 15
Numero de tuiteros que han comentado por precandidato en diferentes fechas
Precandidato Fecha1 Fecha2Alberto Acosta 829 850Cynthia Viteri 454 919Dalo Bucaram 526 672Gabriela Rivadeneira 2689 3996Jaime Nebot 3734 3393Jorge Glas 5014 3312Guillermo Lasso 2777 4578Lenin Hurtado 52 101Lenin Moreno 1069 1946Rafael Correa 10143 16360Mauricio Rodas 2507 2120Ramiro Gonzalez 205 168
Informacion obtenida de las dos fechas de cada precandiidato.
3.2. Modulo Candidatos
En este modulo se encuentra la comparacion de todos los precandidatos en las dos fechas pro-
puestas.
Al comparar los precandidatos se tenıa el problema de que cada uno de ellos tenıa diferentes
muestras por lo que se realizo un analisis factorial de correspondencias (AFC) que asigna un
peso proporcional a su importancia en el total. De esta forma se evita que al trabajar con perfiles
se privilegie a las clases de efectivos pequenos.
En la figura 20 se evidencia que los precandidatos que tienen tuiteros que comentan de me-
jor manera son: Rafael Correa, Jaime Nebot, Gabriela Rivadeneira y junto a ellos se proyectan
Dalo Bucaram, Cynthia Viteri y Ramiro Gonzalez.
En el caso de tuiteros que comentan de manera neutral estan los precandidatos: Lenin Moreno,
Jorge Glas, Lenin Hurtado y Alberto Acosta.
Por el lado de los tuiteros negativos se encuentra Mauricio Rodas y Guillermo Lasso.
47
Figura 20. AFC de precandidatos Fecha 1
En la fecha 2 se encontro que los precandidatos que tienen tuiteros que comentan de mejor
manera son: Rafael Correa, Gabriela Rivadeneira, Mauricio Rodas y junto a ellos se proyectan
Dalo Bucaram, Cynthia Viteri, Ramiro Gonzalez y Lenin Hurtado.
Por los tuiteros neutrales estan los precandidatos: Jaime Nebot, Lenin Moreno y Jorge Glas.
En los tuiteros negativos se encuentra Guillermo Lasso y Alberto Acosta.
Figura 21. AFC de precandidatos Fecha 2
Al comparar las dos fechas se observo que algunos candidatos se mantienen constantes en el
apego de sus tuiteros como: Rafael Correa y Gabriela Rivadeneira.
48
Por otro lado, un precandidato que mejoro fue Mauricio Rodas que en la fecha 1 estaba con
mas tuiteros negativos y para la fecha 2 aparecio con mayor cantidad de tuiteros positivos, al
contrario de el esta el precandidato Jaime Nebot que en la Fecha 1 estuvo con tuiteros positivos
y en la fecha 2 se encontro que tuiteaban mas personas de manera negativa.
En las dos fechas se encuentran constantes los candidatos: Lenin Moreno y Jorge Glas, con
mayor cantidad de tuiteros que comentan de manera neutral.
Al momento de proyectarse hacia tuiteros positivos se encontraron los precandidatos: Cynthia
Viteri, Dalo Bucaram, Ramiro Gonzalez y Lenin Hurtado.
Para el precandidato Guillermo Lasso en las dos fechas se situo en el cuadrante de los tuiteros
que comentanban negativamente.
Los datos que se utilizo para este analisis se encuentran en la Tabla 16
3.3. Modulo de Seleccion
En este modulo se encuentran todos los precandidatos para ser seleccionados y mostrar los
diferentes analisis de cada uno de ellos. Cada precandidato tendra:
Modulo Comentarios
Modulo Tuiteros
Modulo Conteo de Palabras
Modulo Mapa Tuitero
Figura 22. Modulo de seleccion
49
En la figura 22 se encuentran los precandidatos mas sonados en el paıs para una posible candi-
datura presidencial en el Ecuador para el ano 2017.
3.4. Modulo Comentarios
En este modulo se muestra la cantidad de tuiteros con sus comentarios positivos, negativos y
neutrales comparadas en las dos fechas antes expuestas.
(a) Alberto Acosta (b) Cynthia Viteri
(c) Dalo Bucaram (d) Gabriela Rivadeneira
(e) Jaime Nebot (f) Jorge Glas
Figura 23. Comparacion de comentarios por precandidato N◦1
50
(a) Guillermo Lasso (b) Lenin Hurtado
(c) Lenin Moreno (d) Rafael Correa
(e) Mauricio Rodas (f) Ramiro Gonzalez
Figura 24. Comparacion de comentarios por precandidato N◦2
Al revisar los comentarios de todos los precandidatos se puede observar que la mayorıa de ellos
tiene mayor cantidad de tuiteros que hablan positivamente y como segundo lugar comentarios
neutrales dejando por debajo a los tuiteros que comentan negativamente.
Un caso diferente es el del precandidato Jorge Glas en donde la fecha 1 tiene una gran cantidad
de tuiteros que comentan neutralmente y para la fecha 2 incrementan la cantidad de tuiteros con
comentarios positivos.
Las gaficas obtenidas son resultado de la tabla 16
51
Tabla 16
Numero de comentarios (+, -, N) por precandidato en diferentes fechas
Candidato Fecha1 Fecha2Positivo Negativo Neutral Positivo Negativo Neutral
Alberto Acosta 331 172 326 440 219 191Cynthia Viteri 266 39 149 559 173 187Dalo Bucaram 511 148 197 519 21 132Gabriela Rivadeneira 1580 369 740 2203 634 1159Jaime Nebot 2270 488 976 1808 730 855Jorge Glas 2208 402 2404 2047 449 816Guillermo Lasso 1476 482 819 2177 1078 1323Lenin Hurtado 24 6 22 76 16 9Lenin Moreno 466 75 528 1054 278 614Rafael Correa 6040 1283 2820 9248 2932 4180Mauricio Rodas 1292 623 592 1222 333 565Ramiro Gonzalez 134 26 45 107 34 27
Resultados obtenidos de cada precandidato en las diferentes fechas por tipo de comentario.
3.5. Modulo Tuiteros
Figura 25. Modulo de Tuiteros frecuentes
Este modulo muestra los tuiteros que mas han comentado hacia un precandidato.
En la tabla 17 encontraremos de cada precandidato los tuiteros que con mayor frecuencia co-
mentan, cabe senalar que son los que mayor frecuencia han comentado independientemente si
son positivos o negativos por esa razon hay precandidatos que no tienen tuiteros que comenten
52
negativamente por que los que tienen mayor frecuencia son tuiteros positivos. De igual manera
los precandidatos que tienen pocos usuarios no tienen tuiteros que comenten con gran frecuen-
cia.
Tabla 17
Tuiteros que comentan con mayor frecuencia por precandidato
Precandidato Tuiteros Positivos Tuiteros Negativos
Alberto Acosta
carlosabel2010, moebius16,
cahuasquimanuel, patriciave-
dova, covco
aponcev1, can3liux, fevillavi-
cencio, kimontare, pconstitst-
cugat
Cynthia Viteri
cynthiajava, jorgeluisn78,
sukzuniga, jeanninecruzz,
palcuel
hernanmatrecisa, ximearcos,
blancaguiga, haropatec, jalil-
jalilja
Dalo Bucaran
rossygomeza, andrestoro111,
delacruzgabrie6, guseguigu-
ren, robertoddgamar2
jmondagron, damianmosque-
ra4, guiller8velez, montaner-
silvio, albertosaenz20
Gabriela
Rivadeneira
casaannewyork, canpastaza,
canimbabura, casaancanar,
casaanespana
Jaime Nebot
cdlabellavista, parischi-
quitoo, mariachvzcresp1,
mariobu07740570
pabloricaurte73, transportee-
nec, ost ec, gabicaza, juane-
loayza49
Jorge Glas
otonielaguino, jorgeluisan-
chun
giovannyendo, cedenoandra-
dem, jimmyxlucero, andres-
montesd14, viviguevarav
(continuacion)
53
Tabla 17
Tuiteros que comentan con mayor frecuencia por precandidato
Precandidato Tuiteros Positivos Tuiteros Negativos
Guillermo Lasso
centralximena, guzmetmin,
joseloandrade
cueva tapia, daanalfa,
creo guayas, ingcristianpaz,
freddy6518227
Lenin Hurtado
benaleur geovanni atari, rpae3, galo-
mindiola, ramiroopcion, car-
lamaldonadop
Lenin Moreno
boblen1972, frankgreychirib,
leninmorenopais, thelo-
nelywlker, gabriela1834578
jofreromero, saidocta-
viohan1, marcocastro o,
ajaib40, cf203e4e5b3c464
Rafael Correa
jofreromero, marcocastro o,
ajaib40, cf203e4e5b3c464,
leninmorenopais
Mauricio Rodas
antoniocostale5 cpdiazg69, calistoelena,
mcjm53, magdalenanemalc,
maggieligg
Ramiro Gonzalez
gozosoandradev, gabyerazob francis aletor, 34 zurita,
isa chiriboga, andre duenas8,
majoramirez85
Tuiteros por cada precandidatos que tuitean con mayor frecuencia.
Al obtener los tuiteros con mayor frecuencia se pudo observar que los precandidatos Rafael
Correa y Gabriela Rivadeneira tienen usuarios que comentan de manera positiva con mayor fre-
cuencia por esa razon no muestra un tuitero que comente de manera negativa.
54
Los precandidatos Rafael Correa y Lenin Moreno tienen varios tuiteros en comun, esto significa
que los tuiteros estan comentando en forma conjunta refiriendose a estos personajes, es prede-
cible ya que son dos polıticos de la misma bancada.
Este modulo serıa de gran importancia para cada precandidato para conocer a profundidad a las
personas que estan comentando de mala manera y ası saber en que pueden mejorar. Tzu (2006)
“Conoce a tu enemigo y conocete a ti mismo y podras pelear en cien batallas sin un desastre.”
3.6. Modulo Palabras
Este modulo muestra las palabras que mas se repiten en los tuits positivos como negativos hacia
un precandidato.
Figura 26. Modulo Palabras
55
Tabla 18
Palabras positivas y negativas con mayor frecuencia en los precandidatos
Precandidato Palabras Positivas Palabras Negativas
Alberto Acosta
moratoriaminera, correa, mi-
nerıa, paıs, socialismo
moratoriaminera, correa, go-
bierno, crudo, ptroleo
Cynthia Viteri
loja, animales, alcalde, favor,
nebot
sancion, retweeted, imperio
Dalo Bucaran
dalo, fuerzaecuador, candida-
to, manabi, presidente
gobierno, candidato, pueblo,
fuerzaecuador, odio
Gabriela
Rivadeneira
contigodeley, presidenta,
foroeconomicoparlatino,
pais, mujeres
foroeconomicoparlatino, con-
tigodeley, gabrielaenazuay,
presidente, leycannabismedi-
cinal
Jaime Nebot
alcalde, guayaquil, metrovıa,
nebot, paıs
gestion, riesgo, mala, guaya-
quilprotesta, nebotmala
Jorge Glas
gracias, patria, manabi, presi-
dente, pueblo
presidente, vicepresidente,
reconstruccion, reunion,
manta
Guillermo Lasso
dinero, lasso, paıs, presidente,
yocreoenlasso
paıs, dinero, feriado, banca-
rio, presidemte
(continuacion)
56
Tabla 18
Palabras positivas y negativas con mayor frecuencia en los precandidatos
Precandidato Palabras Positivas Palabras Negativas
Lenin Hurtado
exrector, ces, alianza, armas,
vıa
educacion,armas, falta, men-
talidad, nieguen
Lenin Moreno
dicapacidad, lenıonu, perso-
nas, derechos, inclusion
discapacidad, personas,
lenınonu, retweeted, mundial
Rafael Correa
conversatoriosmedios, en-
lace, dinero, electronico,
presidente
conversatoriosmedios, dine-
ro, enlace, presidente, gracias
Mauricio Rodas
alcalde, quito, responderodas,
quitocables, barrios
quito, alcalde, responderodas,
falta, quitocables
Ramiro Gonzalez
ecuatorianos, crisis, partido,
polıtica
traidor, derecha, paıs, ecuato-
rianos, polıtica
Palabras con mayor frecuencia ya sea en los comentarios positivos y negativos de cada precandidato.
En la mayorıa de casos las mismas palabras se repiten en los dos casos de varios precandidatos
esto denota que hay personas que hablan de manera positiva o negativa de un tema en comun.
El caso en particular que llamo la atencion es la del precandidato Jorge Glas en donde las
palabras positivas fueron “gracias, patria, manabı, presidente, pueblo” en donde tienen relacion
con lo sucedido en el ultimo terremoto de Ecuador.
57
3.7. Modulo Mapa Tuitero
En este modulo se encontro la localizacion de los tuiteros que se plasmo en un mapa de Ecuador
incluido su Region Insular. Se podra observar los puntos de tuiteros que se expresan de manera
positiva al igual que los negativos. Para realizar el grafico se utilizo la librerıa “leaflet” que nos
permite visualizar mapas interactivamente.
Figura 27. Modulo Mapa Tuitero
Al momento de observar los tuiteros en el mapa de los diferentes precandidatos se pudo cons-
tatar que la mayorıa de ciudades en los que estan activos son: Quito, Guayaquil y Riobamba.
En la region donde menos personas tuitean es el Oriente.
El mapa tuitero sirve para cada candidato que desee conocer de donde estan escribiendo de
manera positiva o negativa para que tengan referencia hacia donde tienen que ir con mayor cla-
ridad para sus propuestas, de igual manera conocer en que lugar no hay actividad de personas
que tuitean hacia ellos.
58
4. CONCLUSIONES
Este proyecto no se trata de prediccion electoral se torna muy complejo decir por quien va
a votar una persona y mas aun si son en las redes sociales por la complejidad que existe
en el idioma espanol, por el sesgo que se encuentra al momento de realizar un analisis
de este tipo, estimar el grado y la ausencia de participacion es difıcil y ademas hay que
considerar que la red social Twitter no es la mas usada por los ecuatorianos.
El analisis de opinion es central en este proyecto constituye una herramienta importante
al momento de saber que piensa una persona por medio de lo que escribe, pero como dice
Boyd (2010) acerca de Big Data y ciencias sociales donde dice:
“Big Data ofrece nuevas oportunidades para entender la practica social. No obstante, la siguiente afirmacion
debe comenzar con un “pero”. Y ese “pero” es simple: tan solo porque veas trazas de datos eso no significa
que siempre entiendas la intencion o la logica cultural tras ellas. Y solo porque tengas un gran N eso no
significa que sea representativo o generalizable.”
Al utilizar una metodologıa como CRISP-DM se puede tener un proceso sistematico de
todas las partes que intervienen en el proceso de Minerıa de Datos para obtener los mejo-
res resultados.
Se analizo las opiniones generadas en twitter con un modelo supervisado con la funcion
score.sentiment con una precision global del 62.88 % que permitio dar un valor al tipo de
comentario por su polaridad.
Al realizar la limpieza de los comentarios vertidos en twitter se obtuvo muchos problemas
por el idioma espanol por sus dificultades gramaticales como:
• Gran cantidad de artıculos.
• Describir el genero de personas, animales cosas.
• El uso de sus adjetivos tiene varias estructuras.
• Los demostrativos son muchos.
• La conjugacion de verbos
59
• Los tiempos.
Se extrajo la localizacion de los tuiteros por cada precandidato para ubicar los puntos
positivos y negativos en el mapa de tuits. Al conocer estos resultados serıa muy bueno
que los precandidatos busquen de que manera llegar a estas zonas para que tengan un
protagonismo positivo.
Al comparar los precandidatos se tuvo el problema del tamano de muestras por cada uno
de ellos por lo que se decidio realizar un analisis factorial de correspondencias que nos
permitio asignar un peso proporcional a su importancia en el total y ası evitar que se
privilegie a los precandidatps de muestras pequenas.
Al comparar todos los candidatos se pudo constatar que Rafael Correa es el mas popu-
lar en Twitter teniendo mayor numero de seguidores y mayor numero de personas que
tuitean.
El proyecto es dedicado a las personalidades polıticas que deseen conocer de que manera
esta su popularidad y ası poder tomar decisiones adecuadas para el crecimiento en Twitter
de una manera positiva para sus campanas electorales.
60
5. RECOMENDACIONES
Para efectos comparativos se recomienda el diccionario de este estudio y el diccionario
de LIWC (Linguistic Inquiry and Word Count) que tiene un costo.
Para analisis de popularidad y analisis de sentimientos se recomienda el uso de sco-
re.sentiment por ser de libre, confiable, de facil manipulacion y adaptacion.
Pongo a disposicion el modelo para cualquier interesado que quiera conocer la populari-
dad de un precandidato presidencial para las elecciones presidenciales en Ecuador para el
ano 2017.
Realizar procesos en paralelo, para la optimizacion de tiempo de procesamiento en per-
sonalidades con gran actividad en la red social Twitter.
61
6. BIBLIOGRAFIA
[1] ALCAZAR J. (2016). Ranking Paginas Web Ecuador. Recuperado el 16/10/2016 de: http:
//blog.formaciongerencial.com/2015/01/26/ranking-paginas-web-ecuador/
[2] AMERICATV (2009, May 21). ¿Cuanto poder e influencia tienen las redes sociales en
la actualidad?. Recuperado el 08/06/2016 de: http://www.americatv.com.pe/tec/clips/
cuanto-poder-influencia-tienen-redes-sociales-actualidad-noticia-25846
[3] AMORES, M., ARCO, L. y ARTILES, M. (2015). Deteccion no supervisada de la pola-
ridad de opiniones en espanol Unsupervised polarity detection of Spanish opinions
[4] BARRIBLOG (2010). ¿Lo que siempre quiso saber del API de Twitter y nunca se atre-
vio a preguntar? Recuperado el 09/06/2016 de: http://www.barriblog.com/2010/07/lo-que-
siempre-quiso-saber-del-api-de-twitter-y-nunca-se-atrevio-a-preguntar//
[5] BOYD, D. (2010). Big Data: Opportunities for Computational and Social Sciences. Abril,
17:2010.
[6] BRITOS, P.V. (2008). Procesos de explotacion de informacion basados en sistemas inteli-
gentes. Tesis doctoral, Facultad de Informatica.
[7] CHRISTAKIS, N.A et al (2010). Conectados: el sorprendente poder de las redes sociales
y como nos afectan. Numero 302.30285 C4Y. Taurus Madrid.
[8] COMOHACKEAR (2016). Las 10 redes sociales mas populares del mundo en 2016. Recu-
perado el 22/06/2016 de: http://www.como-hackear.com/redes-sociales-populares-mundo-
2016/
[9] CORTEZ, A., VEGA, H. y PARIONA, j. (2009). Procesamiento del lenguaje natural.
2. Recuperado el 15/06/2016 de: http://sisbib.unmsm.edu.pe/bibvirtual/publicaciones/
risi/2009 n2/v6n2/a06v6n2.pdf
62
[10] CORTIZO, J. (2011). Minerıa de Opiniones, o Analisis del Sentimiento. Recuperado el
22/06/2016 de: http://www.baquia.com/emprendedores/2011-05-13-mineria-de-opiniones-
o-analisis-del-sentimiento
[11] DOMINGUEZ, D.C. (2009). Democracia 2.0: La polıtica se introduce en las redes socia-
les/Democracy 2.0: politics inside social networks. Pensar la publicidad, 3(2):31.
[12] FREEMAN, L.C., WHITE, D.R. Y ROMNEY, A.K. (1992). Research methods in social
network analysis. Transaction Publishers
[13] GARCIA, E. (2016). Tecnicas de minerıa de datos (pagina 1). Monografias.com. Recupe-
rado el 24/06/2016 de: http://www.monografias.com/trabajos55/mineria-de-datos/mineria-
de-datos.shtml
[14] IBM (2012). Manual CRISP-DM de IBM SPSS Modeler. IBM SPSS
[15] MENDEZ, P. y RODRIGUEZ, A. (2009). Herramienta de estudio de viabilidad para pro-
yectos que utilizan la metodologıa P3TQ. Universidad de Buenos Aires, Buenos Aires,
Argentina.
[16] MOINE, J.M. (2013). Metodologıas para el descubrimiento de conocimiento en bases de
datos: un estudio comparativo. Tesis doctoral, Facultad de Informatica.
[17] NIGRO, O., XODO, D., CORTI, G. y TERREN, D. (2004). KDD (Knowledge Discovery
in Databases): Un proceso centrado en el usuario. En VI Workshop de Investigadores en
Ciencias de la Computacion
[18] PANG, B. and LEE, L. (2008). Opinion mining and sentiment analysis. Foundations and
trends in information retrieval, 2(1-2):1-135.
[19] RODRIGUEZ, O. (2015). Aprendizaje Supervisado K - Vecinos mas cercano Knn-Method.
Recuperado el 24/07/2016 de: http://www.oldemarrodriguez.com/yahoo site admin/assets/
docs/Presentaci%C3%B3n - KNN.20085205.pdf
[20] SCHMIDT, S. (2002). Analisis de redes: aplicaciones en ciencias sociales. Unam.
63
[21] TICbeat (2014). ¿Que es una API y para que sirve? Recuperado el 09/06/2016 de: http:
//www.ticbeat.com/tecnologias/que-es-una-api-para-que-sirve/
[22] TRIVINHO, E.R. (2011). Visibilidad mediatica, melancolia do unico e violencia invisıvel
na cibercultura. MATRIZes, 4(2):111-125.
[23] TWITTER (2016). Centro de Ayuda. Recuperado el 08/06/2016 de: https://support.twitter.
com/articles/352810
[24] TZU SUN. (2006). El arte de la guerra, volumen 54. Edaf.
[25] VALLEZ, M. y PEDRAZA, R. (2007). El Procesamiento del Lenguaje Natural en la Re-
cuperacion de Informacion Textual y areas afines. Hipertext. net.
[26] WIRTH, R. y HIPP, J. (2000). CRISP-DM: Towards a standard process model for data
mining. En Proceedings of the 4th international conference on the practical applications of
knowledge discovery and data mining, pp.29-39. Citeseer.
64
7. ANEXOS
Anexo A: Diccionario de palabras Positivas y Negativas
Diccionario palabras positivas
acatar capacidad poder abundar absolver absorbente absorcion abundancia abundante acceder
a acentuar aceptar aceptable aceptacion accesible adhesion aclamacion aclamacion espaldarazo
acomodar alojamiento acompanamiento realizar logro accord conformidad explicable acumu-
larse exactitud preciso accurateness lograr logro reconocimiento familiarizar conocido absol-
ver absolucion real realidad firme adaptabilidad adaptable adaptacion adaptado adepto com-
petencia adecuado adherencia adherente adhesion adhesivo adjunto ajustar ajustable ajuste ad-
mirable admiracion admirar admirador admitir entrada adorable adorar adornar adorno habil
diestramente adulacion adelanto ventaja ventajoso adviento aventurero aventurero aconsejable
abogacıa afabilidad afable afecto carinoso afiliado afiliacion afinidad afirmar afirmacion afir-
mativo afijo afluencia afluente a flote agregar agregacion agil agilidad agradable acuerdo ayuda
vigilancia posarse viva lealtad aliviar alianza aliado aliados permitir admisible tolerancia se-
ducir aliado todopoderoso altruista asombro asombroso mejorar docil amenidad amabilidad
amable amistoso amnistıa aventura amorosa amplio amplificar ampliamente entretener diver-
sion angel angelical ungir apocalipsis recurso apaciguar adjuntar aplaudir aplausos nombrar
apreciable apreciar apreciacion agradecido aprehender enfoque caso aprobacion aprobar ap-
to aptitud arbitro arbitrar arbitraje ardiente surgido aristocracia aristocrata aristocratico arresto
art atribuir aspiracion aspirar asentir afirmacion activo assist assist asistencia asistente asocia-
do asociacion garantıa asegurar ciertamente asombrar astuto atletico adjunto archivo alcanzar
logro asistir asistencia atento atraer atraccion atractivo atractivo armonizar audible aumentar
aumento propicio autentico autenticidad autoritario autoridad autonomo disponibilidad avido
premio consciente conciencia volver columna vertebral partidario apoyo bola balsamico bautis-
mo bautizar negociar basico faro hermoso embellecer belleza convenir a propio ofrecer amistad
favor amado benefactor benefico beneficioso beneficiario beneficio benevolencia benevolente
benigno legar mejor otorgar prometer en matrimonio esponsales mejor mejor inocente bendi-
ga felicidad feliz alegre florecer flor consejo audacia reforzar hermoso prima auge boost sin
65
lımites abundante inteligente valiente valentıa sosten de la familia brillante brillo brillantez bri-
llante fraternidad fraternal boyante comprar signatura calm calma sincero candor capacidad
capaz capitalizar fascinacion cuidado despreocupado cuidadoso caress casual incesante cele-
brar celebracion celebridad ceremonial mordimiento campeon campeonato carisma caritativo
caridad casto animar alegre alegre querubın elegante caballerosidad caballerıa elegido amigo
civil civilidad civilizacion civilize aclarar claridad clasico limpieza limpiar claro claridad inteli-
gente cercanıa influencia cooperacion engatusar mimar coexistencia convincente conocimiento
competente coherente cohesion cohorte coincidente colaborar colaboracion colega colosal vuel-
ve comedia gentil comestible comfort comodo comic comico conmemorar conmemoracion co-
mienzo elogiar recomendable elogio conmensurar comision compromiso grande comun sentido
comun comunal comuna comunicar comunicar comunicativo comunion comunidad companero
companerismo empresa compasion compasivo compatible compensar compensacion compe-
tencia competencia competente complemento complemento complementario completo com-
pleto lo completo terminacion conformidad cumplido calma comprender comprension exhaus-
tivo compromiso concesion concluyente concurrir condonar conducente confederacion conferir
confidente confiar confianza confidente agradable felicitar enhorabuena congratulatorio congre-
garse conjuncion conjurar conectar conquistar conquistador conquista conciencia concienzudo
consenso consentimiento consentimiento conservar considere considere considerado examen
consignar consistencia consistente consola consolidar constancia constructivo consultar consul-
ta consumar contacto contacto contenido contenido contenido contentamiento continuidad con-
tribuir contribuir contribucion contribuyente convocar conviccion convencer cooperar coope-
racion cooperativa coordinar coordinacion cordial correcto correccion consejo el abogado el
abogado valor valiente cortes cortesıa cortes pacto acogedor crear creativo creatividad cartas
credenciales credibilidad creıble credito cruzada cruzado abrazo culminar culminacion culti-
var cultivo cultura cupido cure reverencia linda dance atrevimiento atrevido carino intrepido
dawn deslumbrar deal querido estimado decencia bueno descifrar decorar decoracion deco-
rativo dedicarle dedicarle dedicacion deducir defender defensor defensa deferencia definitivo
delicadeza delicado el placer el placer encantador confianza confiable divisar merecer mereci-
damente deseable deseoso dedicar dedicar devocion devoto destreza dig digno dignificar dig-
nidad diligente discernir discreto discrecion discutir distinto distincion distintivo distinguir dis-
66
tinguir distinguido divina divina divinidad dominio donar donacion adorar indudable paıs de
los suenos durabilidad durable dinamica ansioso afan serio la seriedad facilidad facilidad faci-
les faciles faciles faciles economizar extasis extatico comestible educados educacion educativo
eficaz eficacia eficacia eficiencia eficiente elaborar elaboracion regocijado elegancia elegante
elocuente embellecer abrazo eminencia eminente empatıa autorizar empoderamiento habilitar
enchant enchant encantamiento alentar alentar animo hacerse querer por endosar dotar resisten-
cia energetico energizar realizar mejorar mejora disfrutar agradable disfrute iluminar a iluminar
a ilustracion enriquecer enriquecimiento conjunto asegurar entertain entertain entretenimien-
to entusiasmo entusiasta de emprendedor confiar guardar igualdad equitativo equidad esencial
esencial establecer establecer estima etico etica etiqueta aun aun eterno exact exact exaltar so-
bresalir excelencia excelente excite excite emocionado excitedness emocion esfuerzo regocijo
exotico experiencia experiencia experto experto exquisito ensalzar extraordinario extravagan-
cia exuberancia exuberante exultar exultacion ojo fabuloso facilitar factual fair fair fair justicia
fe fe fiel fidelidad fama familiar familiaridad familiarizar famoso lujoso fantastico fantasıa hi-
permetrope fascinacion de moda favor favor favor favor favor favorable favorito audaz factible
fiesta fiesta companero companerismo fertil ferviente fervor festival festivo festividad fidelidad
ardiente filial fill fino fino fino fino fino firmeza fit fit aptitud instinto ostentoso halagar adula-
cion lucir perfecto flexible ligar florecer fluido fond fond fond fond fond fond 6 fond 7 carino
principal prevision perdone perdonar perdonado perdon formalidad fortalecer fortaleza afortu-
nado forward fomentar fragante franco libre libre libre libre libre libertad fresco amigo amistoso
amistad fiesta frugal fructıfero fruicion cumplir cumplimiento plenitud fun divertidos divertidos
divertida alegrıa alegremente gain gain galante galanterıa juego adornar gay generar generosi-
dad generoso genial genio amable autentico mareado regalo dotado dar glad glad alegrar alegrıa
atractivo glamour brillo brillo espigar alegrıa luz tenue gescucha gescucha brillo brillo glorificar
glorioso gloria lustroso glow glow divino devocion oro dorado bueno adios bondad maravillo-
so gracia agraciado cortes graduacion grandioso grandeza agradecido gratificacion satisfacer
gratitud gran gran gran grandeza saluda saluda novio garantıa garantıa guardian guıa guıa guıa
entusiasmo hallowed mano 9 hermoso practico felicidad feliz feliz feliz feliz resistente inofen-
sivo armonioso armonizar armonıa aprovechar refugio sanar salud sano saludable saludable
corazon sinceramente cielo celestial ayuda servicial heroe heroico heroına heroısmo realce di-
67
vertidısimo hit santo homenaje casa honesto honesto honesto luna de miel honor honor honor
honorable hope hope esperanzado hospitalario abrazo humano humanitario humanidad humilde
humildad humor humorıstico higiene ideal ideal ideal idealismo ıdolo idolatrar iluminar ilustre
imaginacion imaginativo inmaculado inmortal imparcial imparcialidad imperativo impermeable
ımpetu importancia importante impress impresionante mejorar la mejorar mejorar mejora impu-
nidad inaugurar inauguracion independencia independent independent indescriptible indicativo
indispensabilidad indispensable individualidad indomable indulgencia industrioso barato infa-
libilidad infalible inferir inferencia inform inform ingenioso ingenio heredar inocencia inocente
innovar innovador inquisitivo inseparable vision insistente inspiracion inspirado inspire inspire
instintivo integridad intelecto intelectual intelectual intelectual inteligencia inteligente inteligi-
ble interceder coito interes interes interes interesado interesado interponer intimidad ıntimo in-
trincado intriga inestimable inventor invencible invitacion invite invite invulnerable irresistible
broma registrarse conjuntamente broma broma broma alegre alegrıa alegre jubiloso aniversario
solo solo justicia justificadamente justificacion justificar afilado kid clase tipo amabilidad beso
beso saber saber conocimiento loable risa risa risa risa 6 risa prodigar ley legal lead learn learn
aprendiz legal legitimidad legıtimo ocio liberal liberal liberalismo liberar libertad para toda la
vida luz luz agradable al igual que al igual que vivo 6 animado logica logico longevidad amor
amor amor amor hermosura encantador amante leal lealtad lucido suerte por suerte suerte lu-
crativo luminoso lujuria lustre lustroso exuberante lujoso lujo lırica lırico magico magnetico
magnificencia magnıfico main majestuoso majestad mayor haz 6 haz 7 manejable varonil mari-
tal matrimonio casara casara maravilla maravilloso maestro maestrıa incomparable mate mate
materia madura madura madura madurez maximizar significativo mensurable mediar medita-
cion meet meloso melodıa memorable arreglar mentor misericordioso misericordia merit merit
meritorio alegremente alegrıa alegre malla meticuloso poderoso templado cuenta consciente de
ministro menta milagro milagroso alegrıa movilidad movilizar moderar moderacion moderni-
dad modesto modestia trascendental monumental moral moral moralizador moralidad motivar
motivados motivacion motivo multitud mutua mutua mirıada natural natural navegable ordena-
do necesariamente negociar agradable agradable agradable agradable nicho agil nobleza noble
noble silencioso nombrar no violencia no violento normal notable notoriedad nutrir alimento
novedad enfermera nutrir nutritivo oasis obediencia obediente obedecer objetivo objetivo obli-
68
gar obtener asequible oferta oferta oferta compensar comienzo adelante abierto open oportuno
oportunidad optima optimismo optimista opcional orden orden orden 6 organizar organizar ori-
ginalidad extrovertida sobrevivir a total correr mas que comienzo excepcional burlar superar
lleno de alegrıa esmerado sabroso palaciego mimar paraıso supremo perdon perdon determina-
do companero asociacion paso apasionado paciencia paciente paciente patriota patriotico patron
mecenazgo pay paz paz pacıfico pacıfico sin par perfecto perfecto perfecto perfeccion perfeccio-
nismo perfeccionista perfume permiso permiso perseverancia perseverar persuasivo pertinente
pintoresco piedad pinaculo piadoso liso liso liso liso plausibilidad jugueton companero de juego
juguete agradable agradable broma por favor por favor contento contento agradable placer pro-
mesa abundante mucho poetico conmovedor poise polaco cortes cortesıa pompa popular popu-
laridad populoso portatil positivo lo positivo positividad posteridad potencia potente practicable
practica elogio cabriola precaucion precedente precepto precioso preciso precision preeminen-
te preferencia primer ministro premisa prima preparatorio prestigio bien bonita bonita bonita
bonita no tiene precio orgullo ante todo principal director principio principio principio intimi-
dad privilegiado privado premio pro proactivo prodigioso prodigio productivo productividad
profesar oferta competente resultado resultado rentable profundo progreso progreso progresi-
vo prolıfico prominencia prominente promesa promesa prompt prompt prontamente apropia-
do propicio propiedad propiedad enjuiciar prosperar prosperidad prospero proteger proteccion
protector protector orgulloso proporcionar providencia valor prudencia prudente puntual puro
purificacion purificar pureza util ronroneo pintoresco calificar calificar calidad aplacar acele-
rar resplandor radiante irradiar reunion compenetracion arrebatado rapto racional delirio facil-
mente verdadero realista de modo realista recoger razonable seguridades tranquilizar receptivo
reclamar reclinar recompensa conciliar reconciliacion recreacion redimir redencion restable-
cer refinar refinamiento refugio real relacion rehabilitacion reforzamiento reintegrar alegrarse
relajacion pertinencia pertinencia pertinente confiabilidad de confianza alivio aliviar religiosa
saborear notable notablemente remedio remodelar renacimiento renovacion renovar renovacion
renombre reparacion reparacion reparacion arrepentirse arrepentimiento reposo acreditado res-
cate rescate resuelto resuelven resuelven resuelto resonar ingenioso inventiva respecto respec-
to respecto respetable respetuoso respiro resplandeciente responsabilidad responsable sensible
sosegado restauracion restaurar resucitar retorno retorno reunion reunir jaranear revelacion re-
69
verenciar reverencia reverente reverentemente revitalizar renacimiento reanimar recompensa
recompensa recompensa rich rich rich rich rich rich 6 riqueza riqueza derecho derecho 6 justo
justicia legıtimo maduro madurar robusto romance romantico romantizar rosado round desper-
tar sagrado safe safe safe safe salvaguardia seguridad sagacidad sabio santo saludable saludo
saludo salvacion santificar santuario cuerdo optimista sanitario cordura satisfaccion satisfac-
toriamente satisfactorio satisfacer satisfacer satisfacer guardar ahorros saborear comprension
corretear scruples escrupuloso seguro seguro seguridad seguridad selectivo autonomo respeto
a ti mismo apariencia sensacional sentido sentido sensato sensible sensibilidad sereno grave
gravedad resolver parte compartir compartir refugio refugio proteger brillante perspicaz astucia
significado significativo significar sencillez simplifique simplifique sincero sinceridad destre-
zas habil pulcro inteligente inteligente inteligente sonrisa sonrisa sonrisa sonrisa smitten sobrio
sociable blandura consuelo solucion calmar sofisticado buscado sonido sonido 6 solvencia re-
puesto brillar especial espectacular rapidamente esplendido esplendor inmaculado animado en
angulo recto estabilidad estabilizar estable soporte estandarizar grapa majestuoso estatuario fir-
me staunchness firme constancia firmeza estable estimular estımulo pie recta sencillo puntal
semental estudioso estupendo robusto elegante afable sublime suscribir suscripcion subven-
cionar subvencion subsistir subsistencia justificar sutil exito exito exitoso satisfacer suficiente
juego traje adecuado cumbre suntuoso super superior superioridad superlativo soporte soporte
soporte soporte apoyo suprema suprema oleada conjetura superar a superar supervivencia so-
brevivir sobreviviente sweet sweet sweet sweet endulzar novio dulzura rapidez desmayo jurada
simbolizar simetrıa simpatico compadecerse simpatıa sıntesis tacto tactica talento talentoso sa-
bor templanza templado tentar tenaz tenacidad sensibilidad estupendo gracias gracias gracias
agradecido terapeutico completo pensativo consideracion ahorro ahorrativo emocion prosperar
tingle unidad tolerancia tolerante tolerar tolerancia mas alto tradicion tradicional tren tranquilo
tranquilidad recorrido tesoro tesoro invitacion tratado tratado tremenda tremenda tributo triunfo
triunfo triunfal triunfante trofeo true integridad confiable verdad veraz unbound intacto poco
comun entender comprensible entendido sin alguna duda indudablemente inolvidable sin prisas
intachable unico unidad ilimitado altruista incontaminados optimista en la delantera mejorar
estimados defender edificacion mas alto vertical arriba hacia arriba usable util utilidad utilitario
utilizacion utilizar mas lejano valiente valido validez valor valioso valor vencer a vastedad ve-
70
nerable venerar verificacion verificar verdadero versatil versatilidad viabilidad viable victorioso
vigilancia vigilante virtud virtuoso visionario visualizacion vitalidad vivaz vıvido voluntario
conceder caliente warmhearted calor recepcion bienestar bien caprichoso saludable deliberado
complaciente complacencia sabidurıa ingenioso maravilla maravilloso maravilloso cortejar fac-
tible hechura mundialmente famoso vale vale la pena dignidad digno cenit animo honesto justo
leal coherente lıder profesional serio extranamos mio
Diccionario palabras negativas
abandonar abandono disminuir abdicar aborrecer abyecto anormal abolir abominable abrasivo
abrupto fugarse ausencia ausente despistado ausente absurdo absurdo abuso abuso abismo acci-
dente abordar maldito acusacion acusaran acusaran dolor mordaz acritud adicto adiccion amo-
nestar amonestacion adulterar adulteracion adulterio adversario adverso adversidad afectacion
afligir afliccion miedo en contra agravar agravacion agresion agresivo agresividad agresor ofen-
der espantado agitar agitacion agitador agonizar agonıa afligir enfermedad sin objetivo alarma
alarmante ay coartada extraterrestre enajenar alienacion alegacion alegar a distancia altercado
ambiguedad ambiguo ambivalente emboscada emboscada mal amputar anarquista anarquıa ira
ira enojado angustia animosidad aniquilar aniquilacion molestar molestia anomalo anomalıa
antagonismo antagonista antagonista enemistarse antisocial antipatıa anticuado antimonopolis-
ta ansiedad preocupados preocupados ansiedad apatico apatıa appall appall detencion aprensivo
arbitrario arduo argue argumento arresto arresto arrogancia arrogante artificial avergonzado ata-
car agresor asesino asesinar asalto asalto por mal camino en pedazos atroz atrofia ataque ataque
ataque audaz audacia austero autocrata autocratico avaricia avaro vengar aversion evitar evi-
tar evitacion horrible torpe torpeza hacha balbucear hacia atras atraso malo mal deflector des-
concierto fianza cebo obstaculo banal bandido perdicion desterrar desterrar destierro arruinado
bancarrota bar barbaro barbaro esteril barrera tımido bastardo batalla batalla campo de batalla
bestial golpe golpe golpe mendigar mendigo decapitar tardıo desmentir empequenecer belige-
rante correa privar duelo privado enloquecido implorar acosar sitiar traicionar traicion tener cui-
dado confundir desconcierto bit malevolo mordida mordida mordida amargo amargura extrano
chantaje paja culpa culpa amable blast blast evidente desolado defecto blind blind blind blind
ceguera bloque bloque estupido matanza sanguinario sangriento blow blow torpeza embotar di-
71
fuminar decir bruscamente consejo 7 alarde jactancioso falso bullicioso tornillo bomba bomba
bombardear bombardeo esclavitud bota alesaje alesaje alesaje aburrimiento bother bother mo-
lesto obligado combate caja jactarse blandir palo de golf bravata pelearse descarado incumpli-
miento pausa pausa pausa descompostura soborno cerda fragil rompio rompio rompio rompio 7
con el corazon roto crıa moreton brusco brutalidad bruto brutal hebilla error bala culo estropear
carga carga gravoso ladron robo burn burn burn burn enterrar entrometido carnicerıa calamidad
calloso cancelar cancelacion cancer canıbal canon capital capitular caprichoso zozobrar cautivo
captura captura carena descuidado descuido vıctima cataclismo catastrofe captura cave censurar
censura censura rozar reto reto caos caotico suplemento carga carga carga 7 chase chase castigar
barato abaratar cheater reprendo infantil cebador cebador faena cronico cırculo clamor clamoro-
so choque estrepito camarilla obstruir cerrar cerrar 7 club club torpe desorden grueso tosquedad
engreimiento engreıdo obligar coercion coactivo frıo frıo frıo frıo colapso colapso chocar coli-
sion colusion colonia combate combate combatiente conmiseracion commit plebeyo vulgar con-
mocion obligar obligar competir competencia competitivo competidor quejar queja complejo
complejidad complican complican complicacion complicidad compulsion encubrir presuncion
preocupacion preocupacion condenar condenar condenacion condescendiente condescendencia
confesar confesion aısle aısle confinamiento confiscar confiscacion conflicto conflicto conflicto
conflicto confundir confrontar confrontacion confuse confuse confuse confuse confusion con-
gestionado congestion conspiracion conspirador conspirar consternacion constrenir restriccion
consuntivo contagioso contaminar contaminacion desprecio despreciable desdenoso contender
contradecir contradiccion contradictorio contrario polemico controversia convict convict guay
frescura corroer corrosion corrosivo corrupto corrupcion coste coste alto precio costoso contra-
rrestar neutralizacion falsificacion encubierto codiciar cobarde astuto atestar calambre de ma-
niatico craso pedir arrastre manıa locura loca credulo crimen criminal encogerse lisiado crisis
crıtico criticar croar ladron torcido cruz cruz cruz 7 crudo cruel crueldad desmoronarse arru-
ga crush crush aplastante culpable culpable incomodo maldicion maldicion superficial brusco
acortar cut cut cınico cinismo dano dano maldita sea detestable maldito peligro peligroso oscu-
ro oscurecer oscuridad maldito desalentadora holgazanear aturdimiento muerto punto muerto
mortal peso muerto sordo sordera deal escasez muerte discutible deudor decadencia decaden-
te decay decay fallecimiento engano enganoso enganar enganar engano enganoso disminucion
72
disminucion descomponer disminucion disminucion difamar defecto derrota derrota defecto de-
fectuoso acusado defensivo desafıo desafiante deficiencia deficiente deficit desfiladero desafiar
degenerar degradar abatido retraso retraso delincuencia delincuente delirio diluvio engano de-
gradar fallecimiento demoler demonio desmoralizar negacion denunciar mella negar dependien-
te agotar deplorable deplorar deponer depravado depreciar depreciacion depress depress depress
depresion depresion privar ridiculizar burla burlon despectivo desert desert desercion deseo so-
litario soledad desesperacion desesperacion desesperado desesperacion despreciable desprecio
desprecio indigente destruir destruccion destructivo desapego detener desalentar disuasorio de-
testar detestable detraer perjudicial devastar devastacion desviarse desviacion diablo diabolico
tortuoso vacıo diabolico diabolico dictar dictatorial diferir de difıcil dificultad dilema dim dim
estruendo terrible suciedad sucio inhabilitar desventaja desventajoso desagradable desacuerdo
decepcionar a decepcionar a decepcionar a decepcionar a decepcion desaprobacion desaprobar
desarmar desastre desastroso repudiar negacion incredulidad descarga descarga negar incomo-
didad desconcertado descontento discordia discordante disuada disuada desanimo descredito
discrepante discriminar desden enfermedad enfermo desgracia disfraz disgust disgust disgust
disgust disgust desalentar deshonesto deshonra falso desinteres dislike dislike triste desestimar
desestimar desobediencia desobediente trastorno desestructurado disipar prescindible dispensar
desplazar desagradar disgusto disposicion disponer disponer desproporcionado refutar dispu-
table disputa disputa indiferencia interrumpir ruptura insatisfaccion insatisfecho descontentar
disentimiento disension disolucion distorsionar distorsion distraer distrayendo distraccion so-
corro socorro desconfiado perturb perturb perturb disturbio desviacion desviar divide divide
division divorcio divorcio divorcio mareado zona de las calmas ecuatoriales dominar dominar
dominar dominacion doom doom dıa del juicio final droga doble doble duda duda duda du-
doso alicaıdo caıda desanimado monotono arrastrar pavor terrible triste drive inclinarse drop
drop drop sequıa drown drown somnolencia sonoliento borracho borracho borracho borracho
dudoso aburrido tonto dump dump burro mazmorra deber disminuirse morir morir excentrico
excentricidad edge egolatra eliminar eliminacion avergonzar verguenza emergencia vacıo vacıo
invadir invasion poner en peligro enemigo hacer cumplir sumergir enfurecer esclavizar enredar
enredo rogar a envidioso envidia epidemia epıteto equıvoco erradicar borrar erosionar erosion
errar erroneo error esoterico estranged evadir evasion aun desalojar mal mal exageracion exas-
73
perar exasperacion excepcion exceso excesivo excluir exclusion excomunion ejecutar eximir
escape agotamiento exilio salida conveniente expulsar gastos gastos costoso explotar explotar
explosion explosivo exponer exterminar exterminio extinto extinguir extravagante fabricar fa-
bricacion fallo fallo fallo fallo fracaso debil falso caıda 7 falacia caer falso falsedad desfallecer
hambruna famelico fanatico fanatico farsa fascista fat fat fat fatal fatalista fatiga culpa miedo
miedo miedo temeroso temible fed debil fingir finta feroz ferocidad feudo feudal fiebre febril
fiasco voluble agitarse demonio feroz lucha lucha lucha combatiente inmundicia inmundo fino
fino 7 fuego fuego fuego puno revision flagrante falla huido huir fugaz endeble piso platija
enemigo debilidad tonto tonto tonto tonterıa prohibir prohibido fuerza fuerza fuerza presenti-
miento extranjera perder olvido abandonado formidable abandonar luchado fundador fractura
fragil frenetico freneticamente fraude fraudulento tenso monstruo traste displicente asustar a
asustar a asustar a espantoso frıgido frıvolo frente frown frown infructuoso frustrar a frustrar a
frustrar a frustracion fugitivo buscar a tientas fun furioso furia escandalo exigente futilidad hiel
gamble gamble tajo llamativo germen get horrible ghetto deslumbramiento relamerse oscuri-
dad melancolico sombrıo goddamn agarrar luchar gratuito grave grave grave grave grave dolor
queja afligirse severo oso pardo grotesco grunido resentimiento brusco queja guerrilla culpa
culpable guisa credulo pistola hombres armados cortar maquina de alquiler bruja demacrado
cesto mano desventaja hang hang al azar desventurado acosar acoso duro duro privacion dano
dano perjudicial duro molestia hate hate hate enemigo odio arrogante guarida estragos peligro
peligro peligroso confusion brumoso dolor de cabeza cruel frenetico cobertura hedonista des-
atento atroz infierno ayuda indefenso impotencia horrible impedir obstaculo hit hit acumular
cojear hoyo hoyo hueco acogedor sin esperanza horda horn horrible horrible horrorizar horror
hostil hostilidad caliente humillar humillacion hung hambre hambriento hunt hunt hunt cazador
hurt hurt hiriente ajetreo estafador hipocresıa hipocrita histeria histerico idiota idiota ociosi-
dad innoble ignorancia ignorante ill ill ill ill ilegal ilegalidad analfabeto enfermedad ilogico
inmaduro inmovilidad inmoral inmoralidad inamovible perjudicar punto muerto impaciencia
impaciente impedir impedimento imperfecto impersonal impetuoso implicar implorar imponer
imprecision encarcelar prision incorrecto impulsivo impuro impureza incapacidad inaccesible
inexactitud inadecuado inane incapaz incesante incompatibilidad incompatible incompetencia
incompetente inconsecuencia inconveniente incorrecto increıble incurable indecente indefinido
74
indeterminable indeterminado acusacion indiferencia indiferente indignacion complacer inefi-
caz inoperancia ineficaz ineficacia ineficacia desigualdad inexacto inexplicable infame infectar
infeccion inferior inferioridad infestar infiltracion inflamar inflacion infligir infraccion infrac-
cion enfurecer ingratitud inhibir inhibicion inhumano mandato lesionar perjudicial lesion insano
inseguro inseguridad insensible insidioso insignificante insinuar insolencia insolente inestabili-
dad inestable insuficiencia insuficiente insulto interferir interferencia interrumpir interrupcion
intervencion intimidar intolerable intoxicar entrometerse intruso intrusion inundar inundados
invadir invalido invisible involuntario involve fastidiar iron iron ironico ironıa irracional irre-
gular irregularidad irresponsable irritable irritacion aislar aislar carcel carcel jar burla poner en
peligro peligro tiron tiron nervioso desempleado asustadizo basura kick kick kick secuestrar
matanza matanza asesino cuchillo knock knock knock falta falta falta retraso laid cojo lamento
lamentable languidecer lapso risa ilegal lay perezosamente perezoso fuga fuga let responsa-
bilidad responsable mentiroso mentira mentira sin vida lımite lımite lımite limitacion cojear
liquidar liquidacion camada carga solitario soledad solitario solitario solitario telar perder per-
der perdedor perdida perdido perdido perdido perdido sin amor baja baja baja humilde ridıculo
calma lunatico senuelo estar al acecho mentira mentira mad mad loco locura haz inadaptado in-
adaptacion enfermedad malicia malicioso maligno mutilar manipular manipulacion homicidio
involuntario mar mar marginal masacre materia pobre mala sin sentido entrometerse medio-
cre manso melancolıa melodramatico amenaza servil despiadado lıo lıo cuenta 9 mina portar-
se mal mal comportamiento travesura danoso avaro miserable miseria desgracia manejar mal
percance informar mal mal informado enganar falsificar srta error error error equivocado des-
confianza entender mal malentendido incomprendido mal uso mix gemido burlarse de mofa
molestar monotono monotonıa monstruo monstruoso temperamental mortificar inmovil abiga-
rrado llorar llorar doliente confusion fangoso mascullar mundano asesinato asesinato asesino
turbio murmurar me¿nag ingenuo asqueroso travieso nebuloso necesidad necesidad necesidad
aguja necesitado negar negacion negativo abandono abandono negligencia negligente nervioso
nerviosismo neurotico neutralizar pesadilla nada ruido despreocupado disparates curioso noto-
rio principiante molestia anulacion anular entumecido nueces objeto objecion oblicuo obliterar
desagradable oscuro obsoleto obstaculo obstinado obstruir obstruccion impar rareza ofender de-
lincuente ofensiva ominoso omision omitir dogmatico adversario oponerse oponerse oponerse
75
oposicion oprimir opresion opresivo ordalıas orden 8 huerfano condenar al ostracismo expul-
sar brote explosion paria grito proscrito atropello indignante forastero despotico rebosar pasar
por alto dominar invadir vigilancia derrocamiento anular abrumador exceso de trabajo deber
dolor doloroso miserable pandemonio panico paralisis paralizado paranoico parasito determi-
nado dividir paso 8 paso 0 paso pasado de moda patetico patrocinar peculiar peligro peli-
groso perecer dejar perplejo perplejidad perseguir persecucion perturbar perverso pervertido
pesimismo pesimista parasito pequeno fobia seleccion pieza pinch pinch lamentable despia-
dado plaga plaga demandante situacion paso pesado parcela punto n ◦ inutil veneno veneno-
so contaminar contaminacion pomposo poor poor poor poor poor poor libra abadejo pobreza
impotente precario precipitado predicamento perjudicar perjudicial absurdo prensa presuntuo-
so fingir pretension pretencioso prision prision prisionero problema aplazar dilacion pinchar
prohibir prohibicion prohibitivo propaganda enjuiciamiento protesta protesta provocacion pro-
vocar merodear palanca punetazo castigar escuchimizado push push push perplejidad escrupulo
dilema pelea pelea peleon raro cuestionable sutileza dejar cobarde race radical rabia raid au-
mentar divagar desenfrenado bribon erupcion rata racionar rattle estrago reaccionario reactivo
rebelde rebelde rebelion rebelde rechazo reprension refutar recalcitrante alejarse recesion te-
merario imprudencia retroceso redundancia redundante estribillo refugiado negativa rechazar
independientemente regreso regresion regret regret lamentable rechazar rechazo recaıda reacio
remordimiento renuncia renuncia revocar reprensible reprimir reproche repudiar repugnante re-
chazar repulsivo resentirse de resentido resentimiento resignacion inquieto inquietud restringen
restringen restringen restriccion tomar represalias retardar jubilarse retiro retiro venganza re-
vertir revocar revuelta revolucion eliminar paseo burla burla ridıculo rıgido rigor riguroso rip
rip arriesgado rival rival rivalidad ladron robo pıcaro root putrefaccion podrido bruto aspereza
rotonda basura grosero ruda rufian ruina ruina ruina ruina ruinoso rumor arrugar operacion no
run huir ruptura ruptura oxidado implacable crueldad sabotaje triste tristeza hundimiento sank
savia sarcasmo sarcastica salvaje escaldadura escandalo escandaloso chivo expiatorio cicatriz
escasez susto susto asustado asustado de miedo esquema esquema burla scold scold quemar
desden desdenoso sinverguenza ceno raspar scream scream screech screech tornillo escudrinar
pelea escoria secesionarse secesion secreto secreto sedentario hervir segregacion aprovechar
egoısta egoısmo senil sin sentido la oracion secuestrar servir servicio servidumbre cortar grave
76
gravedad en mal estado la sombra sombreado lanudo shake superficial verguenza vergonzoso
desvergonzado tiburon shell shell naufragio eludir temblar descarga descarga descarga descarga
descarga pacotilla disparar disparar disparar breve escasez defecto miope shot empujon show
desgarrar musarana grito estridente marchitar sudario encogimiento encogimiento rehuir timi-
dez sick sick sick sick enfermizo enfermedad cerco tonto simplista sin sin pecaminoso siniestro
esceptico incompleto escaramuza esconderse golpe calumnia calumniador difamatorio bofe-
tada barra oblicua sacrificio asesino sordido insomne leve leve leve leve limo poco riguroso
perezoso perezoso babosa lento depresion astuto tortazo smash smash frotis ahogar hacer con-
trabando trampa grunido arrebatar furtivo burla ronquido sollozo sombrıo dolorido dolor dolor
triste triste triste ordenar agrio azotar spear derramar solterona pese malevolo split mimar spot
esguince chisporroteo malgastar punalada estancado manchar duro estancamiento balbucear
sello parada rıgido asustar inanicion morir de hambre estatico robar robar popa barra sofocar
estigma picadura hedor estola robado robado storm tormentoso rezagarse straggler cepa cepa
estrangular extraviado estres estres afligido estricta estricta estricta lucha huelga huelga riguroso
pulso lucha lucha lucha obstinado tercamente testarudez estudio cargado truco estupido estupi-
do estupido estupidez estupor sujecion subyugar subyugacion sumiso subordinacion disminuir
sustitucion sustraer subversion subvertir sucumbir ventosa sufrir sufrir vıctima sofocar hosco
romper superficial superficialidad superfluo supersticion supersticioso reprimir supresion sus-
ceptible sospechoso sospechoso suspender suspension sospecha suspicaz jurar juraron sıntoma
tabu mancha manosear berrinche tardıo arancel andrajo taunt taunt impuestos tear tear moles-
tar tedioso genio genio tempestad temporalmente tentacion tiempo tension terrible aterrorizar
terror terrorismo aterrorizar robo ladron sed sediento espinoso desconsiderado movimiento de
piernas amenaza amenazar tiro tiro ruido sordo frustrar timidez neumatico neumatico neumati-
co cansado cansado cansado cansado cansado esfuerzo tolerable too derrocar tormento torrente
tortuoso quisquilloso tragedia tragico traidor vagabundo pisotear transgredir trap trap trauma
traumatico traicionero traicion traicion treasonous pecado truco truco trivial problema problema
problema problema molesto ausente caminar penosamente try try turbulento confusion turn turn
8 contraccion nerviosa tiranıa feo ultimatum no acostumbrado unarm no atractivo unauthentic
inevitable inaguantable increıble incivil inmundo poco claro incomodo tosco undependability
poco confiable socavar inframundo indeseable deshicieron poco digna deshacer deshecho inde-
77
bido inquietud difıcil antieconomico desempleados desigual desigual inesperadamente injusto
infiel desconocido desfavorable insensible impropio imprevistos desafortunada desafortunada
desafortunada antipatico desagradecido sin defensa infelicidad infeliz insalubre sin importancia
no informado injusto injustificado cruel ilegal desafortunado impasible antinatural innecesario
enervar inadvertido desapercibido desagradable impopular improductivo no cualificado irrazo-
nable la falta de fiabilidad no fidedigno disturbios revoltoso inseguro insatisfactorio poco es-
crupuloso invisible inquietante defectuoso indecible inestable inestabilidad inestable fracasado
prematuro inexperto falso indigno de confianza mentira reacio renuencia imprudente indigno de
convulsion levantamiento escandalo desarraigar trastornado trastornado trastornado trastornado
trastornado inutil usurpar declaracion vagabundo vagabundo vago vaguedad vano desaparecer
vanidad vehemente venganza veneno venenoso veto vejar vejacion vexing vice vicioso rivali-
zar vil villano violar violacion violencia violento vıbora vacıo volatil volatilidad vomito vulgar
gemido espere revolcarse por menguar sin sentido guerra guerra belicoso deformacion caute-
loso residuos residuos antieconomico despilfarro rebelde debilitar desgaste cansancio aburrido
pequenito hierba llorar extrano moza golpear gemido gimoteo whip whip whip malvado mali-
cia salvaje salvaje salvaje salvaje marchitar astuto contraerse de dolor brujerıa withheld retener
afliccion lamentable desgastado desgastado worrier preocupacion preocupacion preocupacion
preocupacion preocupacion peor empeorar peor sin valor herida herida herida ira ruina luchar
desgraciado miseria arruga retorcerse mal mal ilegal forjado bostezo anorar ganido corrupto
hipocrita doble moral inconcistente prepotente injusto comunista arrogante petulante insolen-
te burdo vulgar odioso mentiroso charlatan ladron ambicioso controlador ignorante victimista
insensato inepto calumniador manipulador
78