Análisis de redes sociales - Parametría
Transcript of Análisis de redes sociales - Parametría
Análisis de redes sociales - Parametría
El análisis de redes sociales es una buena herramienta para conocer y entender la opinión pública usuaria de redes sociales. Cabe señalar que, dado el contexto socioeconómico en nuestro país y la brecha tecnológica característica de los países en desarrollo, este grupo reúne características específicas que merecen un tratamiento diferenciado de los trabajos demoscópicos realizados en vivienda o por teléfono.
Acorde con la Encuesta Nacional sobre Disponibilidad y Uso de Tecnologías de la Información en los Hogares, en México, solo 70 % de la población tiene acceso a internet (80 millones de mexicanos). Este segmento se identifica por ser el más urbano, más escolarizado y con mayores recursos económicos. Por ello, no es posible hablar que resultados obtenidos por estos medios puedan ser representativos de la opinión pública mexicana en su conjunto. Si bien quienes opinan y participan en medios tecnológicos representa especialmente a la clase media, un análisis de este segmento puede anticipar frecuentemente lo que será un tema de conversación social más general en el futuro.
Del total de usuarios de internet casi 90% usa redes sociales. De este grupo, poco más del 85% usa WhatsApp, un 84% tiene una cuenta de Facebook (84%), un 31% usa Youtube, un 27% tiene Instagram, y hasta el 10% son usuarios de Twitter. Entre el público que accede a redes sociales la mayor parte de ellos dedica su tiempo a temas como deportes o espectáculos (alrededor de 85%), mientras que solo una minoría los emplean para debatir los temas de vida pública.
Twitter es probablemente la red social con mayor frecuencia de opiniones en temas de interés público. Son diversos los estudios que han señalado la significativa diferencia entre las características de quienes usan redes sociales, siendo Twitter donde se identifica un perfil más especializado, más crítico y/o más informado. Por ello, nuestro análisis se enfoca en esta red social. El presente trabajo se realiza con interfaces basadas en la API de Twitter, donde se filtra- en tiempo real- los tweets de interés para crear una base de datos propia analizable. A partir de este análisis se identifican los topics, hashtags y usuarios más importantes para el seguimiento. Este análisis se basa en un scrapping personal de tweets en México que hacen mención de COVID-19.
Tiempo
Los datos sobre tweets hasta 2020-05-20 tienen 369,594 tweets.
El gráfico de tiempo presenta el número de tweets que mencionan el #COVID19MX. Estos tweets se muestran según la hora de su publicación desde el 31 de marzo al 20 de abril de 2020.
Es importante remarcar que los tweets tienen ciclos normales de creación determinado por las horas de descanso, así como la escalada esperada en los fines de semana. Este ejercicio permite evaluar la relevancia de un tema particular para la opinión pública usuaria de redes sociales y, subsecuentemente, entender su relación con eventos observados en un periodo de tiempo.
En la actualización de este reporte se incluyeron los tweets a partir del día 31 de marzo de 2020. En este sentido, los puntos más altos fuera de tendencia correspondientes a este periodo se observan los días 5 de abril, 9 de abril, 16 de abril, 21 de abril, 8 de mayo y 12 de mayo.
El primero repunte se ajusta en tiempo al anuncio presidencial de acciones para la reactivación de la economía ante la emergencia del COVID-19 —este acontecimiento en particular se retomará más adelante. El segundo punto
del 9 de abril corresponde con el momento en el que se presentaron, por primera vez, las estimaciones de casos confirmados con base en el Modelo Centinela de Vigilancia Epidemiológica. Desde su primera aparición, debido a la carencia de una nota metodológica, los datos causaron polémica e incluso confusión entre el público en general.
El tercero punto más alto coincide en fecha con la conferencia matutina presidencial en la que el subsecretario Hugo López-Gatell presentó un mapa desagregado a nivel municipal, cuyo propósito era ilustrar cuáles localidades terminarían la jornada de #SanaDistancia el día 17 de mayo y cuáles extenderían esta medida al menos el 30 de mayo. El cuarto más alto registro de tweets del 21 de abril la conversación se centró en los comentarios del conductor del noticiero de TV Azteca, Javier Alatorre, quien se declaró en contra de la postura y recomendaciones del gobierno federal.
El día 8 de mayo se registra otro crecimiento significativo del número de tweets derivado del anuncio del Secretario de Educación Pública, Esteban Moctezuma, confirmando que no se retomaran las clases hasta que no existan garantías sanitarias para el retorno seguro de alumnado y docentes. Por último, el alto crecimiento el día 12 de mayo se debió a la conmemoración del Día Internacional de la Enfermería, dado su importante papel en medio de esta pandemia.
Un elemento que vale la pena destacar es la tendencia decreciente respecto al tema del COVID-19: en general, se habla menos de forma cotidiana, salvo que exista un estímulo en forma de noticia o comunicados oficiales que lo impulse.
ANÁLISIS DE REDES SOCIALES
Frecuencia de tweets que mencionaron al #COVID19mxTweets agrupados por hora del 30 de marzo al 20 de mayo de 2020
Elaboración propia con datos de Twitter / Parametría
TIEMPO
Abr/04
400
300
200
100
0
Abr/11 Abr/18 Abr/25 May/02 May/09 May/16 May/23
Núm
ero
de tw
eets
Los primeros días vs los últimos días
Más que una nueva normalidad, la discusión del COVID-19 en redes sociales es ya la normalidad. Si bien la frecuencia de tweets relacionados con el virus ha bajado considerablemente, como ya se presentó en la gráfica anterior, las palabras, menciones y temas relacionados con éste han tenido cierto dinamismo. Para ilustrar este ejercicio, se realizará una comparación entre los términos más mencionados en las primeras dos semanas de cuarentena y las últimas dos.
Hashtags
Los hashtags de las primeras dos semanas son encabezados por #QuédateEnCasa, término que no perdió el liderato en ningún momento del periodo de analizado, y #SusanaDistancia. Destaca que #Tlalnepantla se encuentra dentro de los primeros diez hashtags más frecuentes, debido a haber sido el lugar de uno de los primeros brotes hospitalarios. Además, términos como #CuandoTermineLaCuarentena retratan una especie de nostalgia de la abandonada normalidad.
ANÁLISIS DE REDES SOCIALES
Elaboración propia con datos de Twitter / Parametría
LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASHASHTAGSHashtags más utilizados en tweets de COVID19
Primeras semanas de cuarentena: 30-mar al 15-abr
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
16,000
18,000
20,000
#Que
date
EnCa
sa
#Sus
anaD
istan
cia
#Mex
ico
#CDM
X
#Que
date
EnCa
saYa
#Tla
lnep
antla
#SNT
Esalu
d
#Mex
icoSo
lidar
io
#AM
LOse
VA
#Que
tate
EnLa
Casa
#San
aDist
ancia
#cua
rent
ena
#15A
bril
#Bue
nMie
rcol
es
#Cua
ndoT
erm
ineL
aCua
rent
ena
#Tea
mBS
ide
#Lor
dMol
ecul
a
#EnE
dom
exPr
even
irEsS
alud
#Cua
rent
ena
#AM
LO
17,702
9,474
4,1432,981 2,563 2,498 2,401 2,093 2,068 1,882 1,824 1,749 1,692 1,689 1,689 1,634 1,423 1,348 1,249 1,235
15,000
10,000
5,000
Núm
ero
de tw
eets
En cambio, los hashtags de las últimas semanas se relacionan más con las actividades que ahora son cotidianas en el encierro: #PontePilaEnCasa, #YoConPontePila y #DeporteComunitario. Además, existe un boom en el recomocimiento del personal médico que se dedica a atender a pacientes COVID-19: #DíaDeLaEnfermería, #SalvaVidas y #GraciasPorCuidarnos.
ANÁLISIS DE REDES SOCIALES
Elaboración propia con datos de Twitter / Parametría
LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASHASHTAGSHashtags más utilizados en tweets de COVID19
Últimas semanas de cuarentena: 04-may al 20-may
0
5,000
10,000
15,000
20,000
25,000
#Que
date
EnCa
sa
#Dia
DeL
aEnf
erm
eria
#Sal
vaVi
das
#Cui
dem
osTo
dosD
eTod
os
#Sus
anaD
ista
ncia
#CD
MX
#Pon
tePi
laEn
Casa
#Edo
mex
#Dep
orte
Com
unit
ario
#YoC
onPo
nteP
ila
#Mex
ico
#EnV
ivo
#Los
Lope
z
#San
aDist
anci
a
#Uni
dosS
aldr
emos
Adel
ante
#Pol
icia
DeG
ener
o
#Tra
baja
mos
PorT
uSeg
urid
ad
#Gra
cias
PorC
uida
rnos
#enP
unto
#Vca
rran
za
22,709
6,866
3,028 2,867 2,7582,080 1,794 1,576 1,407 1,387 1,057 1,016 875 790 576 526 526 466 440 423
20,000
10,000
5,000
Núm
ero
de tw
eets
15,000
Menciones
La comparación de menciones a cuentas públicas entre ambos periodos de tiempo también arroja resultados interesantes. En las primeras dos semanas se observa que la Secretaría de Salud federal (SSalud) era la cuenta más mencionada; el subsecretario López-Gatell se hallaba en tercer lugar, después de la cuenta del presidente López Obrador. Además, varios funcionarios públicos federales —el canciller Ebrard, el director del IMSS Zoé Robledo y la secretaria de trabajo Luisa Alcalde— se encuentran en las primeras 20 posiciones debido a su rol central en la atención de distintas áreas de la epidemia. En materia local, sólo los gobenadores Enrique Alfaro (Jalisco) y Alfredo del Mazo (EdoMex) logran entrar dentro de las cuentas con mayor número de menciones.
ANÁLISIS DE REDES SOCIALES
Elaboración propia con datos de Twitter / Parametría
LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASMENCIONESCuentas más mencionadas en tweets de COVID19
Primeras semanas de cuarentena: 30-mar al 15-abr
0
2,000
4,000
6,000
8,000
10,000
12,000
14,000
ssalu
d_m
x
lope
zobr
ador
_
hlga
tell
tu_i
mss
gobc
dmx
met
rocd
mx
felip
ecal
dero
n
gobi
erno
mx
susa
nadi
stan
cia
enriq
uealf
aror
ssalu
dcdm
x
alyn
mon
drag
o237
m_e
brar
d
lope
zdor
iga
zoer
oble
do
luisa
alca
lde
alfre
dode
lmaz
o
a_vc
arra
nza
soyd
avid
show
13,746
9,919
8,191
4,0123,296
2,672 2,6201,817 1,624 1,599 1,304 1,027 885 857 733 632 629 615 585 584
10,000
5,000
Núm
ero
de tw
eets
@
@
@ @ @
@
@
@
@ @
@
@ @ @
@ @ @
@
@
@
En contraste, en las últimas semanas la cuenta más mencionada, como era de esperarse, es del vocero oficial del gobierno: Hugo López-Gatell; le sigue Ebrard y Obrador. En general, se tiende a mencionar menos las cuentas institucionales y se menciona más a las y los titulares de cada institución. También vale la pena destacar que varias cuentas relacionadas con el gobierno de la CDMX cobran relevancia; posiblemente debido a las intervenciones locales que se han hecho tanto en lo económico como en materia de salud pública, en paralelo con lo establecido por el gobierno federal.
ANÁLISIS DE REDES SOCIALES
Elaboración propia con datos de Twitter / Parametría
LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASMENCIONESCuentas más mencionadas en tweets de COVID19
Últimas semanas de cuarentena: 04-may al 20-may
0
1,000
2,000
3,000
4,000
5,000
6,000
7,000
8,000
9,000
10,000
hlga
tell
m_e
brar
d
lope
zobr
ador
_
gobc
dmx
ssalu
d_m
x
skyn
ews
gobi
erno
mx
beat
rizgm
ulle
r
susa
nadi
stan
cia
zoer
oble
do
rosa
icela
_
fond
esoc
dmx
fadl
alaa
kaba
ni
alfre
dode
lmaz
o
ser_
mx
ssalu
dcdm
x
edom
ex
tu_i
mss
sede
cocd
mx
nytim
es
8,267
6,1615,811
4,774
3,529
2,2141,879
1,5451,322 1,236 1,098 1,064 867 862 652 618 490 482 472 432
4,000
2,000
Núm
ero
de tw
eets
@
@
@
@ @
@
@
@ @
@ @
@ @ @
@
@
@ @
@
@
8,000
6,000
Sentimiento
Por último, el sentimiento de ambos periodos tiene diferencias significativas. Al iniciar el periodo de confinamiento, casi la totalidad de tweets se calificaron de forma negativa: la mayoría de los días no contaron con una hora promediada como positiva. Esto puede deberse a que, al momento, se conocía todavía menos de cómo se desarrollaría la epidemia. La falta de información puede generar miedo y confusión entre las personas, por lo que esto explicaría el pesimismo general de las y los usuarios de Twitter.
ANÁLISIS DE REDES SOCIALES
Elaboración propia con datos de Twitter / Parametría
LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASSENTIMIENTOAnálisis de sentimiento en tweets de COVID19: Primeras semanas de
cuarentena: 30-mar 15-abrCada círculo representa una hora; el tamaño del círculo indica la cantidad de tweets encontrados por hora
Mar
/30
12AM
Mar
/31
12AM
Abr/
01 1
2AM
Abr/
02 1
2AM
Abr/
03 1
2AM
Abr/
04 1
2AM
Abr/
05 1
2AM
Abr/
06 0
1AM
Abr/
07 0
1AM
Abr/
08 0
1AM
Abr/
09 0
1AM
Abr/
10 0
1AM
Abr/
11 0
1AM
Abr/
12 0
1AM
Abr/
13 0
1AM
Abr/
14 0
1AM
Abr/
15 0
1AM
Abr/
16 0
1AM
0
-4
Sentimiento
4
5001000
1500
En cambio, las últimas dos semanas, si bien aun el pesimismo impera, se han observado más tweets positivos. Destaca un punto particularmente alto entre el 13 y 14 de mayo. Esta ola de optimismo coincide con el anuncio de los municipios, denominados "Municipios de la Esperanza" por el gobierno federal, que regresarían a sus actividades regulares el 17 de mayo. Es probable que este pico se deba a muchos tweets relacionados con este anuncio: tanto el nombre del conjunto de tales localidades, como el anhelo por la nueva normalidad, explican que el sentimiento haya virado de dirección.
ANÁLISIS DE REDES SOCIALES
Elaboración propia con datos de Twitter / Parametría
LOS PRIMEROS DÍAS VS. LOS ÚLTIMOS DÍASSENTIMIENTO
May
/05
12AM
May
/06
12AM
May
/07
12AM
May
/08
12AM
May
/09
12AM
May
/10
12AM
May
/11
12AM
May
/12
12AM
May
/13
12AM
May
/14
12AM
May
/15
12AM
May
/16
12AM
May
/17
12AM
May
/18
12AM
May
/19
12AM
May
/20
12AM
May
/21
12AM
0
-4
Sentimiento
4
Análisis de sentimiento en tweets de COVID19: Últimas semanas decuarentena: 04-May 20-MayCada círculo representa una hora; el tamaño del círculo indica la cantidad de tweets encontrados por hora
5001000
1500
Nota metodológica
Esta herramienta consiste en extraer información directamente desde la API-Twitter. Esta extracción se realiza en tiempo real para buscar y filtrar la información relacionada con el COVID-19 en México. Para el periodo analizado se extrajeron un total de 369,594 tweets. Para identificar las palabras, hashtags y cuentas más mencionadas se utilizan métodos de análisis de texto para limpiar y agrupar conjuntos de términos.
Análisis de sentimiento
Un sistema automatizado se asigna un puntaje a cada palabra en los tweets de la base de datos, lo cual obtiene un puntaje general por tweet. Con estos puntajes se obtiene un promedio de puntuación de los tweets por hora, y subsecuentemente construir el “sentimiento promedio” del día. El puntaje se posiciona en una escala de números reales (-∞, +∞), en la que los valores positivos significan un “sentimiento promedio positivo”, los números negativos significan un “sentimiento promedio negativo” y el número cero significa un “sentimiento promedio neutral”. A continuación se presenta una tabla con palabras que ejemplifican el sistema de puntaje.
Análisis de sentimiento en palabras Negativas Puntuación Positivas Puntuación bastardo -5 excepcional 5
negro -5 magnífico 5 perro -5 asombroso 4
pinchazo -5 celestial 4 tragón -5 eufórico 4 puto -4.7 exuberante 4 burro -4 fabuloso 4
catastrófico -4 fantástico 4 culo -4 ganador 4
defraudador -4 gracioso 4