Especiales de Caras y Caretas

4
Ilustración: Jung! Cuando el tamaño definitivamente importa Por Esteban Magnani Una diferencia determinante entre nuestra vida virtual y la material es que la primera puede pasarse fácilmente a una base de datos. Pero cuando esta información se lleva a cierta escala también puede usarse para prever el comportamiento de la sociedad, controlar a las personas o vender productos. A esta enorme cantidad de material en permanente movimiento se la llama big data y sabe más sobre nosotros que la madre que nos parió. Especiales de Caras y Caretas CyC 2286 Septiembre 2013 ok.indd 48 9/11/13 2:41:49 PM

Transcript of Especiales de Caras y Caretas

Page 1: Especiales de Caras y Caretas

Ilustración: Jung!

Cuando el tamaño definitivamente importa

Por Esteban Magnani

Una diferencia determinante entre nuestra vida virtual y la material es que la primera puede pasarse fácilmente a una base de datos. Pero cuando esta información se lleva a cierta escala también puede usarse para prever el comportamiento de la sociedad, controlar a las personas o vender productos. A esta enorme cantidad de material en permanente

movimiento se la llama big data y sabe más sobre nosotros que la madre que nos parió.

Especiales de Caras y Caretas

CyC 2286 Septiembre 2013 ok.indd 48 9/11/13 2:41:49 PM

Page 2: Especiales de Caras y Caretas

Q ué es lo que determina el éxito de una banda de rock? La respuesta

podría llevar entrevistas enteras de gran-des productores cazatalentos que expli-can cómo funciona su intuición. Es que cuando la cantidad de variables que in-tervienen en un fenómeno es demasiado grande, sólo cierta capacidad inexplicable puede dar algún tipo de respuesta. Pero algo está cambiando: los ríos de terabytes que circulan por la red, el aumento bru-tal en la capacidad de recolección y pro-cesamiento de datos, sumados a progra-madores cada vez más entrenados en este campo, ahora hacen posible obtener algu-nas respuestas de una realidad hasta hace poco inconmensurable.

De eso se trata big data: de grandes cantidades de información cargada por millones y millones de personas a través de las redes sociales, al usar sus tarjetas de crédito, sus celulares o realizar cualquier otra actividad digital. El espionaje masi-vo de los servicios de inteligencia de los EE.UU. es sólo un ejemplo del poder de los datos que hace unos años habrían re-sultado inmanejables.

Cuando se habla de big data suele pen-sarse en enormes cantidades de informa-ción, tan grandes que no pueden funcio-nar en una sola computadora sino que requiere “clusters”: es decir, redes de com-putadoras funcionando simultáneamen-te. A este requisito conocido y que le da el nombre hay que sumarle la velocidad, porque las redes sociales no descansan y es necesario recopilar, por ejemplo, los millo-nes de tweets, que se lanzan a cada segun-do, además de interpretarlos. Y por último se debe tener en cuenta la necesidad de es-tructurar esa información en bases de da-tos para así poder darle sentido. Cantidad, velocidad y estructura, más capacidad tec-nológica y el software adecuado, permiten encontrar las respuestas que se estaban buscando. La herramienta es muy podero-sa y ya se usa en las áreas más disímiles.

Una de ellas es la política. En EE.UU. no sólo es optativo votar, sino que quien quiera hacerlo primero debe realizar los trámites necesarios y cumplir con los re-quisitos exigidos –varían según los dife-rentes estados–. Esto en parte explica los bajos niveles de participación en las elec-ciones de este país y las estrategias de cam-paña de los candidatos. Para atraer nue-vos votantes el equipo de Barack Obama clasificó a los usuarios de las redes socia-les de acuerdo con las posiciones políticas de sus amigos. Así los especialistas reco-

nocieron a 3,5 millones de potenciales vo-tantes a Obama no empadronados y lue-go se dedicaron a conocer sus intereses específicos sistematizando las publicacio-nes que hacían en las redes sociales. Ese perfil permitió dirigirles sólo aquellas pro-puestas del candidato que podían persua-dirlos: leyes de género para las feministas, propuestas verdes para los ecologistas, et-cétera. El nivel de precisión de esta cam-paña fue muy superior al de afiches con candidatos sonrientes que no pueden de-cir nada por el riesgo de espantar a quien piense distinto. Finalmente el equipo de Obama logró que al menos un millón de personas a las que apuntaron se registra-ra para votar. Obama ganó por menos de cinco millones de votos en todo el país, y en estados como Florida, clave para la vic-toria, la diferencia con su oponente fue de menos de setenta mil.

La misma lógica puede aplicarse para diseccionar otros campos y encontrar las variables que expliquen fenómenos com-plejos, siempre y cuando existan los da-tos. Lo que antes requería focus groups y hordas de estudiantes munidos de encues-tas trajinando las calles, ahora requiere un puñado de programadores desmontando la información que proveen las redes so-ciales. Google, por ejemplo, utiliza esta ca-pacidad para, en la “intimidad” de nues-tro correo electrónico, colocar publicidad que se corresponde con el tema del e-mail “privado” que estamos por mandar a un amigo. El sistema funciona interpretan-do nuestros correos en tiempo real y per-mite a las empresas facturar en publicidad cuando usamos sus servicios.

La información es poder y en el caso de Google, Facebook o Twitter, entre otros, simplemente toman lo que sus usuarios les brindan gentilmente para hacer con ella cosas por demás novedosas. Otro ejem-plo: Google presentó recientemente una herramienta para prever éxitos de taqui-lla. Según pudieron establecer estadística-mente, cada persona consulta la película que le interesa unas trece veces en inter-net antes de ir a verla. O sea que si el bus-cador encuentra cierto número de visitas a trailers, críticas y demás puede estimar la futura recaudación del film. Es como si tu-viera una especie de bola de cristal digital capaz de adivinar el futuro.

PERSPECTIVAS ATEMORIzANTESPor supuesto que estos ejemplos más o me-nos ingenuos tienen una contracara bas-tante más oscura. No hace falta insistir en

las recientes revelaciones sobre el control que EE.UU. hace sobre las llamadas y el uso de internet de ciudadanos de todo el mundo. Ese país se encuentra en un lu-gar privilegiado porque la columna verte-bral global de las telecomunicaciones pasa por allí. La distopía orwelliana 1984, con el Gran Hermano vigilando a través de su ojo omnisciente a cada uno de los ciuda-danos, resulta ingenua al lado de la capa-cidad de empresas y Estados para generar bases de datos que prevean comporta-mientos gracias a la fuerza de las estadísti-cas. Ya no es ciencia ficción la posibilidad de cruzar los videos tomados por las cáma-ras de seguridad con sistemas de reconoci-miento facial para identificar el recorrido y las actividades de cualquier individuo. Las perspectivas resultan atemorizantes. El futuro no tan lejano lo es.

Pero también big data tiene, aunque bastante más pequeño, su costado lumi-noso: la cantidad de información disponi-ble en la red permite a las organizaciones desnudar vínculos de poder o formas más sutiles de corrupción. Es que los poderosos siempre tuvieron herramientas para some-ter y controlar, pero lo novedoso de nues-tra era digital es lo contrario: que herra-mientas similares quedan más cerca para quienes intentan balancear ese poder. Un ejemplo es la tarea que viene haciéndose desde el periodismo de datos, donde con-fluyen programadores con la capacidad técnica y periodistas con el criterio nece-sario para encontrar historias en la ma-raña de información que ofrece internet. Con esa lógica, una organización como ProPublica.org recogió de la web datos que luego cruzan para saber cuánto pagan los laboratorios a cada médico o quiénes financian las fundaciones que, a su vez, donan para las campañas de los distin-tos candidatos políticos de los EE.UU. La información estaba en la web, escondida dentro de cientos de declaraciones obliga-torias que nadie podía revisar individual-mente. Gracias al esfuerzo de periodistas y programadores se pudo recoger la parte re-levante en bases de datos que hicieran vi-sible lo que estaba oculto.

Quien tenga una base de datos sufi-cientemente amplia y capacidad para pro-cesarla de forma adecuada podrá saber más sobre la sociedad que lo que nunca se supo. Hasta qué punto se la usará para li-berarla o para dirigirla es algo que aún fal-ta determinar, pero lo más probable es que la tensión entre ambas posibilidades con-tinúe su ya largo recorrido histórico.

CyC 2286 Septiembre 2013 ok.indd 49 9/11/13 2:41:54 PM

Page 3: Especiales de Caras y Caretas

entrevista a sabina schneider, directora tecnológica de Globant

L as oficinas de Globant ocupan un par de pisos de las enormes torres que contemplan la estación de Retiro, en

el centro porteño. Allí cientos de trabajadores miran el mun-do virtual a través de sus amplios monitores, en una sala ilu-minada, con hamacas y sillones en las cocinas de los extremos, donde algunos almuerzan. Si esta no es la utopía laboral de la sociedad de la información, debe estar muy cerca. Se trata de una de las varias oficinas que esta multinacional argentina tie-ne repartidas en el país, Estados Unidos, Brasil, Uruguay, Co-lombia y Reino Unido.

Sabina Schneider empezó a trabajar aquí en 2004, un año después de que esta empresa comenzara a cosechar de la red la información que interesa a sus clientes. Actualmente es una de las directoras de tecnología.–¿Qué hacen ustedes?–Trabajamos con datos que se publican en internet en tiempo real, en grandes cantidades y los tomamos en crudo, como es-tán en bases NoSQL, para poder encontrar algunas respuestas a las preguntas de nuestros clientes. Esto implica además un di-seño de arquitectura complejo: hoy una computadora sóla no puede procesar toda la información junta y hay que usar “clus-ters”, racimos de computadoras conectadas pensados para po-der procesar fácilmente este volumen de teras y petabytes de datos.–¿Y qué hacen con la información?–Muchas cosas. Por ejemplo, con una entidad bancaria espa-ñola la usamos para analizar el consumo en distintas ciudades en distintos momentos del año y así planificar el turismo, ofer-tas u otras cosas. También se usan para marketing, detectar los segmentos que más usan distintas marcas, cruzándolo con el clima, si llovió o no. –¿Trabajan con políticos?–Nosotros no. Pero hay otras empresas que toman lo que se pu-blica en Twitter y lo analizan semánticamente para medir opi-niones positivas, negativas, con qué temas se los asocia, etcéte-ra. Para eso se usan algoritmos que procesan tweets y obtienen resultados a escala. –¿Estamos lejos de poder prever el surgimiento de una estre-lla pop por medio de big data?–No, no tanto en el sentido de que todo se está digitalizando cada vez más. Pensá en Justin Bieber y la cantidad de “likes”

que tuvo en Youtube cuando la mamá lo filmaba en su casa y cómo eso se empezó a viralizar. Ahí po-dés ir viendo tendencias que luego usás para pre-ver lo que puede pasar con otros, cruzarlos con datos de las redes sociales y encontrar patrones que te permitan prever algunas tendencias. Go-ogle tiene una cantidad de información sobre lo

que la gente está buscando que es enorme y que permite pre-ver lo que va a pasar en algunos campos. Hubo varios hospita-les en EE.UU. el año pasado que predijeron focos de enferme-dades sobre la base de las búsquedas que se hicieron en Google. Por eso, retomando el ejemplo de Justin Bieber, antes de que la madre lo filmara no podíamos saber que sería una estrella, pero una vez que hay respuestas en la red ya se puede empezar a ver tendencias.–Ahí surge la tentación de generar cierta tendencia artifi-cialmente.–Claro. Hay empresas que se dedican a crear perfiles falsos en Twitter para promover a distintos clientes. –¿Qué trabajo con big data te impresionó más?–Por ejemplo, una ONG que analiza enfermedades en Áfri-ca cruzando los datos de empresas de celulares que están muy difundidos en ese continente. Analizando el envío de mensa-jes de texto previeron el surgimiento de enfermedades porque veían que se empezaba a cortar la comunicación entre distin-tas personas. Así se decidía aislar alguna ciudad para evitar una epidemia. También hay cosas interesantes que se están usan-do para gestionar el uso eficiente de la energía en una empre-sa, un edificio o una ciudad. Es como la cara buena de lo que se puede hacer. La mala es lo que podés hacer para controlar a una población. –¿Cómo se evita eso?

–Tiene que haber regulaciones que aseguren que no se produzcan abusos. La tecnología va por delante de las leyes. Por ejemplo, con lo que se puede hacer en reconocimien-to facial se podría aprovechar las cámaras de seguridad que están en Buenos Aires para registrar dónde estuvo una per-sona o comportamientos sospechosos. La legislación no lo prohíbe explícitamente.

Navegando con el enemigo Por E. M.

Una empresa argentina con sucursales en Uruguay, Colombia, Brasil, el Reino Unido y EE.UU. trabaja con big data y vende los resultados obtenidos a empresas de todo el

mundo. ¿El bien y el mal definen por penal?

Foto: Fernando Calzada

CyC 2286 Septiembre 2013 ok.indd 50 9/11/13 2:42:01 PM

Page 4: Especiales de Caras y Caretas

un ProBLeMa De DereChos huManos

Por Sergio SorínEx presidente de Amnistía Internacional Argentina

y coorganizador de Hacks Hackers Buenos Aires

Se llama big data al análisis de gigantescas bases de datos para determinar una probabilidad. Su utilidad depende de la capacidad de pensar modelos que puedan inferir probabilida-des, trazar tendencias. La historia de la civilización es tam-bién el registro de acciones y percepciones. Desde hace déca-das todos formamos parte de grupos sociales particulares que comparten, producen y consumen en internet. Actualmente estamos muy cerca de que toda la comunicación no encriptada pue-da registrarse y analizarse casi in-mediatamente.

¿Cómo se acumula big data? Hay varias formas. En primer lu-gar por medio de API (sistemas que sirven de acceso a datos en bruto de un servicio web) que hoy son la principal herramienta de uso libre para hacer big data. Cada vez más, hackers, investigadores o periodis-tas de todo el mundo, pero también empresas y Estados indagan en es-tos servicios para conocer más de la sociedad. Un ejemplo: para las protestas del 8N contra el gobier-no de CFK, el colectivo HHBA rea-lizó una aplicación que capturaba en tiempo real miles de tuits con el hashtag #8N. La visualización per-mitió ver en tiempo real que la pro-testa se tuiteaba desde ciudades y sobre todo en los barrios de alto po-der adquisitivo. Si esto pudo hacer-se sin recursos, ¿qué pueden hacer quienes cuentan con ellos?

La segunda forma para capturar datos es la de las empresas e insti-tuciones de administración y análisis estadístico. En la actuali-dad, la iniciativa de Agenda Digital de la Jefatura de Gabinete de Ministros discute en sus foros abiertos cuestiones como la “interoperabilidad”, clave para que las bases de datos puedan interactuar entre sí. Pero son las empresas e industrias las que impulsan hoy el big data porque saben que esta tecnología les provee un servicio vital para competir. Mientras los Estados de la Unasur se alarman por la dimensión del espionaje global re-velado por Wikileaks y Edward Snowden, la industria se da una panzada sobre todo gracias al renunciamiento automáti-co de derechos que hacemos al consumir un producto por in-ternet alojado en un servidor fuera del país. Cada vez que usa-mos homebanking, Hotmail, Yahoo, Twitter, Facebook, etcé-tera aceptamos toda o parte de la legislación vigente en otros países como EE.UU., donde espiar internet es legal gracias a la Patriot Act. El concepto de privacidad se está redefiniendo y no de manera equitativa. Lo sería si los ciudadanos o las ins-tituciones que los representan tuviesen la posibilidad de con-

trolar y fiscalizar el registro que las empresas e industrias ha-cen de nosotros.

En tercer lugar existe la tendencia a que todo lo que se publique y conecte a la red se indexe en bases de datos. Buscadores como Google hicieron del rastreo e indexación de contenidos uno de los mayores negocios de todos los tiem-pos. Hoy la empresa llevó esa lógica a un nuevo nivel con

FusionTables, el que permite su-bir una base de datos y analizar-la trazando mapas y gráficos de relaciones sobre los datos que, gentilmente, subimos. Existen mi-les de herramientas tecnológi-cas de este tipo que operan en su mayoría en datacenters reparti-dos desigualmente en 91 países, de los cuales EE.UU. aglutina el 40,9 por ciento.

Y en cuarto lugar, se encuen-tra la más ilegal y desconocida de las opciones para acceder a da-tos supermasivos: el acceso físi-co a las conexiones de internet. Las revelaciones de Snowden demuestran la escala de recopi-lación de datos de los servicios de inteligencia. Y esto mueve mi-les de millones de dólares, un es-tímulo para que siga ocurriendo. Agencias como la NSA, el FBI y la CIA subcontratan empresas como la Booz Allen Hamilton (donde tra-bajaba Snowden) que recibió sólo en 2012 unos 1.300 millones de dólares para realizar análisis de

datos. Un detalle no menor es que el 60 por ciento de toda la conexión latinoame-ricana a internet se hace por una sola ciudad: Miami.

La Declaración Univer-sal de Derechos Humanos dice en su artículo 12: “Nadie será objeto de in-jerencias arbitrarias en su vida privada, su familia, su domicilio o su correspon-dencia, ni de ataques a su honra o a su reputación. Toda persona tiene dere-cho a la protección de la ley contra tales injerencias o ataques”. Cómo el mun-do va a dar cuenta de ello es una gran incógnita.

Ilustración de nota: Jung!

CyC 2286 Septiembre 2013 ok.indd 51 9/11/13 2:42:06 PM