Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1....

8

Transcript of Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1....

Page 1: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

Proyecto1 28/6/12 10:22 Página 1

Page 2: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

� La rápida explosión de losdatos no estructurados, catali-zados por la omnipresencia deInternet y el masivo crecimien-to de los dispositivos móviles,ha creado un nuevo mercadopara capturar y analizar datosque no son tradicionales. Aho-ra, las fuentes de informaciónson sensores móviles, redes so-ciales, medios de pago electró-nicos, sistemas de videovigilan-cia, vídeos, redes inteligentes,imágenes médicas… Estamoshablando del fenómeno BigData, y los primeros afectadosde esta tendencia son los pro-veedores de bases de datos, puesdeben apoyarse en nuevas tec-nologías que ayuden a sus clien-tes a lidiar con tamaña cantidadde información.

La cuestión es que Big Datano está correctamente soporta-do por las bases de datos tradi-cionales debido a que ahora la

mayoría de los datos son desestructurados y demasiadovoluminosos, lo que conllevaunos costes prohibitivos enhardware y software. IDC, porejemplo, señala que en esta dé-cada el universo digital se mul-tiplicará por 44 veces, pasando

de 0,9 a 35,2 zetabytes; siendoel 90% de dicha informacióndatos no estructurados.

Para capitalizar el Big Data,especialistas como EMC, estáncombinando hardware, códigoabierto y tecnología de última

generación para capturar yanalizar dicha información.Un análisis que permita a lasempresas tomar decisiones másacertadas al adquirir nuevasperspectivas derivadas de losdatos empresariales. Por estemotivo, el Big Data es una

oportunidad enorme paraaquellas compañías, que en-tienden que deben evolucionarmás allá del Business Intelli-gence tradicional colocando aanalistas de datos en el centrode las decisiones de negocio.

Este movimiento permite,entre muchas otras cosas, me-jorar el margen de negocio alpoder alinear la oferta con lasnecesidades del cliente, utili-zar recomendaciones orienta-das a beneficios, o identificara clientes en riesgo.

El camino a Big DataTener acceso a todos los da-tos para obtener respuestasmás rápidas requiere de siste-mas elásticos y escalables. Pa-ra ello, EMC sugiere evolu-cionar el enfoque y optar porinfraestructuras orientadas alBig Data, tanto en los alma-cenamientos incluyendo tec-nologías cloud, como en losmotores analíticos orientadosa información estructurada odesestructurada. Así, tecnolo-gías como Isilon de EMC per-miten ofrecer un repositorioúnico de más de 10 petabytes

en lugar de islas de datos, quesuelen requerir una adminis-tración manual y estar sopor-tadas en sistemas dispares.Además, los sistemas tradicio-nales de almacenamiento sue-len ser un servicio provisio-nado por el departamento deTI, con el consiguiente con-sumo de recursos internos. Encambio, con la tecnología Isi-lon, se tiene un sistema únicogeo-distribuido, la gestión serealiza mediante políticas au-tomáticas y el enfoque es deautoservicio.

Resumiendo, guardar la in-formación en sistemas idóneospara Big Data permite realizaruna gestión más eficiente, faci-lita una escalabilidad más trans-parente; proporciona una au-tomatización de situación,protección y servicios del dato;simplifica el acceso a lo largo deredes y plataformas; y optimi-za la medición y autoservicioentre los sistemas usuarios.

EMC recomienda empleartambién herramientas ágilesde analítica, con arquitecturasMPP (Procesamiento masiva-

Hay que evolucionar e ir másallá del BI tradicional, ycolocar a los analistas de datosen el centro de toda decisión

Gestionar grandes datos requiere una nuevaaproximación en tecnología y profesionales

Las bases de datos tradicionales no son las más indicadas para soportar el Big Data

1 julio 2012 Big Data

www

2

El volumen cada vez mayor y el detalle de la informacióncapturada por las empresas, el aumento de las redes so-ciales y el fenómeno de Internet de las cosas están impul-

sando el crecimiento exponencial de los datos a un ritmotrepidante. Lidiar con el manejo de estos Big Data paraaprovecharlos y analizarlos de cara a una mejor toma de

decisiones requiere evolucionar el enfoque en términos dealmacenamiento, aplicaciones de analítica y administrado-res de las bases de datos.

¿Por qué el Big Data es mágico?Decir que el Big Data no tiene relevancia para las organizaciones es co-mo si se afirmara en los años 90 que Internet no es importante para losnegocios. Teniendo en cuenta tres fuentes de datos clave, el Big Data síes primordial.

La clave para gestionar el Big Data es cambiar la relación entre el de-partamento de TI y el negocio, pues el verdadero desafío es comprenderlos fundamentos de lo que la empresa hace y encontrar los modelos deanálisis de datos que permitan crear valor adicional para el negocio.

Tecnología Operacional: Hace referencia al Internet de las cosas, lainstrumentación de casi todo. Si la empresa trabaja con materiales físi-cos, debería considerar cómo una información completa sobre dichomaterial podría cambiar su operativa, costes y eficiencia. Por ejemplo,la industria de seguros de automóviles siempre se ha basado en el ries-go medio derivado de la información demográfica básica. Hoy en día,está empleando sensores en los vehículos para evaluar el riesgo de ca-da individuo en función de sus hábitos de conducción. Este cambio fun-damental en la forma en cómo se calculan los riesgos permite reducirlas primas y aumentar los beneficios.

Datos de Terceros: Se trata de información que está disponible si se vaen busca de ella. Tanto las administraciones como empresas de todo tipoestán abriendo el acceso a sus datos para el consumo externo. Si se com-binan los datos ya disponibles con sus nuevas fuentes, podría proporcio-nar una nueva perspectiva a la toma de decisiones. Por ejemplo, las pro-yecciones demográficas de los datos del censo podrían ser muy valiosaspara decidir sobre los desarrollos de infraestructura, la ubicación de nue-vos almacenes, puestos de torres de telecomunicaciones, etc.

Redes Sociales: Si la empresa vende productos o servicios tiene queaprovechar la mina de oro de las redes sociales. Atrás han quedado losdías en los que era posible controlar uno mismo la marca. La crecienteinfluencia de las redes sociales y la voz de la multitud se convertirán enla principal fuerza motriz para la percepción de la marca.

2-3 EMC:01-518-Portada 29/6/12 11:10 Página 1

Page 3: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

1 julio 2012

www

3Big Datamente paralelo) focalizadas enescalabilidad y productividad,así como reforzar la colabora-ción en tiempo real y el auto-servicio. Greenplum es la op-ción de base de datos orientadaa analíticas de EMC.

En cuanto al análisis de da-tos no estructurados, las solu-ciones tradicionales suelen serreactivas, predefinidas y lentasproporcionando una informa-ción limitada, y analizando só-lo terabytes de datos estruc-turados y agrupados. Encambio, las aplicaciones dise-ñadas específicamente paraBig Data ofrecen una analíti-ca más ágil, proactiva, de in-formación expandida y corre-lacionada, y optimizan elcumplimiento normativo.Son capaces de analizar hastaPB de datos crudos, tanto es-tructurados como desestruc-turados; y son compatiblescon los sistemas y herramien-tas existentes al estar abiertasa un amplio ecosistema de so-luciones. En este sentido,EMC ofrece la integración en-tre su base de datos Green-plum y Hadoop, como solu-ción orientada al análisis dedatos desestructurados.

En los procesos analíticostradicionales, los administra-dores de bases de datos puedenconvertirse en un cuello de bo-tella para los equipos de Busi-ness Intelligence. Por tanto, laorganización necesita evolucio-nar hacia esquemas más cola-borativos formados por los ad-ministradores de bases de datos,adscritos al departamento deTI, y con equipos dedicados ala ciencia de los datos, que in-cluirían al administrador de laplataforma de datos, usuariosde Business Intelligence, usua-rios de la línea de negocio, yun nuevo perfil de profesional:los científicos de datos. Preci-samente este sería el siguientepaso en el camino al Big Data.

Con el objetivo de aportarun nuevo valor al negocio po-tenciando las aplicacionesEMC propone emplear solu-ciones que permitan tomardecisiones en tiempo real,monetizando la información.Frente a unas analíticas queofrecían datos agrupados delpasado, estimativas y aisladasde las aplicaciones, ahora seimpone proporcionar la in-formación en tiempo real,junto con una orientaciónpredictiva y embebida en lasaplicaciones.

En conclusión, la idea deEMC es poner la informaciónen acción de una manera sen-cilla con herramientas para no

programadores y con modeli-zación de procesos, que ayu-den a tomar decisiones, in-

cluso de contexto, más rápidasy mejores en función del últi-mo dato recabado; y que faci-liten un seguimiento de la in-formación para reducir losriesgos asociados a los datos.

El científico de los datosConviene destacar que la ana-lítica avanzada no necesaria-mente tiene que estar relacio-nada con el Big Data; esigualmente eficaz para mejo-rar la forma en que las em-presas pueden obtener infor-mación valiosa del BusinessIntelligence en sus bases dedatos, ya sean grandes o pe-queñas. Estos datos por lo ge-neral incluyen cifras e infor-mación de áreas como ventas,demografía de marketing, re-gistros de CRM y otras fun-ciones básicas del negocio. Es-tos son los datos estructuradosque las organizaciones sabenutilizar bien.

El reto es que las empresasahora quieren saber muchomás de lo que los enfoques

tradicionales de análisis dedatos les ofrecen. Por ejem-plo, estas analíticas puedendecir a una organización quelas ventas del producto X se

redujeron en una región de-terminada, pero no sabría de-cir el porqué. Precisamente,son estos ‘porqués’ los másútiles para las compañías yque los análisis avanzados dedatos saben responder. Ex-plicar el pasado y predecir elfuturo. Así, si la empresamencionada anteriormentedescubre que la presión com-petitiva en los precios es laculpable de la disminuciónde las ventas, podría explorarqué sucedería si cambia su es-trategia de marketing y ha-cer predicciones precisasacerca de si esto podría ayu-dar a impulsar las ventas del

producto X en las regionesdonde las ventas han bajado.

Obviamente, hay muchainformación y diversos méto-dos de modelización. Los aná-lisis de hoy en día requierenel uso de técnicas estadísticaspara ‘aprender’ de los datos,de patrones de relieve y ano-malías, y de profesionales quesepan utilizarlas. El empleo detecnologías Big Data no solopermite aumentar la capaci-dad de procesamiento, tam-bién se trata de encontrar esasideas que marcan la diferen-cia, siempre y cuando se dis-ponga de los perfiles y expe-riencia para llevarlo a cabo.

Es aquí donde surge el cien-tífico de datos, un término quese aplica a aquellos profesio-nales, con habilidades en ma-temáticas, estadísticas e inge-niería informática, que soncapaces de extraer el máximovalor de los datos de la organi-zación, cerrando la brecha en-tre las necesidades del negocioy las TI. Sin embargo, es cru-cial que la comunicación en-tre ellos y la organización sea lomás fluida posible. Contar conplataformas y comunidades dedesarrolladores y científicos dedatos es una buena opción pa-ra fomentar esta colaboracióny la innovación.

Forrester Wave: Mercado de proveedores de solucionesempresariales Hadoop, 1Q2012

Fuente: Forrester Research

Estudio de Big Data de IDC España:Cerca de un 5% de las empresasespañolas ya utiliza esta tecnología Según el estudio de IDC España, el mercado de Big Data se encuentra enuna fase de eclosión en España en 2012. Actualmente, un 4,8% de las com-pañías que componen el tejido empresarial español ya han incorporadoestas tecnologías a su negocio, y se prevé que, para finales de 2012, se lle-gue al 7,6% de adopción. Este informe, que ha sido patrocinado por variasempresas, entre ellas EMC, también pone de manifiesto que un 19,3% delas empresas españolas están familiarizadas con el concepto, y que el14,6% se plantea su uso en el futuro.

En España, Big Data se encuentra en un momento incipiente, en el queempresas innovadoras que buscan posicionarse como líderes en la trans-formación de base tecnológica que está viviendo el mercado son las queestán apostando por estas tecnologías. No obstante, la velocidad de adop-ción de Big Data es diferente según el tamaño de las empresas y el sectoren el que operen. El sector de distribución es el primero en adopción de BigData seguido por el sector financiero, y las empresas de más de 500 em-pleados son las más avanzadas en conocimiento, aunque las empresasentre 100 y 500 empleados son las que lideran la adopción del modelo.

El interés por las tecnologías de Big Data, la creciente presión de la ex-plosión del universo digital y la propuesta de valor que aúna Big Data conAnalytics (que permite generar ventajas competitivas y ayudar a transfor-mar la inteligencia de las empresas) hacen ver con optimismo el futuro deeste mercado. Según Alejandro Giménez, CTO de EMC España, “Big Data po-co a poco está transformando el negocio y la manera de llegar al consumi-dor. No es solo un tema de capacidad y manejo de grandes cantidades dedatos. Big Data es un punto de inflexión para mejorar el interface con elcliente, los servicios que les proveemos y desplazar a la competencia”.

Contar con plataformas y comunidades de científicos dedatos y desarrolladores fomentala innovación y colaboración

2-3 EMC:01-518-Portada 29/6/12 11:10 Página 2

Page 4: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

Big Data es una gran fuerza de cambioUna excelente oportunidad para organizaciones de cualquier ámbito

1 julio 2012 Big Data

www

4

Big Data ya es una realidad, y se está convirtiendo en unafuerza formidable para el cambio, como lo demuestran losproyectos, desarrollados por EMC, y que se muestran en

este reportaje. La gestión y análisis de los grandes datos,estructurados y no estructurados, aplicados en camposcomo la investigación científica, sanidad, seguridad, re-

des sociales o medios de comunicación, entre otros, cons-tituye para las empresas una herramienta única de ganarcompetitividad y de mejora de la vida ciudadana.

Desarrollar productos sociales innovadoresLinkedIn es una de las empresas con una vi-sión audaz para el futuro del Big Data y la web.De hecho, el fundador de la compañía, ReidHoffman, ha declarado que la Web 3.0 proce-derá de los datos y de la analítica. Con más de100 millones de usuarios, LinkedIn está en unaposición privilegiada para acceder a sus datosy aprovechar sus puntos de vista. El compro-miso de la compañía para la búsqueda de apli-caciones innovadoras y útiles se puede encon-trar en productos como LinkedIn Skills, listascon hipervínculos de habilidades que permi-ten saber, por ejemplo, cuáles son las habili-dades particulares más interesantes para unposible empleador. Así, los usuarios puedenencontrar personas, empresas y puestos detrabajo relacionados con sus habilidades. Hayque mencionar también un proyecto de BigData en LinkedIn, como es InMaps, una visua-lización de datos innovadora que cartografía

las conexiones en todo el universo profesio-nal de un usuario.

En defnitiva, LinkedIn aprovecha los da-tos de alto valor generados por los profesio-nales que han establecido sus identidadesreales en este servicio. Al disponer de ungrupo científico de datos, -que incluye acientíficos de diversas procedencias y profe-sionales con experiencia en visualización-,LinkedIn ha proporcionado constantemen-te a su base de usuarios formas innovadorasde conexión y de construir su reputaciónprofesional. Este grupo ofrece a LinkedIn unenfoque único y competitivo, permitiendo ala compañía ofrecer herramientas profesio-nales antes que cualquier otra empresa enel espacio social. Y “esto es solo el inicio dela revolución Big Data”, declara Peter Sko-moroch, científico principal de datos en Lin-kedIn.

Transformar la investigación genética con tecnología de escalaEl Instituto Broad, un centro de investigación de me-dicina genómica formado por científicos del Institutode Tecnología de Massachusetts (MIT) y de la Univer-sidad de Harvard, quería llegar a una comprensiónglobal de los elementos en el genoma humano eidentificar cómo los circuitos de las células genómi-cas procesan la información. A través de una serie deproyectos de colaboración, el Instituto está identifi-cando las mutaciones celulares que causan el cáncer,la base molecular de los virus, bacterias y otros agen-tes patógenos que causan enfermedades infecciosas;e innovando en el desarrollo de fármacos. Todo elloha contribuido a incrementar exponencialmente losdatos que maneja el Broad Institute, -el año pasadocreció a ocho petabytes-, con un rendimiento que seduplica cada cinco meses. Para gestionar los cada vezmás grandes conjuntos de datos relacionados con elgenoma, los investigadores del Instituto Broad se ba-san en el almacenamiento en cluster de EMC Isilon, yhan desarrollado más de 30 herramientas de softwa-re a medida para realizar un análisis altamente espe-cializado de dicha información. En línea con su com-promiso con la investigación y colaboración abierta, elsoftware y los datos están disponibles para todos losinvestigadores para su descarga desde el sitio web delBroad Institute.

Big Data da nuevos conocimientos sobre la vida urbanaEn la era del Big Data, tener en cuenta fuentes de datos innovadoras en las ciudades puede reve-lar nuevos conocimientos sobre la vida urbana. Es el caso de los proyectos Cabspotting y Crimes-potting, desarrollados por la firma norteamericana Stamen Design, que permiten visualizar ten-dencias económicas, sociales y culturales nunca antes vistas. Crimespotting nació porque lasaplicaciones de cartografía del crimen, utilizadas por la Policía de Oakland, tenían una funcionali-dad limitada y mapas anticuados. Todos los días, Crimespotting recoge las denuncias de delitosdel servicio Crimewatch de la ciudad y los importa a su base de datos. Luego ofrece un entorno car-tográfico interactivo que permite seguir los casos de delincuencia en el vecindario, y proporcionaservicios personalizados como alertas específicas para la vecindad. Cabspotting es otro de los pro-yectos de la empresa, que utiliza las coordenadas GPS de los taxis de San Francisco para revelar pa-trones ocultos de la vida urbana. Rastrea las carreras de los taxis situando sus movimientos en unmapa interactivo de la ciudad. La información se recoge desde un servidor de la sede central deYellow Cab, que recaba los datos GPS de cada taxi en tiempo real, y una vez analizados, el resulta-do es un nuevo tipo de antropología urbana que habla de asuntos políticos, sociales y económicos.

4-5 EMC:01-518-Portada 29/6/12 12:59 Página 1

Page 5: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

1 julio 2012

www

5Big Data

El mundo está conectado a una escala sin prece-dentes, y el riesgo de amenaza de una pandemiamundial ha aumentado de manera exponencial.Tradicionalmente, los esfuerzos de control de en-fermedades reaccionan cuando surgen los brotes.Sin embargo, estos tiempos de respuesta retarda-da son demasiado lentos para una población queestá siempre en movimiento. Además, los virusson cada vez más resistentes a los antibióticos, loque hace ineficaces las medidas preventivas tra-dicionales. Es necesario un nuevo enfoque para elcontrol de enfermedades.

En esta línea, Previsión Global Viral (GVF) apro-vecha el Big Data para evitar grandes pandemiasmundiales antes de que comiencen, ante "fraca-sos como la continua falta de éxito en la vacunacontra el VIH/Sida tras 25 años de pandemia. Es-to demuestra que el enfoque de esperar y respon-der no es suficiente”. Por este y otros motivos, GVFrecoge sus datos de múltiples fuentes, incluyen-do la investigación antropológica en los puntoscalientes de enfermedades para identificar cómolos virus pasan de la vida silvestre a los seres hu-manos, y sigue las tendencias de las redes socialespara predecir y prevenir brotes. Utilizando una redde puestos de escucha viral localizados en Came-

rún, la República Democrática del Congo, Mada-gascar, China, Malasia, Sierra Leona y Gabón, GVFtiene como objetivo detener los virus antes de quepasen de animales a los humanos.

Para GVF, el mundo tanto físico como digitales el laboratorio, creando grandes conjuntos dedatos que permiten tomar medidas preventivasreales. Pero siempre hay una necesidad de másdatos para ayudar a predecir y prevenir la próxi-ma pandemia mundial. GVF puede hacer predic-ciones precisas y realizables utilizando la inge-niería y la técnicas de software que fueronincipientes hace una década, pero para mejorarla eficacia de estas predicciones, esta instituciónestá constantemente buscando nuevas fuentesde datos relevantes como crear modelos de inter-acción social a partir de los datos anónimos de te-léfonos móviles.

Como resultado a su trabajo de campo, GVF haaveriguado cómo se propagan los virus de la car-ne de animales silvestres a los humanos; ha iden-tificado una quinta forma de la malaria humana,y estudiado cómo se originó la enfermedad; y haconseguido saber las causas del fallo en el con-trol de la contención de la gripe porcina, entreotros éxitos.

Mejorar la eficiencia energética con la automatizaciónSilver Spring Networks ofrece a las compañíaseléctricas un conjunto de hardware, software yservicios de smart grid. Sus productos se conectana cada dispositivo en la red, creando una red in-alámbrica entre dichos dispositivos que se puedepersonalizar a las necesidades e infraestructura decada eléctrica. Utilizando una infraestructura dered inteligente, los dispositivos de Silver Springcrean una red segura de auto-configuración quegarantiza la cobertura total a cualquier escala. Enesta red, las eléctricas pueden implementar siste-mas de medición avanzada para obtener datosprocesables en programas de eficiencia energéti-ca, programas de respuesta a la demanda que op-timizan la eficiencia energética mediante la re-ducción de la carga máxima, mejorando laeficiencia y la fiabilidad de sus servicios con la au-tomatización de distribución.

A medida que ha ido aumentando la base de ins-talación de Silver Spring, ha ido creciendo su ne-cesidad de contar con un data warehousing y unaplataforma de análisis que le permita obtener unamejor visión y valor de sus datos. Por ello, ha cam-biado a las soluciones de Enterprise Data Cloud deGreenplum para reemplazar su costoso hardwarede back-end y aprovechar los beneficios de losanálisis ágiles y profundos que la tecnología deGreenplum le proporciona. En concreto, SilverSpring emplea una combinación de productosSaaS y bajo demanda de Greenplum, para ofrecerservicios y productos de smart grid más fiables yeficientes. Además, este cambio ha permitido aSilver Spring generar nuevas fuentes de ingresosal poder ofrecer herramientas de análisis mejora-das para utilities que permiten conocer cómo losclientes utilizan la energía.

TV5MONDE es el canal internacional detelevisión en lengua francesa que emitea un promedio diario de 25 millones deespectadores y 180 millones de hogaresen más de 203 países. Con sede en Pa-rís, siete canales diferentes de TV5MON-DE ofrecen subtítulos en varios idiomascon el fin de llegar al público de formasimultánea en los cinco continentes.Tiene más de ocho centros de distribu-ción primaria, emisiones a través de 52satélites, más de 6.000 sistemas de ca-ble, y disponibilidad en tres millones dehabitaciones de hotel. TV5MONDE es elsegundo canal distribuido más grandedel mundo.

Para hacer frente a las miles de horasde programación original, control deversiones, y ampliar la catalogación decontenidos, TV5MONDE ha hecho unagran inversión en TI para gestionar lacarga de trabajo de los grandes archivos

multimedia, gráficos y animación. Sinembargo, la creciente necesidad deemitir para formatos de pantalla ancha,transmisión de alta definición y televi-sión por IP, ha hecho que TV5MONDEnecesitara aumentar bastante la capa-cidad y el rendimiento de su plataformade almacenamiento. Para ello, en unprincipio pensó en actualizar la infraes-tructura SAN que tenía, pero las limita-ciones en la escalabilidad y un rendi-miento pobre llevaron al canal detelevisión francés a explorar otras alter-nativas.

TV5MONDE ya había implantado elsistema de almacenamiento Isilon deEMC para utilizarlo en otra división. Eléxito de esta instalación empujó al ca-nal a llevar a cabo un piloto de almace-namiento NAS (Network-Attached Sto-rage) con una solución mucho másgrande de Isilon, que utilizó como nue-

va infraestructura de almacenamientopara la mayor parte de sus contenidosaudiovisuales.

"Escogimos Isilon porque era fácil deimplementar y es progresivo en térmi-nos de capacidad de almacenamiento yancho de banda”, comenta GuillaumeLairloup, director adjunto de Sistemasde TI para TV5MONDE. Asimismo, Isilonse integra a la perfección con el softwa-re SGT MAM permitiendo que se alma-cenen y cataloguen hasta 15.000 horasde vídeo digital.

EMC Isilon es la nueva plataforma dealmacenamiento de TV5MONDE, el cualahora puede ofrecer una mayor varie-dad de programación en alta definición.Además, este canal internacional de ele-visión tiene ahora la capacidad de poderaumentar terabytes en su infraestructu-ra de almacenamiento en línea con lademanda.

Un almacenamiento adecuado para emitir a más de 200 países

Big Data, en la línea de defensa contra las pandemias

4-5 EMC:01-518-Portada 29/6/12 12:59 Página 2

Page 6: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

Big Data es un concepto relati-vamente nuevo que está en bo-ca de toda la industria, ¿cómoexplicaría este fenómeno des-de el punto de vista de EMC?Para nosotros es un enfoquenuevo de cómo almacenar, ges-tionar y analizar todos los datosque genera una organizaciónpara una óptima toma de deci-siones. Estos datos son tanto es-tructurados como no estructu-rados y provienen de diferentesfuentes como el correo electró-nico, imágenes médicas, dispo-sitivos móviles, redes sociales…en definitiva, todas las nuevasfuentes que han surgido en losúltimos años. Lo que entende-mos por Big Data, y todas lastecnologías asociadas, es con-vertir los datos en informaciónútil para la toma de decisionesen cualquier organización. Se

trata de conseguir un acerca-miento proactivo al cliente me-diante entornos analíticos quesean fiables y escalables, y per-mitan crear nuevos productos,modelos de negocio… Y todoesto conlleva la adaptación deprocesos y tecnologías porquehay que analizar los datos deuna manera diferente.

¿Se puede gestionar el Big Datacon las bases de datos relacio-nales y aplicaciones de BusinessIntelligence tradicionales?Esa gestión se lleva haciendodesde hace muchos años, pe-ro ahora se requiere adoptarun nuevo enfoque. Hay quecambiar los procesos de nego-cio y las bases de datos rela-cionales que antes teníamos,porque ahora los datos proce-den de muchas fuentes dife-rentes, por lo que hay que uti-lizar tecnologías nuevas para

explotarlas. El análisis transac-cional que se hace ahora delos datos es completamente di-ferente, así como las tecnolo-gías que lo capturan, almace-nan, gestionan y recuperan.

¿Cuál es entonces la oferta deEMC en el campo del Big Da-ta?, ¿en qué áreas de produc-to se concreta?Ofrecemos soluciones para to-da la cadena de valor de los da-tos, es decir, desde la capturadel dato hasta el almacena-miento, gestión, análisis deprocesos y la consulta de la in-formación. Todo ello con es-calabilidad ya que podemos es-tar hablando ahora de unpetabyte, y dentro de diezaños, serán los zetabytes. Porello, proporcionamos tecnolo-gía que permite, en todo su

ámbito, gestionar diferentesmodelos y escalabilidades encuanto a los datos. Para EMC,“Data is the new gravity”, se-gún nos explicaba Pat Gelsin-ger en EMC World en Las Ve-gas. Antes, las aplicaciones eranel centro de gravedad en todaslas organizaciones, y ahora elmodelo ha cambiado convir-tiéndose los datos en el centrode gravedad. Bajo esta pers-pectiva, EMC apuesta, no so-lo por los conceptos de análi-sis de datos, también por cómose capturan, se almacenan, ose mejoran los procesos inter-nos de negocio, con produc-tos que van dsede solucionescomo Greenplum para análi-sis de datos, a tecnologías co-mo Isilon, Atmos, VNX… pa-ra almacenamiento; DataDomain y Networker para laprotección de la información;RSA para seguridad; e IIG (la

familia de Documentum) pa-ra la mejora de la explotaciónde los procesos de negocio, ytodo ello contando con tecno-logías de virtualización.

¿Qué tipo de organismos oempresas pueden empleartecnología de Big Data?En principio, desde nuestropunto de vista, todos los secto-res son susceptibles de utilizarla tecnología Big Data, desde elsector financiero, energético,telefonía móvil, Administra-ción Pública, investigación…¡quién no tiene datos para in-novar y buscar nuevos modelosde negocio y más en los tiem-pos que corren! Por ejemplo,

nosotros tenemos proyectos enentidades financieras que, contecnología de almacenamientoy análisis de información, tení-an diferentes datos de clientesen distintas fuentes y sistemastransaccionales. Estos datos re-lativos se han agrupado de for-ma inteligente y esto ha per-mitido hacer una segmentaciónpara poder ofrecer los produc-tos más adecuados en funciónde la capacidad adquisitiva, sunivel de riesgo, inversiones aasumir… Igualmente ocurre enla Administración, que tienemultitud de datos y expedien-tes, que pueden entrecruzar en-tre los distintos organismos, lo-cales y centrales, para mejorar

el servicio al ciudadano. Hayestudios que desprenden quelos gobiernos pueden ahorraren Europa alrededor de 150millones de dólares si gestio-naran bien los Big Data.

Ha comentado que Big Dataimplica un cambio de enfoqueen tecnología, porque se ne-cesita una escalabilidad im-portante; y en aplicacionespues el dato es el centro degravedad. Pero, ¿cuál es el pa-pel que juega el profesionalen la evolución del Big Data?Para las empresas el Big Dataes todo un desafío a nivel tec-nológico y de profesionales.Ha surgido un perfil nuevo, el

científico de datos, que real-mente no existe; se tiene queformar para tender un puenteentre la tecnología y el conoci-miento del negocio porque losdatos que se analizan tienenque dar un resultado y redun-dar en el beneficio del negocio.Por tanto, debe tener un co-nocimiento de los dos mun-dos. Es cierto que el científicode datos ha pasado a tener unarelevancia especial y muchasorganizaciones lo están resol-viendo formando a gente queha estado en tecnología y ne-gocio. Es un reto organizativomuy importante que debe re-solverse en el corto plazo.

¿Cómo ve EMC la evolución deesta tecnología en los próxi-mos años?El fenómeno Big Data acaba deempezar, la masa de datos estácontinuamente creciendo. Sedice que el universo digital cre-cerá un factor 44x en diez años.Esto ha sido posible porque sehan unido diversas tecnologíascomo la virtualización, el cloudcomputing… conceptos nue-vos que las empresas tienen queser capaces de digerir. Nos es-tamos moviendo de contenidodel dato al contexto. Las em-presas tecnológicas deben ir eneste camino y ser conscientes delfenómeno. Hay que invertir entecnologías que ayuden a teneruna mejor oferta y una mayorcohesión e integración de to-dos los elementos necesarios pa-ra rentabilizar el Big Data.

¿Qué conexión tiene el Big Da-ta con el cloud computing?Cloud es un elemento cataliza-dor porque cuando se tiene lainformación en la nube es mássencillo almacenar y analizar eldato. El cloud computing es labase para poder ir a un mode-lo de Big Data del que se pue-de sacar mayor partido en elmenor tiempo. El nivel de éxi-to en el Big Data también de-pende del nivel de madurez delas empresas, y la nube es un pa-so clave en la flexibilidad y laeconomía de coste.

Hay que conseguir un acercamiento proactivo alcliente mediante entornosanalíticos fiables y escalables

“Los datos son el nuevo centro de gravedad”Paloma Herranz, directora de Preventa para España de EMC

1 julio 2012 Big Data

www

6

En la era del Big Data las empresas deben saber adaptarsecon rapidez a los nuevos tiempos, y saber convertir todoslos datos que genera la organización en información útil pa-

ra una correcta y ágil toma de decisiones. Para ello, PalomaHerranz, directora de Preventa de EMC en España, explicaen esta entrevista cómo es necesario cambiar el enfoque

en cuanto a tecnologías, aplicaciones y profesionales parapoder almacenar, gestionar y analizar todos los datos, loscuales han pasado a ser el centro de gravedad.

6 EMC entrevista:01-518-Portada 29/6/12 12:57 Página 1

Page 7: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

1 julio 2012

www

7Big Data

� Con su nueva plataformade analítica para Big Data,Greenplum Chorus, EMC es-tá acercando las capacidadesde las redes sociales y herra-mientas de colaboración a losanalistas de datos, llamados“científicos de datos”, un nue-vo perfil recientemente crea-do para poder gestionar el fe-nómeno de la explosión de lainformación.

Greenplum Chorus es elprimer conjunto de herra-mientas sociales de la industriapara Big Data, que ha sido creado conjuntamente por ladivisión Greenplum de EMCy los expertos de Pivotal Labsen modernas metodologías dedesarrollo ágil y marcos deprogramación. Permite a losprofesionales responsables deanalizar la información cola-borar en conjuntos de datosal estilo Facebook, con el ob-jeto de permitir a las empresasadquirir una mayor visión yvalor económico del Big Data.

“Chorus se sitúa en la in-tersección entre lo social y BigData”, recalca Luis Zamora,responsable comercial de Greenplum en España y Por-tugal. “La unión de los con-ceptos social y colaboraciónayuda a los grupos a la hora decolaborar y, de hecho, obteneraportaciones útiles a partir desus datos. Se trata de un pro-ceso muy social y colaborati-vo. Afecta a muchas personasdentro de una empresa. Mien-tras la mayor parte de la in-dustria está centrada en la ve-locidad de carga, los tiemposde procesamiento, etc., EMCtoma la iniciativa en la ‘socia-

lización’ del análisis de BigData”, explica.

Una plataforma abiertaEn la industria del softwarede hoy en día, contar con laimplicación de los desarrolla-dores es un recurso que no tie-ne precio, y EMC lo sabe. Hatomado la decisión de animara los desarrolladores a que en-tren en su plataforma de ana-lítica del Big Data al propor-cionarles un entorno dedesarrollo extremadamenteágil en el que trabajar y cola-borar. Además, cierra sinergiascon VMware al ofrecerles unentorno virtual independien-te en el que pueden descargarun set de datos y trabajar conellos sin interferir con otrosanalistas o incurrir en el peli-gro de corromper la informa-ción original. De esta manera,los científicos de datos puedencomentar, modificar o com-partir los resultados con otrosanalistas a través de Chorus.

Greenplum Chorus es tam-bién una herramienta abierta,pues el data Warehouse deGreenplum está basado en labase de datos de código abier-to PostgreSQL. Asimismo, secomplementa con la iniciativaOpenChorus que EMC ha cre-ado para acelerar la innovacióny adopción de aplicaciones dedatos colaborativas y sociales,ejecutadas bajo la plataformaGreenplum Chorus.

El código abierto de Green-plum Chorus se lanzará bajolicencia open source durante elsegundo semestre de 2012; y las

actualizaciones del proyecto es-tarán disponibles en opencho-rus.org. No obstante, Green-plum Chorus también formaparte de la plataforma de EMCGreenplum Unified AnalyticsPlatform (UAP), la base paraque las empresas puedan crearsu propia estrategia de analíti-ca del Big Data. Esta platafor-ma combina tres productos deGreenplum en una oferta com-binada: la base de datos paradatos estructurados; la ofertaempresarial Hadoop para ana-lizar y procesar los datos no es-tructurados; y Chorus.

EMC casa el Big Data con las redes socialesempresariales para optimizar su analítica

Las herramientas sociales de Greenplum Chorus ya se encuentran disponibles

Ya está disponible en el mercado Greenplum Chorus, unaherramienta de colaboración social al estilo Facebook, que

EMC proporciona para que los profesionales responsablesdel análisis de datos la empleen en el estudio de conjuntos

de datos y faciliten de forma rápida y eficiente informaciónútil para el negocio de sus organizaciones.

Lo más destacado de Greenplum ChorusColaboración en tiempo real: Chorus elimina el problema de los si-los en una organización al reemplazar el correo electrónico acumuladopor una interfaz única para todos los datos de la empresa, junto conbases de datos virtuales que favorecen la investigación e innovación,así como la colaboración. El resultado es que el equipo de científicos dedatos puede, en colaboración, descubrir, compartir y discutir ideas quetienen un impacto significativo en el negocio.Exploración de datos: Con Chorus, los analistas pueden navegar yexplorar conjuntos de datos y bases de datos Hadoop de toda la orga-nización. Una vez importados al entorno de trabajo, Chorus gestionaráel flujo de datos y monitorizará la dependencia y actualización de la co-pia cuando se actualice la fuente con nueva información.Espacios de trabajo: Con Chorus, los equipos de científicos de datospueden crear nuevos entornos de analítica con unos cuantos clics. Noes necesario hacer una solicitud al departamento de TI y esperar horase incluso semanas.Análisis de datos: Greenplum Chorus crea y mantiene un repositorioactivo de soluciones analíticas, que facilita el intercambio de ficheros,el control de versiones, seguimiento de los cambios y archivado. Estainfraestructura de intercambio de contenido preserva el valor de los fi-cheros con independencia de los cambios en la organización.Publicar puntos de vista: Chorus proporciona una única interfaz en-riquecida con funcionalidades de redes sociales que facilitan la partici-pación y colaboración entre los responsables de analizar el Big Data.

La gran oportunidad de analizar el Big DataHoy en día las empresas no tienen escasez de fuentes de datos, comolo demuestran los datos de IDC, que indican que en 2011 el mundocreó 1,8 zetabytes (1,8 billones de gigabytes) de información, lo quesignifica que la creación de datos se ha multiplicado por nueve en cincoaños. Algunos de estos datos son estructurados, están almacenados enbases de datos y a menudo sirven como material para actividades deBusiness Intelligence. Debido a que el volumen de datos estructuradosha crecido, las bases de datos analíticas han madurado y continuadoproporcionando una mejor analítica de datos estructurados. Sin em-bargo, el Big Data es un reto que va más allá de esta evolución porquela mayoría de los datos no son estructurados.

La conclusión es que aquellas empresas que buscan la agilidad delnegocio necesitan una manera de analizar todos estos datos estruc-turados y no estructurados; y eso es un desafío que supera las capaci-dades de las bases de datos relacionales. Sin embargo, según un es-tudio de TDWI, el 70% de los profesionales de bases de datosconsideran el Big Data una oportunidad, más que un problema. Sinembargo, pese a que cerca de tres cuartas partes de las organizacio-nes han adoptado alguna forma de analítica, sólo el 34% analiza elBig Data. Y las empresas que ya han adoptado este análisis, puedenhoy en día adelantarse a su competencia.

Redacción, publicidad, administración y suscripciones Miguel Yuste 17-3ª 28037 Tel: 913 137 900 Fax: 913 273 704

Editorial

Director Ambrosio Rodríguez • [email protected]

Redactor jefe Rufino Contreras • [email protected]

Jefes de sección Lores Serrano • [email protected]ía Bonilla • [email protected]

Redactores y Colaboradores Cristina López • [email protected]Ángela Mandianes • [email protected] Minaya • [email protected]

Diseño y maquetación Jorge P. Aguilar • [email protected]

Fotografía Santiago Ojeda

Coordinador área de Internet Fernando Reinlein • [email protected]

Marketing y EventosResponsableRuth González • [email protected]

ProducciónImprime: PrinterMan I Cubiertas: AGS

PublicidadDirectora de Publicidad Inma Pérez • [email protected]:. +34 91 313 79 39 / Fax:. +34 91 327 37 04

COMPUTING España está editado por BPS

Consejera Delegada Anunciación López • [email protected]

Depósito Legal M-7753-1995ISSN 1139-9619

7 EMC:01-518-Portada 29/6/12 11:12 Página 1

Page 8: Proyecto1 28/6/12 10:22 Página 1 - Computing · 2012-07-03 · Proyecto1 28/6/12 10:22 Página 1. La rápida explosión de los datos no estructurados, catali-zados por la omnipresencia

EMC2, EMC and the EMC logo are registered trademarks or trademarks of EMC Corporationin the United States and other countries. © Copyright 2012 EMC Corporation. All rights reserved.