Viviendo la Era del Big Data - xumarhu.netxumarhu.net › con_0032_big_data_conalep.pdf · 16...

40
Viviendo la Era del Big DataRogelio Ferreira Escutia

Transcript of Viviendo la Era del Big Data - xumarhu.netxumarhu.net › con_0032_big_data_conalep.pdf · 16...

“Viviendo la Era del Big Data”

Rogelio Ferreira Escutia

Data is the new oil!

—Clive Humby

Crecimiento de la Información

4

Primera Biblioteca - Alejandría

“Biblioteca de Alejandría”, https://es.wikipedia.org/wiki/Biblioteca_de_Alejandr%C3%ADa 2015

5

Castillos – Edad Media

http://musicayocio.com/noticias/fin-de-semana-medieval-en-el-castillo-de-manzanares-el-real/, 2015

6

Mi Biblioteca – Tec de Morelia

7

Computadora Thiane 2 (China)3,120,000 Cores – 54,902 Teraflops

“Top500”, http://top500.org/lists/2015/11/, 2015

8

“90% de la información existente a lo largo del planeta en toda su historia se ha generado en los últimos dos años”

Aitor MorenResponsable de

Inteligencia Artificial de Ibermática

Crecimiento de los 2 últimos años

“Big Data”, http://www.ibermatica.com/sala-de-prensa/opinion/big-data-el-termino-de-moda-en-el-mundo-de-la-informatica

9

Se estima un crecimiento del 4300% en la generación de datos anuales para 2020.

Crecimiento estimado

http://www.winshuttle.es/big-data-historia-cronologica/

Concepto

11

“Big Data” es una cantidad de datos muy grande, que excede las capacidades convencionales de los sistemas de Base de Datos.

¿Qué es Big Data?

“Big Data Now”, O'Reilly Media 2012

12

Difícil de recolectar (distribuidos en toda la red)

Difícil de almacenar (zetabytes = 1 x 10 E21).

Difícil de analizar (gran cantidad de información).

Difícil de procesar (se buscan patrones)

Características del Big Data

“Big Data Now”, O'Reilly Media 2012

13

Procesamiento del Big Data

“Big Data Now”, O'Reilly Media 2012

DATOS MODELADO SIMULACION OPTIMIZACION INFORMACION

14

Procesamiento del Big Data

“Big Data”, Judith Hurwitz2013

15

Cada cosa que se conecta a Internet Internet está lleno de datos. Por lo tanto, cada cosa que conectamos es parte

del Big Data.

Internet y Big Data

“Big Data Now”, O'Reilly Media 2012

16

Estructurados: como las bases de datos (fáciles de recolectar).

Datos sin estructura: Como la mayoría de las páginas Web (complejos de recolectar).

Datos SemiEstructurados: Como los documentos, que llevan un cierto formato (difíciles de recolectar).

Tipos de Datos

“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

17

Origen de los Datos

“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

18“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

”Cómo funciona La Web”, http://www.ciw.cl/libroweb, 2008

Anatomía de la Web

20

Motor de búsqueda completo

“Web Information Retrieval”

21

La Deep Web

“Web Information Retrieval”

22

Búsqueda de Palabras

“Web Information Retrieval”

23

Indexado del contexto

“Web Information Retrieval”

24

Ordenamiento y Ranking

“Web Information Retrieval”

25

Page Rank de Google

“Web Information Retrieval”

26

Reducción de los Datos

“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

27

Fusión e Interpretación de los Datos

“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

28

Visualización de los Datos

“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

29

Origen de los Datos

“Data Science”, Lillian Pierson, Jhon Wiley & Sons 2015

La Era del Big Data

31

Se detectó un patrón de compra en la década de los 90s en las tiendas Walmart:

Hombres casados y con hijos pequeños compraban “cervezas y pañales”

Caso Walmart: Detección de Tendencias

32

33

Avión Airbus A380

34

1000 millones de líneas de código.

Cada motor genera 10 TB cada 30 minutos.

640 TB en un vuelo Londres Nueva York.

Avión Airbus A380

Conclusiones

36

Competitividad Mundial

Ya no voy a ir Ya no voy a ir al antro…al antro…

Ya me dió el dolor Ya me dió el dolor de caballo…de caballo…

Si hubiera Si hubiera entrenado mas…entrenado mas…

Ahorita le Ahorita le meto un meto un

codazo…codazo…

No vuelvo a No vuelvo a cenar cenar

enchiladas…enchiladas…

¿cuánto quedó ¿cuánto quedó el Morelia?el Morelia?

By 2018, the United States will experiencea shortage of 190,000 skilled data

scientists, and 1.5 million managersand analysts capable of reaping

actionable insights from thebig data deluge.

—McKinsey Report

Nunca dejar de Soñar...

¿ Cuando me ¿ Cuando me sacaré la lotería?sacaré la lotería?

39

Sí se pudo!!!

Tu puedes ser el mejor!!!

Rogelio Ferreira Escutia

Instituto Tecnológico de MoreliaDepartamento de Sistemas y Computación

Correo: [email protected] [email protected]

Página Web: http://dsc.itmorelia.edu.mx/~rogelio/http://www.xumarhu.net/

Twitter: http://twitter.com/rogeplusFacebook: http://www.facebook.com/groups/xumarhu.net/