Haz que tus datos sean sexys

Post on 22-Jan-2018

28 views 0 download

Transcript of Haz que tus datos sean sexys

“Haz que tus datos sean sexys”

Jorge López-Malla@jorgelopezmalla

Sergio Gómez@Pulsarin

MAD · NOV 24-25 · 2017

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Haz que tus datos sean sexys■ ¿Quienes somos?■ ¿De qué va esto?■ Tecnologías■ Conclusiones

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Jorge López-MallaStratio Big Data

@jorgelopezmalla

linkedin.com/in/jorge-lopez-malla

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Sergio GómezThingsO2

@Pulsarin

linkedin.com/in/bedeveloper

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Machine Learning■ Entender el problema■ Entrenar un algoritmo■ Ejecutar a gran escala■ Representa tus datos

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

La red de vigías

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Monstruos■ Uruk-hai 5.0■ Goblin,1.0■ Thug,0.5■ Orc,0.7■ Nazgul,10.0■ ******, 9999

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Monstruos

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

El señor oscuro

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

K-MeansK-means es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

K-MeansK-means es un método de agrupamiento, que tiene como objetivo la partición de un conjunto de n observaciones en k grupos en el que cada observación pertenece al grupo cuyo valor medio es más cercano.

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

La magia de los datos

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Tenologías■ Docker■ Apache Spark■ Jupyter■ Notebook■ Apache Toree

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¿Te has bajado el docker?

SPARK_OPTS=.....

fi

vi /opt/conda/share/jupyter/kernels/apache_toree_scala/bin/run.sh

SPARK_OPTS="--packages org.vegas-viz:vegas_2.11:0.3.11 "$SPARK_OPTS

if["${TOREE.....

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¡Ejecuta!

docker run -it -p 8888:8888 --net host -v /home/sgomez/codemotion:/home/jovyan/work:rw jupyter/all-spark-notebook

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¡Al lío!

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

Conclusiones

people@stratio.comWE ARE HIRING

@StratioBD

hello@thingso2.com¡Buscamos talento!

Jorge López-Malla @jorgelopezmalla - Sergio Gómez @pulsarin

¡Gracias!(¿Preguntas?)