Programación Disribuida

Modelos de Programación DistribuidaJonathan Narvaez

Modelo de programación Data-Parallel, diseñado para escalabilidad y tolerancia a fallos

● Uso de operaciones Map y Reduce

Diseño original por Google (2004)

● Usado para la ejecución de múltiples operaciones● Manejo de Petabytes diarios.

MapReduce

Escalabilidad con grandes volúmenes de datos.

● Uso de equipos de bajo costo● Uso de redes de bajo costo● Facilidad en la programación● Tolerancia a fallos

MapReduce Características

Sistema de Archivos Distribuidos

De GFS (Google File System) a HDFS (Hadoop File System)

Arquitectura Master WorkerMap Workers

Minimizar el uso de la red.Uso del disco local para la grabación de los archivos de salida.Tolerancia a Fallos

Reduce WorkersReplicación de resultados.Múltiples ficheros Reduce

MapReduce Características

Imagen tomada de: https://www.flickr.com/photos/nourlcn/5699664914/

MapReduce + HDFS

Imagen tomada de: http://hadoop.apache.org/docs/r1.2.1/hdfs_design.html

1. Biomedical Case Studies in Data Intensive Computing

2. Cloud-scale RNA-sequencing differential expression analysis with Myrna

3. Cloud computing for comparative genomics

4. BlastReduce: High Performance Short Read Mapping with MapReduce

5. Biodoop: Bioinformatics on Hadoop

6. CloudBurst: highly sensitive read mapping with MapReduce

7. Kepler + Hadoop : A General Architecture Facilitating Data-Intensive Applications in Scientific Workflow Systems

8. MapReduce-Based Pattern Finding Algorithm Applied in Motif Detection for Prescription Compatibility Network

MapReduce en la Bioinformática

● El modelo MapReduce reduce la dificultad de la distribución de trabajos y la tolerancia a fallos.

● Diseño escalable y reducción de costos asociados.

● No es adecuado a todos los problemas.

● Restricción a un solo modelos de herramientas de programación.

Conclusiones

Apache Hadoop YARN (Yet Another Resource Negotiator)

MapReduce V2

Adición de Elementos● JobTracker● ResourceManager● ApplicationMaster

Hadoop YARN

Imagen tomada de: http://hadoop.apache.org/docs/r2.3.0/hadoop-yarn/hadoop-yarn-site/YARN.html

● Modelo Resilient Distributed Data Sets.● Modelo de distribuido de memoria para computación, aplicado con apache

Mesos.● Escrito en Scala.● En memoria 100x.● En disco 10x.

https://spark.apache.org/

● Sistema de computación distribuida en tiempo real● Gestión de altos flujos de información● Diseñado con la topología Directed Acyclic Graph● Procesamiento de información similares a MapReduce, con la diferencia

que se realiza en tiempo real.● https://storm.incubator.apache.org/

Imagen tomada de: https://storm.incubator.apache.org/

Bulk Synchronous Parallel

● Procesamiento en memoria local● Sistema de mensajes entre pares● Facilidad en la sincronización de todos los componentes

● Modelo de computación Concurrente● Intercambio de Mensajes que facilitan el acceso remoto a datos● Algoritmo para la sincronización de procesos.

https://hama.apache.org/index.html

Programación Disribuida

Science

Transcript of Programación Disribuida

Contenidos I. Introducción a la Investigación de Operaciones II. Modelos de Programación Matemática Programación Lineal Programación Entera Programación.

PROGRAMACIÓN DIDÁCTICA Y PROGRAMACIÓN DE AULA DE ...

Programación Matemática Programación Lineal...Programación Lineal Muchas personas clasifican el desarrollo de la programación lineal entre los avances científicos más importantes

PROGRAMACIÓN DIDÁCTICA DE Programación Didáctica de 1º ...

1 Programación Interactiva Fundamentos de Programación.

Programación Paralela Programación en memoria compartida: OpenMP 1 PROGRAMACIÓN PARALELA Modelos de programación paralela Programación en memoria compartida:

PROGRAMACIÓN GENERAL ANUAL PROGRAMACIÓN …

Programación 3: programación por capas

Programación Paralela Metodología de la Programación 1 PROGRAMACIÓN PARALELA Tema 4: Metodología de la programación Foster, cap 2.

fundamentos de programación programación … de programación (unidad 4) programación estructurada en Java (6) (4.1) introducción. expresiones lógicas Hasta ahora las instrucciones

PROGRAMACIÓN PROGRAMACIÓN DE LA ASIGNATURA DE …

PROGRAMACIÓN DE LINGUAXE MUSICAL PROGRAMACIÓN DE …

Programación del Módulo Profesional Programación ... · Programación del Módulo Profesional de Programación Multimedia y de Dispositivos Móviles Ciclo Formativo de Grado Superior

PROGRAMACIÓN VISUAL.NET Conceptos de programación visual ...

Lenguajes de programación | Programación estructurada

Programación Modular - ::WEB DEL PROFESOR:: · Programación Modular Programación digital I Escuela de Sistemas Facultad de Ingeniería Gilberto Diaz. Programación Modular ...

Programación didáctica Módulo de Programación (DAW ... · Programación didáctica Módulo de Programación (DAW) aplicaciones web, con independencia del modelo empleado y utilizando

Programación Paralela Programación en memoria distribuida: MPI 1 PROGRAMACIÓN PARALELA Modelos de programación paralela Programación en memoria distribuida:

Programación Paralela Esquemas de Programación Paralela 1 PROGRAMACIÓN PARALELA Esquemas de programación paralela REFERENCIAS Wilkinson, Allen Gibbons,

Lenguajes de Programación I - Programación Lógica