GPGPU programazioa: Txartel grafikoa erabiliz programatu

GPGPU programazioaTxartel grafikoa erabiliz programatu

Mikel Iturbe Urretxa

UniEncounter, 2013ko Martxoak 21

Irudiaren egiletza: CC-BY 2.5 Christian Prade (cprade@Flickr)

Edukiak

Sarrera: GPUak

Plataforma desberdinakOpenMP & OpenACCCUDAOpenCL

Non erabiltzen da?

zer da txartel grafikoa?

“oinarrizko plakako zirrikituetako batean

konektatzen den barruko osagaia da. Bere

helburu nagusia monitoreari azaldu behar

diren datuak zuzen bidaltzea da.”

Iturria: CC-BY-SA 3.0 Euskarazko Wikipedia. http://eu.wikipedia.org/wiki/Txartel grafiko

zer da GPUa?

“a specialized electronic circuit designed to

rapidly manipulate and alter memory to

accelerate the building of images in a frame

buffer intended for output to a display”

Iturria: CC-BY-SA 3.0 Ingelesezko Wikipedia. http://en.wikipedia.org/wiki/Graphics processing unit

zerekin lotzen ditugu?

eboluzio handia

Jatorrizkoaren egiletza: GPLv3 Gang Garrison 2

Jatorrizkoaren egiletza: GPLv2 Xonotic

grafikoak+

fisika

paraleloan aritzeko egokiak

</sarrera>

<gpgpu?>

denok ezagutzen dugunadibidea

Jatorrizkoaren egiletza: CC-BY-ND Pavol Davorsky (˜PAulie-SVK@devianART)

Jatorrizkoaren egiletza: CC-BY-SA 3.0 OpenStreetMap & Euskalmapa.com

Jatorrizkoaren egiletza: CC-BY-SA 3.0 OpenStreetMap, Euskalmapa.com & Amazon Web Services

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Janine Arriaga

Jatorrizkoaen egiletza: CC-BY-SA 3.0 Janine Arriaga & Guudmorning!@Flickr

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Janine Arriaga, Angelica Castillo & Chris Covarrubias

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Nikki Ibanez

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Christophe Dang Ngoc Chan & PD Charles B. King

Moore-ren legea

“bi urterik behin, zirkuitu integratuetako

transistore kopurua bikoiztu egiten da”

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Wgsimon@Wikimedia Commons

eta erlojuaren maiztasuna?

Jatorrizkoaren egiletza: CPU DB. http://cpudb.stanford.edu/visualize/clock frequency

zergatik?

Jatorrizkoaren egiletza: CC-BY-SA 3.0 RRZEicons@Wikimedia Commons & PD Clker.com

(2) & (3)

Jatorrizkoaren egiletza: CC-BY 3.0 NVIDIA CUDA Programming Guide version 3.0

bakoitza bere lanerako egokia

hau baliatzen duenprogramazio eredua

general-purpose computing ongraphics processing units

orotariko konputazioa grafikoakprozesatzeko unitateetan

</gpgpu?>

begiztetanzentratua

Jatorrizkoaren egiletza: CC-BY 2.5 Val Kerry (art makes me smile@Flickr)

industri-estandarrak

adibidea

1 int main(int argc , char *argv []) {

const int N = 500;

3 int i, a[N];

//a[N] bete

for (i = 0; i < N; i++)

7 a[i] = 2 * i;

9 return 0;

OpenMP

int main(int argc , char *argv []) {

2 const int N = 500;

int i, a[N];

4 //a[N] bete

6 #pragma omp parallel for

for (i = 0; i < N; i++)

8 a[i] = 2 * i;

10 return 0;

OpenACC

const int N = 500;

3 int i, a[N];

//a[N] bete

#pragma acc parallel kernels

7 for (i = 0; i < N; i++)

a[i] = 2 * i;

return 0;

zer paralelizatu nahi denadierazten da

nola egiten den jakin beharrikgabe

migrazioa errazagoa

OpenMP oso erabiliaOpenACC ez hainbeste

</OpenMP & OpenACC>

harietanzentratua

Jatorrizkoaren egiletza: CC-BY 2.5 Val Kerry (art makes me smile@Flickr)

<CUDA>

sakonago

gpgpu produktu helduena

NVIDIAk garatua

eta propietarioa... :-(

Jatorrizkoaren egiletza: CC-BY 3.0 Tosaka@Wikimedia Commons

kernelak

paraleloan exekutatuko direnfuntzioak

ezin dute baliorik bueltatu

global

CUDA C

Jatorrizkoaren egiletza: PD Clker.com & Seamas O Brogain

Jatorrizkoaren egiletza: CC-BY 3.0 Tor proiektua

Jatorrizkoaren egiletza: CC-BY-SA 3.0 Ricardas.marozas@Wikimedia Commons

</CUDAren egitura>

eta kernelak exekutatzeko?

(1)zeren gainean egingo du lan?

cudaMalloc()

cudaFree()

cudaMemcpy()

(2)nola exekutatuko da?

kernela<<<exek param>>>(f param)

hariak

blokeak

hariak

Jatorrizkoaren egiletza: CC-BY 3.0 Jorge Barrios (jorgebarrios@Wikimedia Commons)

3D array bat(dim3)

hardware-ak mugatzen dukopurua

threadIdx

(threadIdx.x, threadIdx.y, threadIdx.z)

blokeak

hari taldeak

Jatorrizkoaren egiletza: CC-BY 2.5 Novita Estiti (verypurpleperson@Flickr)

3D array bat(dim3)

blockIdx

(blockIdx.x, blockIdx.y, blockIdx.z)

Jatorrizkoaren egiletza: CC-BY 2.5 Dennis Brekke (dbrekke@Flickr)

kernela<<<hariak, blokeak>>>(f param)

(3)eta harien artekokoordinazioa?

memoria

synchthreads()

adibidea

const int N = 500;

3 int i, a[N], b[N], c[N];

//a eta b edukiz bete

for (i = 0; i < N; i++)

7 c[i] = a[i]+b[i];

9 return 0;

int main(int argc , char *argv []) {

2 const int N = 500;

int a[N], b[N], C[N];

4 //a eta b edukiz bete

6 cudaMalloc ((void **) &d_a , N*sizeof(int));

cudaMalloc ((void **) &d_b , N*sizeof(int));

8 cudaMalloc ((void **) &d_c , N*sizeof(int));

10 cudaMemcpy(d_a , a, N*sizeof(int), cudaMemcpyHostToDevice);

cudaMemcpy(d_b , b, N*sizeof(int), cudaMemcpyHostToDevice);

dim3 hariak (25, 10, 1);

14 dim3 blokeak (2, 1, 1);

kernel <<<blokeak , hariak >>>(*d_a ,*d_b ,*d_c);

cudaMemcpy(c, d_c , N*sizeof(int), cudaMemcpyDeviceToHost);

cudaFree(d_a);

20 cudaFree(d_b);

cudaFree(d_c);

return 0;

__global__ kernel (int *d_a , int *d_b , int *d_c) {

2 int indizea = (threadIdx.x + 25 * threadIdx.y) * (

blockIdx.x + 1);

d_c[indizea] = d_a[indizea] + d_b[indizea ];

tresnak

CUDA-GDB

</CUDA>

GPGPUrako estandar irekia

kodea hainbat gailutanexekutatu daiteke

CUDArekin antzekotasunak etadesberdintasunak

maila baxuagokoa

oraindik ez CUDA bezain osoabaina...

etorkizuna izango da

</OpenCL>

</arkitekturak>

<non? zelan? zertarako?>

Jatorrizkoaren egiletza: CC-BY 2.5 ChrisDag@Flickr

Jatorrizkoaren egiletza: PD AEBko energia departamendua

baita gailu txikiagotan ere

segurtasunaren esparruan...

WPA, hash... “ikuskaritza”

</non? zelan? zertarako?>

eskerrik asko.

lizentzia: CC-BY 3.0http://creativecommons.org/licenses/by/3.0/deed.eu

(kontrakoa adierazita duten irudiena izan ezik.)

LATEXeko Beamer klase librearekin eginiko aurkezpena

http://slideshare.net/janfri

http://hamahiru.org

mikel@hamahiru.orgpgp gakoa: 0x8141DED2

@azken tximinoa

GPGPU programazioa: Txartel grafikoa erabiliz programatu

Technology

Transcript of GPGPU programazioa: Txartel grafikoa erabiliz programatu

Introducción a la Programación CUDA en GPGPU...Introducir la arquitectura GPGPU y la programación en CUDA. Mostrar soluciones a problemas de bioinformática. Qué veremos: Introducción

Monte Carlo en modelos de spin aplicación en GPGPU

Simulaciones de Física Estadística usando GPGPU: tres … · CUDA Driver Version / Runtime Version 4.2 / 4.1 CUDA Capability Major/Minor version number: 2.0 Total amount of global

Resolución de las Ecuaciones de Navier-Stokes en Multi-GPGPU

KONTSUMOBIDE ALDIZKARIA...mezu elektronikoa jasoko dela. Bigarren mezu elektroniko hori jaso arte itxaron behar da kontratua behar bezala egin dela ziur jakiteko. Hegazkin txartel

Txostena...6 GETXOKO LIBURUTEGIAK DATUETAN Getxoko Liburutegiak datuetan 380.174 pertsona hurbildu dira Getxoko liburutegien egoitzak bisitatzera edo kanpoan programatu dituzten jar-

kontsumoBIDE · 4 kontsumoBIDE aldizkaria 28.zk KontsumoaGAUR Kontsumoari buruzko pilula informatiboak Erosketak online egiteko txartel birtualak Internet bidezko erosketa oso iiohikoa

OINARRIZKO CURRICULUM DISEINUA - ivac-eei.eus · PDF fileMintegiko landareen ugalketa, hedapen- eta - produkzio-prozesuak programatu eta antolatzea. ... • Abereen elikadura, aukeraketa

U100 - Euskaltel › 2017-10 › 35681703_eusk.pdf · • Internet: interneterako lasterbidea. Aktibitate menua irekitzeko • Sakatu . Memoria Edukiak memoria-txartel batean, telefonoaren

Presentación de PowerPoint - Iniciofisica.cab.cnea.gov.ar/gpgpu/images/charlas/partec... · • Los accesos a memoria de hilos de un half-warp se fusionan en una o más transacciones

Soluções aproximadas para algoritmos escaláveis de ...€¦ · GPGPU General Purpose computing on Graphics Processing Unit. GPU Graphics Processing Unit. iSAX indexable Symbolic

BIOTEKNOLOGIAKO GRADUA Zientzia eta Teknologia Fakultatea ... · diren gidoi eta protokoloei jarraiki programatu eta gauzatzen dira. Ikasleak lortutako emaitzak prestatu eta interpretatu

GPU: Arquitectura - fisica.cab.cnea.gov.arfisica.cab.cnea.gov.ar/gpgpu/images/clases/clase_3_arquitectura... · En las GPUs, la mayor parte de la arquitectura está dedicada a cómputo

Primeros pasos con CUDA - Argentina.gob.ar › gpgpu › images › clases › clase...Ejemplo: suma de vectores Comencemos con un ejemplo sencillo: suma de vectores. – Sean A, B

Presentación de PowerPoint - Iniciofisica.cab.cnea.gov.ar/gpgpu/images/charlas/partea - motivacin.pdf · por un avance en el software de manejo de las GPUs.

GPGPU - Laboratorio 4

Introducción a la Programación CUDA en GPGPUfisica.cab.cnea.gov.ar/gpgpu/images/bioinfo/01...forma concurrente. Software de un sistema Paralelo Un problema grande es particionado

Primeros pasos con CUDA - fisica.cab.cnea.gov.arfisica.cab.cnea.gov.ar/gpgpu/images/clases/clase_1_cuda.pdf · - Manejo de jerarquía de memorias instaladas en la GPU Memoria local

Simulación de Fluidos con GPGPU

jazzaldia.eus · Web viewZehatzago esanda, urtarriletik apirilera bitarteko hautatze-prozesutik datozen 10 taldek joko dute; beste 5 talde 2018an diskoa argitaratu zutelako programatu