CUDA - obliczenia na układach graficznych
Warp shuffle functions

Opis testu

Celem testu było sprawdzenie działania funkcji z rodziny Shuffle.

Przetestowano następujący kernel

Projekt

Download VS2012 project

Wyniki

GeForce GTX 760

Time taken: 0.005 ms
0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 32 32 32 32 32 3
2 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32 32
Aby kontynuować, naciśnij dowolny klawisz . . .

Wnioski

Tak więc wszystkie wątki w ramach jednego warpa (a więc wątki 0-31 oraz 32-63) do tablicy wyjściwowej wpisały dokładnie taką samą wartość, wartość skopiowaną od wątku 0 numerowanego w ramach warpa (czyli wątkiem 0 w warpie 0-31 jest wątek o globalnym id 0 a wątkiem 0 w warpie 32-63 jest wątek o globalnym id 32).

Program główny