Hallo,
gibt es einen Listenleser, den man mit Anfängerfragen zu diesem Thema mal
nerven könnte? Oder einen, der auch weitervermitteln könnte?
(Den "Rest" vielleicht besser per PM?)
TIA!
Bernhard
Stand:
"einfache" CUDA-taugliche Grafikkarte ist da,
CUDA-Compilern klappt,
einfacher Datentransfer klappt,
Karte kommt mit Code (Niveau "Hallo Welt") klar,
Parallelisierung klappt,
Jetzt kommt "nur" die Frage, wie man einen vorhandenen und erprobten
Algorithmus sinnvoll anpaßt :-)
Etwa:
1.) Berechne für alle (etwa 100 Mio) [a,b,c,d] 4D-Elemente ein Potential.
2.) Ermittle deren summierte Wirkungen an (etwa 10.000 frei wählbaren Stellen
[j,k]) einer Membran.
Vermutete Probleme:
m:n-Relation schwer parallelisierbar,
numerische Genauigkeit
Fragen:
Zeitgewinn gegenüber CPU überhaupt feststellbar
(überwiegt I/O, bei "simple Math" )?
Überhaupt in float (single precision) machbar?