Hallo,
gibt es einen Listenleser, den man mit Anfängerfragen zu diesem Thema mal nerven könnte? Oder einen, der auch weitervermitteln könnte?
(Den "Rest" vielleicht besser per PM?)
TIA!
Bernhard
Stand: "einfache" CUDA-taugliche Grafikkarte ist da, CUDA-Compilern klappt, einfacher Datentransfer klappt, Karte kommt mit Code (Niveau "Hallo Welt") klar, Parallelisierung klappt,
Jetzt kommt "nur" die Frage, wie man einen vorhandenen und erprobten Algorithmus sinnvoll anpaßt :-) Etwa: 1.) Berechne für alle (etwa 100 Mio) [a,b,c,d] 4D-Elemente ein Potential. 2.) Ermittle deren summierte Wirkungen an (etwa 10.000 frei wählbaren Stellen [j,k]) einer Membran.
Vermutete Probleme: m:n-Relation schwer parallelisierbar, numerische Genauigkeit
Fragen: Zeitgewinn gegenüber CPU überhaupt feststellbar (überwiegt I/O, bei "simple Math" )? Überhaupt in float (single precision) machbar?