Frank Gerlach schrieb:
Hier koennte auch der Intel-Compiler helfen. Dieser kann automatisch SSEx-code erzeugen und automatisch vektorisieren. Bei einem einfachen benchmark mit einer verschachtelten Schleife habe ich hier Beschleunigungen um mehrere 100% gegenueber gcc erzielt. Es gibt eine Eval-Version des Intel-Compilers fuer 2 Wochen.
Hast Du dem gcc auch gesagt, dass er SSE verwenden soll?
Hier hält sich der Geschwindigkeitsvorteil in Grenzen, zumal ich bei Intel Probleme mit dem Speichermanagement (Fortran) habe (gcc/gfortran 4.1).
Tobias