Push-Nachrichten von MacTechNews.de
Würden Sie gerne aktuelle Nachrichten aus der Apple-Welt direkt über Push-Nachrichten erhalten?

NVidia äußert sich zur OpenCL-Kompatibilität der Grafikkarten

Ein Sprecher von Nvidia hat sich noch einmal zur OpenCL-Kompatibilität der Grafikkarten geäußert, da offensichtlich viele Kundenanfragen diesbezüglich eintrafen. Insgesamt werden zehn verschiedene Modelle unterstützt: GeForce 9400M, GeForce 9600M GT, GeForce 8600M GT, GeForce GT 120, GeForce GT 130, GeForce GTX 285, GeForce 8800 GT, GeForce 8800 GS, Quadro FX 4800 sowie Quadro FX 5600. Diese Grafikkarten sind sowohl mit Nvidias CUDA als auch mit OpenCL kompatibel, sodass der Benutzer OpenCL unter Snow Leopard nutzen kann. Vereinfacht ausgedrückt handelt es sich bei Open CL um eine Technologie, mit der die Rechenleistung des Grafikprozessors angesprochen werden kann und sich dieser somit als Koprozessor nutzen lässt. Je nach Anwendungsbereich lassen sich Programme auf diesem Wege signifikant beschleunigen.
Bei ATI ist die Liste unterstützter Grafikkarten deutlich kürzer. Lediglich Radeon HD 4850 und 4870 werden offiziell als unterstützte Geräte angegeben. Der Grund für Nvidias Vorsprung hat mit der Tatsache zu tun, dass OpenCL auf den GeForce-Grafikkarten über einen CUDA-Filter ausgeführt wird, ATI steht diese Option nicht so einfach zur Verfügung. Apple und ATI müssten also verstärkt zusammenarbeiten, um dafür zu sorgen, dass auch ATI Modelle mit Unterstützung von Open CL anbieten kann. EIn Artikel auf netkas.org erklärt, worin ATIs technisches Problem liegt und warum nur Karten der Serie 48×0 mit OpenCL umgehen können.

Weiterführende Links:

Kommentare

Waldi
Waldi07.09.09 09:33
Der letzte Mac mini hat ja auch eine 9400M. Der könnte also auch OpenCL verwenden.
Wie merkt man, oder woran erkennt man, ob eine Anwendung OpenCL verwendet?
vanna laus amoris, pax drux bisgoris
0
markus207.09.09 09:51
Ich habe eine ganze Reihe der OpenCL Demos von Apple compiliert.

Hier , in dem Forum Link unten, gibts die zum Download, Infos / FPS Resulate und Screenshoot sind auch vorhanden:

qJulia + Grass+ Displacement + AO + Transpose Bandwith OpenCL Benches:
http://www.insanelymac.com/forum/index.php?showtopic=183237

GALAXIES CPU vs GPU Sternensimulation:
http://www.insanelymac.com/forum/index.php?showtopic=182874

HAPPY BENCHING

GALAXIES screenshoot , meine Nvidia 9600 GT:
Displacement screenshoot , Nvidia 9600 GT:
GRASS screenshoot, NV 9600GT:

PS: ATI , auch 48xx werden die Benches erst mit OS X 10.6.1 ausführen können. ATI devs haben diverse Bugs in deren OpenCL Framework erkannt und arbeiten an einer Lösung.
0
claudiusw
claudiusw07.09.09 09:52
Bin froh, dass mein iMac 24" mit nVidia 8800 GS mit 512 MB auch unterstützt wird. Es gab ja widersprüchliche Angaben dazu.
You can­not cre­ate good ty­pog­ra­phy with Arial.
0
markus207.09.09 10:07
Genau !
Einfach mal Benchen - das zeigts Dir + den anderen
Galaxies + GRASS sind "normale" Apps - ein DoppelClick uns los gehts, die anderen Benches werden mit dem Terminal gestartet (Readme lesen!)

Natürlich muss man bendenken, dass die Mobile NVs (+ 8800GS) zwar OpemCL beherrschen, die sjedoch in der Praxis wenig Nutzen hat, das diese in dem Bereich der compute shader einfach (viel) zu langsam sind.
Daher spielt OpenCL wirklich nur eine Rolle ab 8800GT (meine 9600GT) bzw. Mobile GPUs die erst Anfang 2010 auf den Markt kommen werden.
Richtig nutzbar (wie schon bei CUDA im Bereich h.264 encding + Raytracing on GPU) sind wirklich erst ATI 4870 (wenn die erst mal löpt ) und Nvidia GTX260(9800GTX) aufwärts.
Erst diese GPUs besitzen eine ausreichend ausgebaute compute shader Funktion (in hardware).

Auch ist eine NV GT120 , MacPro 2009 für OpenCL völlig unterdimensioniert - hier ist die CPU bei GALAXIES sogar weit schneller als die GPU !!! CPUs MacPro 2009 : um 100 GogaFlops, GTX 285 170 GigaFlops, GT120 nur 31 GigaFlops . Und selbst eine C2D CPU kommt auf bis zu 27 GigaFlops.
Damit OpenCL also Sinn macht, muss natürlich CPU + GPU zusammenpassen:
schnellste CPUs mit LowEnd OpenCL GPU macht also keinen Sinn !

Auch die "theoretische" Fähigkeit (9400M, GT120) / Unfähigkeit (ATI 3xxx) ist was den praktischen Nutzen angeht nicht überbewerten.
Speziell dann nicht wenn es noch an nutzbaren OpenCL Applicationen für Videoencoding (mpeg4, h.264,..) , Raytraycing (Cinema4D, Maya & Co) fehlt.





0
Michael Lang07.09.09 10:58
markus2: sehe ich auch so. Habe schon immer gesagt, dass es erstens gescheite OpenCl-Progs geben muß (OpenCl steht erst am Anfang und man muß noch viel optimieren) und zweitens macht das erst Sinn wenn Apple echte High-End GPUs ins Rennen schickt. So ab einer NV 8800GT macht OCL Sinn, da dort genügend Shader implementiert sind. ATIs der 48er Serie sind eigentlich sehr gut geeignet, da die sehr viele Shadereinheiten haben. Nvidia ist aber wegen CUDA im Vorteil, da hat ATI ein wenig gepennt. Kann aber noch werden...
ich denke OCL wird so in einem halben bis 1 Jahr richtig interessant werden. Hoffe Apple erkennt die Zeichen der Zeit und setzt mal endlich in allen Modellen ordentliche -sprich aktuelle- GPUs ein!
- Das größte Maul und das kleinste Hirn,wohnen meist unter derselben Stirn. - Hermann Oscar Arno Alfred Holz, (1863 - 1929), deutscher Schriftsteller
0
ts
ts07.09.09 11:18
Langsame Grafikkarten in den MPs können sinnvoll sein, z.B. wenn man die Grafikkarte kaum benutzt. Deshalb sind langsame Grafikkarten wie die Nivia Geforce 120 GT als Option wichtig, aber Standard sollten schnellere Karten sein. Übrigens ist die 4870 152MB auch alt.
+1
Michael Lang07.09.09 12:11
Natürlich ist es sinnvoll in Notebooks zB. die Onboardgrafik zu nutzen, wenn die GPU gerade mal kaum gebraucht wird. Aber als Option ist ja noch die dedizierte Lösung da. Das hat Apple bereits richtig gemacht.
Aber in den Desktop-Macs (iMac, Mini) gehören einfach potentere Karten rein. Bei niedriger Last kann man die ja runtertakten etc., aber wer OpenCl als wichtigen Bestandteil eines modernen OS pusht, der muß auch für leistungsfähige Grafikkarten sorgen! Sonst wird das zum Witz!!
Zumindest optional sollten diese zu vernünftigen(!) Preisen angeboten werden. Für 50Euro mehr der Rechner kann man auch gescheite GPUs einbauen und die Kunden würden kaum meckern. Bei den GPUs würde Apple (nun erst Recht) an der falschen Stelle sparen. Zur Zeit sieht es auch so aus, als hätte Nvidia generell die besseren Karten dabei...zumindest unter OSX


- Das größte Maul und das kleinste Hirn,wohnen meist unter derselben Stirn. - Hermann Oscar Arno Alfred Holz, (1863 - 1929), deutscher Schriftsteller
0
ts
ts07.09.09 13:32
Eigentlich ist Nvidia gerade im Nachteil bzgl. Preis/Leistung…
0
markus207.09.09 13:38
Nun eines hat sich , Gott sei Dank, in den letzten 3 Jahren deutlich verbessert: Die GPUs, die Apple heute als Standard verbaut, sind im Vergleich zu der PPC-Ära (bis 2007) deutlich aktueller.
Früher waren die Standard-GPUs ja echt ein Witz und Alternativen zudem kaum in Sicht.
OpenCL wird diesen Trend weiter verstärken, da Apple natürlich in Modellen Frühjahr 2010 keine GPUs mehr verbauen wird, die nicht OpenCL kompatibel sind UND selbst in Standdardversion deutlich mehr leisten als früher.
Auch muss man bei der Anzahl der Units (Shader) bei GPU Vergleichen vorsichtig sein !! Denn obwohl ATI hier viel mehr solcher Units/Cores hat als Nvidia, ist die Leistung / Unit/Cores bei ATI auch viel schlechter.
Insofern kann man allein Aufgrund der Core-Anzahl (800 ATI 4870 vs 240 GTX 285) eben NICHT auf die Gesamtleistung bei Shader / Compute Jobs schließen. Denn intern sind die GPUs sehr unterschiedlich aufgebaut und ein Core der NV GTX285 erreicht dadurch eben eine höhere Ausführunsgspeed als ein Core der ATI.

Die neue Generation (DirektX 11) von GPUs wird speziell in diesem Sektor (Shader bei Games / CUDA+OpenCL compte jobs) deutlich zulegen, da bei Hersteller das potenzial diese universellen Programmierbarkeit viel stätker ausbauen als den normalen OpenGL / DirektX Bereich.
ATI gibt an hier bis zu 160% Mehrleistung gegenüber der 4870 zu erziehlen.
Das kommt, auch bei NVIDIA speziell CUDA + OpenCL zu gute. Games profitieren nur dann davon, wenn sie extrem viel Shader einsetzten.
0
markus207.09.09 13:41
Ja hat denn einer auch mal die GALAXIE (Bench erforscht ?
Oder sind hier eher PPC-Fans " NO SNOW - NO OpenCL - ONLY PAIN" zu finden
0
Thomas Fricke
Thomas Fricke07.09.09 13:41
Lassen sich die aktuellen GraKas auch in einem Pro der ersten Generation (1,1) einbauen?
0
alclonky07.09.09 13:48
also die 4870 läuft wunderbar im firstgen MacPro zumindest die PC- version mit Mac Rom
0
markus207.09.09 14:02
Ja , die GTX 285 passt auch in den MacPro 1,1 .
Die rockt was weg unter OpenCL: 170 GigaFlops bei Galaxies (MacPro1,1 CPU´s max. 60 GigaFlops).
Bei dem AO (raytracing on GPU vs CPU) ist der Unterschied sogar noch größer!
Nur der neue MacPro 2009 bräuchte für OpenCL eigentlich eher das Nachfolgemodell (Winter 2009 kommen die raus) , da die Klasse i7 Server CPUs auch schon auf 100 GigaFlops bei GALAXIES kommen.

Alle ATI 48XX Gpus laufen bisher (10.6.0) noch nicht, da ich in der letzen Zeit viel mit dem Leiter der AMD Apple OpenCL Abteilung Kontakt hatte.
ATI/AMD versucht das bis zum 10.6.1 update hinzu bekommen.

Daher laufen alle bisher verfügbaren OpenCL Benches nicht, fehlerhaft oder schneckenl angsam auf den ATI 4870 ab.

"Regarding Galaxies (n-body simulation), we just tracked down the issue. .... We’ve fixed this, but it did expose an underlying issue with the demo itself. ...... We’re speaking to Apple about this.

BTW, I ran the demos on a iMac with a Radeon 4850 and I get the following results:

============================================================
Sample Application Result
============================================================
1. Trajectories Runs
2. OpenCL Hello World Example Runs
3. OpenCL Procedural Geometric Displacement Runs
4. OpenCL Parallel Reduction Example Runs
5. OpenCL Matrix Transpose Bandwith) Example Runs
6. OpenCL RayTraced QJulia-Set Example Fails
7. OpenCL Procedural Noise Example Fails
8. OpenCL Procedural Grass and Terrain Example Fails
9. OpenCL Parallel Prefix Sum (aka Scan) Example Fails
10. OpenCL NBody Simulation Example (GALAXIES) Crash

Can you confirm that you get the same results?"

Leider NO !!
Nun, im Gegensatz zu ATI melden mir die ATi 4850/4870 User , dass selbst die die mit "Runs" markiert sind fehlerhaft laufen = keines der obigen OpenCL Demos/Benches läuft auf ATI 48xx. fehlerfrei.

0
GökTürk07.09.09 14:15
meine ist auch dabei
0
markus207.09.09 14:36
4850 / 4870 ?
Zumindest bei 4870 Usern schein der Displacement Bench dann zu laufen, wenn die Compilereinstellungen auf "fast nicht optimiert" stehen.
Dazu zuerst das "normale" Displacement downloaden und dann die ausführbare Datei (nur wenige KB, da Terminal App) mit dem dispalcement_ATI download ersetzen.
ATI 4870 USer erziehlen bisher um die 86 FPS. (GTX285 = 228 FPS)
ATI 4850 FPS Werte habe ich da noch nicht.

DL (oder von der im ersten Post genannten Forumseite)

ATI user zustätzlich (überschreiben orig. Datei des Hauptdownloads):


Readme mit step by step Bildanleitung für die Ausführung der Terminal OpenCL Benches


PS: So sieht der OpenCL Displacement Bench (2 szene) aus, Nvidia 9600 GT um 100 FPS :
0
ts
ts07.09.09 14:57
MacPro4,1 mit 4870 512MB: „displacement” stürzt nur ab, auch mit „displacement_ATI.zip”. Die Fehlermeldung liest sich sehr wie unsauber programmiert!


----------------------------------------------------------------------
Setting up Graphics...
----------------------------------------------------------------------
Creating Shadow FrameBuffer...
Creating Jitter Texture...
Loading Light Probe "stpeters_probe.pfm"
Error opening file stpeters_probe.pfm
Creating Light Probe Texture (0 x 0)....
displacement(348,0x7fff70023be0) malloc: *** error for object 0x7fff5fbff958: pointer being freed was not allocated
*** set a breakpoint in malloc_error_break to debug
Abort trap
logout

[Prozess beendet]
0
ts
ts07.09.09 15:03
Weiterer Test: Man muss erst mit cd in das entsprechende Verzeichnis wechseln…schlecht und es flackert wie verrückt.
0
markus207.09.09 15:04
1.
"Die Fehlermeldung liest sich sehr wie unsauber programmiert!"
Ist original Apple Source Code

2. Bitte das readme lesen !!!!
Loading Light Probe "stpeters_probe.pfm"
Error opening file stpeters_probe.pfm

Du must vor der Ausführung von displacement erst den Befehl cd ....
eingeben um auch in das Verzeichnis des Benches zu wecheln.
Ohne das change directory .... findet der Bench natürlich seine Dateien nicht.
0
markus207.09.09 15:06
10.6.1 soll es nach ATI developer Angaben richten
Trotz flackern : Was zeigt denn der Test an FPS an ?
0
markus207.09.09 17:45
Neue Galaxies 16K Version verfügbar,
DL Link:


ATI hat mir den Tipp gegeben die Apple Source die Sternenanzahl von 4 K auf 16K zu erhöhen. Lastet speziell schnelle GPUs besser aus.
9600 GT nun 112 GigaFlops (16K) statt 97 GigaFlops.
Die GTX285 Mac (bei 4K = 168 GigaFlops) müsste % tual noch mehr zulegen.
Meine C2D CPU kommt, gleich wie bei 4K, auf nur 25 GigaFlops.
Insofern werde ich mir sicher bald zumindest die GTX260 für ca. 160 Euro zulegen (Speed 60-75% von der GTX285).
Die GTX260 (in etwa 4870 Niveau) müsste auf mind. 150 GigaFlops beim 16K Galaxies Bench kommen.

Sicher veröffentlich barefeat in Kürze auch die 16K Werte seiner GPU Palette im MacPro 2009.
barefeat:


Happy BENCHING
0
ts
ts07.09.09 17:46
Also das cd benutzt werden muss ist schlampig. Ich habe auch festgestellt, dass es manchmal dauernd zusätzlich Artefakte produziert, meistens stark flackert und andere Male hingegen sauber zu laufen scheint. Dieser Zustand ändert sich auch im laufenden Programm.

Das transparente Objekt in Szene 2 sieht bei mir übrigens wie eine Kugel aus.

Es wird mir folgendes angezeigt während die Anzeige „sauber” ist:
Szene 1
[GPU] Compute: 12.21 ms Display 82.09 fps

Szene 2
[GPU] Compute: 11.79 ms Display 86.55 fps
0
markus207.09.09 22:48
Die Nvidia GTX285 kommt auf knapp 300 GigaFlops (16K)- die rockt gut was weg.
0
Sebelschwan07.09.09 23:30
Ich spinne jetzt einfach mal rum und werfe einen recht gewagten Blick in die Kristallkugel: Meiner Meinung nach ist die Einführung von Open CL ein cleverer Schachzug Apples Microsofts Dirext X allmählich den Hahn zuzudrehen. Somit würde z. B. für Programmierer das ständige Hinterhergerenne von einer zur nächsten Direct X Version und dessen "Spezialfunktionen" entfallen da man sich ausschließlich auf die Power von CPU und GPU verlassen kann.
Ich denke dass noch sehr viel Potential in Open CL steckt und beispielsweise eine direkte Verknüpfung mit Open GL dabei auch nicht so unwahrscheinlich erscheint. Somit könnte sich Apple wie es zunehmend zu beobachten ist durchaus interessant für den Spielmarkt machen.
Ist aber natürlich alles nur Spinnerei
0
markus207.09.09 23:50
Nun ja - die Startschwierigkeiten (Bugs) bei ATI+OpenCL zeigen jedoch schon das du da noch in ganz ferne Zukunft gucken must.
Für Games ist das OpenCL zur Zeit völlig uninteressant, da so eine API 100% tig zuverlässig auf allen vorhanden OpenCL GPU laufen muss.
Und das tut es bisher halt nur auf den NVidias.
Auch stecken in den Host Apps, also die Apps die die Daten zur GPU schicken und wieder abholen ne Menge Problempotential die bei so omplexen Dingen wie Games viel zu riskant sind.
Ne, zuerst werden nur reine Number Cruncher OpenCL Anwendungen für Raytraycing, Videoencoding und wissenschaftliche Berechnungen entwickelt werden. Games + OpenCL kommt, wenn überhaupt erst in ein paar Jahren.
OpenCL Raytraycing, Videoencoding und wissenschaftliche Berechnungen kommen dagegen schon im Winter 2009.

0

Kommentieren

Sie müssen sich einloggen, um die News kommentieren zu können.