|
R300 3D-Architektur im Detail
AGP 8x und Speicherinterface
Der
Radeon 9700 ist einer der ersten Grafikprozessoren
die den vollen AGP 8x Standard unterstützen.
Der AGP-Port stellt die Verbindung zwischen der Grafikkarten
und dem Rest des PC her. Es werden sämtliche Daten wie
3D Modelle, Texturen, Shader/Rendering Kommandos sowie ein
Video-Stream übertragen.
AGP 8x bietet eine Bandbreite von ca. 2 GB pro Sekunde, was
einer Verdopplung der möglichen Übertragung zu AGP
4x entspricht.
Die zusätzliche Bandbreite welche AGP 8x bietet, ist
ein wesentlicher Pluspunkt für Games und High-End Workstation
Applikationen. Es ermöglicht schnellere Ladezeiten und
macht so auch detailreichere 3D Landschaften/Modelle und komplexere
Shader-Effekte möglich.
Ob AGP 8x auch einen Performancesprung bewirkt ist eher zu
bezweifeln, die ersten Tests sprechen hier nur von ca. 0,5
bis 2 % Mehrleistung.
Ganz
neue Wege geht ATI beim Speicherinterface. Zum ersten Mal
kommt beim R300 ein 256 Bit breites
Speicherinterface zum Einsatz, welches bei 310 MHz eine Bandbreite
von 19,8 GB/s (32 Byte x 2 x 310
MHz) bietet. Dabei splittet der Chip die 256 Bit Speicheranbindung
in vier von einander unabhängige Controller
mit je 64 Bit auf. Das erhöht die Effizienz indem die
verfügbare Speicherbandbreite besser genutzt wird.
Zudem unterstützt der R300 schon den kommenden DDR-II
Speicherstandard.
Hyper Z III
Um eine 3D Landschaft richtig darstellen zu können,
ist es notwendig, den Abstand eines jeden übertragenen
Objektes vom Ausgangspunkt zu kennen. Dieser Abstand wird
in einem speziellen Buffer gespeichert, welcher Z-Buffer-
oder Tiefenpuffer genannt wird. Der Z-Buffer speichert alle
Tiefendaten und gibt an welches Objekt wo zu platzieren ist.
Das Auslesen und Aktualisieren des Z-Buffer verbraucht sehr
viel mehr Bandbereite, als alle
anderen am 3D Renderingprozeß beteiligten Komponenten.
Genau hier setzt ATI´s Hyper Z-Technologie
an, um die vom Z-Buffer benötigte Bandbreite um ein vielfaches
zu verringern.
Die dritte Generation von HyperZ, wurde zum Vorgänger
in allen drei Punkten (Hierarchical Z,
Z Compression und Fast
Z Clear) deutlich verbessert. Es wurde aber auch eine
neue Componente Early Z Test neu
in Hyper Z integriert.
Hierarchical Z
Ein
Hauptproblem, der aktuellen Spiele ist der so genannte Overdraw.
Ein Beispiel für Overdraw:
In einem Spiel schauen sie durch ein Fenster in einen Raum.Einige
der Wände und Objekte sind aber nicht sichtbar. Die meisten
Grafikprozessoren können nicht vor dem Rendern festellen,
welche Pixel verdeckt und welche sichtbar sind. Diese GPU´s
können erst nach dem Rendern über den Z-Buffer bestimmen
was sichtbar ist und was nicht.
Um den Overdraw weitestgehend zu reduzieren, hat ATI das Hierarchical
Z in der dritten Generation deutlich verbessert.
Die Technik vom Hierarchical Z unterteilt
den Z-Buffer in die Blöcke der Pixel. Somit kann schneller
überprüft werden, was im abschließenden Bild
sichtbar ist und was nicht. Ist ein gesamter Block verdeckt,
so wird dieser gelöscht und es geht zum nächsten
Block. Wenn jedoch einige Teile des Blocks sichtbar sind,
wird dieser wiederum in kleinere zerlegt und der Prozess beginnt
von neuem. Zum Schluss überprüft Early
Z noch einmal ob auch wirklich alle nicht sichtbaren
Pixel gelöscht wurden. Wenn nicht werden diese jetzt
noch vor der Pixel Shader Engine entfernt.
Z Compression
Die
Komprimierung von Daten ist ein verbreitetes Verfahren bei
der Übertragung großer Datenmengen über ein
Medium mit begrenzter Bandbreite. In der dritten Generation
wurde auch die Z Compression weiter
verbessert. Z Compression verwendet einen verlustfreien Komprimierungsalgorithmus,
um die vom Z-Buffer übertragene Datenmenge zu verkleinern.
HyperZ III erzielt ein Komprimierungsverhältnis von minimal
2:1 bis maximal 4:1. Die Vorteile der dritten Generation liegen
besonders in der vollen Unterstützung von Full-Scene-Antialiasing.
Mit 6x FSAA, kann das Kompressionsverhältnis
bis zu 24:1 betragen, was natürlich
einen der wichtigsten Faktoren für die Leistung unter
Antialiasing der Radeon 9700 darstellt.
Fast Z Clear
Bei Fast Z Clear wurde im vergleich
zum Hyper Z II nichts verändert. Fast Z Clear stellt
eine Technik dar, welche den Z-Buffer bei jedem übertragenen
Frame schnell löscht. In höheren
Auflösungen ist dieser Prozess besonders interessant,
da bei einer Auflösung von 1600x1200 ca.
7,7 MB in den Z-Buffer geschrieben und wieder gelöscht
werden müssen. Durch Fast Z Clear kann der Z-Buffer ca.
64x schneller gelöscht werden
als bei herkömmlichen Architekturen, was natürlich
besonders in hohen Auflösungen die Leistung ernorm steigert.
|