Повторюсь: это мой взгляд и прошу не судить очень строго и по возможности поправьте меня.
Итак, начнём с того, что такое ГПУ и для чего он нужен и как сей ГПУ работает.
GPU (Graphics Processing Unit) — графический процессор, который берет на себя часть функций по формированию трехмерного (3D) изображения. Этим мог бы заниматься и центральный процессор, но специализированный микрочип ГПУ справляется с этим на порядки (!) быстрее и позволяет разгрузить центральный процессор (CPU) от выполнения операций, связанных с расчетами геометрических трансформаций, моделей освещения и т.д., оставляя за ЦПУ бработку физики, звука, ОС и.т.д.
Современные графические процессоры по сложности не уступают центральным. Разница заключается в их функциональном назначении: формирование изображения, выводимого на экран монитора. Характеризуются графические процессоры, как и центральные, такими параметрами, как микроархитектура, тактовая частота работы графического ядра и технология их производства. Специфичекими характеристиками их являются: число вершинных и пиксельных конвейеров, соответственно — Vertex Pipelines (вершинный конвеер) и Pixel Pipelines (пиксельный конвеер).
Для чего нужен Vertex Pipelines? Они (вершинные конвееры) определяют местоположение вершин, которые задают каждый из этих объектов, строют по этим вершинам грани, заполняют получившиеся области - полигоны (треугольники). Получается "картинка", состоящая из одних граней (каркасная модель).
Для чего нужен Pixel Pipelines? Они (пиксельные конвееры) заполняют полигоны текстурами, соответствующими освещению, степени детализации, требуемым перспективным искажениям и т.д.
Повысить производительность этих операций позволяет их разбивка на стадии ("конвейерезация"), а также распараллеливание операций между конвеерами. С указанной целью данные, полученные от CPU, обрабатываются в вершинном процессоре или блоке Vertex Pipelines, являющемся частью общего конвейера обработки.
Там Vertex Pipelines насилуют информацию выше-описанными способами, после этой обработки данные поступают в пиксельный процессор Pixel Pipeline, работающий под управлением специальной программы — пиксельного шейдера (Pixel Shader), которая определяет значения пикселов, заполняющих каркасную модель (или производит "растеризацию"), включая определение их цвета, яркости (освещения), прозрачности и т.д. Пиксельные шейдеры реализуют также такие функции, как мультитекстурирование (наложение нескольких слоев текстуры), попиксельное освещение, создание процедурных текстур, постобработку кадров и т..д. После обработки данных в пиксельном процессоре они поступают в блок растровых операций — ROP (Raster Operation). На данном этапе с использованием буфера глубины (Z-буфера) определяются и отбрасываются пикселы, которые будут не видны пользователю, т.е. отсекаются невидимые поверхности трехмерного изображения, а также реализуются эффекты полупрозрачности впередистоящих обектов изображения путем смешивания цветов пискселов этих и сзадистоящих объектов.
Вернёмся к нашим баранам. В XENOS используются унифицированные конвееры, т.е. каждый конвеер может работать как вершинный, так и как пиксельный. Это довольно молодая технология, широко распространённая в новых видеокартах. Этой новомодной "фишкой" очень любят козырять бобро-адепты. RSX - гораздо более традиционен.
Но является ли это недостатком? Давайте поглядим на характеристики обоих ГПУ.
RSX --- XENOS
Pixel shader: 24 --- 48 унифицированных конвееров
Vertex shader: 8 --- (те же) 48 унифицированных конвееров
частота ядра: 550МГц --- 500МГц
пиковое колличество полигонов: 366.6 млн полигонов в секунду - 500 млн полигонов в секунду
пиковое колличество вершин: 1.1 млрд вершин в секунду - 1.5 млрд вершин в секунду
Какие показательные цифры! Поклоники ПС3 в шоке, поклоники бокса - ликуют. XENOS позволяет рисовать чуть ли не в два раза больше полигонов, чем RSX, какие ещё могут быть разговоры? Но давайтека задуемся, что означают эти цифры на самом деле. А означают они следущее: если XENOS бросит все свои унифицированные конвееры на просчёт полигонов - то он получит эту рекордную цифру. Но на такие мелочи, как текстуры, мощностей у него не останеться. У RSX конвееры спецализированные, т.е. на пиксели всегда останеться 24 конвеера, сколько полигонов не было бы на экране, хоть один, хоть 300млн, пиксельных конвееров всё-равно будет 24. Обьяснять, что это означает? Думаю не стоит.
Но посмотрим и на другие характеристики:
RSX --- XENOS
24 texture filtering units (TF) and 8 vertex texture addressing units (TA) --- 16 texture filtering units (TF) and 16 texture Addressing unit (TA)
24 filtered samples per clock --- 16 filtered samples per clock
Maximum texel fillrate: 13.2 GigaTexels per second (24 textures * 550 MHz) --- 8 gigatexel per second (16 textures x 500 MHz)
32 unfiltered texture samples per clock, ( 8 TA x 4 texture samples ) --- 16 unfiltered texture samples per clock
Баа! а вот и XENOS начинает сливать! Оказывается специализированные конвееры гораздо мощнее унифицированных! С чего бы вдруг? Продолжаете блаженно верить, что XENOS превосходит RSX по всем параметрам? Но откуда вообще пошли разговоры о слабости RSX? В августе 2005, представитель nVidia сказал PlayStation Magazine "the RSX GPU is basically a slightly less powerful GeForce 7800", что не является правдой. nVidia отреагировала на это заявление другим утверждением, а именно, что RSX (который разработала NVIDIA) более мощный, чем GF 7800. Теперь про бохс360: Xenos может выдавать 1.5 миллиардов при использовании всей мощности 48 универсальных шейдеров. Это здорово, но цифра более, чем теоретическая, поскольку этим универсальным шейдерам приходится заниматься и всем остатьным: и тексурами и т.п.
Это как семейный бюджет на неделю - 100 долларов. На все деньги купить мороженное. Если брать по 20 рублей то получиться целых 120 пачек. Гипотетически семью можно кормить неделю мороженным, но фактически дети покроются сыпью.
С другой стороны у RSX всего 24 вершинных шейдерных конвейера. Они могут только это и ничего больше. Но фактически получается не половина от возможностей Xenos, а больше - почему?
Производительность 1 универсального шейдера Xenos 10Flops за такт, а у RSX 27.
Далее, у RSX есть еще 8 текстурных шейдерных конвейеров. Суммируя их производительность получает суммарную производительность RSX = (27Flops*24вертексных шейдера+ 10Flops * 8 текстурных шейдеров)*550MHz = 400.4GFlops против производительности Xenos = 10Flops*48 универсальных шейдера*500MHz = 240GFlops.