27 фев 2013, 20:16
Некоторые тут не понимают, что скорость работы системы определяет самое медленное звено, а также то, что конвееры на видеокартах далеко не универсальны, особенно в старых поколениях.
Так, есть, например, показатель "максимальная теоретическая производительность", она на RSX у PS3 составляет 400,4 GFLOPs (что в голых числах в 4,5 раза меньше, чем у PS4), однако эти гигафлопсы складываются из работы всех подсистем RSX, а их там: 24 пиксельных процессора и 8 вершинных. То есть тут 400,4 = 24 * 27 Flops * 550MHz + 8 * 10 Flops * 550MHz (где 550MHz - частота работы ядра). То есть подобную производительность вы можете получить только равномерно загрузив все конвейеры видеочипа. Это не универсальные конвейеры, то есть загрузить их левыми задачами у вас не получится. NVIDIA кинула Sony и не дала им более новый чип из 8-й линейки, в которой были представлены QUDA-ядра и универсальные конвейеры.
Плюс ко всему, пропускная способность шины для совместимости с Cell была опущена до скромных 128bit. Отсюда образовалось ещё одно бутылочное горлышко - вы просто не успеете подать на расчёты все данные, обработанные процессором.
В противовес ядра Cell обладают значительно более широким перечнем инструкций, что позволяет задействовать его на близких к его теоретической пиковой мощности уровнях. То есть Cell в операциях с одинарной точностью это 25,6(PPE)+6*25,6(SPE)=179,2GFLOPs производительности, которую можно достичь не только теоретически, но и в практических задачах. Именно поэтому Cell легко справляется с декодированием сумасшедшего числа потоков FullHD видео, что даже на сегодняшних процессорах сделать очень сложно (отключите графическое ускорение и запустите фильм в FullHD h.264 High Profile).
Анонсированный GPU даёт теоретическую производительность в 1,8GFLOPs, но в этот раз мы имеем а) универсальные ядра, работающие с широким спектром задач, включая вычисления типа OpenCL б) значительно более скоростную память GDDR5, без каких-либо ограничений и без необходимости перебрасываться данными между памятью проца и видео по тонкой 128-битной шине.
Вывод -> несмотря на дефолтную на вид архитектуру PS4, получается довольно приличная конфигурация, которая
а) не требует от программистов заниматься программной эквилибристикой с побайтным управлением данными в памяти
б) лишённую узких мест даже с точки зрения ПК (нет шины PCI-E, нет зависимости от северного моста и т.д.). Плюс, процессор и GPU не выполняют левых задач - кодек аудио отдельно, кодек h.264 идёт отдельно, есть даже отдельный чип, на котором может фоново крутиться операционная система приставке, не вмешиваясь в основной процесс.
В итоге получается платформа, которая хоть и обладет на первый взгляд дефолтным железом, но позволяет сделатьс ним значительно больше, чем на ПК, что гарантирует безоблочное существование платформы на первой половине своего жизненного цикла (примерно к этому периоду средний ПК догонит приставку по практической производительности).
Главным минусом всего этого, является полный отказ от совместимости с прошлыми приставками, а также "шаг назад" в плане архитектуры процессора (x86-64 архитектура полна атавизмов, которые туда пихают для совместимости с древне-говно-мамонтовыми программами). Скажем так, Cell значительно мощнее CPU PS4.
Loading...