Страница 1 из 4

Немного о старом поколении консолей и ПК

: 04 авг 2014, 03:20
ТомпкинСкуэр
Помню довольно давно читал, может кому будет интересно, статья довольно техническая, тем не менее:
Чуть больше года назад в продажу поступила PS3, а еще годом ранее – Xbox 360. Окончательные итоги этого раунда консольной войны подводить, разумеется, еще рано, однако, располагая немалым количеством информации относительно начинки обеих приставок и имея возможность сравнить игры «первой» и «второй» волн на обеих консолях, кое-какие выводы о реальном соотношении сил между двумя представителями «нового поколения» сделать уже можно.

Речь идет не о том, чтобы выяснить, «какая консоль лучше» – потребительские качества приставок определяются, прежде всего, теми играми, которые на них доступны. Очевидно, что для истинного фаната Metal Gear Solid, Final Fantasy или Gran Turismo Xbox 360 просто не существует, а любителям Gears of War, Halo, Mass Effect или тем, кто ожидает Fable 2, PS3 не нужна не то что за 500 или 600 долларов, а даже даром – впрочем, даром, как известно, сладок даже уксус, так что не стоит зарекаться… Поэтому мы не ставим себе целью убеждать кого-либо в том, что за консолью Microsoft будущее, или что, наоборот, победит PS3 – во-первых, только время расставит все по своим местам. А во-вторых, какая, по большому счету, разница? Ведь через год-два их стоимость опустится ниже 200-долларовой отметки и можно будет без особого душевного надрыва позволить себе обе – лишь бы HD-телевизор был.

Пиарщики Microsoft тоже иногда говорят очень смешные вещи – например, что уровень гарантийных возвратов у Xbox 360 не выше, чем по отрасли
Тем не менее, внести кое-какую ясность в вопрос о соотношении технических характеристик Xbox 360 и PS3, по нашему мнению, необходимо. В пылу консольной войны PR-люди Sony повесили на уши своим потенциальным потребителям просто-таки тонны лапши. Пиарщики Microsoft тоже иногда говорят очень смешные вещи – например, что уровень гарантийных возвратов у Xbox 360 не выше, чем по отрасли – но представителей SCE в этом вопросе превзойти невозможно. Все их заявления, зачастую транслируемые через «испорченный телефон» форумов и блогов, приводят к тому, что у многих геймеров формируется совершенно искаженная картина того, как соотносятся сегодняшние и будущие возможности консолей нового поколения.

Например, довольно часто приходилось слышать, что Xbox 360 – это «один в один» аналог PC (только, разве что, без Windows) или что у PS3 более современная и мощная графическая система, чем у консоли Microsoft. Ни одно, ни другое утверждение не имеет ничего общего с действительностью. Отдельно хотелось бы отметить вопрос о «потенциале» консолей – у PS3 он действительно велик, хотя больше относятся к распределенным суперкомпьютерным вычислениям и Folding@Home, чем к играм. В то же время, особо не обсуждаемый публикой потенциал Xbox 360 еще очень далек о того, чтобы быть полностью исчерпанным.

Nintendo Wii мы касаться не будем – это специфический продукт со своей идеологией и аудиторией, который слишком непохож на «мускулистых» конкурентов, чтобы их можно было корректно сравнивать.
Очень не хотелось бы, чтобы наш обзор технологий рассматривался как «игра в одни ворота» – за Xbox 360 и против PS3 – однако так исторически сложилось, что подавляющее большинство «консольных мифов» сконцентрированы вокруг технического превосходства новой PlayStation. И, развенчивая их, нам волей-неволей придется наносить удары по ее сложившемуся «супертехнологичному» имиджу. Тем не менее, постараемся быть максимально непредвзятыми – и, чтобы не быть голословными, обратимся, наконец, к фактам и деталям.

Поскольку объем этих фактов даже в очень сжатом и популярном изложении достаточно велик, мы вынесли в начало статьи краткий дайджест. Желающие познакомиться с фактами и комментариями поближе, могут пройти по ссылкам к конкретному фрагменту текста. Пытливые читатели могу просто перейти на следующую страницу и прочесть текст целиком. Итак, факты:
Центральные процессоры обеих консолей: Cell и Xenon – разработаны компанией IBM и имеют много общего. Каждое из трех симметричных ядер Xenon очень похоже на главное ядро Cell. ==>
Вспомогательные ядра Cell сильно упрощены и справляются со сложным кодом плохо, поэтому в реальных условиях на определенных типах задач Xenon c тремя симметричными полноценными ядрами может легко обойти 8-ядерный Cell с семью урезанными ядрами. ==>
Преимущество Cell над Xenon в пиковой производительности с плавающей запятой менее чем двукратное: 204 миллиарда операций в секунду против 115. Нужно иметь в виду, что это не реальное соотношение мощности процессоров, поскольку настоящая производительность зависит от великого множества факторов, а пиковая производительность – лишь один из них, и далеко не самый важный.
Главное ядро Cell и ядра Xenon существенно уступают Pentium 4 и, тем более, процессорам архитектуры Core 2 с той же частотой в производительности в «обычных» приложениях, где мало используются вычисления с плавающей точкой, но много условных переходов. ==>

По данным Merrill Lynch и iSuppli, себестоимость Cell более чем в два раза выше себестоимости Xenon, что не может не сказываться на себестоимости и цене консоли. ==>
Благодаря развитию графических процессоров, локомотивом которого является PC-графика, скорость Cell в операциях с плавающей запятой уже не имеет особого значения. Из-за недовольства разработчиков характеристиками первоначально разработанной видеосистемы PS3, Sony пришлось отказаться от идеи использовать Cell в качестве видеопроцессора и приспособить для этой цели PC-чип Nvidia G70, «дотянув» некоторые его характеристики до уровня конкурирующего чипа Xenos из Xbox 360. ==>

G70 разработан для соответствия спецификациям DirectX 9.0с и Shader Model 3.0 – то есть, по сути, Sony использует в PS3 доработанную версию продукта, созданный в результате сотрудничества Nvidia c Microsoft, ибо собственных разработок такого уровня у нее не было. ==>

Основные технические характеристики видеосистем PS3 и Xbox 360 примерно одинаковы, но графический чип в консоли Microsoft относится к следующему поколению видеоускорителей и использует свою вычислительную мощь эффективнее. ==>

Благодаря наличию гибко настраиваемого аппаратного тесселятора, графический чип в Xbox 360 позволяет с минимальными усилиями и небольшими затратами системных ресурсов отрисовывать очень детализированные модели с огромным количеством полигонов. Кроме того, он может выводить до 500 миллионов треугольников в секунду против максимум 330 миллионов у PS3. ==>
CPU и GPU в Xbox 360 очень тесно связаны, что позволяет экономить пропускную способность системной памяти, ускоряет работу и создает потенциал для необычных алгоритмов в будущем. ==>
CPU и GPU в PS3 тоже связаны напрямую, но, несмотря на это, в системе есть ряд «бутылочных горлышек», усложняющих жизнь разработчикам. Использование Cell в качестве второго видеопроцессора даже теоретически невозможно из-за архитектурных ограничений (не говоря уже об огромной сложности синхронизации работы CPU и GPU в таком режиме), зато видеочип вполне может «отъесть» у Cell часть пропускной способности между процессором и системной памятью. ==>
При одинаковом общем объеме RAM в обеих консолях (512 Мбайт), Xbox 360 предоставляет играм примерно на 70 мегабайт больше благодаря более эффективному использованию памяти операционной системой. ==>

Антиалиасинг в Xbox 360, в отличие от PS3, реализован без дополнительной нагрузки на основную память. ==>

Недостаток места на двухслойных DVD далеко не так критичен, как хочет показать Sony. ==>
По аналогии с устройством первой Xbox, в которой использовался процессор Intel Celeron 733 МГц, многие считают, что в Xbox 360 установлена какая-то разновидность x86-совместимого процессора производства Intel или AMD. Это не так: как и Cell в PS3, и, к слову сказать, Broadway в Nintendo Wii, центральный процессор консоли Microsoft под названием Xenon разработан IBM и является модификацией той же самой архитектуры PowerPC, которая лежит в основе CPU консолей-конкурентов.
Отказ от продукции Intel обусловлен несколькими причинами. Во-первых, в отличие от Intel, IBM согласилась передать Microsoft право на производство чипа на сторонних фабриках, что позволяет гибко маневрировать и переносить производство туда, где оно сейчас дешевле, не попадая в зависимость от одного поставщика.

Во-вторых, архитектура NetBurst, которую Intel могла предложить в период разработки Xbox 360, была не очень удачной: процессоры сильно грелись и демонстрировали не слишком высокую удельную производительность на единицу площади чипа.
В-третьих, у IBM к тому времени был уже определенный опыт разработки процессоров для игровых консолей. Ее инженеры лучше понимали специфические требования игроделов и лучше могли воплотить их «в железе».

Xenon в разрезе
Однако замена Intel на IBM отразилась не только на себестоимости, она повлекла за собой ряд принципиальных последствий, связанных с программированием. Речь идет не о том, что Pentium и PowerPC не совместимы по исполнимому коду. Большая часть игрового кода сейчас пишется на языках высокого уровня, и программистам, как правило, неважно, какая именно система команд у процессора – это забота компилятора. Разумеется, из этого правила есть много исключений, но они не играют решающей роли. Куда более важно то, что одно отдельно взятое 3.2-гигагерцевое ядро Xenon сильно проигрывает в производительности одноядерному Pentium 4 с такой же тактовой частотой. Дело в том, что для экономии площади кристалла и количества транзисторов из ядер была изъята логика, позволяющая исполнять команды НЕ в порядке их поступления (по-английски это называется out-of-order execution – соответственно, схема, применяемая в Xenon, называется in-order execution). ВРЕЗКА. закрыть << НЕ по порядку рассчитайсь!

Зачем нужно out-of-order execution? Рассмотрим следующий пример c таким псевдо-кодом:

LOAD R1, R2 – загрузить в регистр R1 значение ячейки памяти, на которую указывает R2
ADD R5, R1 – прибавить к R5 значение из R1 и поместить результат в R5
ADD R6, R7 – прибавить к R6 значение из R7 и поместить результат в R6

Легко видеть, что вторую команду нельзя выполнить до окончания первой, поскольку в арифметической операции участвует значение, извлекаемое из памяти первой командой. Но вот третья команда совершенно независима от первых двух и ее можно начать исполнять, даже если чтение из памяти затянется надолго. Затянуться ему легче легкого: если затребованный адрес памяти окажется в кэше второго уровня, задержка будет невелика – всего десяток-другой тактов, а вот промах кэша и обращение к основной системной памяти приведут к задержке уже в пару сотен тактов. Это очень большое время, за которое современный процессор потенциально мог бы исполнить десятки и даже сотни операций – во всяком случае, нашу третью операцию он точно мог бы исполнить. Но такое может сделать только чип с поддержкой out-of-order execution. In-order-процессор будет дожидаться окончания чтения из памяти, выполнит вторую операцию и только после этого перейдет к третьей.
Преимущество in-order-процессора очевидно – это простота. Но можно ли как-то справиться с его недостатками? Частично их устраняют с помощью компиляторов, располагающих команды в оптимальном порядке, но есть и более продуктивный метод: многопоточность ядра. Если ядро процессора будет исполнять два потока команд одновременно, то, споткнувшись об обращение к системной памяти в одном потоке, оно может продолжить исполнять второй и таким образом минимизировать бесполезные простои. Подобную систему внедряли и в Pentium 4 (hyper-threading), но некоторые «особенности» архитектуры этого out-of-order-процессора привели к тому, что HT там не впечатляет – от 0 до 20-30% в зависимости от версии ядра (на старых ядрах наблюдался даже «отрицательный прирост»). В Xenon же многопоточность – вполне действенное средство поднятия производительности. Это на PC можно написать традиционный чисто однопоточный код, который сможет эффективно задействовать ресурсы одноядерного процессора. На Xbox 360 такой код даже не сможет эффективно использовать всего одно ядро – таким образом, Xenon вынуждает разработчиков к многопоточности и параллелизму. Из этого, кстати, следует, что игра, изначально разработанная на Xbox 360, может с минимумом доработок быть портирована на однопроцессорный PC. Высокопроизводительной процессор «персоналки» способен последовательно выполнить в течение кадра те задачи, которые три ядра Xenon исполняли бы параллельно. А вот традиционные «однопоточные» PC-игры при переносе на Xbox 360 однозначно нуждаются в серьезной доработке и «распараллеливании», иначе процессор приставки может и «не потянуть». Что характерно, примерно так же соотносятся Xbox 360 и PS3 – c консоли Sony на консоль Microsoft портировать движки намного легче, чем в обратном направлении. Xenon может выполнять код для Cell без особых сложностей – достаточно лишь относительно небольших правок и перекомпиляции, а вот чтобы заставить Cell выполнять работу Xenon, нужно здорово «попотеть».

Cell в разрезе
Мы потому так подробно рассматривали процессор Xbox 360, что в основе Cell лежат сходные технические решения. Дело в том, что восторг по поводу наличия у PS3 восьми ядер не дает многим разобраться, что же это за ядра, в чем их достоинства и недостатки. А недостатков и «особенностей» достаточно – как мы только что увидели, наличие трех ядер у Xenon отнюдь не делает этот чип в три раза более «сильным», чем одноядерный Pentium 4.

Cell является асимметричным процессором: у него есть главное ядро (Power Processor Unit – PPU) и семь (вообще-то восемь, но в PS3 одно всегда заблокировано) вспомогательных ядер (Synergistic Processing Unit – SPU).

По своим характеристикам и устройству PPU очень похож на одно из ядер Xenon: он поддерживает набор инструкций PowerPC, имеет ту же тактовую частоту (3.2 ГГц) и тоже является in-order-процессором с поддержкой одновременного выполнения двух потоков. У Xenon, правда, богаче набор команд векторной 3D-математики, нужной для игр, а 128-битных регистров – 128 вместо 32-х. Кроме того, у PPU всего 512 килобайт кэша второго уровня против мегабайтного кэша у Xenon.
Другими словами, сердце у PS3 довольно слабое, но, по замыслу Sony и IBM, сильным ему быть и не надо – PPU лишь должен координировать работу команды вверенных ему субъядер.
Чтобы уместить все эти субъядра на одном кристалле площадью всего 221 квадратный миллиметр, их пришлось еще сильнее упростить: SPU является не просто in-order-процессором (что само по себе отрицательно сказывается на производительности). В нем также отсутствует модуль предсказания переходов и одновременно может исполняться только один программный поток. По поводу предсказания переходов мы поговорим чуть ниже, а пока рассмотрим вопрос, с которым уже немного знакомы. Как мы помним, двухпоточная система помогает справиться с проблемами простоев при обращении к системной памяти – и если ее нет, то большие задержки съедят живьем нашу производительность.

Cell является очень эффективной «числодробилкой»
В Cell эта проблема решается очень элегантно – собственно, именно благодаря такому решению процессор является очень эффективной «числодробилкой». Вместо того чтобы использовать двухуровневую систему «кэш-системная память», рискуя то и дело нарываться на промахи кэша и длительные простои, каждое SPU имеет 256 килобайт очень быстрой SRAM, расположенной прямо на кристалле процессора. Обращение к такой памяти вызывает задержку фиксированной длительности всего в 6 тактов. Когда необходимо получить доступ к системной памяти, программа производит чтение или запись блока через DMA (прямой доступ к памяти). Эта схема очень эффективна для незамысловатых «числодробительных» алгоритмов – особенно учитывая, что для обсчета физики, графики и мультимедиа традиционный кэш, используемый в процессорах, не очень полезен, а иногда и бесполезен вообще. Но при работе со сколько-нибудь сложным кодом она создает массу дополнительных проблем и неприятностей, из-за которых разработчики ругаются на PS3 нехорошими словами и не выдерживают сроки релизов. Отказаться же от использования SPU нельзя – PPU сам по себе слишком слаб и не потянет современную игру самостоятельно.
Как бы то ни было, иногда (например, при расчетах, связанных с 3D-графикой, физикой, обработкой видео или звука) схема, при которой процессор располагает не кэшем, а некоторым объемом очень быстрой локальной памяти, является предпочтительной. Архитектура Cell здесь подходит как нельзя лучше, однако и Xenon способен преподнести несколько сюрпризов. Дело в том, что процессор Xbox 360 способен превратить часть своего сравнительно небольшого мегабайтного кэша второго уровня в аналог быстрой памяти, находящейся в распоряжении SPU Cell. При работе в обычном режиме по мере заполнения новыми данными старые значения, к которым процессор давно не обращался, из обычного кэша удаляются. Программист Xenon’а может отключить эту систему и использовать L2-кэш как очень быстрый буфер для вывода геометрических данных, которые потом сразу забирает оттуда видеопроцессор, подключенный к Xenon напрямую. Это дает возможность процедурно (то есть, на ходу) создавать или модифицировать геометрию окружающего мира и с минимальными задержками отправлять ее видеопроцессору. Инженеры IBM действительно хорошо потрудились и создали «игровой» микропроцессор, который отлично приспособлен к специфическим видам рабочих нагрузок, которые возникают именно в играх.

Но вернемся к Cell. Отсутствие в SPU предсказания переходов является еще одной серьезной проблемой этого процессора – даже, пожалуй, еще более серьезной, чем высокопроизводительная, не очень удобная для сложных алгоритмов модель памяти. Вспомогательное ядро очень бодро «перемалывает» цифры, но лишь до тех пор, пока ему не встретится условный переход. Конвейер обработки команд у Cell очень длинный (21 такт). Поскольку при выборе ошибочного направления декодирования команд его нужно сбрасывать и заполнять заново, все два десятка тактов SPU не будет делать ничего полезного. Сходные проблемы были у Pentium 4, где длина конвейера 20 тактов (в 2-3 раза больше, чем у Pentium III, Core 2 или обычных процессоров архитектуры PowerPC). Это общий недостаток всех процессоров с длинным конвейером – они очень долго «втягиваются в работу» после ошибки в предсказании перехода. Однако если в Pentium 4 это отчасти компенсируется исключительно эффективным механизмом предсказания, который срабатывает в 90-95% случаев, то SPU тут похвастаться нечем, кроме не очень действенного механизма «подсказок», оставляемых компилятором или программистом в теле программы и указывающих предполагаемое направление будущего перехода.
Именно по этой причине IBM любит демонстрировать выдающиеся результаты Cell на не очень интеллектуальных задачах вроде перемножения матриц, где условных переходов нет, а циклы можно «развернуть». Большое количество проверок и переходов в коде многократно снижают производительность Cell. Справедливости ради, надо сказать, что по сравнению с современными архитектурами Intel и AMD, ядра Xenon тоже не особенно хороши в плане исполнения сложного кода. Но SPU еще хуже. ВРЕЗКА. закрыть << Ложь, наглая ложь и гигафлопы в секунду

======================== << 3 >> ========================

На самом деле, объективно сравнивать производительность процессоров очень трудно. Это пиарщики не испытывают здесь никаких проблем: берем количество операций с плавающей точкой, которые может выполнить процессор за такт, умножаем на тактовую частоту – и вуаля! При частоте 3.2 ГГц Cell той версии, что используется в PS3, выдает около 204 миллиардов операций в секунду (giga floating point operations per second – GFLOPS), Xenon из Xbox 360 – 115 GFLOPS (разница, как видим, вовсе не такая значительная, как хотелось бы пиарщикам Sony), а обычный Pentium 4 – что-то около 25 GFLOPS.
2-кратное преимущество в производительности над Xenon и 10-кратное – над Pentium 4? Не совсем. В реальных программах встречаются не только операции с плавающей запятой, но и целочисленные операции, и условные переходы. Из-за упрощенной архитектуры SPU Cell справляются с ними хуже, чем ядра Pentium и Xenon. Но как точно узнать, насколько хуже?

К сожалению, пока никак. Традиционный способ сравнения процессоров – использование тестов производительности (benchmarks). Но таких всеобъемлющих тестов, как SPEC CPUint2000/2006 или CPUfp2000/2006, которые оценивают производительность процессора на разных типах задач, для Cell не существует – и вряд ли они появятся, поскольку тонкая подгонка тестовых программ под особенности конкретной платформы противоречит самой идее универсальных тестов.

Ситуация поэтому несколько напоминает соревнования между пауэрлифтерами и бодибилдерами: пока одни поднимают валуны и тянут корабли и самолеты для демонстрации силы, другие принимают эффектные позы и демонстрируют рельеф мускулатуры. Как здесь выявить победителя, если бодибилдер тянуть корабль в соответствии с правилами соревнования отказывается, а пауэрлифтер упитанный и у него мускулатуру плохо видно?

======================== << 4 >> ========================
Однако, благодаря возможности установки Linux на PS3, энтузиастам удалось измерить производительность Cell в тестах Dhrystone (симулирует нагрузки, характерные для ОС и пользовательских программ), Linpack (оценивает производительность при расчетах с плавающей запятой), а также в синтетическом тесте Geekbench. При этом было задействовано только основное ядро PPU.

Исходя из приведенных по ссылкам данных, можно сделать вывод, что основное ядро Cell примерно соответствует по производительности устаревшему процессору PowerPC G5 1.6 ГГц (в чем-то существенно уступает, в чем-то превосходит), где-то в полтора раза сильнее Pentium III 866 МГц и, соответственно, в несколько раз уступает в производительности современным ядрам Intel Core 2.
Во избежание претензий относительно качества тестов, признаем сразу – да, их качество оставляет желать лучшего, но это единственные реальные сравнительные данные по производительности Cell, которые удалось узнать. Все остальное – из области домыслов и пиара, что довольно странно и необычно. К примеру, выпустив новую архитектуру POWER6, IBM немедленно поделилась с общественностью результатами тестов производительности в CPUint2006 или CPUfp2006. С Cell же картина обратная – вот уже несколько лет нам рассказывают о непревзойденных характеристиках этого процессора, но официальных тестовых данных реальных систем не найти.

Данные по Xenon тоже отсутствуют, поскольку «легальный» Linux на этой консоли запустить нельзя, а при работе под XNA производительность явно оказывается заниженной в десятки раз и тесты не отражают реальной картины. Но Xenon изначально разрабатывался эксклюзивно для Xbox 360, а Cell всегда позиционировлся как универсальный процессор для множества применений, поэтому отсутствие официальных тестов выглядит очень странно.

Однозначного превосходства в мощности центрального процессора у PS3 перед Xbox 360 нет
Итак, прежде всего, нужно помнить, что однозначного превосходства в мощности центрального процессора у PS3 перед Xbox 360 нет. Легко можно подобрать приложения, в которых производительность трех полноценных ядер Xenon будет превосходить производительность одного полноценного и семи урезанных ядер Cell. Для этого всего лишь нужно, чтобы в коде было очень много условных переходов и частых обращений к произвольным адресам системной памяти, что не позволит эффективно использовать встроенные в SPU 256-килобайтные блоки SRAM. Речь идет не о каких-то абстрактных тестах, придуманных из вредности – AI, скрипты и прочая игровая логика как раз подходят под такое описание. Да, SPU можно нагрузить и такими задачами, но превосходство в количестве ядер будет сведено на нет их низкой эффективностью. Поэтому, когда разработчики эксклюзивов на PS3 (например, Lair) говорят о том, что Cell позволяет им запрограммировать сотни персонажей на поле боя, это нужно понимать правильно: разработчики делают это не потому, что SPU очень подходит для такого рода задач, а потому что других доступных вычислительных ресурсов у них нет. Xenon позволил бы им сделать все то же самое, но со значительно меньшим количеством нестандартного «секса с железом».

Яркий пример – GTA 4 c ее огромными пространствами, реалистичной физикой автомобилей, толпами пешеходов и продвинутой системой анимации. Несмотря на то, что изначально эту игру анонсировали на PS3, демонстрации игры журналистам проходят на Xbox 360 – потому что на этой консоли можно сделать все то же самое, но только проще и быстрее.

Впрочем, если взять показатели PS3 в области физической симуляции, то они, безусловно, впечатляют: разработчики популярного кроссплатформенного физического движка Havok говорят, что им удалось добиться в 5-10 раз большей производительности, чем на Xbox 360 – то есть, в сцене может находиться в 5-10 раз больше объектов. Проблема, однако, в том, что доведенная для такого уровня детализации физика (десятки тысяч взаимодействующих в сцене объектов) вряд ли будет иметь какое-то значение для геймплея. Если вы не создаете симулятор рассыпающихся фигур из костяшек домино, то очень трудно использовать физику такого размаха в игровом процессе. Поведение игры будет каждый раз непредсказуемым, и геймдизайнер не сможет контролировать то, что американцы метко прозвали experience. Без этого контроля игра будет не более чем прикольным развлечением минут на десять. Если подобные игры когда-нибудь и создадут, то вряд ли их будет много и вряд ли они будут особенно популярны. Именно поэтому не стоит считать мощную «физику» таким уж большим преимуществом PS3. Если найдется гениальный геймдизайнер, который сможет придумать, как совместить геймплей и физику, эта карта может сыграть – но, учитывая инертность индустрии и ее «любовь» к спорным инновациям, мы вполне можем никогда этого и не дождаться. Не будем также забывать, что у консоли довольно мало памяти и особо масштабные миры там банально не поместятся.

Кроме того, 5-10 кратное превосходство «по физике» получено в «лабораторных условиях». В реальной игре часть SPU будут отвлечены на другие задачи, с которыми они справляется совсем не блестяще, и превосходство будет отнюдь не таким впечатляющим. В принципе, Cell можно будет «нагрузить» со временем физикой второстепенных деталей: одежды, волос, частиц воды, дыма и так далее. Это сложно, но возможно, и совершенно не усложнит геймплей. Однако и у Xbox 360 есть «секретное оружие», которое можно будет задействовать для подобных задач на более поздних этапах жизненного цикла консоли, и о котором мы поговорим чуть позже.

Что же мы имеем в итоге? В силу того, что современные игры гораздо больше нагружают видеосистему, чем процессор, мощности CPU Xbox 360 вполне достаточно для всех сегодняшних игровых применений. И, благодаря наличию трех ядер, которые могут одновременно исполнять шесть потоков, этот процессор имеет вполне приличный задел на будущее. Нельзя сказать, чтобы производительность Xenon поражала – очевидно, что сейчас на PC доступны значительно более интересные и сбалансированные процессоры. Но благодаря ряду архитектурных особенностей и узкой специализации Xenon, игровые программисты могут использовать его ограниченные ресурсы значительно эффективнее, чем куда более впечатляющие ресурсы процессоров Intel.
Центральный процессор PS3 разработан той же компанией IBM на основе той же технологии, что и Xenon, но может исполнять девять потоков одновременно. Тем не менее, он демонстрирует высокую производительность лишь на простых «числодробительных» задачах – свойственный многим играм программный код с высокой алгоритмической сложностью легко способен опустить его производительность ниже уровня CPU Xbox 360.

При этом цена Cell более чем в два раза превышает цену Xenon, что немаловажно для таких дешевых потребительских устройств, как игровые консоли. По данным Merrill Lynch, себестоимость Cell на старте PS3 должна была составлять 230 долларов, в то время как себестоимость Xenon на старте Xbox 360 – 108 долларов (данные iSupply). Конечно, к тому, что говорят аналитики, нужно относиться осторожно, но в данном случае эти цифры не должны слишком отличаться от реальности: Xenon намного меньше Cell по площади и количеству транзисторов (165 против 234 миллионов), так что разница в цене должна быть очень серьезной.

Лирическое отступление: о чем думала Sony?
Концепция Cell является продолжением и развитием идей, заложенных в PS2
Итак, о чем думала Sony в 2000 году, заказывая для своей следующей консоли разработку такого дорогого и сложного в программировании процессора с неоднозначными возможностями? Рискнем предположить, что вовсе не о том, что будет в 2006-2007 годах торговать «потенциалом», теряя при этом многие сотни долларов на каждой проданной PS3. То, что произошло с Cell, можно смело назвать «технологической трагедией»: после четырех лет разработки и затраченных на нее сотен миллионов, оказалось, что игровой индустрии такой чип просто не очень нужен. А теперь выясняется, что такой чип не нужен и самой Sony, которая недавно объявила о продаже этой технологии компании Toshiba.
Фактически, концепция Cell является продолжением и развитием идей, заложенных в PS2 (интересующиеся архитектурой PS2 могут познакомиться с ней на врезке).

Как видим, принцип остался тем же: основное универсальное ядро + векторные модули-«числодробилки», только теперь эти модули стали более мощными, универсальными и обзавелись гораздо большим объемом встроенной памяти, а число их выросло. Благодаря этому, Cell теоретически способен даже самостоятельно рендерить изображения в реальном времени. Известно, что Sony изначально намеревалась использовать его одновременно и как центральный процессор, и как видеопроцессор. По некоторым данным, компания Toshiba разрабатывала специальную конфигурацию Cell, при которой вместо половины модулей SPU на кристалле должен был быть модуль рендеринга.
При подобной архитектуре консоли ни о каком «неизрасходованном потенциале» речь бы не шла – рендеринг в реальном времени легко способен «съесть» все ресурсы Cell. Он с первого дня отрабатывал бы свои деньги на все 100%, и никакого вопроса «к чему бы нам приспособить простаивающие SPU» у программистов возникнуть не могло.
Как устроена PS2

Схема внутреннего устройства PS2
На этой схеме нас больше всего должно интересовать ядро Emotion Engine (EE Core) и два векторных модуля: VU0 и VU1.
EE Core представляет собой микропроцессор MIPS, который исполняет основной игровой код. Это достаточно обычный процессор, для которого можно писать обычные программы на языке C/С++, легко переносимые на любой другой CPU. Модули VU0 и VU1 – это очень простые векторные процессоры, оснащенные маленькой собственной памятью и способные быстро выполнять операции, необходимые для скелетной анимации, трансформации треугольников из мирового пространства в пространство камеры и других графических задач. Выходные данные из VU1
направляются прямиком в графический чип Graphic Synthesizer, который осуществляет текстурирование и выводит финальную картинку.

Очевидно, что PPU Cell является наследником EE Core, а SPU – это развитие идеи VU0/VU1.

========================= << 6 >> =========================

В то время как Sony пыталась объединить все функции в одном процессоре, остальная индустрия шла совершенно другим путем, перенося все большее количество функций и вычислительной нагрузки с CPU на графический процессор (GPU).

Это в 1999 году Sony могла разработать в помощь центральному процессору PS2 графический чип Graphic Synthesizer, который превосходил по производительности все 3D-ускорители, присутствовавшие на PC-рынке (в том числе ATI Rage и Nvidia Riva) – PC-графика тогда была еще «зеленой», и с консольным «железом» ей тягаться было рано. Но за те годы, что Sony вынашивала Cell, Nvidia и ATI поглотили всех стоящих конкурентов и заматерели в борьбе друг с другом уже настолько, что ни одна другая компания не была способна предложить ничего и близко соответствующего производительности их графических решений.

Самым, однако, ужасным для Sony было то, что уже не мог конкурировать с PC-графикой и Cell. Используемые в «персоналках» GPU представляют собой специализированные процессоры, вся архитектура которых построена вокруг графических вычислений – и в этом деле они потрясающе эффективны. Топовые GPU уходящего поколения DirectX 9.0 (GeForce 7900 GT и Radeon X1950 XTX) по пресловутому теоретическому максимуму операций с плавающей точкой в секунду превосходят Cell в 8-10 раз! Когда пиарщики Sony говорят о том, что пиковая производительность консоли составляет 2 TFlops, нужно понимать, что только 200 GFlops приходится на Cell, а остальные 1.8 TFlops (то есть, 90 процентов) – это заслуга видеочипа.

Ghost Recon Advanced Warfighter 2: слева – версия для Xbox 360, справа – для PlayStation 3
И дело даже не в этих «маркетинговых» терафлопах, которые на практике почти ничего не значат. И по мощности, и по функциональности, и по сложности архитектуры PC-графика ушла слишком далеко, чтобы Sony и Toshiba, которая изначально разрабатывала модуль рендеринга для Cell, могли за ней угнаться.

Поскольку Xbox 360 изначально строилась по схеме CPU+GPU, то к 2004 году стало ясно, что на одном только Cell, пусть и модифицированном для рендеринга, PlayStation 3 будет катастрофически проигрывать конкурентке по уровню графики, и надо срочно что-то делать. К этому добавилось недовольство приближенных к Sony разработчиков игр характеристиками решения Toshiba.
Компания ATI была уже занята, бросив две сотни своих инженеров на разработку новаторского графического чипа Xenos для Xbox 360. Из двух графических титанов свободной осталась Nvidia, и, к счастью для Sony, она согласилась лицензировать ей лучший GPU, который находился у нее в разработке на тот момент – NV47/G70 (сейчас на нем основаны видеокарты серии GeForce 7800/7900). Его PS3-версию назвали RSX. Это очень хороший и производительный чип, но это PC-чип, в котором отсутствует такой традиционный для консолей элемент, как eDRAM, да и архитектура его по сравнению с изделием ATI является устаревшей. В результате получается парадоксальная ситуация – комбинация Xenon+Xenos, выйдя на рынок на год раньше и будучи более чем на 100 долларов дешевле в производстве, чем комбинация Cell+RSX, способна выдавать более качественную графику и обладает в этой сфере более серьезным потенциалом.

Графические процессоры: Xenos vs. RSX
Как и в случае с Xenon и Cell, Xenos и RSX, с одной стороны, очень похожи, а с другой – не похожи совершенно. С точки зрения «грубой силы» возможности GPU примерно равны – подробнее об их характеристиках можно узнать во врезке.
Некоторые разработчики отдают пальму первенства продукту ATI, некоторым больше нравится чип Nvidia – все зависит от специфических особенностей движка, приемов программирования и теплоты финансовых отношений конкретного разработчика с конкретным производителем «железа».

Параметры Xenos и RSX
Как можно видеть, практически по всем показателям у графических чипов наблюдается паритет с небольшим преимуществом Xenos. Превосходство RSX в количестве блоков текстурной выборки объясняется тем, что 8 блоков без фильтрации встроены в вершинные процессоры и по паре (с фильтрацией + без фильтрации) – в каждый из пиксельных процессоров. Соответственно, если в этом такте процессор не обращается за текстурой, соответствующий блок простаивает. У Xenos текстурные блоки отделены от процессоров и задействуются только тогда, когда они нужны – поэтому можно обойтись меньшим их количеством при близкой реальной скорости текстурирования.

RSX почти в полтора раза опережает Xenos в пиковом количестве шейдерных инструкций за такт: 136 против 96 (при том, что тактовая частота у обоих изделий одинакова). Но нужно, опять же, помнить, что пиковая пиковая производительность в реальных применениях недостижима, а Xenos эффективнее загружает свои вычислительные модули, чем RSX – так что однозначного лидера производительности нет, все зависит от конкретных нагрузок. В некоторых проектах, к примеру, разработчики вообще отказываются от использования вершинных процессоров RSX, делая все соответствующие вычисления на Cell – так что практически четверть производительности видеочипа просто никак не задействуется.

========================= << 7 >> =========================

Ирония состоит в том, что Shader Model 3.0, по спецификации которой разработан G70/RSX, является совместной разработкой Microsoft и Nvidia. Получается, что и Xenos, и G70/RSX вышли в некотором смысле «из под крыла» Microsoft, а заслуга Sony заключается преимущественно в том, что она смогла приспособить один из этих чипов в свою приставку. Так что Microsoft в какой-то степени определила облик и архитектуру графической подсистемы не только своей next-gen-консоли, но и консоли-конкурента.

Поэтому даже люди из лагеря Sony не отрицают очевидного – Xenos и RSX являются продуктами одного класса. Например, Chief Creative Officer студии Insomniac (создатели Ratchet & Clank, Resistance: The Fall of Man и ближайшие партнеры Sony) Брайан Хастингс в своей статье признал, что видеосистемы обеих консолей находятся примерно на одном уровне при некотором превосходстве Xbox 360.

В чем состоит это превосходство?
Начнем с того, что Xenos является первым графическим чипом, в котором применена унифицированная шейдерная архитектура. Традиционная архитектура с делением на пиксельными и вертексные блоки, на которой построен G70/RSX, обладает несколькими существенными недостатками – среди которых, прежде всего, неэффективность использования вычислительных ресурсов. В реальных условиях практически невозможно добиться, чтобы соотношение между вычислительными затратами на обработку вершин и пикселей всегда соответствовало соотношению между количеством вершинных и пиксельных процессоров (у G70/RSX это 8:24). Это значит, что часть блоков обязательно будет простаивать. С унифицированной архитектурой данная проблема снимается – Xenos может бросить свою шейдерную мощь (три блока по шестнадцать ALU, каждый блок может выполнять свою шейдерную программу) на обработку вершин и пикселей в нужном соотношении.

Но это не главное преимущество архитектуры Xenos над G70/RSX. Чип ATI располагает специальным модулем под названием «диспетчер потоков». Он динамически распределяет ресурсы таким образом, чтобы держать ALU всегда загруженными – такая схема отдаленно напоминает двухпоточное исполнение на ядре Xenon и в PPU Cell, только здесь на 48 ALU исполняется 64 конкурирующих потока. Если какой-то из потоков не может исполняться из-за того, что дожидается результатов чтения из текстуры или должен пропустить текущую ветвь условия, он временно «замораживается», уступая вычислительные ресурсы тому потоку, который в этом такте готов к исполнению
.
Microsoft/ATI Xenos
Конечно, стопроцентной утилизации вычислительной мощности невозможно добиться и здесь, однако Xenos гораздо ближе полной загрузке, чем RSX, из которого программистам крайне трудно выжать более половины теоретического максимума шейдерной производительности. Особенно это касается сложных шейдеров уровня Shader Model 3.0, которых в играх будет чем дальше, тем больше.
Сегодня унифицированную архитектуру с диспетчером потоков, аналогичным используемой в Xenos, имеют новые GPU AMD/ATI и Nvidia c поддержкой DirectX 10, которые только выходят на PC-рынок – в Xbox 360 эта технология используется уже полтора года. Фактически, консоль стала «полигоном», на котором Microsoft отрабатывала графическую архитектуру Windows Vista.

Как известно, DirectX 10 предполагает шейдерную модель 4.0, открывающую перед гейм-дизайнерами ряд новых полезных возможностей. Xenos не поддерживает SM 4.0 в полной мере, однако в нем имеется ряд нововведений, которые позволяют отнести этот GPU к промежуточному поколению 3.5.
В частности, Xbox 360 поддерживает текстурные массивы и целочисленное индексирование, благодаря которым за один вызов рендеринга можно выводить сотни и тысячи анимированных
объектов, что выливается в существенную экономию времени центрального процессора. Геометрических шейдеров и потоковой записи, как в DX10, здесь нет, но есть функции, которые отчасти заменяют или даже превосходят эти возможности. Как было показано на врезке, Xenos может обрабатывать в секунду в полтора-два раза больше треугольников, чем RSX – и в Xbox 360 есть схема, которая позволяет эффективно использовать это преимущество.

========================= << 9 >> =========================

Повышение детализации 3D-модели с помощью карт смещени
Там имеется специальный аппаратный тесселятор (он, rстати, появился и в новых Radeon’ах на основе чипа R6x0), который «на лету» может увеличивать количество вершин и полигонов в модели в несколько раз. Таким образом, можно сделать геометрию не только куда более «гладкой», но и с помощью вершинных шейдеров и карт смещения добавить ей новых деталей. Благодаря такому механизму можно добиться высокой детализации моделей при относительно скромном расходе памяти и шейдерной производительности.

На самом деле, тесселятор позволяет делать еще очень много интересного. Например, в Rare-овской Viva Pinata c его помощью делают адаптивную тесселяцию ландшафта (то есть, его детализация уменьшается по мере удаления от зрителя), а также рендеринг нескольких теневых карт (высокодетализированной для близких участков и низкодетализированной для отдаленных) за один проход.

В PS3 тоже можно делать адаптивную тесселяцию с помощью комбинации SPU и GPU – заметим, у ATI/Microsoft этим занимается только GPU, то есть ресурсы процессора не отвлекаются. Но чтобы добиться хотя бы отдаленно похожих результатов, разработчикам приходится очень тонко синхронизировать взаимодействие между основным процессором и видеочипом, что создает дополнительные проблемы.
В качестве примеров эффективного использования тандема SPU+GPU можно привести игру Lair, где таким образом была реализована технология Progressive Meshes, позволившая совместить высокую детализацию геометрии ландшафта с огромной зоной видимости. К сожалению, сама игра получилась слишком невзрачной, чтобы на это обратили внимание.

Viva Pinata!
Viva Pinata использует множество передовых технологий: deferred shading (как в S.T.A.L.K.E.R.) для ночных сцен, адаптивную тесселяцию ландшафта, однопроходной рендеринг нескольких теневых карт, продвинутую систему визуализации меха. Результат – одна из самых симпатичных консольных игр на сегодняшний день

Среди других возможностей Xenos, которые роднят его с новейшими видеочипами поколения DirectX 10, есть функция MEMEXPORT. Она позволяет сохранять результаты шейдерных вычислений в буфер в оперативной памяти вместо того, чтобы отправлять их дальше по графическому конвейеру. Применений у этой функции масса: начиная с продвинутых режимов расчета освещения вплоть до трассировки лучей и заканчивая использованием GPU в качестве сопроцессора-«числодробилки» в помощь центральному процессору (именно это имелось ввиду, когда шла речь о «секретном оружии», которое можно противопоставить производительности Cell в физических вычислениях). Как мы помним, программист может сделать так, чтобы GPU забирал информацию прямо из кэша Xenon. Обработав эту информацию с помощью сорока восьми своих шейдерных процессоров, GPU может вернуть результат обратно в память, откуда его опять заберет для дальнейшей обработки центральный процессор. Таким образом, «числодробительные» возможности Xbox 360 могут существенно вырасти.

Splinter Cell Conviction

Возможности Xenon и Xenos позволяют разработчикам Splinter Cell Conviction создавать очень реалистичное освещение с использованием вторичных источников света (отражение от освещенных поверхностей). Удастся ли сделать что-нибудь подобное на PS3? Посмотрим.
Благодаря очень тесной интеграции CPU и GPU Xbox 360, разработчики могут по своему усмотрению использовать как центральный процессор в помощь видеочипу в сложных алгоритмах рендеринга, с которыми имеющая ряд ограничений архитектура GPU не справится, так и видеочип в помощь центральному процессору для массированных физических расчетов. На PS3 тесная интеграция SPU и GPU приводит к тому, что программировать высокопроизводительную графику там могут только настоящие самураи, принявшие близко к сердцу кодекс бусидо, который требует стремиться контролировать железо напрямую и отвергать любые API как недостойные.

Uncharted: Drake’s Fortune

Разработчики Uncharted: Drake’s Fortune из студии Naughty Dog являются признанными экспертами по тому, как выжимать все соки из железа PlayStation. Но таких, как они, не так уж много
«Совместный рендеринг» на PS3
Реальная пропускная способность между элементами PS3
А можно ли использовать Cell в помощь RSX для повышения качества графики? Да, можно, но не совсем так, как принято считать. В фанатских кругах ходит басня о том, что Cell способен «помогать» RSX, взяв на себя часть рендеринга. Чтобы понять, почему это не более, чем смешная сказка, нужно взглянуть на таблицу на фото с презентации PS3-девкита для разработчиков.
Обратим внимание на правую верхнюю цифру в этой таблице. Она показывает, что Cell способен читать данные из видеопамяти со скоростью всего в 16 мегабайт в секунду (на слайде даже специально указано, что это не опечатка – настолько мизерна эта цифра по меркам внутренних шин передачи данных). То, есть, фактически, с точки зрения чтения видеопамять для Cell просто не существует, поскольку канал к ней в полторы тысячи (!) раз уже, чем к обычной памяти. Ну и откуда прикажете процессору брать данные для рендеринга?

Motorstorm

Тем не менее, «совместный рендеринг» действительно может принести немалую пользу и улучшить качество графики – просто понимать под этим следует нечто иное, нежели использование Cell в качестве второго видеопроцессора. Дело в том, что обычные CPU, как правило, не используются для отсечения невидимых полигонов. Они отсекают невидимые объекты целиком с помощью различных алгоритмов типа BSP или Octree. Но у любого видимого объекта почти половина полигонов невидима, поскольку находится на другой стороне от зрителя. Традиционные CPU справляются с отсечением таких полигонов неэффективно, поэтому обычно правильнее бывает отправить видимые полигоны вперемешку с невидимыми, чтобы GPU сам с ними разбирался – все равно он будет простаивать, пока процессор пытается облегчить ему работу. Однако с Cell все по-другому. У него есть много ядер, часть из них все равно ничем не занята – и эти ядра «любят» как раз такую работу и достаточно эффективно с ней справляются. Поэтому SPU вполне можно занять «чисткой» моделей от невидимых полигонов и вершин – так поступили, к примеру, разработчики Motorstorm, что, однако, не помогло им добиться заявленных Sony 60 кадров в секунду.

Но, по крайней мере, это дает возможность существенно увеличить сложность моделей и количество полигонов в кадре – то есть, в какой-то мере скомпенсировать превосходство Xenos в аппаратной поддержке сглаживания геометрии. Другое дело, что при этом часть заявленной вычислительной мощи будет бесполезно теряться из-за того, что многие расчеты, которые надо бы делать на вертексных модулях RSX, придется выполнять на Cell – в то время как те самые вертексные модули, которые занимают место на кристалле GPU и стоят денег, будут бездельничать.

«Бумажные» показатели компонентов PS3 велики, но значительная часть их либо обречена на потерю из-за простоя, либо расходуется просто на то, чтобы как-то соединить «два мира»: мир Cell c его 256 мегабайтами Rambus XDR RAM и мир RSX c его 256 мегабайтами видеопамяти GDDR3. Они связаны «толстым каналом» FlexIO с пропускной способностью около 25 Гбайт/с – казалось бы, все прекрасно. Благодаря технологии TurboCache и интерфейсу FlexIO, RSX может располагать свой кадровый буфер в системной, а не в видеопамяти. Но в этом случае ему придется «перегонять» данные через Cell, отбирая у него часть пропускной способности – ведь RSX напрямую не подключен к системной памяти!
При этом ради экономии шина доступа к видеопамяти у RSX урезана до 128 бит по сравнению с 256 битами в нормальном G70. Соответственно, пропускная способность видеопамяти тоже сократилась вдвое, а для работы в высоких разрешениях и с мультисэмплингом она имеет очень большое значение.
Пропускная способность PS3: если используется TurboCache, видеоданные приходится гонять через Cell в системную память и обратно. Много ли останется самому Cell?

Таким образом, программисты поставлены перед не очень приятным выбором: либо располагать кадровый буфер в видеопамяти и расплачиваться за это худшими текстурами и меньшим количеством кадров в секунду, либо заставлять центральный процессор (!) прогонять через себя данные, серьезно уменьшая реальную ширину его канала доступа к памяти.

В Xbox 360 всей этой путаницы просто нет, проблем меньше, а возможностей больше. Все 512 мегабайт GDDR3-памяти консоли Microsoft унифицированы и могут использоваться в любых пропорциях как для системных нужд, так и для нужд GPU. Это одна из причин, по которой на Xbox 360 зачастую оказывается больше текстурной памяти (и соответственно, больше качественных разнообразных текстур), хотя общий объем RAM у обеих консолей одинаковый. Под операционную систему Xbox 360 и тело игры обычно расходуется порядка 150 Мб. Соответственно, более 350 Мб остается на текстуры и геометрию. Почему играм на PS3 может не хватать памяти?


======================== << 12 >> ========================

Во-первых, операционная система PS3 занимает в три раза больше памяти, чем на Xbox 360: 64 мегабайта системной RAM + 32 мегабайта видеопамяти для OS PS3 против всего 32 мегабайт, которые требуются OS Xbox.

Во-вторых, оставшаяся свободной память разделена на две половины, доступ к которым не всегда так прост, как может показаться.

В-третьих, SPU могут работать только с 16-байтными блоками памяти. Это значит, что, если в структуре данных меньше 16 байт, разработчики все равно должны использовать для нее блок такого размера и впустую расходовать часть памяти. Очевидно, это одна из причин, по которым операционная система на PS3 требует так много RAM. То же самое распространяется и на обычный игровой код – движкам на PS3 однозначно потребуется больше памяти, чем их аналогам для Xbox 360. Эта проблема уже начала проявлять себя: известно, что разработчики TES4: Oblivion не смогли уместить в памяти PS3 весь дополнительный контент, который прекрасно поместился в тех же 512 мегабайтах, но на консоли Microsoft.

Пропускная способность Xbox 360: канал между GPU и видеопамятью свободен от обращений к буферу кадра, что позволяет часть его выделить центральному процессору.
Сама архитектура GPU на Xbox 360 способствует экономии системной памяти и эффективному использованию ее пропускной способности. Еще раз вспомним, что RSX – это доработанный PC-чип Nvidia G70, в то время как Xenos – это именно консольный чип, разработанный специально для Xbox 360. Он сочетает в себе передовые PC-технологии (унифицированная шейдерная архитектура) и давно и хорошо зарекомендовавшие себя консольные технологии (10 мегабайт eDRAM c огромной пропускной способностью для буфера кадров). У RSX eDRAM отсутствует, поскольку на момент создания этого GPU Nvidia не работала с данной технологией и сейчас только начинает ее осваивать для некоторых из своих продуктов. eDRAM давно используется в консолях, в PS2 она тоже была, а вот в PS3 ее нет.
Почему 10-мегабайтный eDRAM-буфер так важен? Дело в том, что GPU тратит значительную часть находящейся в его распоряжении памяти на хранение кадра в процессе рендеринга. Если проследить весь путь данных через графический конвеер, то мы увидим, что в его конце рассчитанное значение цветов пикселей отрисовываемого треугольника должно быть сохранено в память. В память записывается не только цвет пикселей, но и другая информация – например, в специальный буфер (Z-буфер) записывается информация о том, на каком расстоянии от зрителя находится данный пиксель – и если окажется, что пиксели, которые мы должны выводить сейчас, находятся дальше, чем тем, что мы нарисовали раньше, новые пиксели отбрасываются. Все это требует большого количества памяти и большой пропускной способнобности – причем HD-разрешения и использование мультисэмплинга многократно увеличивает аппетиты GPU.

Со временем разработчики научились более полно использовать графический потенциал PS3. Сверху – NSF: Carbon, Снизу – NSF: ProStreet. Слева – версия для Xbox 360, справа – для PlayStation 3
Буфер кадра, Z-буфер, буфер трафарета (stencil) при разрешении 1920x1080 и 4x MSAA потребуют более 60 мегабайт памяти и пропускной способности во многие гигабайты в секунду (чем сложнее сцена, тем больше должна быть пропускная способность). RSX борется с этим, сжимая данные в буферах перед отправкой их в память. Однако сложные изображения с большим количество объектов и мелких деталей, характерные для современных и будущих игр, довольно плохо поддаются сжатию – тем более, сжатию «на лету». Поэтому в реальных условиях, даже несмотря на сжатие, RSX должен затрачивать на хранение буфера кадра при использовании MSAA не один десяток мегабайт драгоценной памяти, не говоря уже о затратах пропускной способности на доступ к этому буферу. А это значит – меньше места для текстур, меньше кадров в секунду. Либо, если разработчики решили хранить буфер в системной памяти – постоянно занятые пересылкой графических данных шины между RSX и Cell, Cell и XDR RAM.

В Xbox 360 системная память на все эти буферы не должна тратиться вообще: в нее лишь записывается уже готовый кадр, который забирает оттуда микросхема вывода изображения на монитор или телевизор – это требует минимально возможных затрат ресурсов.
Все операции по работе с буферами производятся в отдельном «дочернем» чипе GPU. Туда вынесены модули, которые занимаются записью сэмплов (субпикселей) в память, блендингом (смешиванием цветов) и антиалиасингом. Там же находится 10 мегабайт встроенной прямо в чип памяти eDRAM с огромной пропускной способностью в 256 Гбайт/с. Это позволяет использовать 4x MSAA практически без потери производительности, затрат системной памяти или расходования ее пропускной способности.
Единственной причиной, по которой мы все еще имеем «счастье» наблюдать «лесенки» по краям объектов в Xbox-играх, являются некоторые технические ограничения, которые использование MSAA налагает на движок.

Дело в том, что 10 мегабайт eDRAM не хватает, чтобы отрендерить изображение целиком, поэтому его приходится разбивать на фрагменты и рисовать по частям, а это влечет за собой определенные «тонкости», затрудняющие программирование и заставляющие отказываться от некоторых интересных методов рендеринга. Поэтому многие разработчики либо жертвуют антиалиасингом ради красивых спецэффектов, либо используют его ограниченно – в режиме 2x.

Про XDR, GDDR3 и eDRAM
Огромное количество разнообразных аббревиатур, связанных с оперативной памятью: XDR, DDR, DDR2, DDR3, GDDR2, GDDR3, GDDR4 и даже GDDR5 – а также постоянно растущие цифры в обозначениях создают впечатление, что характеристики оперативной памяти улучшаются невиданными темпами.

Это так и одновременно не так. Дело в том, что у оперативной памяти есть не одна, а две главных характеристики: пропускная способность и латентность (на самом деле, конечно, характеристик намного больше, но мы говорим о главных). Что такое пропускная способность, должно быть интуитивно ясно – к примеру, если взять в качестве аналогии дорогу, то понятно, что у четырехрядного шоссе пропускная способность больше, чем у двухрядного, поскольку одновременно по нему может ехать больше автомобилей. Что такое латентность, понять тоже легко – если максимальная скорость вашего автомобиля 150 км/ч, то каким бы широким и пустынным не было бы шоссе, быстрее, чем за два часа, 300 км не проехать.

Возвращаясь к электронике, можно сформулировать следующим образом: пропускная способность подсистемы памяти определяет, сколько запросов к памяти выполняется одновременно и сколько данных можно «утянуть» за один запрос; латентность определяет минимальное количество времени, которое занимает выполнение одного запроса. Так вот, в то время как пропускная способность памяти растет довольно быстро, ее латентность практически не улучшается – бывает даже, что в новых типах памяти с большей пропускной способностью латентность оказывается выше (и, соответственно, хуже), чем в старых!

Фактически, за последние 25 лет латентность оперативной памяти уменьшилась всего примерно в 3 раза, в то время как тактовая частота процессоров возросла в 500 и более раз. В итоге, выходит, что для современного процессора самая новая и современная память выглядит в 100-150 раз более «тормозной», чем выглядела для его убеленного сединами «дедушки» 1982 года выпуска тогдашняя RAM! Да, нынешняя память способна отдавать много данных на каждый запрос и эффективно работает в последовательном режиме доступа, но при запросе информации по произвольным адресам ждать приходится ОЧЕНЬ долго.

Такая ситуация оказывает самое серьезное влияние на технику программирования и используемые алгоритмы – программисты всеми силами стараются скомпенскировать огромную относительную латентность грамотным использованием кэшей, предвыбоки (данные «заказываются» в RAM задолго до того, как они будут обрабатываться процессором) и других методов. Но далеко не во всех ситуациях эти методы помогают.

Все это было сказано для того, чтобы стало понятно: высокая пропускная способность, которой, к примеру, может похвастаться XDR (память, используемая в качестве системной в PS3) или GDDR3 (используется в качестве видеопамяти в PS3 и общей памяти в Xbox 360) не способна в полной мере скомпенсировать огромную относительную латентность, которая характерна для современной динамической памяти, используемой в качестве системной. Поэтому разница в реальной производительности систем на основе разных типов памяти отнюдь не так существенна, как это может показаться, если просто сравнивать пиковую пропускную способность «по бумажке».
Возможным выходом из тупика является более широкое использование новых типов встраиваемой динамической памяти (Embedded DRAM – eDRAM) наподобие той, что применяется для хранения буфера кадра в Xenos. В частности, разработчики из IBM в начале этого года сообщили, что им удалось создать eDRAM, которая по своим характеристикам близка к статической памяти, которая обладает низкой латентностью и которую по этой причине используют для кэшей процессоров. Поскольку ячейки eDRAM требуют намного меньше транзисторов и, соответственно, занимают на чипе куда меньше места, это позволяет надеяться, что следующее поколение консольных чипов будет оперировать уже не сотнями килобайт, а десятками мегабайт быстрой сверхоперативной памяти.

Немного о Blu-ray и перегреве
Итак, общая тенденция такова: компоненты PS3 имеют формально более высокие характеристики, однако на деле это мало что означает, поскольку архитектура Xbox 360 позволяет добиться более эффективного использования тех ресурсов, что имеются в ее распоряжении – и в результате ее производительность во многих случаях будет выше, чем у PS3.

Так произошло не потому, что инженеры IBM, Nvidia и Sony глупее инженеров IBM, ATI и Microsoft. Нет, просто консоль Microsoft получилась именно такой, как ее с самого начала задумывали и разрабатывали, а Sony пришлось «менять коней на переправе» радикально пересматривать дизайн приставки, а потом мучительно заставлять «чужие» друг другу компоненты работать вместе. Идея Кутараги сконцентрировать вычислительную мощь в CPU оказалась идущей вразрез с общими тенденциями индустрии и, в конечном счете, ошибочной – но в 2000 году, когда формулировался будущий образ PS3, предугадать это было практически невозможно.
В результате, при близких реальных возможностях, на стороне Xbox 360 – удобство разработки и значительно меньшая себестоимость, которая позволит Microsoft всегда быть на шаг впереди Sony при снижении цен на консоли.

Есть еще один немаловажный момент: несмотря на то, что Xbox 360 очень отличается от PC по архитектуре, инструментарий разработки на обеих платформах является довольно схожим, поэтому PC-разработчики чувствуют там себя «как дома». И это позволяет многим студиям с гораздо меньшими затратами портировать свои PC-игры на эту консоль или вести параллельную разработку для обеих платформ.

У PS3 тоже есть свои козыри в этом вопросе – например, открытый формат описания данных Collada, который облегчает обмен контентом с PC-миром, и, среди прочего, позволяет использовать в версии UT III для PS3 моды, созданные пользователями PC-версии.
Но как быть с маленьким объемом дисков – всего 9 гигабайт у Xbox 360 против 50 гигабайт у Sony c ее Blu-ray?

Во-первых, он не такой уж и маленький. Огромный мир TES4: Oblivion и детализированный мир S.T.A.L.K.E.R. прекрасно умещаются на каких-то 4 гигабайтах. Gears of War достаточно 7 гигабайт. А Resistance: Fall of Man, которая по графике, мягко говоря, сильно уступает этим шутерам, занимает 15 гигабайт. Очевидно, что разработчики тратили дисковое пространство, потому что им было что тратить, а не по необходимости. Тот же Брайан Хастингс из Insomniac сообщил, что в Resistance они вообще не сжимали звук. Таким образом, можно предположить, что большинству студий, которые свои данные сжимают, дискового пространства будет хватать еще долго.

Реально вопрос нехватки дискового пространства может встать только перед проектами, подобными GTA IV, где имеется большой живой мир, любой уголок которого можно в любой момент посетить – и при этом разработчики достаточно богаты, чтобы обеспечить каждому из этих уголков высокий уровень детализации. Но и создатели GTA IV с этими проблемами успешно справляются (а разработчики Assassin’s Creed – уже справились).

В играх, которые не могут похвастаться продвинутым графическим движком, технические различия между консолями незаметны вовсе: Stranglehold на Xbox 360 (слева) и PlayStation3 (справа)
На самом деле, гораздо более актуальной для разработчиков является проблема отсутствия винчестеров в Core- и Arcade-версиях. Невозможность кэшировать данные на HDD – это реальное неудобство, которое на порядок больше отравляет жизнь создателям больших масштабных игр, чем 9-гигабайтный размер диска.

Достаточно скоро должна сойти на нет и проблема «красного кольца смерти». Уже общеизвестно, что она вызвана нарушением контактов GPU и CPU при перегреве консоли из-за недостаточно эффективной системы охлаждения.
Перевод технологического процесса по производству основных чипов Xbox 360 на 65 нанометров (по некоторым данным, он уже состоялся) должен существенно понизить тепловыделение – так, что даже хилые кулеры этой приставки должны с ним справиться. В целом, «красное кольцо смерти» сильно напоминает «синий экран смерти», хорошо знакомый пользователям старых версий Windows. Еще 6-7 лет назад шутки про синий экран были очень популярны, поскольку каждый первый пользователь неоднократно сталкивался с этим явлением. Но после перехода на XP проблема незаметно исчезла, и стало возможным годами пользоваться Windows и ни разу не увидеть «синего экрана». Есть все шансы, что то же самое будет и с «красным кольцом».


MayX
Заключение
Итак, какие же выводы можно сделать из всего сказанного?
Судя по всему, Cell – это «тупиковая ветвь» микропроцессорного развития. Он значительно хуже справляется со сложными программами, чем традиционные симметричные процессоры, он требует тщательной ручной доводки и оптимизации, но при этом уступает по своей главной разрекламированной характеристике – производительности с плавающей запятой – графическим процессорам последних поколений. GPU могут противопоставить его восьми-девяти ядрам десятки и даже сотни потоковых ALU (правда, пока что с меньшей частотой). Безусловно, Cell является очень интересным процессором, привлекающим программистов необычностью и сильными сторонами своей архитектуры (а сильные стороны у нее, конечно же, есть), но уже довольно скоро гранды «PC-строения» представят свои разработки на эту тему. И, скорее всего, новые продукты AMD, Intel и Nvidia будут гораздо более производительными, чем Cell, но при этом свободными от многих его недостатков.
Поскольку современные GPU освободили центральный процессор от большей части вычислений с плавающей запятой, превосходство Cell над Xenos в гигафлопах в секунду не дает ему особых реальных преимуществ. В свою очередь, низкая производительность Cell при выполнении программ с большим количеством условных переходов и большими наборами данных, не умещающихся в локальных хранилищах SPU, сильно усложняет жизнь разработчикам и делает Xbox 360 лучше приспособленной для сложных игр с продвинутым AI.
Архитектура PS3 запутанна и полна узких мест, из-за чего пиковые значения производительности и пропускной способности, которые получаются «по бумажке», имеют очень отдаленное отношение к тому, что выходит в реальной жизни. В Xbox 360 тоже есть неприятное ограничение – слишком маленький по современным меркам размер eDRAM, который мешает «на всю катушку» использовать возможности Xenos, но его обойти ряде случаев легче, чем «бутылочные горлышки» PS3.
Надежды фанатов Sony на то, что «вот разработчики раскроют потенциал PS3 и заткнут Xbox 360 за пояс» беспочвенны, поскольку графическая подсистема (а именно она определяет облик нынешних и будущих игр) у Xbox 360 так же мощна и при этом в некоторых аспектах более современна. Конечно, на обеих платформах есть сильные и слабые разработчики, однако лучшие игры на Xbox 360 всегда будут выглядеть хоть немного, но эффектнее лучших игр на PS3. Впрочем, это, конечно же, вопрос вкуса. Ratchet & Clank Future или Uncharted, может быть, и не являются более продвинутыми технически, чем игры на консоли-конкуренте, но яркая и разнообразная цветовая палитра позволяет им смотреться привлекательнее серо-коричневых «близнецов», заполонивших Xbox 360.
У PS3 есть Blu-ray, куда можно записывать данные без сжатия. Зато меньше свободной оперативной памяти, которая намного важнее для разработчиков сложных масштабных игр. Главной проблемой у разработчиков на Xbox 360 является не ограниченный размер DVD9, а отсутствие винчестера в Core-версии. Учитывая, что все игры должны идти на всех версиях Xbox 360, невзирая на наличие или отсутствие HDD, в будущем это может стать одним из главных лимитирующих факторов, не дающих возможностям консоли раскрыться в полной мере. Как Microsoft намерена решать эту проблему, пока неясно. Возможно, что никак.
В любом случае, несмотря на все свои архитектурные «фокусы», PS3 по-прежнему остается интересным продуктом – надежным, качественным, вполне проработанным. Все-таки за этой приставкой стоит полувековой опыт Sony в производстве бытовой электроники.
Несмотря на всю продуманность и элегантность архитектуры, Xbox 360 до последнего времени оставалась достаточно сырым в плане реализации продуктом с низкой надежностью и неприятными проблемами при эксплуатации. Сказывается и отсутствие такого производственного опыта, как у Sony, и желание сэкономить везде, где можно и где нельзя.
Но, невзирая на прошлые ошибки, низкая себестоимость и ранний старт сделали свое дело: на нынешнее Рождество впереди явно Xbox 360, обладающая и большей библиотекой игр, и более привлекательной ценой.
Что там будет на следующее – тайна, покрытая мраком. Тем не менее, уже сейчас можно сделать неутешительный вывод: годовое опоздание и сильно завышенная стоимость PS3 (и то, и другое – результаты ошибочных решений Кена Кутараги и его команды) лишили эту консоль возможности стать бесспорным лидером текущего поколения.
Можно выразиться еще жестче – пока что PS3 поддерживает «на плаву» только сила бренда PlayStation. Не будь у продукции Sony такого количества поклонников, завоеванных во времена PS и PS2, груз ошибок уже утянул бы PS3 на дно. Но пока бренд спасает ее. Как долго это будет продолжаться и сможет ли PS3 когда-нибудь «перейти в наступление», окончательно выяснится в 2008 году.
MayX
Альтернативное мнение.

"Разгромная" статья, рассчитанная на дилетантов =)

Итак, разбор полетов. В скобках - выдержки из статьи, без скобок - комментарии к ней.

(Поскольку объем этих фактов даже в очень сжатом и популярном изложении достаточно велик, мы вынесли в начало статьи краткий дайджест. Желающие познакомиться с фактами и комментариями поближе, могут пройти по ссылкам к конкретному фрагменту текста. Пытливые читатели могу просто перейти на следующую страницу и прочесть текст целиком. Итак, факты:
• Центральные процессоры обеих консолей: Cell и Xenon – разработаны компанией IBM и имеют много общего. Каждое из трех симметричных ядер Xenon очень похоже на главное ядро Cell)

Центральные процессоры обеих консолей: Cell и Xenon – не разработаны компанией IBM, Cell - Sony,IBM,Toshiba в порядке уменьшения вложенных денег, а Xenon - на базе G5 (IBM + Apple) но имеют не так уж много общего. Каждое из трех симметричных ядер Xenon построено на базе процессора G5 и имеют абсолютно схожую с ним архитектуру. Xenon - это не больше, чем 3 G5 надстроенные друг на друге, в то время как центральный (координирующий) cопроцессор Cell PPE - этот тот же G5, но с оптимизированным тепловыделением (65нм)


(По аналогии с устройством первой Xbox, в которой использовался процессор Intel Celeron 733 МГц, многие считают, что в Xbox 360 установлена какая-то разновидность x86-совместимого процессора производства Intel или AMD. Это не так: как и Cell в PS3, и, к слову сказать, Broadway в Nintendo Wii, центральный процессор консоли Microsoft под названием Xenon разработан IBM и является модификацией той же самой архитектуры PowerPC, которая лежит в основе CPU консолей-конкурентов.
Отказ от продукции Intel обусловлен несколькими причинами. Во-первых, в отличие от Intel, IBM согласилась передать Microsoft право на производство чипа на сторонних фабриках, что позволяет гибко маневрировать и переносить производство туда, где оно сейчас дешевле, не попадая в зависимость от одного поставщика.)

Как бы правильно понять автора? Т.е. IBM ”разрешило” производство чипов на сторонних фабриках, как я понял. Так что нам мешает разместить выпуск автомобилей Lexus на ВАЗе? Правильно, нет соответствующего оборудования и технологий, рассчитанных на производство машин Lexus. То есть, производственные мощности есть, а технологий и оборудования для производства нет.
На самом деле IBM смогла обеспечить достаточный объем необходимых для 360 процессоров, отказавшись от долгого партнерства с Apple (более 10 лет) и вынудив последних перейти на процессоры от фирмы Intel.

Отсюда вытекает и другая история. Microsoft ”не парилась” с собственными разработками, практически полностью позаимствовав архитектуру своих новых на то время консолей у Apple. По ссылке ниже совершенно ясно видно, что на E3 2005 вместо ”работающих прототипов” игры для будущей 360 консоли запускаются на компьютерах PowerMac G5отметки
http://www.anandtech.com/tradeshows/sho ... i=2420&p=5

(Во-вторых, архитектура NetBurst, которую Intel могла предложить в период разработки Xbox 360, была не очень удачной: процессоры сильно грелись и демонстрировали не слишком высокую удельную производительность на единицу площади чипа.)

Вот тут Бобров лукавит - Процессоры от IBM всегда отличались одной большой проблемой - это просто бешеное тепловыделение. С этой проблемой тщетно боролась Apple, которая выпускала свои, скажем так, недешевые компьютеры на процессорах G4 и G5% ноутбука на процессоре G5 так и не вышло по очень банальной причине - G5 просто плавил все вокруг себя (не знакомая ли проблема?) - температура процессора 2GHz G5 достигала отметки более 80С. А с увеличение частоты PPC G5 проблема усугубилась еще сильнее.

http://xlr8yourmac.com/systems/iMacG5_c ... g_fan.html

(В-третьих, у IBM к тому времени был уже определенный опыт разработки процессоров для игровых консолей. Ее инженеры лучше понимали специфические требования игроделов и лучше могли воплотить их «в железе». )

Интересно знать? Какой опыт на тот момент был у IBM?


(Однако замена Intel на IBM отразилась не только на себестоимости, она повлекла за собой ряд принципиальных последствий, связанных с программированием. Речь идет не о том, что Pentium и PowerPC не совместимы по исполнимому коду. Большая часть игрового кода сейчас пишется на языках высокого уровня, и программистам, как правило, неважно, какая именно система команд у процессора – это забота компилятора. Разумеется, из этого правила есть много исключений, но они не играют решающей роли. Куда более важно то, что одно отдельно взятое 3.2-гигагерцевое ядро Xenon сильно проигрывает в производительности одноядерному Pentium 4 с такой же тактовой частотой. Дело в том, что для экономии площади кристалла и количества транзисторов из ядер была изъята логика, позволяющая исполнять команды НЕ в порядке их поступления (по-английски это называется out-of-order execution – соответственно, схема, применяемая в Xenon, называется in-order execution). )

Я не знаю, где и когда жил автор этой статьи в расцвет G5, когда он писал фразу: отдельно взятое 3.2-гигагерцевое ядро Xenon сильно проигрывает в производительности одноядерному Pentium 4 с такой же тактовой частотой”
Вот тесты, где 2ух ядерный G5 с частотой всего лишь 2.7GHz рвет как грелку по большинству тестов не просто процессор от Intel - один из ее наимощнейших процессоров Dual Intel Xeon DP Irwindale 3.6 GHz
http://www.anandtech.com/mac/showdoc.aspx?i=2436&p=4

(Преимущество in-order-процессора очевидно – это простота. Но можно ли как-то справиться с его недостатками? Частично их устраняют с помощью компиляторов, располагающих команды в оптимальном порядке, но есть и более продуктивный метод: многопоточность ядра. Если ядро процессора будет исполнять два потока команд одновременно, то, споткнувшись об обращение к системной памяти в одном потоке, оно может продолжить исполнять второй и таким образом минимизировать бесполезные простои. Подобную систему внедряли и в Pentium 4 (hyper-threading), но некоторые «особенности» архитектуры этого out-of-order-процессора привели к тому, что HT там не впечатляет – от 0 до 20-30% в зависимости от версии ядра (на старых ядрах наблюдался даже «отрицательный прирост»). В Xenon же многопоточность – вполне действенное средство поднятия производительности. Это на PC можно написать традиционный чисто однопоточный код, который сможет эффективно задействовать ресурсы одноядерного процессора. На Xbox 360 такой код даже не сможет эффективно использовать всего одно ядро – таким образом, Xenon вынуждает разработчиков к многопоточности и параллелизму. Из этого, кстати, следует, что игра, изначально разработанная на Xbox 360, может с минимумом доработок быть портирована на однопроцессорный PC. Высокопроизводительной процессор «персоналки» способен последовательно выполнить в течение кадра те задачи, которые три ядра Xenon исполняли бы параллельно. А вот традиционные «однопоточные» PC-игры при переносе на Xbox 360 однозначно нуждаются в серьезной доработке и «распараллеливании», иначе процессор приставки может и «не потянуть».)

In или out order обработка данных определенно хороша. Но есть одно большое ”но”! Введение в процессор алгоритмов предварительной обработки данных в РАЗЫ увеличивает его себестоимость. Одной из основных вех при разработке Cell Sony - дешевизна процессора.

(Что характерно, примерно так же соотносятся Xbox 360 и PS3 – c консоли Sony на консоль Microsoft портировать движки намного легче, чем в обратном направлении. Xenon может выполнять код для Cell без особых сложностей – достаточно лишь относительно небольших правок и перекомпиляции, а вот чтобы заставить Cell выполнять работу Xenon, нужно здорово «попотеть». )

В этом отношении автор прав лишь частично. Во-первых тут не вина процессоров в том, что нужно попотеть. Потеть придется в любом случае, но в направлении 360 -> PS3 больше, просто по причине того, что приходится содействовать SPE, идеалогия программирования PS3 еще достаточно молода, а для G5 (Мака) игры еще писались в прошлом веке той же самой тогда независимой студией Bungie

(Мы потому так подробно рассматривали процессор Xbox 360, что в основе Cell лежат сходные технические решения. Дело в том, что восторг по поводу наличия у PS3 восьми ядер не дает многим разобраться, что же это за ядра, в чем их достоинства и недостатки. А недостатков и «особенностей» достаточно – как мы только что увидели, наличие трех ядер у Xenon отнюдь не делает этот чип в три раза более «сильным», чем одноядерный Pentium 4. )

Сходные тех решения начинаются и заканчиваются на PPE - далее Cell имеет совершенно другую идеалогию и архитектуру, на текущий момент не имеющую аналогов, о чем автор пишет ниже.

(Cell является асимметричным процессором: у него есть главное ядро (Power Processor Unit – PPU) и семь (вообще-то восемь, но в PS3 одно всегда заблокировано) вспомогательных ядер (Synergistic Processing Unit – SPU). )

Одно не заблокировано, а отдано под нужды OC - почувствуйте разницу!

(По своим характеристикам и устройству PPU очень похож на одно из ядер Xenon: он поддерживает набор инструкций PowerPC, имеет ту же тактовую частоту (3.2 ГГц) и тоже является in-order-процессором с поддержкой одновременного выполнения двух потоков. У Xenon, правда, богаче набор команд векторной 3D-математики, нужной для игр, а 128-битных регистров – 128 вместо 32-х. Кроме того, у PPU всего 512 килобайт кэша второго уровня против мегабайтного кэша у Xenon.)

По поводу кэша отдельное спасибо автору - У Xenon - 1 кеш на 3 ядра, а у PPE - 512 на 1 ядро. Так у кого кэша больше?

(Другими словами, сердце у PS3 довольно слабое, но, по замыслу Sony и IBM, сильным ему быть и не надо – PPU лишь должен координировать работу команды вверенных ему субъядер.)

Если срвнивать одно ядро Cell с 3 ядрами Xenon - определенно слабее. Но к счастью Cell не состоит из одного ядра. У него их еще семь =)
Источник: http://www.gameland.ru/post/39791/2.html

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 03:23
Serious Man
Гамеланд сдох :FatYoBa:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 03:49
narrenturm
>статья про процы восьмилетней давности
большинству будет похуй, увы

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 04:17
ТомпкинСкуэр
narrenturm писал(а): >статья про процы восьмилетней давности
большинству будет похуй, увы
Тем не менее для поднятия общего уровня образования отупленных консольщиков статья более менее годная, эх...Святой я человек. Святой! :Oops:
Там не полная версия статьи, сейчас скину полную и под спойлер прятать не буду, сейчас вообще пиздец будет Nightgrowler

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 05:39
Рептил
У меня оба эти журнала до сих пор лежат :slepicwin:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 05:42
BOOM
>немного
:lol5:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 06:37
Cheewbakka
:uporot:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 06:56
Animal
Оп гей лалалей

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 08:31
HUNK USS
ТомпкинСкуэр, ниасилил я стока букв :pcelita:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 09:25
Timur033
хуйни с геймленда скопипастил :stop:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 09:30
Timur033
Ps3 давно уже доказала, что она мощней хбокса360. А эта статейка была написана тупицами и опровергнута многими играми на каррентгене. :reggie:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 09:36
PC-Elite
ТомпкинСкуэр, ирод!!
Ты не подумал, что бедные консолешкольники слишком современны, чтобы потянуть столько текста, да ещё без картинок??! :blyad: :dad: :ohyou:
СПОЙЛЕР
Годно :yoba: :trollface:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 10:01
Testo
ТомпкинСкуэр, зачем столько копипастить? Кинул бы просто источник на геймленд. :prof:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 14:44
ТомпкинСкуэр
PC-Elite писал(а): Ты не подумал, что бедные консолешкольники слишком современны, чтобы потянуть столько текста, да ещё без картинок??!
:awesome5: точно!)) Без картинок они вообще книжки не читают, да какие книжки, туристическую брошюру с трудом осиливают небось :Oops:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 14:45
ТомпкинСкуэр
Testo писал(а): зачем столько копипастить? Кинул бы просто источник на геймленд.
ТомпкинСкуэр писал(а): Там не полная версия статьи

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 14:46
kotik
:facepalm: ниочем :kaz2:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 14:49
Firex
И нахуя тут эта паста?

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 14:54
Prosto ya 4
Никому не интересно эту хрень читать, особенно если автор ТомпкинСкуэр

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 15:05
Vonterfull
О чем статья? Вкратце расскажите :take:

Re: Немного о старом поколении консолей и ПК

: 04 авг 2014, 15:07
Firex
Vonterfull, устаревшая паста (2007г) про технические особенности консолей прошлого поколения.