Re: Первый обзор Alan Wake - шедевра не вышло?
: 27 апр 2010, 12:39
zatorax
Я не знаю как оценивать содержание ваших постов. Вы ссылаетесь, в большинстве случаев, на совершенно очевидные вещи, что хочется повторить крылатую фразу "Спасибо, кэп!". При этом, вы исхитряетесь делать весьма своеобразные выводы, причем, как мне всё больше кажется — нарочно. И опять... так много белива, только теперь уже доходит до смешного
Direct memory access (DMA) — это не какое то устройство, это метод доступа к памяти и он придуман как раз для того, чтобы не тратить процессорное время на передачу данных, вы же называете какие то сумасшедшие цифры в 25-40%, такое возможно только в режим Program Input Output (PIO). В режиме DMA процент утилизации равен нулю.
Дальше про вашу синхронизацию...
Вам не знаком термин Front Side Bus (FSB), я прав? Потому что по другому эту ерунду про синхронизацию частот я не могу объяснить. И да, Память может работать как в синхронном так и в асинхронном режимах. Асинхронный режим — уменьшение задержек, синхронный — прирост пропускной способности. А то что вы пишите — это вообще абзац.
И далее:
Пропускная способность памяти XDRAM 25.6 GB/s если быть точным, ни байтом меньше ни байтом больше. Пропускная способность FSB Xenon 21.6 GB/s. Не такая уж значительная разница, не так ли?
В моем понимании, альфа-текстуры это тоже самое что и в понимании других - текстуры с альфа-каналом (32 бит вместо 24. 24бит/цвет + 8 бит прозрачность).
Рендер в KillZone2 основан на крохотной хитрости, деталей не припоминаю, но вроде как «каркас» уменьшается в 4 раза и отсылается CELL, который накладывает все эти замечательные фильтры. Разрешение всего этого дела порядка 640х320 точек или что то вроде того + ограничение на количество теней в кадре и так далее так далее так далее. Где то была PDFина по этому движку, можно поискать.
Ну и по поводу Ямаучи и прозрачности в GT5, http://www.eurogamer.net/articles/digit ... blog-entry
И что за бредовый подсчет такой? Мне интересно что за 2 х буфера? 640 х 480 х 8888 х 24S8 depth = 2,4 Мб, какие 9.8? 0о
Далее, задача вспомогательной памяти не хранить картинку целиком, этим занимается основная, в то время как вспомогательное берет на себя часть критичных для пропускной способности памяти вычисления. 10MB — это большущий кэш. И это как раз то о чем я говорил, разработчики работают с XBOX как с ПК железом, т.е. основное ядро отрендрило что то, вспомогательное дорисовала остальное и кадр на вылет, вот так и получилось 1365х768 no AA. Но X-Engine всё изменил. Halo Reach и Alan Wake - первые ласточки, можете запасаться попкорном, M$ еще не такое покажет на E3.
Одна и та же архитектура и лежит в основе Xenon и CELL
IBM не изобретает велосипеда, просто берет наработки уже существующих процессоров. И да, между CELL и Xenon не так много отличий, серьезно отличается только назначение процессоров.
СПОЙЛЕР
Это на основании чего сделан вывод? Современные компьютеры оснащаются памятью DDR3 которая, внезапно, стала довольно медленная для CPU. Вы знаете, по существу DDR3 не очень то отличается от DDR2, по сути, частотой и напряжением питания, принцип работы то у нее тот что и SD RAM. Так что ваш вывод относительно скорости DDR я считаю надуманным.gunnar2906 писал(а):Это GDDR3 - отлично подходящая для GPU, но довольно медленная для CPU.
СПОЙЛЕР
Это не так, вернее не совсем так. Каждое ядро PowerPC Processing Element(PPE) обрабатывает два независимых потока параллельно(SMT ), а не последовательно, как вы пишите. В сумме 6 не зависимых параллельных потоков.gunnar2906 писал(а):3 ядра CPU XBox 360 имеют 3 DMA контроллера. То бишь одно на 2 потока. В принципе это не так важно - 2 этих потока выполняют свои инструкции последовательно. Иными словами - по очереди.
СПОЙЛЕР
Хм.. а вы никогда не слышали о такой компании как SIS? Вероятно нет, потому что SIS принимала участие в разработке XBOX 360. И это самый сладкий пирог архитектуры консоли. Да, именно так как вы сейчас подумали, CPU и GPU имеют параллельный доступ к памяти, в этом вся прелесть, поэтому инженеры и смогли сделать её единой. А вы как думали?gunnar2906 писал(а):Видеоподсистема также имеет 2 DMA контроллера на каждую банку. Одновременно доступ к памяти может осуществлять один DMA контроллер. Это называется конкурирующими запросами. В PS3 таких проблем нет - память разделена.
СПОЙЛЕР
А тут попер, простите, откровенный бред.gunnar2906 писал(а):Неплохо бы заметить, еще пару вещей. Во-первых, частота работы XDRAM в PS3 равна частоте работы Cell. Это значит, что при обращении к памяти простои связанные с синхронизацией частот DMA и CPU отсутствуют. Но не только это делает работу с памятью в PS3 чрезвычайно быстрой и мало отличается от теоретически заявленных. В боксах же частота памяти 700 MHz, CPU 3.2 GHz, а GPU 500 MHz. Синхронизация частот при работе DMA занимает от 25 до 40% процессорного времени, что сильно отличает номинально заявленные полосы пропускания шин от фактических.
Direct memory access (DMA) — это не какое то устройство, это метод доступа к памяти и он придуман как раз для того, чтобы не тратить процессорное время на передачу данных, вы же называете какие то сумасшедшие цифры в 25-40%, такое возможно только в режим Program Input Output (PIO). В режиме DMA процент утилизации равен нулю.
Дальше про вашу синхронизацию...
Вам не знаком термин Front Side Bus (FSB), я прав? Потому что по другому эту ерунду про синхронизацию частот я не могу объяснить. И да, Память может работать как в синхронном так и в асинхронном режимах. Асинхронный режим — уменьшение задержек, синхронный — прирост пропускной способности. А то что вы пишите — это вообще абзац.
И далее:
Пропускная способность памяти XDRAM 25.6 GB/s если быть точным, ни байтом меньше ни байтом больше. Пропускная способность FSB Xenon 21.6 GB/s. Не такая уж значительная разница, не так ли?
СПОЙЛЕР
Я боюсь вас об этом просить. У меня уже глаза на лоб полезли после прочитанного...gunnar2906 писал(а):Если хотите, то могу рассказать про синхронизацию чуть подробнее, но сейчас не хочу вдаваться в непонятные для многих вещи.
СПОЙЛЕР
Вот только сама XD RAM не может считать больше 8 байт за такт.gunnar2906 писал(а):Так что про память - это попадание пальцем в небо. В PS3 гораздо более прогрессивная и эффективная система взаимодействия с памятью, исключающая конкурентные запросы (каждый SPU имеет свой DMA способный читать/писать в память 16 байт за такт).
СПОЙЛЕР
Тут не спорю, только CPU — это не GPU, об этом не стоит забывать, задачи у CELL весьма и весьма разные. Так что ему уперлась, еще как. И как конвеер, я уже говорил, CELL не силен, 104 GFLOP против 1800 GFLOP RSX. Другое дело что GPU их пустить в дело не может и разработчикам приходится выкручиваться перекладывая часть вычислений на CELL, которому и без того есть чем занятся.gunnar2906 писал(а):Разговоры про числодробилки мне уже надоели. Полная глупость и безграмотность. Отсутствие стандартной предикативной системы ветвления ни о чем не говорит. Для процессоров общего назначения она нужна, а для сопроцессор или GPU конвейеров она вообще не уперлась...
СПОЙЛЕР
Хорошо, а THQ (4A Games) почему не портирует? BioWare? Ubisoft? Могу перечислить массу игр не от Valve которые не вышли на PS3, если хотите.gunnar2906 писал(а):Valve не разрабатывает игры для PS3 только по одной причине - Гейб Ньэлл (хозяин) - один из крупнейших акционеров Microsoft. Других причин на текущий момент я не вижу. На текущий момент с документацией нет никаких проблем.
СПОЙЛЕР
Тут нет никаких взаимоисключений. «Делала» и «портировала» — это не одно и тоже. «Делала» - это значит писала код под определенную архитектуру для получения максимальной производительности. «Портровала» - это значит брала инструментарий и оптимизировала код так, чтобы он работал на новой платформе как можно лучше.gunnar2906 писал(а):Два взаимоисключающих предложения. Turn 10 делала Форзу 3 с момента выхода Форзы 2 дольше, чем прошло между выходами Uncharted 1 и 2, но разница между прогрессом между частями этих игр довольно существенна. От какого "ухода" от PC мы говорим, если понадобилось всего 19 дней для осуществления порта с PC на Бокс?
СПОЙЛЕР
Речь идет об адресной шине GPU. Мощности CPU и GPU мы начали сравнивать как только получаем данные производительности в Floating point Operations Per Second (FLOPS). Что значит «узко-направленный вычислительный узел»? Если узел вычислительный, то он просто вычислительный узел, без каких либо дополнений. Простые вычисления и элементарные вычисления в данном контексте — это одно и тоже. Описание вами предложенное вполне вписывается в характер вещей.gunnar2906 писал(а):Тут я вообще не совсем понял, о какой узкой шине идет речь? И с каких пор мы начали сравнивать общие вычислительные мощности GPU и CPU? GPU - узконаправленный вычислительный узел, заточенный под выполнение определенных задач. Я же перед этим сравнивал шейдерный конвейер и SPU. Теретическая вычислительная мощность 1 унифицированного шейдера в Xenos = 10FLOPSx500MHz = 5 GFLOP при вычислениях одинарной точности, и SPU peak performance for SP = 3.2GHzx8FLOPS = 25.6 GFLOPS.
"Простые вычисления" и "элементарные вычисления" - есть большая разница в этих словах. Суперскалярные вычисления производимые SPU сложно назвать элементарными. Но они просты, поскольку задаются алгоритмами без использования условий.
СПОЙЛЕР
Слишком много просите для простого спора на фанатском форуме )gunnar2906 писал(а):Помимо этого - объясни, что в твоем понимании альфа-текстуры и сравни результаты мультипроходного разделенного рендеринга в KillZone 2 с любой из игр на боксе. Также расскажи о сложностях альфа текстурирования Ямаучи в его GT =)))
В моем понимании, альфа-текстуры это тоже самое что и в понимании других - текстуры с альфа-каналом (32 бит вместо 24. 24бит/цвет + 8 бит прозрачность).
Рендер в KillZone2 основан на крохотной хитрости, деталей не припоминаю, но вроде как «каркас» уменьшается в 4 раза и отсылается CELL, который накладывает все эти замечательные фильтры. Разрешение всего этого дела порядка 640х320 точек или что то вроде того + ограничение на количество теней в кадре и так далее так далее так далее. Где то была PDFина по этому движку, можно поискать.
Ну и по поводу Ямаучи и прозрачности в GT5, http://www.eurogamer.net/articles/digit ... blog-entry
It's interesting to note Polyphony's approach to the ghost lap. Rather than render the car as a transparency, an interlaced approach is used in order to lower bandwidth and fill-rate. Maintaining 60FPS is a tough call and while Forza 3 is probably the better example of a game that cuts down its alpha textures to an absolute minimum, GT5 too uses similar tricks in order to maintain frame-rate. Alpha-to-coverage (a cheaper transparency technique) is used in both games, though the use of MSAA does mitigate the screen-door effect.
СПОЙЛЕР
Не совсем так) Xenos — это далеко не X800 XL как думаете вы и авторы той статьи. Как вы думаете, если все так просто, то зачем ATI понадобилось делать второе ядро и снабжать его такой быстрой памятью?gunnar2906 писал(а):Если мы говорим про Xenos
Все просто 640 х 480 х 4 байта цвета х 4 байта буфера глубины x 2 буфера = 9,8 МБ. Или при разработке Xenos учитывались "шаманства" с уменьшением кол-ва цветов или сокращении z-буфера? И где в Теккене 6 - MSAAx4 для которого EDRAM создавалась?
At 1365x768 with no AA - вроде так? То есть Бокс может и HD, но уже без хваленого АА?
И что за бредовый подсчет такой? Мне интересно что за 2 х буфера? 640 х 480 х 8888 х 24S8 depth = 2,4 Мб, какие 9.8? 0о
Далее, задача вспомогательной памяти не хранить картинку целиком, этим занимается основная, в то время как вспомогательное берет на себя часть критичных для пропускной способности памяти вычисления. 10MB — это большущий кэш. И это как раз то о чем я говорил, разработчики работают с XBOX как с ПК железом, т.е. основное ядро отрендрило что то, вспомогательное дорисовала остальное и кадр на вылет, вот так и получилось 1365х768 no AA. Но X-Engine всё изменил. Halo Reach и Alan Wake - первые ласточки, можете запасаться попкорном, M$ еще не такое покажет на E3.
СПОЙЛЕР
Именно, у PS4 будет такой же процессор как у XBOXgunnar2906 писал(а):Я просто поражаюсь, насколько Cell мертв. Я даже не удивлюсь, когда в он будет стоять в новом Боксе... Пока нет альтернативы =)
Или идет речь о том, что IBM официально объявила о прекращении дfльнейших разработок Cell? Как всегда научно-популярные сайты все извратили - IBM решили закончить эксперименты с процессором с 32 SPU^ но при этом продолжают разработки для других процессоров семейства Cеll и для PS4 в том числе =)
We managed to get hold of an IBM spokesperson an hour ago and they said that only one CPU development cycle is being 'halted' which is the successor to the current PowerXCell-8i cpu. IBM have said they are planning to work on other CPU's in the Cell Processor 'family' and we would assume that by the time the Playstation 4 hits market that they could very well be involved on some level.
Одна и та же архитектура и лежит в основе Xenon и CELL