2013-04-29 10:53:39

Mark Cerny氏: 次世代ハードの処理ボトルネックと、PS4の取った戦略

テーマ:PS3,PS4,Orbis
PS4のリードシステムアーキテクト、Mark Cerny氏が、その性能にも関わらず、PS4が直面しうるボトルネックについて語った。もちろん彼のチームは、デベロッパがそうした点を全て回避する方法を既に考えている。

「グラフィックスで開発者がぶつかる最初のボトルネックはメモリ帯域幅です。オブジェクトごとに10かそれ以上のテクスチャを用いることが次世代では標準になることを考えると、直ぐにこのボトルネックにぶつかります。レンダリングにおけるフェーズの多くはメモリに依存しているため、ビットあたりのテクセルのテクスチャを下げようとすること以上に、開発者ができることはあまり多くありません。」

「このボトルネックに対する私たちの戦略はシンプルです。システムメモリにGDDR5を使用し、そうすることで広い帯域幅を持つようにするのです。」

では、メモリがボトルネックにならなければ?

「メモリがボトルネックにならないとすれば(それは実際に可能でしょうが)、表現しようするオブジェクトのメッシュが高密度である場合には、頂点(数)がボトルネックになります。その場合、モデリングを行うアーティストにもっと大きな(ポリゴンの面としての)三角形を使うように頼むことはできるでしょうが、実際問題としては、そうすることは難しいでしょう。プレイヤーが画面で見る上で、一つ一つの三角形は1ピクセル程度の大きさしかないということがごく普通にあるからです。その場合には、そうです、頂点ボトルネックが大きくなる可能性があります。」

「頂点ボトルネックを軽減するために開発した技術は幅広く、様々なものがありますが、この場合にはハードウェアの拡張機能になります。これらの拡張機能の中で最も興味深いのものは、グラフィックスのためのフロントエンドの処理に使用することができるというものです。」

Cerny氏はハードウェアの拡張機能について、こう説明している。
「(ハードウェアの拡張機能とは)ハードウェア、GPUの内部ファームウェア、およびコンパイラ技術をミックスしたものです。頂点シェーダを取る際には、コンピュートシェーダとして一回、バーテックス(頂点)シェーダとして一回、合わせて二回のコンパイルが必要です。コンピュートシェーダは三角形をふるいにかけ、これは元のバーテックスシェーダから位置計算をまず行い、その三角形がバックフェース(裏側に隠れている)しているかとか、そういったことを計算します。」

「そしてコンピュートシェーディングでは、次の処理で使うバーテックスシェーダの三角形の縮小セットを計算しながら生成していきます。このコンピュートシェーダとバーテックスシェーダは、非常に、非常にしっかりとハードウェア内部で連動しています。これは実装上では、難しいソリューションではありません。

「グラフィックスプログラマの観点からは、この技術を使用するにはコンパイラでいくつかのフラグを設定し、グラフィックスAPIで異なるモードを使うことになります。ですからこの技術は、午後にでもちょっと試してみて、パフォーマンスが実際に上がるかどうか確認できるような種類のものなのです。

皆さん、お分かりになっただろうか?

このホリデーシーズンのPS4リリースにあたり、PS3のような大失敗を避ける上で、こういったこと全てを早くから公開していくのは適切なやりかただと思われる。しかしながらCerny氏と彼のチームはそういった失敗を避けるため、既に熱心な取り組みを行ってきた。彼らは、PS4に最適化されたバージョンのパフォーマンス解析ツール「Razor」と、サンプルコードをデベロッパに配布すると約束した。

Cerny氏はまた、現実のワールド・コードは後日配布されるとも語った。
「もし誰かが何か面白いコードを書いたとして、他のPSの開発者が利用できるよう、ソースコードを公開しても構わないと思っている場合、それは非常に大きな価値を持つでしょう。


NS: Gamingbolt  Mark Cerny Comments On PS4 Bottlenecks And How Devs Can Overcome
AD
いいね!した人  |  コメント(51)  |  リブログ(0)

みらいさんの読者になろう

ブログの更新情報が受け取れて、アクセスが簡単になります

最近の画像つき記事
 もっと見る >>

コメント

[コメントをする]

51 ■titanて

いくらするのかと思えば13万とかなのねw
これを比較対象に出して勝ち誇るなんて正気の沙汰じゃない
これでPC組んだらいくらになるんですかね
まあPS3の時もいたよねこういう人

50 ■無題

一度でもハイエンドパーツで組んだPCの現物と
しばいて本気を出させた時の現場を見れば
いかに比較するのが馬鹿げているか分かりそうなものですけどね

PS4は性能的な面だけでなく
プログラミングのモデルにまで変革を進めてくれそうでその意味でも楽しみです!

49 ■無題

TITANの方が高性能って
TITAN単体で使えると思ってんの?

48 ■無題

TITANって日本での価格がおいくらか知ってますか?
GPUだけ机の上においてゲームするつもりでしょうか?
やっぱり脳みその無い方の考えることは分かりませんね

47 ■Re:無題

>(M)キーパーさん
メモリとGPUを比較してどうしたいんだか…

46 ■無題

アンチプレステ知識なさすぎwwww

45 ■無題

もしや、eDRAM(1T-SRAM)のTがTB(テラバイト)だと思ったのかな?まさかないよね?w 正しくはトランジスタ

44 ■無題

また糞箱次世代は混載DRAMに頼る構造なのか
720版の劣化は免れないな

43 ■無題

帯域176GB/secのGDDR5を8GBも積んでいるのに下手にESRAMとか噛ませると返って遅くなっちゃうぜ
なお、720に搭載のESRAMは102GB/secの模様

42 ■Re3::無題

>じゃっかるさん
ありがとうございます
TSVもHBMも次々世代には使われてそうですねw

41 ■無題

間違いなく@MEKEMEKEKEEPERですねコイツ。

「高性能だとは思えない」っていう想像からくる文章から「の方が高性能じゃないか」っていう断定の文章になってる、
日本語怪しすぎますね。

40 ■無題

>(M)キーパーさん
あなたのような難癖付けたいだけのアンチソニーの方も大量にいるんですよねえ

39 ■無題

また変なの湧いたけどもしかしてツイッターでアンチソニー活動されてる方でしょうかね?Mキーパーとかいうの
それとくろださんでしたっけ
もしかして機械翻訳かけてらっしゃいますか?
かなり日本語がおかしいことになってるので外国人の方でしょうか?

38 ■無題

PS狂信者達がPS4を持ち上げてるがGDDR5を積んでいるからといってそんなに高性能だとは思えない。
TITANの方が高性能じゃないか。

37 ■無題

物理的にピーク性能は超えられない以上、開発の効率化を最優先でサードパーティに
明示しようという試みでしょ
出来ない事をやろうとして無駄な時間を掛けない様にケース毎に分析してボトルネック
を回避する為のノウハウの蓄積と公開

特に今世代ではGPGPUの活用も加わるから描画性能とのトレードオフ
も計算して、尚且つCPUを頂点処理に使った場合のパフォーマンスとか

36 ■次世代Xbox終わったな・・

GDDR5の鬼帯域を持つPS4でさえ
ここまで帯域を稼ぐ為にカスタムしている事実

次世代Xboxはメモリ帯域がPS4の4分の1もない
その上CPUとGPUが劣るので物理演算でもPS4レベルは無理
世代が違って見えるくらい差がつくでえ
しかもPS4より低スペックで500ドルw

35 ■無題

>くろだ

曲乗りも出来るようにした≠曲乗りしないと性能が出ない
だと思うんですが
何も矛盾してないでしょそれ

34 ■無題

ポリゴン演算とGPGPUの連携をAPIで楽にできるって言ってるのに
曲芸ガーとか脳障害すぎるだろ

33 ■無題

>26
くろだ「eDRAMは1TB/s、WiiUはeDRAMがあるから1TB/s」レベルの池沼だよ

32 ■無題

・大容量で広帯域のメモリ積んだから帯域不足がボトルネックにはならない

・低容量でいいなら更なる超広帯域のRAM積めたけど最適化しないと意味がないからやめた

・帯域の次に問題となりうるのは頂点シェーダーだがコンピュートシェーダーとの連携をAPIで実装できる

帯域も頂点シェーダーも遥かに劣るWiiU、720は論外

31 ■無題

偶に特定の人たちの間で話題になる、WiiUに搭載されているがまだ使われていない「謎技術」がそれです(バァーン

30 ■無題

くろださんフルボッコ祭り開催中w

29 ■無題

伸びてると思ったらちょんてん豚がわいてたのか

28 ■Re:Re:Re:無題

>ありにゃん
実装上の問題としての例として理解されたし。

27 ■Re:Re:無題

>abcさん
NVIDIAのVoltaのことじゃないですか?
DRAMをスタックするとかなんとか
ロードマップにチラッと出た段階ですよ

26 ■Re:無題

>くろださん
>帯域が1t級にする方法はある、他のハードは実装してる(予定がある)

どこに書いてあるの?
このインタビューとどこが関係あるの?

25 ■Re:Re:無題

>サムワン

eSRAMはeDRAM違うぞ?

24 ■無題

帯域と搭載メモリ量とのバランスに於いてロジックに混載する形での
RAMの採用は見送ったという単純な話なのに、そこが理解出来てない

コストとの兼ね合いでRAMにトランジスタ数を割けばその分ロジック
部分が減って基礎性能が下がるようでは本末転倒

容量が32MBしかなくて、その中でやりくり可能なら絶大な効果を発揮
出来るだろうけど、テクスチャリッチとは行かんよな

23 ■無題

頂点数の話
PSEdgeの発展系だね
SPURSをGPCPUに置き換えた感じ
しかもDMA転送によるレイテンシの問題もない
キャッシュ介さずGPUにアクセスできるのもコレの実現の為かな?

22 ■無題

wiiUが性能は任天堂のファーストが証明してる

ミニゲーム以外は開発しづらいって

21 ■Re:Re:あら

>くろださん
んじゃあWiiUの擁護をしてみてくれ
PS4よりWiiUの方がパフォーマンス面で優れているということを
もっと具体的にここで証明してほしい
スペックがPS4よりも上なら俺はWiiUの方を買う
だから是非とも反証して頂きたい

20 ■無題

>くろださん
異なる話を並べ替えて印象操作しといてそれか
失笑したわ

19 ■無題

>>くろだ
わざわざ異なる話を何故か並べ替えてまで一y素の話にして印象操作ですか・・・
難癖付けるだけならまだしも何がしたいんですかね?

18 ■Re:Re:あら

>くろださん
異なる話をゴッチにしてるから日本語能力を疑われるんですよ。
技術的理解力もね。
小鉄さん。

17 ■Re:あら

>はなさん
ソニー開発者がのべたものをまんま並べ替えたやつで日本語力聞いてくるのか
失笑したわ

16 ■Re:無題

>くろださん
理解できないのであれば黙っていればよいのではないでしょうか?

・PS4ではGDDR5の採用でメモリ帯域によるボトルネックは解決した
・次に考えられるボトルネックはGPUの頂点性能だが、適切な論理合成を行えばこちらも解消可能なもである
・論理合成のやりかたはAPIの呼び出し方の調整程度で容易に調整できる
と言っているのですよ。

つまり、帯域の問題はすでに解決しており、開発者が曲芸を踊る必要はないと言っているのです。

15 ■無題

>>11
最初の2行はアーキテクチャの話
3行目はソフトウェア階層の話
順番入れかえることになんか意味があるの?

「開発者に苦労をさせないアーキテクチャ」と「ハードウエアの真の性能を引き出す」を同時に実現してはならない!なんておかしな妄想にとりつかれているならわかるけどさ

14 ■Re:無題

>くろださん
丸々擁護…?
つまり、パフォーマンスを上げるのに帯域が必要であるが、それによってアクロバットが必要に成っては、結局トータルのパフォーマンスが得られない。
だから可能な限り帯域をあげ、処理の効率化の為のローレベルのアクセスを与え、そのパフォーマンスのチェック手段と、効率的なライブラリの共有化を目指す。

何か一つが重要で唯一の最適解、金の槌と銀の弾丸が存在するって話では元々ないのでは?

13 ■無題

くろさんは日本語もだけどゲームについても勉強してきた方が良いね
E3すら知らなかったとか言ってる時点でどうしようもないというか・・・

12 ■無題

なんつうかこのくろだとかいうの任天堂信者じゃなくてただの馬鹿なんじゃないのか?
ソニーに難癖付けてるだけの無能というか阿呆というか・・・

11 ■無題

帯域が1t級にする方法はある、他のハードは実装してる(予定がある)
開発者に苦労させないためにその方法は取らなかった、が
開発者が曲芸踊れるように他のハードが禁止しているローレベルのアクセスとチェッカー用意した

そして現代のゲームに必要なのは帯域である


順番変えるだけでここまで苦しい発言になるんすが、丸々擁護できるのは可能かなぁ

10 ■あら

>くろださん
誰にも理解できない難癖書き込む前に日本語勉強しなおしてこい

9 ■Re:無題

>くろださん
WiiUのチップの写真を見た事ありますか?
たった32MB程度のeDRAMで、チップ全体の4割程度を占領しています。
このおかげで他に必要な物が搭載出来ずにパフォーマンスを押し下げています。
更に問題は、高速でも少な過ぎるeDRAMで、遅いメモリを補いパフォーマンスを引き出すには、常に解けないかもしれないパズルを解くような難しさが必要です。
だからソニーはそれを選択しなかったって話なんですよ。
局所極小ピーク時でのパフォーマンスを上げる方法と、全体的にパフォーマンスを底上げする方法とで、ソニーはPS3の反省を踏まえて後者を選んだって事でしょう。

8 ■無題

批判をすることは別に問題ない
的外れな批判、もしくは理解できないのに無理に批判する→これは批判ではなく難癖という

7 ■無題

くろだ氏が任天堂ハードの設計をすればいい
そうすれば究極のハードが出来上がるだろう
産廃ハードはもうコリゴリだよ

6 ■無題

>>くろだ
あの・・・頭大丈夫ですか?

5 ■無題

くろだって別の記事で意味不明なことばっか書いてた任天堂信者か・・・
痛々しいんでやめてほしいですねえ

4 ■無題

PS4より先に批判をすべきハードがあると思うが、
信者さんは華麗にスルーをして重箱の隅をつつくわけだ
このブログにはマーク·サーニー以上の天才がいるらしい

3 ■無題

言をしてるな
L3がわりのSRAM 使えば帯域が1tにはね上がるが、開発者にを困らせたくない、と発言したのに
別の記事では完全なアクセスを提供する、と言う

そして今回はチェッカーまで作ったんで何とかしてね?

2 ■無題

ComputeShaderだと、LDS64KBを32KBのスクラッチパッドと32KBのスレッド同期用に使えるから高速に演算できるらしいね

コメント投稿

AD

Ameba人気のブログ

Amebaトピックス

      ランキング

      • 総合
      • 新登場
      • 急上昇
      • トレンド

      ブログをはじめる

      たくさんの芸能人・有名人が
      書いているAmebaブログを
      無料で簡単にはじめることができます。

      公式トップブロガーへ応募

      多くの方にご紹介したいブログを
      執筆する方を「公式トップブロガー」
      として認定しております。

      芸能人・有名人ブログを開設

      Amebaブログでは、芸能人・有名人ブログを
      ご希望される著名人の方/事務所様を
      随時募集しております。