« PS4のGPGPU性能は現行ハイエンドビデオカードより高速らしい | トップページ | ソニーの新型4K液晶テレビの画質をチェックしてみた »

2013年6月 2日 (日)

メモリ周りで全て決まったようなもの

著名な専門家のAndo氏のブログにて、興味深いことが書かれている。

まず紹介ですが、Ando氏の本はいくつか出されている。以下の感想記事でAndo氏について簡潔に紹介されている。

"高性能コンピュータ技術の基礎 "の感想

現在のCPUはメーカーの発表資料だけでは理解できません。詳しい人が平易な言葉で解説してくれなければ、素人には実質理解できません。現在のところこのようなCPUの解説をニュース系WEBサイトで記事しているのは、後藤氏大原氏Ando氏ぐらいではないかと思います。その中で最もテクニカルな記事を書くのがAndo氏だと思いますが、その著者が設計者向けに書いた本なので、工学知識がなくIT系ニュースサイトを巡回程度しかしない私には難しかったです。
関連:Hide Ando氏の連載記事

富士通のCPUを設計した経験はあるらしく、設計者向けに解説本を出すほどの専門家です。

それでは、Ando氏の分析について、以下にご紹介したいと思います。

大きな違いは,PS4のSoCが8GBのGDDR5メモリをメインメモリとして使っているのに対して,Xbox OneのSoCはAMDの標準のAPUと同様にCPUとGPUがDDR3のメインメモリを共有するという 構造になっています。ただし,これだけではGPUが必要とするメモリバンド幅を満たせないので,GPUに対してはオンチップの32MBのSRAMをつけています。

Microsoftは200GB/sのメモリバンド幅と言ってますが,メインメモリはDDR3 2チャネルで34GB/s程度で,~166GB/sは32MBのSRAMのバンド幅です。つまり,GPUが高いバンド幅でアクセスできるのは32MBという限定されたメモリだけです。そして,32GBのSRAMのデータをメインメモリに移すにはDMAエンジンを使って転送する必要があります。また,CPUとGPUとの連携はDDR3メモリ上のデータなら両方がアクセスできますが,CPUは高速の32MBメモリにCPUはアクセスできないとなると,こちらを使った連携はできません。しかし,AMDの標準のAPUではCPUからGPUのフレームバッファをアクセスするFusion Control Linkがあり,Xbox OneのSoCでもCPUから32MBのSRAMをアクセスできるという機能を持っている可能性も排除できません。

PS4ではGPU側でPhysXなどの物理シミュレーションを動かす予定ですが,Xbox Oneではそういう話はなく,NVIDIAはXbox One用にCPUで動かすPhysXを発表したとのことです。

GDDR5を使い,全メモリが174GB/sでアクセスできるのと,オンチップの32MBのメモリは同程度のバンド幅があるのですが,メインメモリは34GB/sしかバンド幅が無いというのは大きな違いで,これがSemicAccurateが,Xbox OneはPS4に負けたという一つの理由です。

また,PS4はCPUとGPUが連携して,GPUを汎用処理にも使えるように考えられているのに対して,Xbox OneではGPUは描画中心の構成になっている。更に,Xbox Oneは,その寿命の間に来るTVの4K化の対策をどうするのかが示されていないなどをハードとして負けている点に数えています。

なお,負けを認めたとSemiAccurateが書く一番の理由は,5月21日の発表で,MicrosoftはPS4などの先行するプラットフォームとの比較には全く言及せず,PS4に対するアドバンテージを訴えなかったのは,Microsoftが内心,負けを認めているという解釈です。

Xbox OneのPhysX対応に関しては技術的問題というより、政治的問題のため、対応しなかった可能性もありますが、演算能力があまり高くないCPUにやらせるとは実にもったいないですね。Kinect対応、複数のOS搭載に対する対応などで結構リソースが消費されているのに、PS4に比べて不利だなと思えます。ちなみに、次世代エンジンのUE4も、物理演算はGPUベースとなっているそうです。もしXbox Oneはそういう対応ができても非力だった場合、マルチで差をつけられるかもしれません。XBOX360時代、UE3との相性はPS3より有利だっただけに、逆転される可能性が高まりそうです。

帯域幅についてはちょっとズレはあるみたいので、留意されるとよいかと思います。eSRAMは32MBしかない点は大きな不利になりそうです。

PS4のKZSFの開発元がメモリ利用容量について公開しています。

KZSFの開発元サイト (スライド形式で6~9ページ参照とのこと)
System 1,536MB
Shared 128 MB
Video 3,072 MB
Render Targets 800MB

レンダーターゲットだけでも800MBを用いていることです。PS3のVRAMは256MBしかなかっただけに、驚きを覚えます。

VRAMに相当する部分は3GBぐらいを用いているらしいので、ずいぶん贅沢な使い方だなと思えます。

ちなみに、最近発売された新しいビデオカードGTX780のVRAMはGDDR5 3GBです。ややハイエンドクラスなので、意外な印象を持ちます。

GTX770は2GB。(4GB版も登場する予定。)

GTX780は8万円台。GTX770は5万円台。PS4のコストパフォーマンスの高さには驚かされます。(まだ値段は発表されてないけどw)

同じGDDR5ですが、高速版を用いていることです。PS4はややクロックが低めなGDDR5を用いていることは、おそらく歩留りの良いバージョンをたくさん製造できるようにするためかと思われます。ハイエンドクラスのビデオカードなら、歩留りの悪い高速版メモリを使っても問題ありませんし。

【表】GeForce GTX 770の主なスペック 参考サイト:PC watch
GeForcee GTX 770 GeForce GTX 680 GeForcee GTX 780
アーキテクチャ Kepler(GK104) Kepler(GK104) Kepler(GK110)
プロセスルール 28nm 28nm 28nm
GPUクロック 1,046MHz 1,006MHz 863MHz
Boostクロック 1,085MHz 1,058MHz 900MHz
CUDAコア 1,536基 1,536基 2,304基
テクスチャユニット 128基 128基 192基
メモリ容量 2GB/4GB GDDR5 2GB GDDR5 3GB GDDR5
メモリクロック 7,010MHz相当 6,008MHz相当 6,008MHz相当
メモリインターフェイス 256bit 256bit 384bit
ROPユニット 32基 32基 48基
TDP 230W 195W 250W

|

« PS4のGPGPU性能は現行ハイエンドビデオカードより高速らしい | トップページ | ソニーの新型4K液晶テレビの画質をチェックしてみた »

PS4」カテゴリの記事

コメント

XBOX ONEの発表会ではメモリの種類すら伏せていましたね。
後から個別に発表してましたけど。

投稿: poi | 2013年6月 3日 (月) 11時29分

でもまあ現行機で散々疑似表現が発案されたので、720pで押し通すなら
例によってアップスケールで済ませばカジュアル層になら通用するかと
個人的にはアンチな方々から劣化劣化と所構わず騒がれなくなる事が何
よりも有り難い

今回はアナライザも優秀そうでプリプロダクションで無理な企画を検討
する手間を省けそうなのもポイント高い

投稿: おっさん | 2013年6月 3日 (月) 20時10分

>>poiさん

あくまでも素人考えですが、eSRAM 32MBの点はもしかしたら歩留まりとして結構厳しい可能性があるかもしれません。将来のシュリンクを期待して設計したと思われますが、少なくとも28nm世代は厳しいことになるのではと見ています。

インテルのハイエンドCPU(Xeon)でさえ15MBです。ちょっと下のクラスだと12MBです。やはり容量が大きいほど歩留まりが悪化するみたいですね。

32MBのままで製造するとは信じ難いです。まさかと思いますが、冗長性を図るため、24MBとかにスペックダウン?する可能性もあるかもという気がします。多分歩留まりが悪くても頑張る可能性もあるかもしれませんが、コストの良い設計とは思えませんね・・

投稿: mkubo | 2013年6月 4日 (火) 01時00分

>>おっさん様

>例によってアップスケールで済ませばカジュアル層になら通用するかと

確かにそういう可能性もありますね。ただXBOX360で十分と思われたら、積極的に(あるいは早期に)買い換える理由がない可能性もあるかも。当面PS3/XBOX360とのマルチもあるみたいですし。>CODシリーズとか。

平井社長も言っていた、「PS4はゲーマー重視路線」の思惑がうまくいけば、欧米のコアゲーマーがPS4を優先に買ってくれる可能性があるかと思います。(XoneがKicnet付のため、値段が高い可能性もありますし。)

http://japan.cnet.com/news/service/35032785/

投稿: mkubo | 2013年6月 4日 (火) 01時07分

GDDR5とeSRAM+DDR3ですが、
GDDR5は低クロック版との話も出ていますし、
冗長性はCU数やクロック数で確保しています。
それに、選別落ちはPC向けGPUにも回せます。

eSRAMは私は知らないのですがeSRAM+APUなんて
他に潰しのきくものなんでしょうか?
しかも、mkubo様の指摘通り32MBと言うと
eSRAMとしては大容量の方です。
32MB以上のものが他に利用するケースがあるのなら
その選別落ちの32MBを使用すればいいのですが
32MBしかないとなると冗長性がありません。

また、DDR3は通常のDDR3の高クロック版の選別品となりますよね?
こちらも、歩留りやコストに関係してくると思うのですが。

投稿: Powerman | 2013年6月 4日 (火) 08時17分

安藤さんの記事ということで、PS4のメモリの件で
少し思い出したことがあったので書き込みさせていただきます。

安藤氏の2013年4月6日の記事
4.TSVを使うチップの3Dスタックの実用化は2015年以降か?
http://www.geocities.jp/andosprocinfo/wadai13/20130406.htm
(結局2015年以降になっても、CS向けに大量生産というのはむずかしそうです)

SCEはMSのように、容量最優先(DDR3 8GB+eSRAM)にせず
その上で、「積層メモリ」という技術上の危険なバクチは我慢して
GDDR5 4GBというある意味穏当な選択をした

GFの2013年1月の発表会のスライドでは
PS4が2.5Dのスタックドメモリを次世代PS向けに検討しているというのが
普通にバラされてましたからねw

そういう流れの中で、SCEにとって非常に幸運なことに
GDDR5の4Gbitチップが間に合い、次世代Xboxと同じ容量の
8GBの搭載がいきなり可能になった、と言えるでしょう
結果的にSCEにとって非常に悩ましい技術的な選択が、今回ズバズバと当たりました
(この推察この前も言いましたね、すんません・・・)

mkuboさんも積層メモリの件を以前から注目されていて
自分もPS4に載ったら凄いことになるんじゃ・・・と期待していたのですが
実際のAPUの演算能力から考えると、
GDDR5の帯域で必要十分なんじゃないかと思います
PS4のGPUのベースと言われているHD7870の帯域が153GB/s
PS4はAPUとして接続するから少し多めにして176GB/s
「PS4での4Kゲームは無い」ということも考えると、非常にいいバランスだと思います

PC向けハイエンドグラボも当分の間は
積層メモリを載せることはできず、GDDR5のままで行くでしょう
そういった意味で、海外の開発者がよく言っている
「PS4は数年間にわたりゲーミングPCに対して同等かそれ以上のアドバンテージを保つ」
というのは理由がないわけではありません
DX12が策定される気配がないことや、半導体の製造技術の鈍化に見られるよう
一時期のようにPC業界が新技術を取り込んで
急激に進化していくという状況ではないからです。

投稿: a | 2013年6月 4日 (火) 18時56分

>>powermanさん

>それに、選別落ちはPC向けGPUにも回せます。

さすがにそれはないと思いますが、AMDはサーバ向けのAPUを出荷しているようで、可能性はないとは言えませんね。

>また、DDR3は通常のDDR3の高クロック版の選別品となりますよね?

そうですね。いくらDDR3といっても、高クロック版は値段がそれなりになりますからね。かつてほどの過当競争もありませんし、メモリベンダーはPCパーツの量産は消極的です。スマホ・タブレット向けに注力しています。

もしかしたら考えられる限り、最悪の選択といえるかもしれません。

投稿: mkubo | 2013年6月 5日 (水) 00時47分

>>aさん

そういえば、サーニー氏も、TBクラスのバンド幅であっても、パズルを解く必要がある仕組みはやらないとおっしゃっていましたね。積層メモリ方式を検討した可能性が高いみたいですね。

>「PS4での4Kゲームは無い」ということも考えると、非常にいいバランスだと思います

こちらとしては複雑ですが、正しい選択だと思いますね。

>DX12が策定される気配がないことや、半導体の製造技術の鈍化に見られるよう
一時期のようにPC業界が新技術を取り込んで
急激に進化していくという状況ではないからです。

haswellはあまり進化がなかったようですね。自作派から期待外れと言われています。
省電力にフォーカスしたことですが、デスクトップでやる限り、あまりメリットがないようです。

頼りはやはりAPUかなと思います。AMDのCPU系についてはもっと頑張って欲しいところです。

投稿: mkubo | 2013年6月 5日 (水) 00時59分

この記事へのコメントは終了しました。

トラックバック


この記事へのトラックバック一覧です: メモリ周りで全て決まったようなもの:

« PS4のGPGPU性能は現行ハイエンドビデオカードより高速らしい | トップページ | ソニーの新型4K液晶テレビの画質をチェックしてみた »