画像やリンクが無効になっている可能性もあるのでご了承下さい。
「APU 新製品」に関する勉強会の内容を、当日の進行に沿って書いていこうと思う。前回の記事では「参加しましたよ~」と言う報告のみだったので、今回の記事を本編とする。
当日は、第一回目の勉強会と同じく、日本 AMD コンシューママーケティングマネージャー 森本氏による素晴らしいプレゼンの進行だった。
Session. 1 Trinity AMD A- シリーズ APU のご紹介
ここで先ずは「今後の AMD としての方向性」を聞くことが出来た。最近では専らキーワード的に出てくる “HSA” と言う言葉。これに専念して行くという事だ。
HSA とは Heterogeneous System Architecture の略であり、CPU と GPU という異質の物であっても同じ容易さでプログラミングが可能となるようなソフトウェア思想である。現状、GPU を利用するコーディングは CPU のそれよりも冗長で難しい。これが同等の容易さになれば GPU の支援を受け、”より高速” に “より省電力” なアプリケーションやシステムが出来上がるだろう。つまり APU という CPU+GPU ワンチップ構成が非常に優位に働いてくる。
Session. 2 AMD A-SERIES 概要
CPU 部では Piledriver コアを使用。1Module あたり “2Core + L2 Cache 2MB” という物が 2Module ある。Integrated GPU (以下 iGPU) として RadeonHD 7000 シリーズをオンダイで実装。
プロセスルールは 32nm でトランジスタ数は ~13 億個。ダイサイズは 246mm² となり、x86 コアは最大で 4 つまで。対応する CPU ソケットは “SocketFM2” となる。Llano の FM1 から短期で移行してしまったが、これは「どうしても変える必要があった」との事。
Session. 3 APU 新アーキテクチャの進化概要
上の写真は手元の資料を撮った物。Trinity のブロック図になる。
1 つのダイの上にこれだけの物が載っている。Piledriver Core や GPU 以外で注目したいのは DisplayPort 1.2/HDMI のコントローラが載っている点。DisplayPort とは、ディスプレイをデイジーチェーンで 2 枚接続が可能であったり、4K 出力 (3840x2160 の解像度) にも対応している。いわゆる次世代的なグラフィックインターフェイス。
Session. 4 Trinity は Llano に比べ 2 倍のワットパフォーマンス
Llano から Trinity への進化のポイントはダイサイズが 228mm² から 246mm² と +18mm² に留まりつつも、トランジスタ数は 11 億 7800 万から 13億 300 万と +1 億 2500 万の増加。尚かつ消費電力は Llano の 35~45W, 65~100W という範囲から Trinity では 17-35W, 65~100W と省電力帯のワット数を大幅に減少させることに成功している。
機能面でも Llano からあった “DirectX11 対応, DualGraphics, HD3D, 1080P FullHD, HDMI 1.4a, USB 3.0, SATA 6Gbps” らに加え、”TurboCore 3, DisplayPort 1.2, AMD Eyefinity, AMD HD Media Accelerator” が加えられつつも 2 倍のワットパフォーマンスを得た。
Session. 5 アップグレード、コンフィグレーションを容易に
2011 年に SocketFM1 プラットフォームが Llano と合わせて登場。2012 年に SocketFM2 へ遷移するという短命なプラットフォームであった FM1。しかし、Trinity の次に出るであろう APU (Kaveri?) も FM2 となるはずなので、わりと長寿なプラットフォームになる。
また、APU をサポートするチップセットも Llano 時代から引き続き A55 や A75 が使用される。今回 Trinity では更に A85X という ATX フォームファクタ向けの最上位を用意した。CrossFire 対応となり、PCIE 2.0 x16 を 2 分割し x8 レーンを 2 本使っての動作となる。
FCH for A-SERIES | |||
A55 | A75 | A85X | |
CodeName | Hudson-D2 | Hudson-D3 | Hudson-D4 |
Fab | 65nm | ||
SATA | 6 (3Gbps, AHCI 1.1) |
6 (6Gbps, AHCI 1.2) |
8 (6Gbps, AHCI 1.2) |
USB 3.0 + 2.0 + 1.1 |
USB 3.0 x0 USB 2.0 x14 USB 1.1 x2 |
USB 3.0 x4 USB 2.0 x10 USB 1.1 x2 |
|
RAID | 0, 1, 10 | 0, 1, 5, 10 | |
TDP | 7.6W | 7.8W |
Session. 6 A-SERIES プラットフォームポジショニング
正直ここは「売れてくれないと困る」という値段設定に。Llano とのラインナップ差としては、A6 が 4Core から 2Core になった事のみ。(Llano A6-3670K = 4Core)
Series Price |
Model | Cores | Max Turbo | Unlocked |
A10 ~¥12,980 |
A10-5800K | 4 | 4.2GHz | Yes |
A10-5700 | 4 | 4.0GHz | No | |
A8 ~¥9,980 |
A8-5600K | 4 | 3.9GHz | Yes |
A8-5500 | 4 | 3.7GHz | No | |
A6 ~¥6,480 |
A6-5400K | 2 | 3.8GHz | Yes |
A4 ~¥4,980 |
A4-5300 | 2 | 3.6GHz | No |
Session. 7 進化するソフトウェア
ここでは主に “VISION コントロールエンジン” の機能に触れた物となる。この機能はドライバである Catalyst に含まれる Vision Engine Control Center の事。
主な機能の概略は次の通り。
動画手ぶれ補正機能 AMD Steady Video
Youtube を例に取ると、サポートされるブラウザは InternetExplorer, Firefox, GoogleChrome, WindowsMoviePlayer となる。実際に使用してみた感じだと、動画のブレの様な動きを検知し、補正してくれる。
AMD Quick Stream
Youtube 等のストリーミング視聴時、予めバッファを多く取る事で回線が不安定であっても、再生が途切れる事無くストレスフリーに見ることが出来る機能。自分の回線自体やサーバサイドの回線が細くても安定した視聴が可能となる。
Session. 8 OpenCL 関連
まず、OpenCL とは “オープンスタンダードな開発環境” であり、パラレルコンピューティングの為の業界標準プログラミング言語となる。これはKhronos という団体により策定管理されている。
CPU や GPU、スマートフォン、タブレット、サーバなど、統合されたプログラミング環境を提供。1 つのコードを書くだけでクロスプラットフォームに対応し、メジャーな HW/SW ベンダで対応されている。
2011 年デベロッパ向けのアンケートにて北アメリカで OpenCL は 2 番目に多く使われ、ヨーロッパ圏でも 2 番目に。アジア太平洋圏では 3 番目と、世界中の開発者はオープンスタンダードな開発環境へ移行中である事が見て取れた。
Session. 9 ISV 関連
個人的に ISV は何の略か知らなかったので調べたが、独立系ソフトウェアベンダの事を指すようだ。
APU と言っても環境があったところで、ソフトウェアが無くては生かせない。OpenCL 等 GPGPU 対応がより進まなくてはならないが、既に多くの ISV がサポートしている。
更に対応しているアプリケーションも共に増加している。Adobe や CyberLink 社のユーザはそれなりに多いと思うので、意識せず恩恵を受けている人も多いかも知れない。
また、AMD AppZone というアクセラレーション対応ソフトウェアのライブラリ的な Web サイトがオープンしている。まだ日本語版のサイトは出来ていないが 10 月上旬にはオープンするそうだ。
この資料に “Android Apps for Your PC” との記載があるが、Windows 上で Android アプリを動作させることも出来るようだ。更に BlueStacks というソフトを用いれば APU のアクセラレーションを有効に使いながら Android アプリを Windows 上で動かせる。
何故 AMD が Android に? と疑問が湧いたが、AMD は Android にも注力しているそうだ。これは初耳だった。
次に OpenCL 対応アプリケーションと APU の組み合わせを 2 例貼っておく。
まずは WinZIP。バージョンが 16.5 以上で OpenCL 対応を済ませている。実使用した際のレポートはこちらの記事を参照して頂きたい。
そして GIMP。こちらは高機能なレタッチソフト。OpenCL 対応と非対応ではフィルター適用時にかかる時間に大きな差が出ている。
エンドユーザがどの様に PC を利用しているのか? というデータが最後にあった。ユーザが PC で使う目的とその頻度をグラフ化した物になる。
この様なデータを元に、ユーザがやることへフォーカスしていけば、より効率的な OpenCL 等によるアクセラレーションの効果も大きくなる物と思われる。
Session. 10 APU の省電力機能について
Llano の第一世代における省電力機能の説明があったが、頭が痛くなりそうな計算式等があったが、割愛させて頂く。
直接体感できるであろう省電力機能で “Swichable Graphics” という機能の説明があった。これはかなり面白い事が出来そうな機能であり、主に Mobile 向けとなるそうだがマザーボードの設計次第ではデスクトップでも実現は出来るそうだ。
概要は APU の iGPU と Mobile 向け dGPU を持つシステムで使用出来るオプション。最新の Swichable Graphics 4.0 となれば、プロファイルに登録したアプリケーションにより iGPU と dGPU のどちらを使用してグラフィックを出力するか選択及び切り替えが可能となる。加えて Dual Graphics と BACo (Buss Active Chip off) もサポートする。
これにより、パフォーマンスが欲しいアプリには dGPU を使い、それほどパワーが要らない箇所には iGPU を使わせると言った GPU の使い分けが出来る。パフォーマンスを引き延ばしても不要なところは省電力な iGPU を用いる事で、無駄の無いパフォーマンスと省電力性が得られるという非常に面白い機能だ。
Session. 11 AMD における GPGPU とヘテロジーニアスコンピューティングの歴史
GPGPU によるコーディングのお話しが主体となる。残念ながら自分自身としてコーディングは全く行わないので、内容は理解不能である。
手元の資料も転載禁止となっている為、お役に立てず申し訳ないが、割愛となる。
おわりに
第二回目となる勉強会にも参加する事が出来たが、難易度的には自作ユーザ視点だと高い物があった。レポートとして書けないような生の声を勉強会では聞くことが出来るし知ることが出来る。こんなレベルの自分だが、また機会があれば応募させて頂きたいと思う。
なによりメインの森本氏のプレゼンは冒頭にも書いたがテンポ良く非常に聞きやすく面白いのである。
現在この記事を書いている裏でも A10-5800K に関して触っていたりと APU にどっぷり嵌まってしまっている現状、この良さをもっと多く伝えられたらと思い、乱文ではあるが今後とも APU に関する記事を書いていこうと思う。
コメント