画像やリンクが無効になっている可能性もあるのでご了承下さい。
はじめに
パーツも揃ったのでメインマシンのハイエンド化計画第二弾が 12/23 に始動した。
昔は PC を組み立てるとか組み替えるのが楽しくてしょうがなかったけど、今回は歳のせいか腰がちょっと重かった。
それでもやらなければ組み上がらぬ!! ということで作業してみた物の、思わぬ結果に呆然となったお話し。
PC 組み替えはなんだかんだで楽しい
先ずは現環境のマシンの配線を抜いて作業台によっこらせっと。
側板を外し中をのぞき込み、どんどんパーツを撤去していく。マザーボードを抜き出すのが結構厄介だった。
ケースは Corsair 465X RGB という小さめのミドルタワーケース。ケースファンフル装備だとトップファンを外さないとマザーボードを固定しているネジにアクセス出来ない物だからちょっと面倒。
掃除しながらちまちまやって 1.5 時間が経過してマザーボード摘出に成功。
で、ここからが本番。ROG CROSSHAIR VIII DARK HERO (以下 C8DH) に色々載せていく。
先ずは Ryzen 9 5950X を。落としたら 10 万が死ぬなーと緊張した。
お次はメモリモジュール。4 本あるので X570-F で使っていた時と全く同じ順番で載せておいた。そうしないと回らなくなる可能性もあるから。
そして NVMe な SSD の Samsung 980 PRO 500GB を載せる。ちょっとサーマルパッドに押されてたわんでいる気もするが。
尚、C8DH の M.2_1 のヒートシンクはサイズが 2280 の場合、SSD とヒートシンクで共用のネジとなっている。SSD が片方浮いた状態でヒートシンクを被せてネジを止めるのが少し気持ち悪い。
CPU グリスはマスキング塗り
楽にやるならセンターうんちだろうけど、ちょっと多いと漏れて CPU 側面を汚すので嫌。
多少手が掛かるけどマスキング塗りが個人的には一番のお気に入り。
要らなくなったプラスチック製の会員カードをヘラにして伸ばす。
グリスは猫グリスを使用した。これは熱伝導率が良いのに伸びが良くて非常に塗りやすいから。
で、最後にマスキングテープをペリペリ剥がす。これが気持ち良い。
そして組み替え完了
大体こんな感じで。
DARK HERO の文字が映える。
動作確認と OS インストール
組み替え終えたマシンを設置して配線も済ませスイッチオン。当然の如く一発起動でニッコリ。
取り敢えず初期 BIOS が 2601 だったので、現時点で最新の 3003 へ更新しつつ CPU 以外の設定を行って OS のインストールとした。
そして起こる謎現象
Windows10 20H2 をインストールしたが、その途中でいきなりキーボードやマウスを見失ったりと USB 周りのトラブルが見られたりエラーが出ていたりした。
インストール段階では余り見た事も無いような雰囲気だったのでちょっと怖かった。
なんとかインストール完了し、あとは HDD に入れて置いたドライバ類をインストールしていこうというタイミングで突然マシンが落ちて再起動を始めた。意味が分からない。
改めて起動後にイベントログの確認をした所……
それはとんでもない内容だった。「致命的」「プロセッサコア」とかなんとか。余り目にしたくない WHEA-Logger 系の物。
切り分け作業
OS が落ちて再起動しちゃうのがかなり頻繁に起きてしまうので、環境を作り込んでいくのはかなりの厳しさがある。正直、タスクマネージャで CPU のグラフを見る位しか出来ない感じに。
と言う訳で原因を探るべく切り分け作業を行うことにした。
先ずは SATA ケーブル。AINEX の SATA ラウンドケーブルを 2 本かって今回の組み替えで使用したからちょっと怪しいなと。なんか CRC エラーでてたし。
これを今まで使用していたマザーボード付属品の SATA ケーブルに戻したところ、CRC エラーこそ出なくなったが再起動しちゃう問題は相変わらず。
次にメモリ。これもまた再起動を引き起こす場合があるからと弄って見た。
最初にネイティブ DDR4-2400 動作までクロックを落としてチェック。しかし再起動してしまう。
ついでに DDR4-3733 CL16 まで OC した状態でもチェック。これも同様に再起動してしまう。
じゃぁメモリ自体がおかしいのかと言うと、そんなことは無い。
Karhu RAM Test で 1000% とかノーエラー余裕で。
ダメ元で次は USB 周り。キーボードとマウス以外、マザーボード上の USB ヘッダすら何も繋がない状態でチェック。しかしこれもダメ。
残る所は CPU とマザーボード。マザーボードを今からまた入れ替えるのは面倒極まり無いので、CPU のチェックを。
折角のせた 5950X を外し、短い眠りから目覚めさせた 3900X に換装。
これでチェックしたところ、何事も無い動作をしてくれた。全く落ち無い。凄い安定感。
これでマザーボードも原因から外すことが出来た。
でもあれ!? 5950X がおかしい!? 初期不良!? と言う事になった。
BIOS では CPU 周りを全然弄らず Auto 設定なのにそれで再起動乱発されてはどうにもならず。
更にもう一度 5950X に戻して起動。特に HDD へアクセスすると 9 割方再起動が掛かって WHEA-Logger を吐く。
試しにと Prime95 でフルロードしてあげたが、高負荷では落ち無い様で。気難しい性格の 5950X だこと。
ということはうちの 5950X は CPU 部は OK だけど SoC 部分が半死状態の可能性が高い。どのみち不良という事になるのだろうが。
一応 SoC や VDDG, VDDP と言った電圧も弄って上げたけど状態変わらず。
購入店にお電話
海外情報だと RMA したら直った。つまり交換したら直ったという報告がいくらかあるので、購入店に電話してみた。
一通り状況を説明した所、店舗側でそれが初期不良であると承認が得られたら新品交換して頂けるそうだ。これはありがたい。
返金されても今の時期にまた買い直すのは大変だからね……
そんなわけで
現状、CPU には Ryzen 9 3900X を載せて使用しているステータスに。
ひとまず環境をどんどん作っていって CPU だけあとからまた 5950X に―― と言う事になるだろう。
ホントは 5950X のパワーを見ながらやっていきたいところだったのだけどね……orz
取り敢えずは残念な結果になってしまったが、交換品が届いてくれることを祈りたい。
電話したら即日発送してくれた……
2020/12/25 10:00 過ぎに購入店に電話で初期不良に関する問い合わせを行った。
起きている内容を取り敢えず簡単に伝えたところ、「仕入れ先の承認が得られれば新品交換に」と言う事となった。
数時間後、メールで連絡が来て「承認が得られた為に新品交換します」との事。これは良かった。
そして交換品の発送には 2~3 日かかるかもと記載があったが、本日速攻発送の連絡を頂いた。仕事が速すぎて本当にありがたい。
明日 26 日にも届きそうなので、到着次第速攻で CPU を載せ替えて動作確認を行いたい所だ。
新品交換完了で――
(2020/12/26 23:00 更新)
2020/12/26 13:00 頃、インターホンが鳴り、佐川急便のドライバーさんが交換品の 5950X を届けてくれた。同時に不具合品の方を引き取ってくれた。
おじさんニッコニコの笑顔で 3900X から 5950X に換装し、PC を設置。配線を済ませて電源投入。
Windows10 が起動し、マザーボード上の Q-CODE を確認。正しく AA (若しくは 40) である事が確認出来た。不具合品の時は起動中 AA で起動後は FF を示していた。
次に一番簡単に再現できていた HDD 上のファイル一覧をエクスプローラー経由でゴリゴリする。全フォルダのファイル名一覧を表示させても再起動する事は無かった。
以後 30 分位はあれこれポチポチしてみたが一向に再起動が発生する様子も無く、これは完全に解決したと判断した。
今現在は 5950X のパワーをかみしめているところとなる。
コメント
5950X
3950X だけで初期不良が出てるってわけでもないが
(可能性としての話)
ケミカル薬品は 部分的に人の手が入ってて。品質検査をするのだけども、全体の中に不良があっても検体で(サンプルで)採取した分では 成分の不良が含まれてない
露光の場合は
ロット単位でケミカル溶剤を使うから、最終的に不良のケミカル薬品にHitする。 8コアと6700Kとかで 初期不良報告がよく出るのも
非常にわかりにくい ケミカル的な不良が発生した状態にある
6コアのRyzen 3600とか5900Xとかは
非常にわかりやすい不良の仕方をしてるから(しかし)ケミカル薬品のロット死に巻き込まれてるので、やっぱ3600とか1600とか2600でも初期不良報告は8コア程じゃないけどある。
ってことかと
・ 電圧が不足してるからとかでもなくて??
理屈的には電圧が0.025V足りないから落ちてるのは、間違いないが
他の例だったら SSDとかDRAMチップ側の不良品とかあるじゃん??
そっち系のような初期不良起こしてたら 本気の不良個体で機能Lvでどうしようもない、ってやつ。
ケミカル薬品を完成させてる企業と、その原料を生成してる国が異なることもあり
ロット全体においては不良を含んでいても。サンプルで採取した分では入ってない
非常にわかりにくい
状態なので弾かれずに通過するんで。 特に8コアはかならずロット死を引く
6コアの方でもつまりは4コア死んでたようなCASEであっても わかりにくいから通過する
仮に0.025Vの電圧を追加するだけで正常に(一応)機能しはするのであれば
HTTハイスレを無効にすれば電圧要求がちょっと下がるから 6C6Tの3500とか4C4Tの3200とか。 8C8TのRyzenと12C12TのRyzenもあるが、機能Lvで死んでる個体が混ざりやすい = 市販されない理由
・ ケミカル溶剤が
クリティカル起こしてたら わかりやすく出るはず。
問題はロット死してるケミカル薬品なので もっと広い範囲で不良個体が生成済み。不良してるからコア側がわかりやすいカタチで不良おこしてる = 5900Xとか3900Xの12コア品
だから不良報告は8コアよりは6コアは少ないが、、
生きてる判定のコア側にもHitしてるから(5900Xの初期不良報告!)⇒ 5950Xなんかは2個積んでるから(笑) その事故ってるウェハから採った2個積んでるんで。
って。
左側が生きてても、右側の8コアの中のどれか1コアが死んでたらOUT (12コアと16コア)
⇒ ハズレ個体なら 最大で0.10V違う (HTTハイスレが通らない)
⇒ HTTが通っていながらブルスク吐いてる = 機能Lvで死んでるリスクがある
電圧なら確定で同じタイミングでブルスクかブラックアウトするから
ランダム的な予測できないタイミングでブルスクしてるっぽい(困惑)であれば、不良コアを回してるのでPBOが通ってあるのに(電圧を満たせてる) ちんぷんかんぷんな再現性のランダムエラー
不良コアを特定可能ではあるが
負荷が入ったときに当然にでる(仮と定義したら)単コアで負荷をかけてもダメ、複数コアでキャッシュとかが活性化されてるときに再現性があるが。ランダムエラーで困惑不可避(だったり笑。)
仮に 半値でいいですよー
とか言われても。「いや交換でお願いしますー」それでやったほうが。事故ロットじゃなくななるんで ってことよなぁ END