各種ストレステストをパスしたメモリ設定で突如エラーが出るように……

この記事は約4分で読めます。
スポンサーリンク

はじめに

 先日書いた以下の記事の通り、Ryzen 9 3900X にアップグレードしたあとの再調整は完了としていた

AMD Ryzen 9 3900X のメモリ周りを調整した
はじめに 無事 Ryzen 7 3700X から Ryzen 9 3900X へのアップグレードが完了した。 そこでまず、パフォーマンスを活かす為に足回りになるメモリの動作に関する調整を行った。 Ryzen 7 3700X の時の設...

 昨晩、ちょっと久々に MEMBench やって見るかなーと、DRAM Calculator for Ryzen を起動して MEMBench のタブを開き Run をクリックした。
 すると一瞬でエラーを吐いてどんどんエラーカウントが増えていった。

 何事かな……? と Memtest に切り替えてみたり Karhu RAM Test も実行してみたり。

 どう考えてもメモリ周りがおかしいことになっている。
 因みに先日の再調整完了から BIOS は一切弄っていないので本当に「なにもしていない」
 尚かつこれだけ早くエラーが出るにもかかわらず、実用上の問題は全く無かったことも不思議なもので。なのでこの時までエラーがあることすら気付かなかった。

メモリの再調整

 これ以上メモリ電圧や SoC, VDDG 辺りを盛って解決という方法はもうスマートじゃ無いなと判断したのでサブタイミングを見直し、緩める方向で再調整することに決めた。
 調整するにもメモリパフォーマンスへの影響が少ないところが良いなという事で以下 3 箇所を緩めた。

  • Twrrd 2 → 4
  • TwrwrSd 5 → 7
  • TwrwrDd 6 → 7

 という感じ。

 Twrrd は関連する Trdwr とペアで調整する必要があるそうだが、それを行わず Twrrd だけ詰めていたので DRAM Calculator for Ryzen にならって Trdwr 8 の Twrrd 4 という事に。この項目は Write → Read (Twrrd) と Read → Write (Trdwr) 時のディレイ設定。

 TwrwrSd は異なるランク間、TwrwrDd は異なるメモリ間に於ける Write to Write に関するタイミング調整となり、それぞれあと 1 でも小さくすると起動しなくなる詰め具合だが、だからといって帯域が上がるわけでも無いし Latency が下がるわけでも無いから両者 7 に緩めてみたまで。

 最終的に以下の様なセッティングとなった。

再度ストレステスト

 寝放置でテストを走らせるので DRAM Calculator for Ryzen の MEMBench にある Memtest モード (HCI Memtest) を用いた。
 Single 400% とセットして全スレッド動作を確認した後に就寝。

 朝起きたら次のようにエラー 0 で完走していたが、一部スレッドは 500% にまで伸びる等、ばらつきが大きく時間もかかっていた。
 これは恐らく HCI Memtest の実行ファイルを最新版に入れ替えて実行した影響と思われるが、テストとしての問題は無いので良しとする。

 歯抜けのスレッドが多発してまともに実行出来なかった為、HCI Memtest のバイナリを入れ替える事で問題を回避していた。
 しかし、そもそもの原因は IME である ATOK との相性問題にあった。MS-IME に切り替えると嘘のように歯抜け状態にならなくなったので、ATOK 利用者はこの点だけ要注意。

 続いて OCCT を用い、メモリに加えて SoC への負荷も与えておく。
 OCCT のセッティングは「大」の「AVX2」とし、1 時間程度連続実行させておくだけ。
 こちらもエラー無しで完了となりホッとした。相変わらずメモリ温度の上昇幅がデカいからちょっとヒヤヒヤする。

 最後に Karhu RAM Test で Coverage 1600% 程度の軽いテストでエラー無しを確認してストレステストを完了とした。
 Karhu も Coverage 指定で終了出来れば 6400% とかやりたいんだけどねぇ…… と良く思う。

 2020/02/19 10:00 追記
 Karhu RAM Test を外部マクロで 4 時間動作にセットして寝放置。完走した。
 Coverage 7,660% まで行けてたので 99.5% 位のエラーは検出するはずだからほぼほぼ大丈夫だろう。と思いたい。

パフォーマンステスト

 こちらもまた DRAM Calculator for Ryzen の MEMBench を用いてテストする。

 結果としては以前のスコア 103.92 秒と比べれば誤差の範囲内でしかない物になった。
 タイミングを緩めて安定性に向けた調整を行うにも項目を適切に選べればパフォーマンスを殺さずに行けるようだ。

おわりに

 BIOS から何も弄って居ないにもかかわらず、散々ストレステストをクリアした環境でも突如エラーが発生し出すなんてのはちょっと困るもんで、メモリモジュールかメモコン辺りが劣化したのかなーなんて嫌な事を考えてしまう。
 結果的にはメモリのサブタイミングを緩めることで解決は出来たから良しとしよう。

 結構カツカツに詰めてから日が経ってる方は一度軽くエラーが出ていないか確認してみると良いかも知れない。

  • 2020/02/27 — TwrwrSd, TwrwrDd に関する説明が間違っていたので修正。
スポンサーリンク

コメント

タイトルとURLをコピーしました