Windowsのクラッシュの原因 (nvlddmlm ID 14)

最近頻繁にWindowsがクラッシュ(画面がブラックアウト)するようになりました。イベントビューアーのWindowsログ -> システムを確認するとnvlddmlm関連のログが3つ残っています。ログは記事の最後に記載するので気になる方はご確認ださい。

2023-07-02 結論はドライバーの問題でした。安定しているバージョン(531.29)に戻して解決しています。

2023-11-10 バージョン(537.13)でもブラックアウトは回避できるが、「HDRを使用する」と再発するので無効化した。

2023-12-08 バージョン(546.26)でもブラックアウト発生。「HDRを使用する」と再発するので無効化した。

目次

クラッシュの原因は?

nvlddmlmで調べると次のことがわかりました。

  • NVIDIAのグラフィックボードを使用していると発生する
  • Windowsのドライバーと競合している
  • 電源管理の問題の可能性
  • HDR関連のドライバーの不具合の可能性(2023-11-10追加)

急に頻繁に発生するようになったことから、最近導入したRTX4090の影響かと思いましたが、導入してからしばらくは問題なく動作していたので、頻繁に更新しているNVIDIAのドライバーの影響ではないかと思われます。

あと、もう1つ疑うのは、省電力の設定をしていることです。これはCPU、GPU、Windowsの設定を変更しています。

  • CPUは、UEFIによるV/Fカーブの設定変更
  • GPUは、GPU TWEAK 3によるPower Limit制限
  • Windowsは、システム -> 電源 -> 電源モード を 「トップクラスの電源効率」に設定

使用感としてはGPUのPower Limit以外は省電力になっている実感がないのであまり意味ないかもしれません。というわけで、まずはあまり効果を感じられないWindowsから順に設定を戻そうと思います。

グラフィックボード NVIDIA Geforce RTX 4090
ドライバーのバージョン 531.68

復旧方法

クラッシュすると画面が映らないので何も確認できず、しかたなく電源OFF,ONで復旧させます。

電源モードの変更

  1. Windowsボタンから[設定] -> [システム] -> [電源]を開く
  2. 電源モードをバランスに変更する

結論

症状が治まるまで、いろいろ試してみます。状況に変化があればこの記事を更新するようにします。

追記 2023-04-26

前回のクラッシュが2023-04-21から5日ぶりにイベントID 14のnvlddmkmのエラーが発生した。設定変更してしばらくは落ち着いていたが再発してしまった。今回はCheomeでGoogle MEETでビデオ会議中に発生してしまった。1、2分くらいで画面が表示されたのでそのままOSが落ちるほどではなかった。

しばらく落ち着いていたので`可能性としてはありそうなので、次は電源モード「最適なパフォーマンス」を試してみようと思う。

追記 2023-04-28

2日で再発。Youtube見てると落ちる気がする???次は、GPUのPowerLimit制限をやめてデフォルト設定に戻した。GPU Tweekも起動しないように設定してみた。

追記 2023-05-09

再発していないので、原因はGPU TweekのPowerLimitなのかもしれない。GPU Tweekをデフォルトで起動するようにして再発するか様子を見る。

追記 2023-05-11

再発しました。直接か間接かわかりませんがGPU Tweekが原因の可能性がある。GPU TweekをアンインストールしてAfterburnerを導入してみた。

追記 2023-05-22

あれから10日経過しても再現していないので、ASUSのGPU Tweekが原因であった可能性が高いです。(後日再発したので、ASUS GPU Tweekが原因ではありませんでした。)MSIのAfterburnerではエラーが発生していないので、機能というよりはソフトウェアの問題であったと思われます。ASUSさんにはArmory Crateを筆頭にアプリケーションの安定性をもっと向上してほしいです

追記 2023-06-04

BIOSからMemTest86を実行したところエラーが2件発生していた。このPCを組んだ当時はテストが通っていたのでBIOS更新などの影響があったかもしれない。
XMPを解除して再テストしたところMemTest86のエラーが解消されたため、XMPの設定を元に調整してみた。DRAM frequencyを3600Mhzから3200Mhzにダウンクロックしてエラーが発生しないので、しばらくこれで様子を見る。
NVIDIAのドライバーもすべてアンインストールしてから再インストールしてみた。

追記 2023-06-08

メモリーを定格動作にしてもエラーが発生したため、メモリーが原因の可能性が低くなった。イベントビューアーでこれまでのエラーを確認すると、2023-04-18以降からID 14 nvlddmkmのエラーが発生していた。それまでは問題ないとすると、それ以前動作しているドライバー(531.29)をインストールしてみた。今のところ再現せずエラーが発生していないため、しばらく様子を見る。これで直ったら単純にドライバーの問題であった可能性が高い。

2023-07-02

NVIDIAのドライバーのバージョン531.29に戻して以来、安定動作している。後で調べてわかったことですが、このバージョンは、ASUSのサポートで公開していたバージョンと一致していました。ASUS公開のドライバーは動作検証されているはずなので、最初からこれを使った方がよかったかもしれない。

https://rog.asus.com/jp/graphics-cards/graphics-cards/rog-strix/rog-strix-rtx4090-o24g-gaming-model/helpdesk_download/

2023-11-10

久しぶりにTails of ARISE の追加DLC Beyond the Dawn をプレーするためにディスプレイ設定の「HDRを使用する」を有効にしてから、Windowsのクラッシュ(ブラックアウト)が再発した。バージョン 537.13に変更した後も安定動作していたことからHDR関連のドライバーの不具合の可能性が高い。残念ですが、HDRを無効にして様子を見ています。

エラー発生日対応
2023-04-07
2023-04-14
2023-04-17
2023-04-18NVIDIAドライバー更新 531.68
2023-04-19
2023-04-21電源モードを「バランス」に変更
2023-04-26電源モードを「最適なパフォーマンス」に変更
2023-04-28GPU Tweek 3のPowerLimitをデフォルトに変更
起動時にGPU Tweek 3を起動しないように設定
2023-05-02NVIDIAドライバー更新 531.79
2023-05-11GPU Tweekデフォルト起動に変更してから2日で再発
GPU Tweekをアンインストール
MSI Afterburnerをインストール
2023-05-23再発 MSI Afterburnerを停止
2023-05-27エラー発生
2023-05-29エラー発生
2023-06-02エラー発生
2023-06-04MemTest86でエラー発生を確認
XMP解除とDRAM frequencyを3600Mhzから3200Mhzにダウンクロック
ドライバーもすべてアンインストールしてから再インストール
2023-06-08メモリーOCを元に戻す。MemTest86でエラー無しの状態。
古いドライバー531.29 (2023-03-14)をインストール
2023-07-021カ月近く安定して動作している。
2023-11-10ディスプレイ設定の「HDRを使用する」を有効にすると画面がブラックアウトする事象が再発した。
ドライバー537.13
2023-12-08バージョン546.29を試すが、「HDRを使用する」とブラックアウトするので無効化した。

システムのイベントログ

ソース "nvlddmkm" からのイベント ID 14 の説明が見つかりません。このイベントを発生させるコンポーネントがローカル コンピューターにインストールされていないか、インストールが壊れています。ローカル コンピューターにコンポーネントをインストールするか、コンポーネントを修復してください。

イベントが別のコンピューターから発生している場合、イベントと共に表示情報を保存する必要があります。

イベントには次の情報が含まれています: 

\Device\Video3
badfbadf(badfbadf) 00000000 00000000

メッセージ リソースは存在しますが、メッセージがメッセージ テーブルに見つかりませんでした。
ソース "nvlddmkm" からのイベント ID 0 の説明が見つかりません。このイベントを発生させるコンポーネントがローカル コンピューターにインストールされていないか、インストールが壊れています。ローカル コンピューターにコンポーネントをインストールするか、コンポーネントを修復してください。

イベントが別のコンピューターから発生している場合、イベントと共に表示情報を保存する必要があります。

イベントには次の情報が含まれています: 

\Device\Video3
UCodeReset TDR occurred on GPUID:100

メッセージ リソースは存在しますが、メッセージがメッセージ テーブルに見つかりませんでした。
ソース "nvlddmkm" からのイベント ID 0 の説明が見つかりません。このイベントを発生させるコンポーネントがローカル コンピューターにインストールされていないか、インストールが壊れています。ローカル コンピューターにコンポーネントをインストールするか、コンポーネントを修復してください。

イベントが別のコンピューターから発生している場合、イベントと共に表示情報を保存する必要があります。

イベントには次の情報が含まれています: 

\Device\Video3
Resetting TDR occurred on GPUID:100

メッセージ リソースは存在しますが、メッセージがメッセージ テーブルに見つかりませんでした。