AMD Radeon RX 7900 XTX、DeepSeek AI 推論ベンチマークで NVIDIA GeForce RTX 4090 に勝利！ローカル AMD マシンで R1 を実行する方法

AMD の Radeon RX 7900 XTX が、DeepSeek R1 AI モデルを優れたパフォーマンスで実行し、推論ベンチマークで NVIDIA の GeForce RTX 4090 を上回りました。

AMD は DeepSeek の R1 LLM モデルのサポートを迅速に開始し、優れたパフォーマンスを実現

DeepSeek の最新 AI モデルは、その性能の高さで業界を席巻しています。モデルのトレーニングに使用されるコンピューティングリソースについて多くの人が疑問を抱いていますが、平均的な消費者でも、AMD の「RDNA 3」Radeon RX 7900 XTX GPU を使用することで、モデルを実行するために必要な十分なパフォーマンスを引き出すことができるようです。

AMD は、主力 RX 7000 シリーズ GPU と NVIDIA の同等製品を比較した DeepSeek の R1 推論ベンチマークを公開し、複数のモデルで優れたパフォーマンスを示しました。

AMD Radeon RX 7900 XTX vs NVIDIA GeForce RTX 4090 DeepSeek R1 推論ベンチマークの画像

AI ワークロード用コンシューマー GPU の可能性

AI ワークロード用のコンシューマー GPU は、これまで主流の AI アクセラレータと比較してパフォーマンス/コスト比が良好であるため、多くの個人にとって有効な選択肢となっています。また、モデルをローカルで実行することで、プライバシーも保護されます。これは、DeepSeek の AI モデルにおいて大きな懸念事項でした。

幸い、AMD は Team Red の GPU で DeepSeek R1 蒸留を実行する方法に関する詳細なガイドを公開しており、その手順は次のとおりです。

ローカル AMD マシンで DeepSeek R1 を実行する方法

Adrenalin ドライバーのバージョンを確認: 25.1.1 以降の Adrenalin ドライバーを使用していることを確認します。
LM Studio をダウンロード: lmstudio.ai/ryzenai から LM Studio 0.3.8 以降をダウンロードします。
LM Studio をインストール: LM Studio をインストールし、オンボーディング画面をスキップします。
[検出] タブをクリック: LM Studio の [検出] タブをクリックします。
DeepSeek R1 Distill を選択: DeepSeek R1 Distill を選択します。Qwen 1.5B などの小型 Distill は超高速パフォーマンスを提供し (推奨される開始点)、大型 Distill は優れた推論機能を提供します。いずれも非常に高性能です。
量子化設定を確認: 右側で、「Q4 KM」量子化が選択されていることを確認し、「ダウンロード」をクリックします。
モデルをロード: ダウンロードが完了したら、チャットタブに戻り、ドロップダウンメニューから DeepSeek R1 distill を選択し、「パラメータを手動で選択」がチェックされていることを確認します。
GPU オフロードレイヤーを調整: GPU オフロードレイヤーで、スライダーを最大まで動かします。
モデルのロードをクリック: モデルのロードをクリックします。
推論モデルを実行: ローカル AMD ハードウェア上で完全に実行される推論モデルを操作します。