ハオのガジェット工房

※当サイトでは一部アフィリエイト広告を利用しています。自作PC、スマホを中心とした最新情報をお届けします。

AMD Radeon RX 7900 XTX、DeepSeek AI 推論ベンチマークで NVIDIA GeForce RTX 4090 に勝利!ローカル AMD マシンで R1 を実行する方法

AMD の Radeon RX 7900 XTX が、DeepSeek R1 AI モデルを優れたパフォーマンスで実行し、推論ベンチマークで NVIDIA の GeForce RTX 4090 を上回りました。

AMD は DeepSeek の R1 LLM モデルのサポートを迅速に開始し、優れたパフォーマンスを実現

DeepSeek の最新 AI モデルは、その性能の高さで業界を席巻しています。モデルのトレーニングに使用されるコンピューティング リソースについて多くの人が疑問を抱いていますが、平均的な消費者でも、AMD の「RDNA 3」Radeon RX 7900 XTX GPU を使用することで、モデルを実行するために必要な十分なパフォーマンスを引き出すことができるようです。

AMD は、主力 RX 7000 シリーズ GPU と NVIDIA の同等製品を比較した DeepSeek の R1 推論ベンチマークを公開し、複数のモデルで優れたパフォーマンスを示しました。

AMD Radeon RX 7900 XTX vs NVIDIA GeForce RTX 4090 DeepSeek R1 推論ベンチマークの画像

AI ワークロード用コンシューマー GPU の可能性

AI ワークロード用のコンシューマー GPU は、これまで主流の AI アクセラレータと比較してパフォーマンス/コスト比が良好であるため、多くの個人にとって有効な選択肢となっています。また、モデルをローカルで実行することで、プライバシーも保護されます。これは、DeepSeek の AI モデルにおいて大きな懸念事項でした。

幸い、AMD は Team Red の GPU で DeepSeek R1 蒸留を実行する方法に関する詳細なガイドを公開しており、その手順は次のとおりです。

ローカル AMD マシンで DeepSeek R1 を実行する方法

  1. Adrenalin ドライバーのバージョンを確認: 25.1.1 以降の Adrenalin ドライバーを使用していることを確認します。
  2. LM Studio をダウンロード: lmstudio.ai/ryzenai から LM Studio 0.3.8 以降をダウンロードします。
  3. LM Studio をインストール: LM Studio をインストールし、オンボーディング画面をスキップします。
  4. [検出] タブをクリック: LM Studio の [検出] タブをクリックします。
  5. DeepSeek R1 Distill を選択: DeepSeek R1 Distill を選択します。Qwen 1.5B などの小型 Distill は超高速パフォーマンスを提供し (推奨される開始点)、大型 Distill は優れた推論機能を提供します。いずれも非常に高性能です。
  6. 量子化設定を確認: 右側で、「Q4 KM」量子化が選択されていることを確認し、「ダウンロード」をクリックします。
  7. モデルをロード: ダウンロードが完了したら、チャット タブに戻り、ドロップダウン メニューから DeepSeek R1 distill を選択し、「パラメータを手動で選択」がチェックされていることを確認します。
  8. GPU オフロード レイヤーを調整: GPU オフロード レイヤーで、スライダーを最大まで動かします。
  9. モデルのロードをクリック: モデルのロードをクリックします。
  10. 推論モデルを実行: ローカル AMD ハードウェア上で完全に実行される推論モデルを操作します。

上記の手順がうまくいかない場合は、AMD が YouTube で個々の手順を詳しく説明したチュートリアルを公開しています。必ず確認して、ローカルの AMD マシンで DeepSeek の LLM を実行し、データが適切に処理されていることを確認してください。

今後の展望

NVIDIA と AMD の今後の GPU では、このようなワークロードを容易にする専用の AI エンジンが搭載されているため、推論能力が大幅に向上すると予想されます。