AMD の Radeon RX 7900 XTX が、DeepSeek R1 AI モデルを優れたパフォーマンスで実行し、推論ベンチマークで NVIDIA の GeForce RTX 4090 を上回りました。
AMD は DeepSeek の R1 LLM モデルのサポートを迅速に開始し、優れたパフォーマンスを実現
DeepSeek の最新 AI モデルは、その性能の高さで業界を席巻しています。モデルのトレーニングに使用されるコンピューティング リソースについて多くの人が疑問を抱いていますが、平均的な消費者でも、AMD の「RDNA 3」Radeon RX 7900 XTX GPU を使用することで、モデルを実行するために必要な十分なパフォーマンスを引き出すことができるようです。
AMD は、主力 RX 7000 シリーズ GPU と NVIDIA の同等製品を比較した DeepSeek の R1 推論ベンチマークを公開し、複数のモデルで優れたパフォーマンスを示しました。
AI ワークロード用コンシューマー GPU の可能性
AI ワークロード用のコンシューマー GPU は、これまで主流の AI アクセラレータと比較してパフォーマンス/コスト比が良好であるため、多くの個人にとって有効な選択肢となっています。また、モデルをローカルで実行することで、プライバシーも保護されます。これは、DeepSeek の AI モデルにおいて大きな懸念事項でした。
幸い、AMD は Team Red の GPU で DeepSeek R1 蒸留を実行する方法に関する詳細なガイドを公開しており、その手順は次のとおりです。
ローカル AMD マシンで DeepSeek R1 を実行する方法
- Adrenalin ドライバーのバージョンを確認: 25.1.1 以降の Adrenalin ドライバーを使用していることを確認します。
- LM Studio をダウンロード: lmstudio.ai/ryzenai から LM Studio 0.3.8 以降をダウンロードします。
- LM Studio をインストール: LM Studio をインストールし、オンボーディング画面をスキップします。
- [検出] タブをクリック: LM Studio の [検出] タブをクリックします。
- DeepSeek R1 Distill を選択: DeepSeek R1 Distill を選択します。Qwen 1.5B などの小型 Distill は超高速パフォーマンスを提供し (推奨される開始点)、大型 Distill は優れた推論機能を提供します。いずれも非常に高性能です。
- 量子化設定を確認: 右側で、「Q4 KM」量子化が選択されていることを確認し、「ダウンロード」をクリックします。
- モデルをロード: ダウンロードが完了したら、チャット タブに戻り、ドロップダウン メニューから DeepSeek R1 distill を選択し、「パラメータを手動で選択」がチェックされていることを確認します。
- GPU オフロード レイヤーを調整: GPU オフロード レイヤーで、スライダーを最大まで動かします。
- モデルのロードをクリック: モデルのロードをクリックします。
- 推論モデルを実行: ローカル AMD ハードウェア上で完全に実行される推論モデルを操作します。
上記の手順がうまくいかない場合は、AMD が YouTube で個々の手順を詳しく説明したチュートリアルを公開しています。必ず確認して、ローカルの AMD マシンで DeepSeek の LLM を実行し、データが適切に処理されていることを確認してください。
今後の展望
NVIDIA と AMD の今後の GPU では、このようなワークロードを容易にする専用の AI エンジンが搭載されているため、推論能力が大幅に向上すると予想されます。