本文以 AMD 显卡 RX 6750GRE 12GB 为例,主要面向不支持 ROCm 的A卡用户,详解在家用电脑上本地部署 DeepSeek-R1 的步骤和容易踩坑的地方。

一、升级驱动

1、首先升级显卡驱动到最新的可选版本:25.2.1 或者更新的版本。

2、安装 HIP SDK。注意版本要和 ollama 需要的版本一致。例如 0.5.9 版本的 ollama-for-AMD 在发布页写了,需要 6.1.2 版本的 ROCm 或者 5.7 版本的 ROCm,此处下载 6.1.2 版本。

Snipaste_2025-03-01_21-44-02.png

二、安装 ollama

在这个页面确认自己的 AMD 显卡是否支持 ROCm

rocm.docs.amd.com

如果支持的直接安装 ollama 官网版本,不需要看后面的步骤替换文件。

https://ollama.com/

否则需要安装魔改版的 ollama,不要从官网下载安装。例如 RX 6750GRE 12GB 默认不支持 ROCm

ollama-for-amd 项目地址:https://github.com/likelovewant/ollama-for-amd/releases

1、目前最新发布版本是 0.5.9,下载 0.5.9 版本的 OllamaSetup.exeollama-windows-amd64.7z,先安装 OllamaSetup.exe,双击安装,然后右下角托盘 ollama 右键退出。
Snipaste_2025-03-01_21-56-12.png
Snipaste_2025-03-01_21-56-30.png
Snipaste_2025-03-01_21-59-19.png

2、桌面 ollama 图标右键 -> 属性,打开文件所在位置,跳转到主程序目录,用 ollama-windows-amd64.7z
压缩包里的 ollama.exe 替换原本的 ollama 主程序。

v2-c238580ba9268abfca06508a7f65bc3e_1440w.png

把压缩包里的 libs\ollama 目录文件复制到 C:\Users\[用户名]\AppData\Local\Programs\Ollama\lib\ollama,覆盖原文件

v2-803807ba8664ed2b1a025e842909b746_1440w.png

3、在这个网页 AMD-GPU-Arches-lists-Info 查看自己显卡对应的 GPU Arches 代号,比如 RX 6750GRE 12GB 的对应代号是 gfx1031

则在这里 ROCmlibs for 6.1.2 下载 gfx1031 对应的 ROCmlibs 文件,用来替换 ollama 主程序目录下面的 ROCmlibs

Snipaste_2025-03-01_22-26-04.png

压缩包中的 rocblas.dll 覆盖到 C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm 目录里面

Snipaste_2025-03-01_22-28-54.png

压缩包中的 library 目录,覆盖到 C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm\rocblas 里面

Snipaste_2025-03-01_22-31-10.png

三、安装 deepseek-r1

deepseek-r1 有满血版和蒸馏版,家用显卡只能运行经过蒸馏减少体积的版本。这里给个简单判断下载哪个版本的方法,因为模型运行时会全部加载到显存内,所以下载的模型大小不要超过显存大小,就可以流畅运行。

比如 RX 6750GRE 12GB的显存是12GB,deepseek-r1:14b 的体积是 9.0GB,实测是可以流畅运行 ,速度有 25 token/s。

Snipaste_2025-03-01_22-39-38.png

打开 CMD 窗口,输入命令 ollama run deepseek-r1:14b,就会开始下载

Snipaste_2025-03-01_22-50-33.png

我已经下载好了,这里就直接进入了对话

四、安装 Page Assist

在 CMD 窗口界面使用 deepseek 不是很方便,推荐安装浏览器插件 Page Assist,不仅界面美观还支持开启联网搜索,使 AI 能力更强。

Page Assist 可以设置简体中文

Snipaste_2025-03-01_23-00-17.png

网络搜索有多个搜索引擎可选。搜索结果建议最少设置5个,少于5个结果会不太准确,5个以上回答速度又会比较慢。

Snipaste_2025-03-01_23-00-33.png

五、常见问题

通过查看 ollama 的 server.log 可以判断是否成功调用显卡,如果日志里提示 “no compatible GPUs were discovered
”,就是没有按步骤正确操作,缺少必要的组件,大模型会只使用 CPU 模式运行。

Snipaste_2025-03-01_23-20-06.png

正确安装后日志会有显卡的名字和规格

Snipaste_2025-03-01_23-22-48.png