本文以 AMD 显卡 RX 6750GRE 12GB 为例,主要面向不支持 ROCm 的A卡用户,详解在家用电脑上本地部署 DeepSeek-R1 的步骤和容易踩坑的地方。
一、升级驱动
1、首先升级显卡驱动到最新的可选版本:25.2.1 或者更新的版本。
- 发布说明:AMD Software: Adrenalin Edition 25.2.1 Optional Update Release Notes
- 驱动下载:AMD Software: Adrenalin Edition 25.2.1 Optional Update Driver for Windows® 10 & Windows® 11 64-bit
2、安装 HIP SDK。注意版本要和 ollama 需要的版本一致。例如 0.5.9 版本的 ollama-for-AMD 在发布页写了,需要 6.1.2 版本的 ROCm 或者 5.7 版本的 ROCm,此处下载 6.1.2 版本。
二、安装 ollama
在这个页面确认自己的 AMD 显卡是否支持 ROCm
如果支持的直接安装 ollama 官网版本,不需要看后面的步骤替换文件。
否则需要安装魔改版的 ollama,不要从官网下载安装。例如 RX 6750GRE 12GB 默认不支持 ROCm
ollama-for-amd 项目地址:https://github.com/likelovewant/ollama-for-amd/releases
1、目前最新发布版本是 0.5.9,下载 0.5.9 版本的 OllamaSetup.exe
和 ollama-windows-amd64.7z
,先安装 OllamaSetup.exe
,双击安装,然后右下角托盘 ollama 右键退出。
2、桌面 ollama 图标右键 -> 属性,打开文件所在位置,跳转到主程序目录,用 ollama-windows-amd64.7z
压缩包里的 ollama.exe
替换原本的 ollama 主程序。
把压缩包里的 libs\ollama
目录文件复制到 C:\Users\[用户名]\AppData\Local\Programs\Ollama\lib\ollama
,覆盖原文件
3、在这个网页 AMD-GPU-Arches-lists-Info 查看自己显卡对应的 GPU Arches 代号,比如 RX 6750GRE 12GB 的对应代号是 gfx1031
则在这里 ROCmlibs for 6.1.2 下载 gfx1031
对应的 ROCmlibs 文件,用来替换 ollama 主程序目录下面的 ROCmlibs
压缩包中的 rocblas.dll
覆盖到 C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm
目录里面
压缩包中的 library
目录,覆盖到 C:\Users\用户名\AppData\Local\Programs\Ollama\lib\ollama\rocm\rocblas
里面
三、安装 deepseek-r1
deepseek-r1 有满血版和蒸馏版,家用显卡只能运行经过蒸馏减少体积的版本。这里给个简单判断下载哪个版本的方法,因为模型运行时会全部加载到显存内,所以下载的模型大小不要超过显存大小,就可以流畅运行。
比如 RX 6750GRE 12GB的显存是12GB,deepseek-r1:14b 的体积是 9.0GB,实测是可以流畅运行 ,速度有 25 token/s。
打开 CMD 窗口,输入命令 ollama run deepseek-r1:14b
,就会开始下载
我已经下载好了,这里就直接进入了对话
四、安装 Page Assist
在 CMD 窗口界面使用 deepseek 不是很方便,推荐安装浏览器插件 Page Assist,不仅界面美观还支持开启联网搜索,使 AI 能力更强。
- chrome商店:Page Assist
- Edge商店:Page Assist
Page Assist 可以设置简体中文
网络搜索有多个搜索引擎可选。搜索结果建议最少设置5个,少于5个结果会不太准确,5个以上回答速度又会比较慢。
五、常见问题
通过查看 ollama 的 server.log 可以判断是否成功调用显卡,如果日志里提示 “no compatible GPUs were discovered
”,就是没有按步骤正确操作,缺少必要的组件,大模型会只使用 CPU 模式运行。
正确安装后日志会有显卡的名字和规格