DeepSeek-R1 671B最小化部署实验：CPU+192GB内存-HQY 一个和谐有爱的空间

25

2025
02
19:22:51

DeepSeek-R1 671B最小化部署实验：CPU+192GB内存

DeepSeek从春节一直火到现在，我除了看各种报道资料向大家学习之外，也一直考虑着能拿手头什么样的硬件配置玩一下：）

今天我要分享的结论很简单。当然除了下表之外，还想补充点经验给大家参考——包括我自己的，也包括来自同行友人的。

测试模型	DeepSeek-R1-UD-IQ1_S（671B，Dynamic 1.58-bit）
OS	Ubuntu 24.01 LTS

CPU	AMD EPYC 8534P（64核，SP6，Zen4c）
内存	6通道192GB DDR5-4800	4通道256GB
Token/s (输出超过1000)	≈5.47	≈4

我只使用CPU+6通道DDR5内存（无GPU），DeepSeek-R1-UD-IQ1_S跑到了5.47 Token/s。测试硬件平台，与《一次无需调优的测试：SMT多线程对存储服务器IOPS的贡献》基本相同。我主要是验证了一点，大模型Decode输出的性能与内存或显存带宽直接相关。

建议：

1、在以上测试中，我发现Ubuntu Linux下Ollama有时不够稳定？后来改用llama.cpp效果还好，包括从SSD加载模型都更快。尽管核心也是基于llama.cpp，但Ollama也有不少优点，特别是与前端软件对接的生态方面。

2、用纯CPU来跑DeepSeek，建议每个核心只用单线程——也就是64核跑64线程就好；如果跑128线程（即SMT用满）还会稍慢点。另外根据LLM大模型的特点，AMD的NPS设置建议设置为1（单CPU）或0（双CPU），即禁用NUMA内存亲和。

扩展阅读：《AMD EPYC 9005服务器BIOS & 工作负载调优指南》

这个1.58B量化的671B模型，文件大小只有131GB，所以比较节省内存。

注：当前我只在CPU上跑了DeepSeek-R1-UD-IQ1_S这个1.58bit量化的671B全量模型，主要是节省内存。我甚至看到网上有人说拿128G内存+4090 24G显卡跑的？如果内存够多的话，也可以试着跑下KTransformers那样的CPU+GPU混合推理方案。

如果您只有1块GPU并且显存容量不够，比如24GB的也可以把1.58bit量化模型当中的7层跑在GPU上，余下用CPU来跑。而达到2块80GB的GPU卡就能承担模型的全部61层了。

测试记录

https://huggingface.co/unsloth/DeepSeek-R1-GGUF 我是从这里下载的测试模型，也参考了里面的部署说明。

已关注关注重播 观看更多

企业存储技术

0/0

00:00/00:18进度条，百分之0播放00:00/00:1800:18全屏

倍速播放中 0.5倍 0.75倍 1.0倍 1.5倍 2.0倍超清流畅

继续观看

DeepSeek-R1 671B最小化部署实验：CPU+192GB内存

转载,DeepSeek-R1 671B最小化部署实验：CPU+192GB内存企业存储技术已同步到看一看写下你的评论

视频详情

上面这段视频，是在4通道内存配置时运行的。在我提问后DeepSeek会先显示“思考过程”，然后给出下面的输出：

在输出较短的Token时，速度比我在本文开头列出的还会高一点。

已关注关注重播 观看更多

企业存储技术

0/0

00:00/00:11进度条，百分之0播放00:00/00:1100:11全屏

倍速播放中 0.5倍 0.75倍 1.0倍 1.5倍 2.0倍超清流畅

继续观看

DeepSeek-R1 671B最小化部署实验：CPU+192GB内存

转载,DeepSeek-R1 671B最小化部署实验：CPU+192GB内存企业存储技术已同步到看一看写下你的评论

视频详情

这一段在字符界面的输出，就是6通道内存的配置了。

更多分享

上面这位朋友用了最新的Turin CPU，12通道内存并且容量更大，所以可以跑4bit量化的DeepSeek R1 671B。性能自然也比我前面的更快：

如上图，这个纯CPU跑的DeepSeek R1Q4_K全量模型达到了9.27 Token/s。至于72B以及更小参数的模型，我建议还是用GPU性价比高些。

去年我还曾关注过AI PC领域，当时做过一期视频节目介绍Ollama + Chatbox，不知是不是有点长所以看的人不多。Ollama的流行度自不必说，而当时关注到Chatbox这个中文UI的人应该还不多吧。

而在今天，DeepSeek让全民都来关注AI，动手本地部署大模型的人也多了不少。

推荐本站淘宝优惠价购买喜欢的宝贝:

本文链接：https://hqyman.cn/post/9164.html 非本站原创文章欢迎转载，原创文章需保留本站地址！

分享到：

打赏

休息一下~~

作者:hqy | 分类:编程&AI | 浏览:443 | 评论:0

发表评论:

◎欢迎参与讨论，请在这里发表您的看法、交流您的观点。

« 2025年6月 »
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

本站推荐小工具: MSDN ISO 磁力地址版本1

MSDN ISO 磁力地址版本2

Windows系统下载仓储站

微软原版软件官方镜像下载列表

Windows kms激活

Office kms激活

VMware ESXi8.0 补丁免费下载

Vmpatch镜像站

领淘宝优惠券

在线小工具

BING精品壁纸图片

360精品4K壁纸图片，每日词霸

Unlock Music 音乐解锁 (React)

在线查IP |WhatIsMyIPAddress

在线下载测速

百家姓暗号

在线fc小游戏

圈住猫的游戏

2048的游戏

找色差小游戏

今天吃什么呢

毒鸡汤网页

每日笑话精选

在线查QQ价值

在线it-tools工具箱

在线it-tools工具箱(备站)

微软密钥在线检测

在线WinXP虚拟机

whois在线查询

开发者资源的宝库

Linux工具箱一键脚本

Linux工具箱

城通网盘

宝塔服务器面板

阿里云特价VPS服务器

腾讯云特价VPS服务器

华为云特价VPS服务器

京东云特价VPS服务器

cloudcone特价VPS服务器

racknerd特价VPS服务器

恒创VPS特价服务器

简云免费虚拟云主机

PrivacyPolicy

控制面板: 您好，欢迎到访网站！
登录后台查看权限
个人中心修改密码

随心随性: 沧海月明珠有泪，蓝田日暖玉生烟。

网站分类

搜索

最新留言

文章归档

网站收藏

一个和谐有爱的空间

友情链接

孙悟空

HQY 一个和谐有爱的空间

HQY

25

20250219:22:51