24
2025
02
16:22:54

单卡 AI画图炼丹性价比之王,超大HBM2显存【Mizuiro-Aqua】


之前我曾经推荐过英伟达的Tesla M40计算卡,当时我说了,它唯一的卖点就是大显存,24GB显存可以出大图(虽然原版SD直出高分辨率图容易出鬼图,这方面还是建议用SDXL),其他方面这张卡都很废,算力就是现在的中端游戏卡水平,架构也是老旧的Maxwell,28nm功耗老高,尤其是AI,当年AI还没有这么流行,所以没有半精度加速,玩游戏性能也一般。就是这样一张只卖显存的卡,竟然还涨价了,原来24GB显存版的M40只要400,现在已经涨到600多了,这价格都能买RTX2060了,至少RTX2060架构新,而且不用折腾亮机卡就能玩游戏。

当时很多人推荐它的下一代,Tesla P40,采用的是GP102核心(对应游戏卡GTX1080Ti),同样是24GB的显存,架构新一代,16nm工艺,功耗和性能都有进步,价格之前要千元以上,现在有降价,只要600多。但是大家似乎忽略了一个问题——Pascal架构的游戏卡都有一个毛病,半精度性能奇差,只有0.18T FLOPS(只有单精度的1/64),这速度连现在的一些低端卡都不如,所以我依然认为P40不适合AI应用,当年英伟达给P40的定位也不是AI应用,因为英伟达为AI应用准备了另一款计算卡,它就是Tesla P100,现在价格也不贵,700左右。



P100是一款专业的计算卡,使用的是GP100计算卡核心,16GB的HBM2显存(专业卡都支持ECC),显存带宽732GB/s,已经接近前代旗舰游戏卡RTX3090了,虽然P100相比P40在单精度、双精度算力上没有任何优势(因为P100的流处理器数量竟然还少了一些,3584个,而P40是3840个),但是半精度性能很强,达到双倍单精度性能水平,19.05T FLOPS,我估计和RTX2080相差不大了(不考虑Tensor),显存还要更大、更快,RTX2070现在都要千元以上,这么一看这款计算卡性价比真的不低。



你肯定会说,为什么不用Tensor core呢?Tensor core是Volta架构上才出现的东西,P100并不支持,很多人选择RTX之后的显卡用来计算也是看上了Tensor core,因为Tensor core的特性,其半精度性能非常强,Tesla V100的Tensor性能能达到112T FLOPS。但是别忘了我们的应用是Stable Diffusion,这个软件对Tensor的支持并不是很完美,虽然最近英伟达也更新驱动来支持SD使用TensorRT,但是使用TensorRT后是不能使用LoRA和ControlNet等插件的,虽然对于我来说没什么大问题,因为我就喜欢随机瞎画,但是你要是对画图的内容有所控制的话,没有ControlNet是不可以的!LoRA也是非常重要的,通过LoRA可以用比较低的成本控制出图的风格(LoRA的训练很快,模型也只有36MB一个,而且训练的门槛很低,我这种编程白痴都能炼出来)。所以,对于SD来说,Tensor就是“纯纯的废铁”,想要更强的画图能力,还是得看流处理器性能。


但我说,P100和P40价格差不多,主要原因除了单精度算力差不多之外,显存也是一个问题,因为16GB显存确实没有24GB那么爽,尤其是目前的SDXL更吃显存了,16GB可能只是勉强够用,想出大图的话,24GB才勉强幸福(所以说上48GB?咋不上天?几十万的卡谁买得起啊!),当然HBM2的显存带宽是真不错,功耗也不高。P100依然是最便宜的16GB HBM2的GPU卡之一,最便宜的HBM2显卡是AMD的Vega56,但是它只有8GB显存。


但是!计算卡不是游戏卡,它本来不是给个人用户准备的,所以一些使用习惯也是不同的。首先家用电脑要安装它,需要进BIOS把“Above 4GB decoding”打开,否则插上可能没法开机,一些比较老的主板没有可能就不行了,没这个功能。而且计算卡没有视频输出,你需要有核显或者亮机卡,家用电脑本来PCIe插槽就紧张,插一张显卡再插计算卡,空间可能很窘迫。还有一点,这张卡的供电不是显卡用的8-PIN,虽然长得像,但是显卡8-PIN插不进去,强行大力出奇迹的话不仅点不亮,还可能会烧卡(我已经看到不止一个铁憨憨这么做了),它使用的是EPS12V标准,和CPU用的8-PIN供电是一样的,但依然不保证CPU供电一定插得进去(如果你的电源有多个EPS12V的话,可以试试,我手上的几个电源中只有我花高价买的750W模组电源有两个CPU供电),所以可以买转接线,将两个显卡供电插头转成EPS12V。最后,这卡没主动散热,直接用的话几秒钟就会过热,它只有一个带散热片的均热板,当然有很多解决方法,例如换个散热器,但是合适的散热器不太好找,尤其是这张卡还是HBM2显存的,很难同时照顾好核心和显存的散热,所以还是直接加风扇比较简答和实惠。加风扇也有很多方法,比较暴力的是拆开散热的外壳,切掉部分散热片,之后用轴流风扇直吹,效果很好、噪音很低,但是巨丑,更推荐的是用风扇从显卡的供电处的进风口制造风道,需要比较暴力的风扇,离心或者轴流都可以(更推荐用离心风扇,因为比较薄,和显卡差不多厚,不用搞导流板),可能会很吵,但是无创。




推荐本站淘宝优惠价购买喜欢的宝贝:

image.png

本文链接:https://hqyman.cn/post/9138.html 非本站原创文章欢迎转载,原创文章需保留本站地址!

分享到:
打赏





休息一下~~


« 上一篇 下一篇 »

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

请先 登录 再评论,若不是会员请先 注册

您的IP地址是: