Plugins

分享推荐实用的WordPress插件

WordPress

记录分享WordPress使用经验和技巧

Web前端

分享Web前端设计理念及技术

设计资源

搜刮来的设计资源

8G显存跑AI：Llama3.1完胜Qwen3.5？Ubuntu下四大模型横评，速度竟差一倍！

2026-04-02 05:43:35 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 文章在Ubuntu系统下测试了四个8-9B参数AI模型在8G显存环境中的性能表现。通过详细的驱动配置步骤释放显存，然后对比了qwen3.5、qwen3-vl、deepseek-r1和llama3.1的输出速度、显存占用和功耗。测试发现llama3.1速度最快达50.4TPS，qwen3.5出现复读机幻觉表现不佳，deepseek-r1和qwen3-vl较为均衡。文章为不同应用场景提供了模型选择建议和部署指导。 综合评分： 79 文章分类： AI安全,安全工具

几乎没有延迟，马上就识别到了问题，但是思考过程中，前半段是中文，后半段是英文。但好歹比3.5好使，用时两分半，一共输出6914 token，平均速度44.93 TPS，比3.5快了71 %。

运行过程中，显存占用6858 MB，功率105瓦，比9B模型资源消耗还多。

然后试试经典的deepseek-r1:8b。

ollama&nbsp;run deepseek-r1:8b --verbose

不愧是一代经典，仅用时34秒，一共输出1575 token，平均速度46.05 TPS，比qwen3-vl:8b稍微快一点点，大概2 %。

运行过程中，显存占用5504 MB，功率100瓦。

最后试试经典的llama3.1:8b。

ollama&nbsp;run llama3.1:8b --verbose

8.6秒，这也太快了！一共输出414 token，平均速度50.4 TPS，比deepseek-r1:8b又快了9 %。

运行过程中，显存占用5352 MB，功率100瓦。

当然，还有一个叫lucasmg/deepseek-r1-8b-0528-qwen3-q4_K_M-tool-true的模型，据说是deepseek-r1的qwen3优化版本，我们也试一下。

ollama&nbsp;run lucasmg/deepseek-r1-8b-0528-qwen3-q4_K_M-tool-true --verbose

杂交之后，回答用时56秒，一共输出2503 token，平均速度45.43 TPS，输出速度跟deepseek-r1:8b差不多，但是输出更长了。

运行过程中，显存占用5504 MB，功率99瓦。这不是一样的？

汇总一下：

这么看来，好像qwen3.5也没什么优势啊，还不如deepseek-r1和qwen3-vl更均衡。当然，追求速度，还是得看llama3.1。

这次横评不仅仅是为了跑分，而是为了给后端的自动化运维框架（例如ollama直接支持的OpenClaw应用）选拔大脑：

对于高频短促的日常脚本执行或英文文档查询，llama3.1:8b的50+ TPS是首选；但对于需要深入排查疑难杂症，deepseek-r1:8b的逻辑深度与输出速度是无可替代的；对于图片识别，qwen3-vl:8b也是一个不错的选择。

各位看官，如果你手头只有一张8G显存的显卡，你会选择哪个模型陪你打江山？是追求速度的Llama，还是追求深度的DeepSeek？

***推荐阅读***

我们的WireGuard管理系统支持手机电脑了！全平台终端配置，支持扫码连接，一键搞定

保姆级教程：一条命令部署OpenVPN管理系统V4版，支持Win/Mac/安卓/iOS全平台接入

成本省下99.7%！用40元的腾讯云服务器自建IPsecVPN，成功对接企业级飞塔防火墙

万物皆可EVE-NG！一招解决Ubuntu镜像MAC冲突

告别OSPF！EVE-NG专业版+BGP Unnumbered打通Underlay的完整实战

从180秒到0.01秒：智算中心Underlay路由优化的速度与激情

Type-2是管家，Type-5是外交官！Border Leaf让智算中心网络走出去

上医治未病！从PFC流控到ECN预警配置实战

路修好了，该跑车了！RoCE零成本部署，智算中心RDMA平替方案全公开

单边写入为何秒杀双边传输？从UDP 4791到BTH头，看懂RDMA的灵魂构造！

手机也能跑DeepSeek-R1/Qwen3了：零成本搭建AI推理平台

2048卡昇腾910C集群算力集群交付工程手册

2048卡H100算力中心100G无阻塞存储网建设方案

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：铁军哥衡水铁头哥衡水铁头哥《8G显存跑AI：Llama3.1完胜Qwen3.5？Ubuntu下四大模型横评，速度竟差一倍！》

版权声明

本站仅做备份收录，仅供研究与教学参考之用。
读者将信息用于其他用途的，全部法律及连带责任由读者自行承担，本站不承担任何责任。

ZONE.CI 全球网 | 安全领域涉猎者-乌云独行地带

ZONE.CI 全球网

安全领域涉猎者-乌云独行地带

2026年Q1网络安全威胁深度分析：AI驱动攻击、供应链漏洞与防御策略升级

2026年Q1网络安全威胁深度分析：AI驱动攻击、供应链漏洞与防御策略升级

8G显存跑AI：Llama3.1完胜Qwen3.5？Ubuntu下四大模型横评，速度竟差一倍！

8G显存跑AI：Llama3.1完胜Qwen3.5？Ubuntu下四大模型横评，速度竟差一倍！

HiclawManager知识库：核心经验与最佳实践

HiclawManager知识库：核心经验与最佳实践

不读懂Skill，就用不好AI！

不读懂Skill，就用不好AI！

战争还没打响，卡车、火车和油罐车已经先开口了——为什么每次大战之前，物流系统总会先说话！

战争还没打响，卡车、火车和油罐车已经先开口了——为什么每次大战之前，物流系统总会先说话！

装了几个插件，花了20多块钱Token

装了几个插件，花了20多块钱Token

秦安：伊朗宣布已关闭霍尔木兹海峡，有效摧毁“跌涨全凭特朗普”

秦安：伊朗宣布已关闭霍尔木兹海峡，有效摧毁“跌涨全凭特朗普”

每周文章分享-253

每周文章分享-253

美国监视全球使用VPN的信息2026年

美国监视全球使用VPN的信息2026年

《放眼地平线：在东欧磨练反无人机技能》

《放眼地平线：在东欧磨练反无人机技能》

ZONE.CI 全球网 | 安全领域涉猎者-乌云独行地带

安全领域涉猎者-乌云独行地带

ZONE.CI 全球网

评论：0 参与： 0

目录

ZONE.CI 全球网

安全领域涉猎者-乌云独行地带
ZONE.CI 全球网公众号