2026-06-18 07:42:44 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 云知声发布3000亿参数U2大模型，主打智能密度与原生Agent能力，通过MoE架构实现高效推理。该模型强调为企业提供高性价比的生产力解决方案，5月Token收入ARR增长600%，预计6月达1500万美元。文档指出行业正从参数竞赛转向商业化落地竞争，但智能密度概念需第三方验证，垂直领域优化可能牺牲通用能力。 综合评分： 72 文章分类： AI安全,解决方案,技术标准,安全建设,其他

cover_image

云知声U2：3000亿叫板万亿

零知Lab 零知Lab

零知实验室

2026年6月11日 11:00 山东

在小说阅读器读本章

去阅读

云知声U2：3000亿参数叫板万亿

6月8日港股有家公司干了件挺”反骨”的事。

发了个大模型，参数不到3000亿。

2026年这年头动不动就万亿起步，3000亿？听着像是个淘汰产品吧？

但这家叫云知声的公司（9678.HK）甩出一组数据，把所有人都打懵了：

Token调用收入ARR单月暴涨600%，预计6月干到1500万美金。

创始人还说了句让整个行业沉默的话：

“我不需要一个中科院院士来开滴滴。”

今天就想跟你聊聊这件事——当所有人都在疯狂堆参数的时候，凭什么有人敢反着来？

一、U2到底是个啥？

简单说就是云知声的第二代大模型。

但跟市面上那些”我又多了多少参数””我又长了多少上下文”的发布会不一样，云知声这次打出的牌是三个字：

智能密度。

创始人黄伟提了个公式：AI商业价值 = 智能密度 × Token价值

说白了就是——别光看你模型有多大，得看每个参数能干多少活。

这个思路跟主流完全反着来。主流玩的是Scaling Law，堆参数、堆算力、堆数据，等着”智能涌现”。云知声说的是：我不比谁大，我比谁花得更值。

| 对比项 | 行业主流 | U2 | | — | — | — | | 参数规模 | 万亿起步 | 近3000亿 | | 架构 | 稠密或大MoE | MoE，每次激活约1/10参数 | | 核心追求 | 越大越强 | 强而小、强而省 |

3000亿打万亿，这不是技术落后，是主动选的。

用的MoE架构，每次推理只激活十分之一参数，剩下的”按需休眠”。同样算力下，U2能服务更多人、跑更多任务、费更少的电和GPU时间。省下来的成本？直接变成利润。

二、U2最大的赌注：为执行而生

如果”智能密度”是理论基础，那原生Agent能力才是它真正的杀手锏。

解释一下啥意思——现在市面绝大多数大模型本质上是”为生成而设计”的。擅长聊天、写文章、翻译、总结，这些都是”生成任务”。

但企业真正要的不是”会聊天的AI”，是“能干活的AI”——查数据、填报表、审合同、分析风险、出报告。

传统做法是在大模型外面套一层Agent框架，用各种插件教它干活。就像给文科生配了个工具箱，勉强能用，总觉得哪不对劲。

U2完全不一样——从训练第一天起就把Agent能力刻进模型里了。

举个例子，你给U2下指令：”帮我出份客户季度投资报告。”

传统模型的反应大概是生成一段文字，然后你自己去找数据、做表格、排版。

U2的反应是：自己调研持仓数据 → 分析行业风险 → 算回撤指标 → 生成一份直接能用的结构化报告。全程不用你插手。

这就是黄伟说的”为执行而设计”。不是让AI陪你唠嗑，是让AI替你搬砖。

三、创始人的嘴有点”毒”

写了这么多年科技文，很少见到CEO在发布会上说这么多不客气的话。

“不需要中科院院士开滴滴”

最出圈的一句。

意思是很多企业场景根本不需要最强的大模型。你让顶级AI帮你订会议室、整理会议纪要、回邮件，就像请中科院院士开滴滴——能力溢出了，钱也白花了。

“很多任务场景，硕士博士水平就够了。”

这话刺耳，但你细想确实有道理。现在行业最大的痛点之一就是——大家都在造法拉利，但大多数用户只需要一辆靠谱的五菱宏光。

“会聊天的时代结束了”

2025年是个分水岭。之前比的是谁能聊更好、写更好，生成式AI的时代嘛。

但从2026年开始真正重要的是——你的AI能不能独立完成工作流？帮企业省钱？产生可衡量的结果？

黄伟管这叫“生产力AI的正赛”。2023到2025是热身赛，今年开始才是真刀真枪拼商业化。

他还提了个我觉得很有意思的观点，把人机交互分三层：

第一层，听懂你说的字——语音识别，十几年前就搞定了。

第二层，理解你的意图——你说冷了，AI自动调温关窗帘，这是现在的水平。

第三层，理解你的深层意识和场景——从语气停顿里识别独居老人的孤独，主动触发陪伴提醒。这才是未来的方向。

四、钱不会骗人

概念吹完了，看看实际的商业表现。毕竟大模型行业不缺讲故事的人，缺的是能把故事变成收入的人。

| 指标 | 数据 | | — | — | | Token收入ARR环比增长 | **600%**（5月单月） | | 预计6月ARR | **1500万美金**（约1个亿人民币） | | 收入模式 | 项目制→按Token付费 | | 2025年大模型业务收入 | **6.1亿元**（涨10倍） |

这几个数字里最值得看的不是绝对值，是变化趋势。

云知声正在经历一次商业模式的根本转型——从传统ToB项目制（签合同交付回款），转向MaaS模式（按Token用量持续收钱）。

项目制的天花板很明显——你能做的项目数量有限，每个项目人力成本固定。但按Token收费就不一样了：只要客户在用，收入就在产生。理论上没天花板。

黄伟把它比喻成”打开水龙头”——高频、持续、高毛利的复购收入。

而且云知声有张底牌——它在医疗、医保、交通、客服这些高门槛行业深耕多年。数据积累、合规资质、客户关系，新玩家砸钱也追不上。

护城河不在模型本身，在场景里。

五、不过话说回来，真的没问题吗？

写到这儿我得泼几瓢冷水。只唱赞歌的文章没啥意思，我想给你看完整画面。

“智能密度”到底是不是科学概念？

说实话目前没有公认学术定义。这个词更多是云知声提出的商业叙事框架，用来对抗主流的”参数崇拜”叙事。

方向我觉得没问题，但具体到U2身上——它是否真的做到了”用更少参数实现同等能力”，还得等第三方独立评测说了算。

目前公开的评测只有几个描述性结果，没有具体的排名数字和对比对象。各家评测机构跑完数据后真相才会浮出来。

通用能力和垂直能力怎么取舍？

U2训练数据明显向医疗、保险、政务这些垂直领域倾斜了。好处是这些场景里表现猛，坏处是通用对话、创意写作、开放问答可能不如同级别的通用大模型。

如果你的需求是多场景的，U2够不够用？这个问题目前没有明确答案。

ARR暴涨600%能持续吗？

5月份增长600%确实亮眼，但这种爆发通常有特殊原因——大客户集中上线、新功能推广期之类。能不能保持季度级稳定增长，才是检验商业模式成色的标准。

还有，1500万美金的ARR如果能兑现，对一家港股上市的AI公司来说体量也不算大。离盈利还有段路。

跟DeepSeek类比恰不恰当？

很多人把U2类比为云知声的”DeepSeek时刻”。相似处确实有——都质疑参数竞赛、追求高性价比、走差异化路线。

但也有明显区别。DeepSeek是通过极致工程优化实现了效率飞跃，有大量开源代码论文支撑。而U2目前的”智能密度”主张，更多还是自说自话的阶段，缺少同行复现和技术细节公开。

类比可以，别急着画等号。

六、跟我们普通人有啥关系？

聊完技术和商业回到每个人身上。

大模型行业进入淘汰赛了。 前两年百模大战是谁都能进来玩一把，现在光有模型不行了，得有场景、客户、持续收入。没商业闭环的会被加速清场。

“够用就好”可能变成新趋势。 不是所有场景都要最强模型。就像不是所有人都要最新款iPhone一样。中等参数、垂直优化、价格合理的产品反而可能有更大市场。

竞争维度变了。 以前比谁更聪明，以后比谁更靠谱、谁更便宜、谁在你这个行业落地最深。

对普通开发者来说选择更多了，不用死盯着头部那几家，一些有特色的二线模型在特定场景下可能更适合你。

对普通用户来说，你用的AI产品会越来越实用——不再只是陪你唠嗑，而是真帮你办事儿。

信息来源：云知声6月8日U2发布会及媒体报道（新浪财经、36氪等）。性能数据以官方公布为准，部分商业数据为预测值。

几个问题想听听你的看法：

“不需要中科院院士开滴滴”这话你觉得有道理不？日常使用中你真的需要最强的大模型吗？
如果有个模型参数不大但在特定领域特别好用还便宜，你会考虑换掉你现在的主力模型吗？
从参数竞赛转到生产力竞赛，你觉得哪些公司能赢到最后？

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：零知实验室零知Lab 零知Lab《云知声U2：3000亿叫板万亿》