云知声U2:3000亿叫板万亿

admin 2026-06-18 07:42:44 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 云知声发布3000亿参数U2大模型,主打智能密度与原生Agent能力,通过MoE架构实现高效推理。该模型强调为企业提供高性价比的生产力解决方案,5月Token收入ARR增长600%,预计6月达1500万美元。文档指出行业正从参数竞赛转向商业化落地竞争,但智能密度概念需第三方验证,垂直领域优化可能牺牲通用能力。 综合评分: 72 文章分类: AI安全,解决方案,技术标准,安全建设,其他


cover_image

云知声U2:3000亿叫板万亿

零知Lab 零知Lab

零知实验室

2026年6月11日 11:00 山东

在小说阅读器读本章

去阅读

云知声U2:3000亿参数叫板万亿


6月8日港股有家公司干了件挺”反骨”的事。

发了个大模型,参数不到3000亿。

2026年这年头动不动就万亿起步,3000亿?听着像是个淘汰产品吧?

但这家叫云知声的公司(9678.HK)甩出一组数据,把所有人都打懵了:

Token调用收入ARR单月暴涨600%,预计6月干到1500万美金。

创始人还说了句让整个行业沉默的话:

“我不需要一个中科院院士来开滴滴。”

今天就想跟你聊聊这件事——当所有人都在疯狂堆参数的时候,凭什么有人敢反着来?

一、U2到底是个啥?

简单说就是云知声的第二代大模型。

但跟市面上那些”我又多了多少参数””我又长了多少上下文”的发布会不一样,云知声这次打出的牌是三个字:

智能密度。

创始人黄伟提了个公式:AI商业价值 = 智能密度 × Token价值

说白了就是——别光看你模型有多大,得看每个参数能干多少活。

这个思路跟主流完全反着来。主流玩的是Scaling Law,堆参数、堆算力、堆数据,等着”智能涌现”。云知声说的是:我不比谁大,我比谁花得更值。

| 对比项 | 行业主流 | U2 | | — | — | — | | 参数规模 | 万亿起步 | 近3000亿 | | 架构 | 稠密或大MoE | MoE,每次激活约1/10参数 | | 核心追求 | 越大越强 | 强而小、强而省 |

3000亿打万亿,这不是技术落后,是主动选的

用的MoE架构,每次推理只激活十分之一参数,剩下的”按需休眠”。同样算力下,U2能服务更多人、跑更多任务、费更少的电和GPU时间。省下来的成本?直接变成利润。

二、U2最大的赌注:为执行而生

如果”智能密度”是理论基础,那原生Agent能力才是它真正的杀手锏。

解释一下啥意思——现在市面绝大多数大模型本质上是”为生成而设计”的。擅长聊天、写文章、翻译、总结,这些都是”生成任务”。

但企业真正要的不是”会聊天的AI”,是“能干活的AI”——查数据、填报表、审合同、分析风险、出报告。

传统做法是在大模型外面套一层Agent框架,用各种插件教它干活。就像给文科生配了个工具箱,勉强能用,总觉得哪不对劲。

U2完全不一样——从训练第一天起就把Agent能力刻进模型里了。

| 能力维度 | 传统模型+Agent框架 | U2原生Agent | | — | — | — | | 工具调用 | 后期外挂插件 | 训练阶段就集成进去 | | 多步规划 | 依赖外部编排 | 模型自己规划 | | 结果验收 | 事后人工检查 | 内嵌过程监督 |

举个例子,你给U2下指令:”帮我出份客户季度投资报告。”

传统模型的反应大概是生成一段文字,然后你自己去找数据、做表格、排版。

U2的反应是:自己调研持仓数据 → 分析行业风险 → 算回撤指标 → 生成一份直接能用的结构化报告。全程不用你插手。

这就是黄伟说的”为执行而设计”。不是让AI陪你唠嗑,是让AI替你搬砖。

三、创始人的嘴有点”毒”

写了这么多年科技文,很少见到CEO在发布会上说这么多不客气的话。

“不需要中科院院士开滴滴”

最出圈的一句。

意思是很多企业场景根本不需要最强的大模型。你让顶级AI帮你订会议室、整理会议纪要、回邮件,就像请中科院院士开滴滴——能力溢出了,钱也白花了。

“很多任务场景,硕士博士水平就够了。”

这话刺耳,但你细想确实有道理。现在行业最大的痛点之一就是——大家都在造法拉利,但大多数用户只需要一辆靠谱的五菱宏光。

“会聊天的时代结束了”

2025年是个分水岭。之前比的是谁能聊更好、写更好,生成式AI的时代嘛。

但从2026年开始真正重要的是——你的AI能不能独立完成工作流?帮企业省钱?产生可衡量的结果?

黄伟管这叫“生产力AI的正赛”。2023到2025是热身赛,今年开始才是真刀真枪拼商业化。

他还提了个我觉得很有意思的观点,把人机交互分三层:

第一层,听懂你说的字——语音识别,十几年前就搞定了。

第二层,理解你的意图——你说冷了,AI自动调温关窗帘,这是现在的水平。

第三层,理解你的深层意识和场景——从语气停顿里识别独居老人的孤独,主动触发陪伴提醒。这才是未来的方向。

四、钱不会骗人

概念吹完了,看看实际的商业表现。毕竟大模型行业不缺讲故事的人,缺的是能把故事变成收入的人。

| 指标 | 数据 | | — | — | | Token收入ARR环比增长 | **600%**(5月单月) | | 预计6月ARR | **1500万美金**(约1个亿人民币) | | 收入模式 | 项目制→按Token付费 | | 2025年大模型业务收入 | **6.1亿元**(涨10倍) |

这几个数字里最值得看的不是绝对值,是变化趋势。

云知声正在经历一次商业模式的根本转型——从传统ToB项目制(签合同交付回款),转向MaaS模式(按Token用量持续收钱)。

项目制的天花板很明显——你能做的项目数量有限,每个项目人力成本固定。但按Token收费就不一样了:只要客户在用,收入就在产生。理论上没天花板。

黄伟把它比喻成”打开水龙头”——高频、持续、高毛利的复购收入。

而且云知声有张底牌——它在医疗、医保、交通、客服这些高门槛行业深耕多年。数据积累、合规资质、客户关系,新玩家砸钱也追不上。

护城河不在模型本身,在场景里。

五、不过话说回来,真的没问题吗?

写到这儿我得泼几瓢冷水。只唱赞歌的文章没啥意思,我想给你看完整画面。

“智能密度”到底是不是科学概念?

说实话目前没有公认学术定义。这个词更多是云知声提出的商业叙事框架,用来对抗主流的”参数崇拜”叙事。

方向我觉得没问题,但具体到U2身上——它是否真的做到了”用更少参数实现同等能力”,还得等第三方独立评测说了算。

目前公开的评测只有几个描述性结果,没有具体的排名数字和对比对象。各家评测机构跑完数据后真相才会浮出来。

通用能力和垂直能力怎么取舍?

U2训练数据明显向医疗、保险、政务这些垂直领域倾斜了。好处是这些场景里表现猛,坏处是通用对话、创意写作、开放问答可能不如同级别的通用大模型。

如果你的需求是多场景的,U2够不够用?这个问题目前没有明确答案。

ARR暴涨600%能持续吗?

5月份增长600%确实亮眼,但这种爆发通常有特殊原因——大客户集中上线、新功能推广期之类。能不能保持季度级稳定增长,才是检验商业模式成色的标准。

还有,1500万美金的ARR如果能兑现,对一家港股上市的AI公司来说体量也不算大。离盈利还有段路。

跟DeepSeek类比恰不恰当?

很多人把U2类比为云知声的”DeepSeek时刻”。相似处确实有——都质疑参数竞赛、追求高性价比、走差异化路线。

但也有明显区别。DeepSeek是通过极致工程优化实现了效率飞跃,有大量开源代码论文支撑。而U2目前的”智能密度”主张,更多还是自说自话的阶段,缺少同行复现和技术细节公开。

类比可以,别急着画等号。

六、跟我们普通人有啥关系?

聊完技术和商业回到每个人身上。

大模型行业进入淘汰赛了。 前两年百模大战是谁都能进来玩一把,现在光有模型不行了,得有场景、客户、持续收入。没商业闭环的会被加速清场。

“够用就好”可能变成新趋势。 不是所有场景都要最强模型。就像不是所有人都要最新款iPhone一样。中等参数、垂直优化、价格合理的产品反而可能有更大市场。

竞争维度变了。 以前比谁更聪明,以后比谁更靠谱、谁更便宜、谁在你这个行业落地最深。

对普通开发者来说选择更多了,不用死盯着头部那几家,一些有特色的二线模型在特定场景下可能更适合你。

对普通用户来说,你用的AI产品会越来越实用——不再只是陪你唠嗑,而是真帮你办事儿。


信息来源:云知声6月8日U2发布会及媒体报道(新浪财经、36氪等)。性能数据以官方公布为准,部分商业数据为预测值。

几个问题想听听你的看法:

  1. “不需要中科院院士开滴滴”这话你觉得有道理不?日常使用中你真的需要最强的大模型吗?

  2. 如果有个模型参数不大但在特定领域特别好用还便宜,你会考虑换掉你现在的主力模型吗?

  3. 从参数竞赛转到生产力竞赛,你觉得哪些公司能赢到最后?


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:零知实验室 零知Lab 零知Lab《云知声U2:3000亿叫板万亿》

评论:0   参与:  0