文章总结: 快手团队在WSDM2026发表TemporalExpertNet论文获最佳长文提名奖,针对大促场景CVR预估的分布偏移问题,提出跨时序知识复用框架,通过结构解耦、BridgeNet、TEG和两阶段训练实现历史促销知识迁移,在线应用后CVR提升7.52%、RPM提升4.27%,工程开销极低,实现了学术创新与业务落地的双重价值。 综合评分: 90 文章分类: 解决方案
WSDM 2026|快手大促CVR预测技术斩获最佳长文提名奖!
原创
快手技术 快手技术
快手技术
2026年3月24日 19:41 北京
近日,国际数据挖掘顶级学术会议WSDM 2026(ACM International Conference on Web Search and Data Mining)在美国爱达荷州博伊西举行。由快手商业化算法团队联合复旦大学、天津大学共同完成的研究论文《TemporalExpertNet: Cross-Temporal Knowledge Reuse for Promotion-Aware CVR Prediction》,荣获大会Best Full Research Paper Runner-Up(最佳长文提名奖)。
该工作聚焦大促场景下转化率预估这一核心问题,提出了面向工业级广告系统的跨时序知识复用框架,并已在快手大规模短视频广告平台完成线上验证与全量应用,在学术创新与业务落地两个层面均展现出重要价值。
- 论文标题:TemporalExpertNet: Cross-Temporal Knowledge Reuse for Promotion-Aware CVR Prediction
- 论文链接:https://dl.acm.org/doi/10.1145/3773966.3777956
本届WSDM大会评审竞争激烈,主会议共收到全球投稿613篇,最终录用100篇,录用率仅16.3%。在此基础上,大会仅评选出1篇Best Full Research Paper和1篇Best Full Research Paper Runner-Up。作为国际公认的Web搜索与数据挖掘领域顶级学术会议之一,WSDM长期聚焦信息检索、数据挖掘、推荐系统、在线广告等前沿方向,具有广泛国际影响力。
1、研究背景:
大促流量激增下,CVR预估为何更难?
在短视频广告与推荐场景中,CVR(Conversion Rate,转化率)预测是商业化系统中的关键环节,直接影响广告投放效率、用户体验与平台收益。但在618、双11、黑五等大型促销节点,系统往往面临一个极具挑战的问题——数据分布在短时间内发生剧烈且不均匀的变化,这种变化并非所有流量一起变化,而是具有明显的异质性,具体如下:
- 广告主侧:不同广告主对大促的响应程度并不一致。部分广告主会显著提升预算,并动态调整出价与投放策略,而部分广告主的整体投放节奏变化相对有限。
- 用户侧:用户对促销活动的敏感度同样存在明显差异。部分用户会因价格刺激、活动氛围等因素表现出更强的转化意愿,而另一部分用户的行为模式则与日常阶段接近。
数据分布并非整体同步变化,而是分群体发生偏移,这一特征使得大促期间的数据分布呈现出更强的非平稳性。也正因如此,基于平稳假设或依赖常规历史分布训练得到的CVR模型,会在大促期间出现明显的预测偏差、校准失真与泛化退化。
从业务视角来看,这一问题更为关键。虽然大促周期在全年中占比有限,但往往对应着极高的流量峰值与收入贡献,因此,如何在这些关键节点提升CVR预测的稳定性与准确性,始终是广告系统中的核心挑战之一。
2、核心问题:
历史大促知识能否服务当前预测?
既然618、双11等大促具有周期性,那么历史大促中所积累的知识,是否可以直接迁移到当前大促中使用?答案并不简单。
首先,历史大促中沉淀了大量高价值知识,例如:特定用户群体在促销周期中的行为模式、广告主预算变化对转化的影响机制,以及某些促销场景下更容易触发转化的上下文规律。然而,当前流量与历史流量不完全一致。尽管都是大促场景,但不同年份、不同阶段、不同平台环境下,流量结构和行为模式均存在显著差异。如果直接复用历史模型,可能因为分布不匹配而导致知识失效。
因此,值得关注的不是“能不能用历史模型”,而是如何把历史大促中的有效知识,以可控、结构化的方式迁移到当前任务中。
现有研究大多围绕相对稳定场景下的转化预测展开,通常依赖当前数据进行直接拟合,默认训练分布与应用场景基本一致。然而,在大促场景中,用户兴趣、商品供给与转化机制都会随时间发生显著变化,因而存在更强的时序漂移与分布偏移。针对这一问题,已有部分方法开始尝试引入历史促销信息进行适配,但其核心仍主要停留在数据层面的复用,即利用历史大促数据缓解当前场景的数据不足或分布变化,对历史促销过程中沉淀下来的可迁移知识缺乏显式建模。
与这类工作不同,本论文更关注知识层面的复用。其核心是从历史大促中提炼具备泛化能力的促销模式与行为规律,并将其迁移至当前大促任务中。同时,进一步针对跨时序表征不一致、历史知识难以直接复用等关键问题进行建模,使历史知识能够以更高效、可控的方式服务于当前场景。
3、方法设计:
TEN如何让历史大促知识服务当前预测?
围绕上述关键问题,本论文提出了面向工业级广告系统的跨时序知识复用框架TemporalExpertNet(TEN)。TEN的目标是让系统具备更强的能力:在当前流量基础上,有选择地调用历史大促知识,并将其转化为对当前预测有价值的信号。其关键思路是让模型具备识别、对齐、调用历史促销知识的能力。整体来看,TEN主要包括四个核心设计。
1. 结构解耦:
把日常能力和促销能力拆开建模
当前流量中的日常行为模式与历史大促中沉淀下来的促销知识,在本质上承担着不同作用,不应被混在同一套表示中统一建模,这构成了TEN的出发点。
基于这一认识,TEN将模型拆分为两部分:
- 日常编码器:用于刻画当前最新流量下的基础行为模式,捕捉用户、广告和上下文在日常分布中的表征;
- 促销专家:用于承载历史大促场景中学到的转化模式知识,尤其是那些只在促销期间才更明显出现的行为规律。
这样的结构设计使模型既能保持对当前流量的敏感性,又能有选择地复用历史大促知识,从而避免在每次大促到来时都重新学习。
2. BridgeNet:
让历史大促知识与当前数据接合
把历史促销专家保留下来,不代表这些知识能直接被当前样本使用。一个关键挑战在于历史促销专家所适配的输入分布,与当前日常流量生成的表示空间不一致。历史模型中的知识虽然有价值,但它形成于过去时点和过去分布之上。如果直接拿来作用于当前流量,很可能因为表征错位而难以发挥效果。
为了解决这个问题,论文设计了BridgeNet。它通过表示对齐机制,将当前日常流量下得到的特征,映射到更适合历史促销专家理解和利用的语义空间中,缓解跨时序表征不匹配带来的知识调用障碍。
由此,TEN超越了对历史知识的简单保留,而能够让历史知识真正服务当前预测。
3. TEG:
精准建模不同样本需求
大促带来的分布变化不是全局统一的,而是具有明显的样本异质性。
对于一部分样本而言,用户或广告主在活动期间的行为模式变化显著,此时历史促销知识拥有较高参考价值;而对于行为仍与日常阶段接近的另一部分样本而言,如果强行引入促销知识,反而可能带来干扰。
因此,TEN不是让所有样本统一走促销分支,而是进一步提出了TemporalExpertGate(TEG)。TEG会根据样本特征进行动态路由与专家融合,判断当前预测更应依赖日常能力,还是更应激活历史促销专家,从而实现细粒度、自适应的预测调整。
基于此,TEN能够更精细地建模不同样本对促销知识的实际需求。
4. 两阶段训练:
先解决“能不能迁”,再解决“该怎么用”
除了结构设计之外,TEN的另一个关键点在于其两阶段训练策略。BridgeNet和TEG所承担的目标并不相同:前者关注“如何让当前样本能够对接历史知识”,后者则关注“在样本层面如何合理调度不同知识源”。如果从一开始就将这些目标同时联合优化,训练过程中容易出现信号干扰,影响模型收敛与最终效果。
为此,TEN将训练过程拆分为两个阶段:
第一阶段,重点学习跨时序表示对齐,先解决历史知识能否顺利迁移到当前样本的问题,该阶段选择历史大促数据进行微调;
第二阶段,再进一步学习门控融合机制,让模型在完成基本对齐后,能够针对不同样本自适应决定如何组合日常能力与促销能力,该阶段选择最新数据进行微调。
这种“先对齐、再融合”的训练方式,本质上是将“知识迁移”和“知识调度”拆开优化,既降低了训练难度,也提升了整体稳定性和最终效果。
4、效果验证:
离在线均取得显著收益
TEG在离线对比基线方法取得显著收益,消融实验证明不同模块设计的有效性。
离线实验效果图
在线上实验中,TEN已在快手大规模短视频广告平台完成部署验证。结果显示,在618预热期,相较于生产基线,TEN在如下两个方向实现了提升:
- CVR提升 7.52%
- RPM提升 4.27%
与此同时,模型的工程开销保持在较低水平:
- 模型体积仅增加0.23%
- 推理时延仅增加1.8%
在取得稳定收益后,TEN进一步全量上线至618当日全部流量,带来了显著的业务增益。TEN在几乎不显著增加系统负担的前提下,有效提升了大促场景下的预测质量,体现出较强的工程可落地性和实际业务价值。
5、结语
TemporalExpertNet (TEN) 的提出,旨在解决时变环境下的建模挑战。其核心价值在于提出了一种新的迭代思路:从单纯的“模型替换”转向“知识累积”。该方法通过结构化的知识解耦、对齐与调度机制,使系统能够保留历史大促中的有效信息,避免每次面对新场景时都重新学习。TEN不仅提升了商业化系统在关键节点的稳定性与收益,还增强了模型在长时间跨度下的经验复用能力和适应性。
关于我们
商业化算法部是快手核心算法部门,负责快手国内及海外多场景的变现算法研发,致力于建设领先的广告变现算法,通过算法驱动商业营销增长,不断优化用户和客户体验,引领行业创新型解决方案,推动行业变革。团队成员多来自国内外顶尖高校,以及头部大厂核心团队。团队推荐相关技术获得了24年钱伟长科技进步一等奖。出价上基于RL和生成模型在NeurIPS 2024 广告出价比赛获得双赛道第一名。近年团队技术成果在KDD/WWW/ICLR/NeurIPS/CVPR/ICCV/AAAI等顶会上发表论文100+,其中不乏获得CIKM Best Paper、SIGIR Best Paper提名奖和WSDM Best Paper提名奖。
热招岗位
-
职位名称
广告算法实习生 -【商业化算法部】
-
任职要求:
-
2027届优秀毕业生,计算机、数学、统计学等相关专业本科以上学历,博士、硕士优先;
-
熟悉Linux,精通C / C++、Java、Python等至少一门编程语言,优秀的编码能力,扎实的数据结构和算法功底;
-
熟悉机器学习、数据挖掘、计算广告学相关基础知识,对常用算法有使用经验,并能根据实际场景进行优化,熟悉大规模数据挖掘处理、分布式计算;
-
善于阅读文献,快速学习,具备优秀的分析和解决问题能力,良好的沟通协作能力。
-
加分项:
-
有互联网广告算法、搜索 / 推荐系统、机器学习、计算机视觉、计算广告学及博弈论相关领域研究,及一线互联网公司实习经验者优先;
-
在NIPS、ICML、ICLR、IJCAI / AAAI、SIGKDD、CVPR / ICCV、ACL等相关国际顶级会议或期刊上有文章发表者优先;
-
有Kaggle、KDD Cup等推荐算法、数据挖掘比赛获奖者优先;
-
有ACM / Topcoder Algorithm或类似算法竞赛经历者优先。
-
投递方式:
扫描下方二维码投递,或投递简历至邮箱:[email protected]
【相关阅读】
点击【阅读原文】,加入我们!
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:快手技术 快手技术 快手技术《WSDM 2026|快手大促CVR预测技术斩获最佳长文提名奖!》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。








评论