AI时代的银行数据治理探索

admin 2026-03-17 22:13:15 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: 文档探讨AI与银行数据治理的双向赋能关系。一方面,高质量数据集是AI落地基础,工行、光大等行探索建设知识工程与多源数据融合;另一方面,AI技术如机器学习、知识图谱推动治理向智能化升级,南京银行、农行在分类分级与质量监测上取得实效。结论指出两者相辅相成,银行业正加速推进相关建设以提升核心竞争力。 综合评分: 78 文章分类: 数据安全,AI安全,安全建设,解决方案


cover_image

AI时代的银行数据治理探索

智探AI应用

2026年3月16日 19:03 广东

以下文章来源于银行科技研究社 ,作者木子剑

银行科技研究社 .

13万+银行科技从业者聚集地。在这里可以了解银行科技监管政策、组织架构、人事、技术应用、合规、招聘、招标等数字化转型信息。

在数据成为生产要素的AI大模型时代,数据治理的重要性不言而喻。那么,AI时代的银行数据治理工作该如何做呢?

事实上,当下,AI与数据治理正形成一种相辅相成的关系,两者相互赋能。据悉,多家银行已开展了相关探索。

AI需要高质量数据,对数据治理提出新要求

众所周知,数据是AI大模型的“燃料”,模型的综合能力与其训练数据的规模、质量和多样性有关。国家发改委创新和高技术发展司的文章中曾指出,没有海量、高质量的数据“投喂”,再先进的算法也只是无源之水。

高质量数据可驱动大模型应用性能提升,支撑AI赋能。尤其是对于银行来说,构建垂直、专业、合规的金融大模型需要高质量数据供给。有效的数据治理可破解高质量数据供给不足的瓶颈,实现人工智能真正大规模落地。

数据治理通过构建统一的数据平台,整合分散在银行各处的数据与知识,经过清洗、标注、建模或图谱化、向量化等过程,形成标准化、高质量的数据资产。据

《银行科技研究社》了解,基于国家层面的要求以及自身的需求,银行业正探索高质量数据集建设。

2025年6月,国务院国资委在上海召开“央国企金融领域人工智能高质量数据集工作推进会”,以响应“AI+”专项行动对高质量金融数据集建设的要求,深化金融数据开发利用。而金融机构通过建设标准化、场景化、智能化的高质量金融数据集,将显著提升行业智能风控能力、系统性风险预警水平及个性化服务质效。

工行软件开发中心不久前发文指出,在算法趋同、算力普惠的竞争环境下,银行的核心竞争力正加速向高质量数据集迁移。其提出观点,数据质量与治理能力已成为银行未来竞争的决定性因素。

事实上,这已是更多银行及其高管层的“共识”。

建行副行长雷鸣也曾在2025年10月的活动中指出,数据治理已演变成为商业银行竞争的重要组成部分。

因此,多家银行已启动面向AI的数据治理,高质量数据集建设成为重点。

例如,工行在依托企业级数据中台实现结构化数据的规模化沉淀、共享和应用的基础上,围绕非结构化数据打造集数据采集、数据清洗、数据标注、质量评估和数据运营为一体的企业知识工程,形成面向高质量数据集的知识运营能力,系统推进企业知识数据集的建设和应用,为人工智能模型训练提供高质量的数据支撑。该行具体的举措包括建设企业级知识工程体系、实现一站式的知识工程、完善高质量数据集运营机制等。

光大银行则在2025年12月的内部会议上确定了2个关于数据要素领域的实践方向,其中之一即“构建高质量数据集”,推动数据要素与AI深度融合。该行副行长杨兵兵表示,在AI时代,构建高质量数据集成为关键突破口,主要在于2个方面:一是多源数据融合,包括业务数据、“酶”数据、元数据等各种类型的结构化和非结构化数据;二是建立数字孪生,数字孪生主要包括对实际业务的仿真分析、对象建模、数据连接和可视化交互,通过数字孪生,AI对现实世界的理解会更加透彻,判断会更加准确,才能更好地实现智能决策。

不过,虽然高质量数据集对于银行来说相当重要,但相关建设正处于探索阶段,还面临不小的挑战。

AI赋能数据治理,可在多个方面发挥作用

在数据治理赋能AI的同时,AI也在赋能数据治理。

北京金融科技产业联盟2026年1月正式发布的《人工智能推动金融数据治理转型升级研究报告》梳理了传统数据治理模式面临的挑战,指出数据治理亟待从“人工主导”向“智能驱动”升级。

《报告》显示,人工智能关键技术可赋能数据治理,并从“面向核心支撑算法的技术:机器学习”“面向非结构化数据治理的技术:NLP与计算机视觉”“面向知识化数据治理的技术:知识图谱”“面向隐私保护的数据治理技术:联邦学习”4方面展开介绍。

其中,机器学习技术可直接、广泛地应用于数据治理的核心场景,解决传统规则方法难以处理的复杂问题。例如,在数据质量管理方面,机器学习能够基于历史样本自动识别数据中的错误、缺失与异常,实现对质量问题的实时监控与预警;在数据分类与标注环节,机器学习通过分析多维特征和复杂模式,能够自动生成分类标签并进行敏感度分级,减少人工干预。

知识图谱技术则以图结构组织和表示知识,为解决数据关联与语义分析问题提供了有效方案。其核心价值在于通过语义建模和关联计算,将分散、异构的数据转化为结构化的知识网络,实现数据的统一理解、动态管理与智能推理,提升数据治理的质量与效率。例如,在数据血缘追踪与质量监控方面,通过图结构存储数据间的源头、流转、变换关系,知识图谱可以构建出完整的数据血缘链路,实现从源数据到报表指标的全路径可视化追踪。

因此,银行可借助AI实现更高效的数据治理。据《银行科技研究社》了解,多家银行已在此方向进行实践。

2025年12月消息,南京银行联合阿里云完成银行数据安全分级分类项目的阶段性验证,而数据安全分级分类是数据治理的基石。在此项目中,工程师仅使用6000条训练数据,便实现了94.6%的准确率。

据悉,针对数据安全分级分类面临的挑战,南京银行与阿里云探索出一条技术路径——以通义千问大模型为核心,依托“模型飞轮”范式与通义点金飞轮平台,构建端到端的金融垂直领域模型生产能力。

其中,针对标注成本高的问题,团队应用阿里云提出的“模型飞轮”范式:先由更大尺寸的基座模型(如通义千问-Max)基于少量种子样本生成大量高置信度伪标签数据,再用于对通义千问3-4B进行监督微调与强化学习优化。这一过程实现了“以AI造AI”,在仅需6000条真实标注数据的情况下,等效获得了数万条训练样本的效果,缓解了数据瓶颈。

此外,整个项目运行于阿里云专为金融场景打造的“通义点金飞轮平台”之上。该平台集成了“合成—训练—评测—应用—迭代”五大模块,支持从原始数据清洗、合成增强、模型训练到上线部署的全生命周期管理。

农行则在更早前介绍过AI赋能数据治理方面的实践。该行在数据资产服务、数据安全保护、数据质量监测、数据治理工具等方面探索AI应用,推动实现数据治理智能化。

其中,依托AI等技术,及时准确发现数据问题,助力开展数据治理,提升数据质量。一方面,建立数据智能监测预警机制,基于往期数据的属性(如数据的数据量、字段的空值率、金额总和等),预测当期数据的属性数值,将预测值与当期数据的实际属性值进行比对,若两者的差值超出合理阈值则自动产生预警,自动识别数据波动的规律和异常;另一方面,针对发现的数据质量问题提供智能化数据治理建议,根据数据质量问题信息清单对问题数据进行标注,形成问题数据分类标签体系,智能识别分类数据质量问题等。

写在最后

AI与数据治理的相互赋能,已引起金融业的关注,一些中小银行也开始行动。就在近期,赣州银行就AI+数据治理双向赋能项目启动交流报名,以推动数据资产价值释放与管理效能提升。

据悉,交流内容的一方面是“AI赋能数据治理”,包括但不限于AI赋能元数据管理、主数据管理、数据质量提升、数据标准/数据字典管理、数据模型管理、数据资产管理等;另一方面是“数据/数据治理赋能AI大模型”,包括但不限于高质量数据集建设、数据标注、数据资产入表等。

可见,AI时代对数据治理提出了更高的要求,同时AI也在助力更有效的数据治理。

智探AI应用交流群,有兴趣的朋友请添加群主:cosmic-walker 备注:公司+姓名+职务+AI入群。


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:智探AI应用 《AI时代的银行数据治理探索》

评论:0   参与:  0