文章总结: 滴滴开源项目华佗宣布实现对国产沐曦GPU的深度观测支持,旨在提升异构计算环境下的运维诊断能力。该系统基于CCF孵化,提供内核级观测服务,覆盖GPU、CPU等关键组件。文章详细介绍了通过调用MetaX库获取实时指标的适配原理,并提供了Docker及K8s环境下的具体部署配置与指标说明,为AI基础设施可靠性保障提供技术支撑。 综合评分: 85 文章分类: 安全工具,安全运营,云安全,产品介绍
滴滴开源新进展:华佗项目支持国产沐曦GPU,助推信创发展
原创
滴滴开源 滴滴开源
滴滴技术
2026年3月11日 19:59 北京
近日,滴滴开源项目华佗(HUATUO)生态迎来新进展:项目现已实现对沐曦(MetaX)GPU的深度观测支持。开发者可通过华佗平台,实时获取沐曦GPU的关键运行指标,这将进一步丰富华佗在异构计算环境下的可观测能力,为云原生、AI训练等场景的运维诊断提供更全面的数据支撑。
华佗是由滴滴主导发起开源,依托中国计算机学会(CCF)孵化的操作系统深度观测项目,专注为云原生通用计算,AI 计算,云服务,基础服务等提供操作系统内核级深度观测能力。华佗支持 AI 计算硬件的全方位故障检测,不仅覆盖 GPU,还包括 CPU、缓存 (L1/L2/L3)、TLB、内存 ECC、PCIe、网卡物理链路、PFC/RDMA 及 ACPI 等关键组件,为 AI 基础设施的可靠运行提供坚实保障。
华佗项目 GitHub 地址:
https://github.com/ccfos/huatuo
适配介绍
华佗通过调用 MetaX libmxsml 获取实时的 GPU 数据,在开启了 MetaX GPU 监控后,可以在华佗中查询到 GPU 相关的数据,如:
GPU 基础信息:如 GPU 型号、GPU 标识、驱动版本等GPU 状态:如 GPU 功耗、温度、利用率、时钟频率等GPU 通信:如 PCIe 速度、带宽,MetaXLink 速度、带宽等
这些数据可以帮助我们更加清晰地定位生产环境中的各种问题。有关指标的详细说明,请见后续的”指标介绍”章节。如果想要启用 MetaX GPU 的监控,需要将以下内容挂载到容器中的对应位置:
docker run --privileged --cgroupns=host --network=host \ -v /sys:/sys \ -v /proc:/proc \ -v /run:/run \ -v /opt/maca:/opt/maca \ -v /opt/mxdriver:/opt/mxdriver \ -v /dev/dri:/dev/dri \ huatuo/huatuo-bamai:latest
如果是在 K8s 中使用,则创建相应的 PV 与 PVC 即可。在容器启动完毕后,访问其服务地址的 /metrics endpoint,如果输出中包含带有 metax 字样的指标,则成功采集了 GPU 数据。
指标介绍
说明
GPU index:GPU 的索引,根据 GPU 模式的不同有所区分: - Native 模式和 VF 模式的 GPU 索引从 0 开始。 - PF 模式的 GPU 索引从 100 开始。CE:Correctable Errors, 可纠正错误UE:Uncorrectable Errors, 不可纠正错误MetaXLink:MetaXLink 是用于 GPU 间通信的专有互联技术。每块 GPU 可拥有多条 MetaXLink 连接,索引从 1 开始。
结语
开源正成为连接技术创新与产业升级的关键纽带。滴滴开源始终以共建共享为核心,致力于携手产业伙伴共同探索技术创新与落地实践的最佳路径,促进生态资源、能力与经验的共享。未来,滴滴开源将继续赋能产业创新,实现开源价值的长期沉淀与可持续发展。
滴滴云原生可观测 HUATUO 开源项目正式入驻 CCF
部分相关内容,引用自以下公众号
@中国计算机学会:
https://mp.weixin.qq.com/s/6vLY4-HkcL43XUpklWX0uw
@CCF开源发展技术委员会:https://mp.weixin.qq.com/s/WXIqgT5VBF90B42aRLsSmg
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:滴滴技术 滴滴开源 滴滴开源《滴滴开源新进展:华佗项目支持国产沐曦GPU,助推信创发展》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。











评论