文章总结: 文章以驾驶比喻AI的重要性,指出未来不会用AI如同现在不会开车。作者通过实践发现,驾驭AI的关键在于维护规则本。类比企业管理,让AI自我总结错误并更新规则,形成智能迭代,从而构建高可用的AI军团。未来AI将改变经验总结与知识分享的方式,掌握AI能力至关重要。 综合评分: 87 文章分类: 实战经验,AI安全,安全建设
做AI的驾驶员
原创
白帽汇赵武 白帽汇赵武
赵武的自留地
2026年1月19日 22:15 北京
最近每天废寝忘食整到凌晨一两点,感觉回到了年轻的时候,主要原因还是花了几百美金在用各种大模型编程、写agent用agent,每次想着我要睡觉了浪费钱了,我就爬起来跑一个架构类的大任务再睡。每次当我感觉自己了解差不多了的时候,技术又快速发生了变化,无论是大模型还是框架以及应用,每天我都看看AI日报又出了哪些新东西。
有朋友会说,你一个创业者,每天不务正业,还做一些基础研究做什么。你知道就跟开车一样,我并不享受开车的乐趣,但是你会不会开车跟你是什么工种自己什么样的社会地位没有任何关系。AI是一个工具,而且是一个跟汽车很像的工具,他能直接改变我们的出行方式和范围,而且几乎每家每户都有车,当然再过一段时间可能我们不需要学驾驶,但是在未来不会用AI,就跟现在不会汽车驾驶一样,是一件比较小众的事情。
我之所以会这么痴迷,是因为我是程序员出身,我很清楚当年看不懂汇编语言的感受,后来有了c有了ruby,有了golang,每一个工具的出来都会让我觉得又加快了创新的能力,我们又能更快地推动让世界更美好的进程。AI出来后这种感受最初非常强烈,然后就冷了下来,感觉MCP怎么做也上不了生产环境,所有的工作流都是一个项目,完成度很低,且并不稳定(中间唯一有的例外反而是用suno做了一个曲子,整体很好听,尤其是solo部分惊艳到了我),无论coze还是dify还是langchain,我都感觉是中间过程的产物,用他们做不出伟大的事物。冷了一段时间后,当模型进入到opus4.5和gemini3以及gpt5.2的时代,再一次引爆了我的激情,这个时间段行业工程实践从MCP进化到了skills,突然就觉得很多之前头疼的问题豁然开朗,就都有了新的答案。
于是我把以前想做没时间做的、以及想做但是感觉自己做不出来的愿望清单拿了出来,挨个做过去,无论是效率还是成功率,翻了几倍是毫不夸张的了。确实做了出来,实用性还很高,立刻觉得类似Goby这样的小玩具可想象空间太大,但是都有了这些能力,再做这些小工具好像对不起这个时代。整体下来的感觉就是,工具还是好工具,但是幻想着不学习不体验就能掌握,就好比给你一把宇宙飞船的钥匙,你都觉得是垃圾不敢开,你就想着掰断几个铁板拿出去卖钱也算给了自己一个交代。
几个小总结花了很长时间,简单但是对我来说是本质认知。第一就是目前的大模型确实还不是带情感的智能(以后我相信会的),本质上就是预测一个token的概率。第二就是任何新概念,不管是提示词还是tool call还是mcp还是skills以及多智能体,本质上最终就是拼凑成为一段平权的文本,用于让大模型生成新的文本内容,中间那些名称就是人类驾驭大模型的套索。第三个是:驾驭它最好的办法是维护一个规则本,这一点是最最重要的用AI来完成一件可稳定输出的关键。
回头想想,早期每一次我不知道跟大模型问什么让我很苦恼让我感觉自己很笨,每一次大模型犯同样的错误的时候我都很想骂人,还有很多同事不愿意用AI也是一样的问题,驾驭不了他。以前是基于面向人类的沟通方式,后来变成了面向AI的沟通方式,你要么自己打败柯洁,要么跟AI学习诡异的方法去打败柯洁。你自己大概率怕是打不过了,你学了那种非人类诡异的打发可能就开了天眼。
其实AI跟人类很像,你让他任意发展,就会变得无序或者莫名其妙,一个企业也是如此,一个人你不去告诉他公司要往那走,他犯了错误也不去纠正,那么任何人进来都会变成傻子,你绝不会去说员工是傻子,大家一定集体去骂那个创始人和CEO是傻子,因为在他的管理之下让这个公司变成了无序的天堂。相反,公司制订了规则,做好什么事情能够分钱,做错了什么事情要开除,大家就按照顺序走了。不管个体有些怎样不同的价值观,只要按照这个正确的方向走那就没有大问题。
方向再正确,中间都会发生很多不可预知的事情发生,毕竟一两句话的使命和愿景,是解决不了大家上厕所抽烟的问题的。我不知道其他企业怎么做,我在创业过程中遇到的问题就是,当我们发现了一个问题,我们并不会记录下来形成新的认知,我们做对了一件事情,也不会及时记录下来形成全员的规则和认知。换句话说,我们每个人的成长在无序地环境下只能基于自己去摸索方法论和方向,所有坑都踩一遍,头破血流还活下来的人最后才找到答案。所以老师傅成长的历史是曲折的,是漫长的,是不可批量复制的。
我们推行了事故本,大家最初不愿意记录,后来终于开始记录了,但是只限于几个邮件发送的相关人员知道,并没有提炼为公司的集体智慧(至今我都不知道公司的权威文档应该放到哪里能被大家都看到,且不跟各种细碎的过程文档放到一起)。人是有自己想法的,且有个学习过程的,且依赖于他个人的理解能力和意愿度的。想要批量复制,难上加难,所以人力部门一批一批地培训新进来的同事们,与其说是培训,不如说是对齐和筛选。
人性的问题,在大模型这里就完全不存在了,人类历史上产生的所有文本它们都滚瓜烂熟了,它们的世界知识比我们任何一个个体知道地更多,最重要的是,它们对规章制度会非常遵从且一步到位。于是我给它们进行规则的约定,一条一条地加进去,我手写每一条rules,更新agent.md,skills.md,我中间花了很长时间去给他总结问题和制定要求。后来我突然觉得不对,为什么人类要干这么初级的活,我变成为AI打工的人了呢?就好像我本来享受做菜的乐趣,后来出了机器人,但是它很智障,只能炒菜不能切菜和洗碗,于是变成了它享受了做菜的乐趣,我变成了切菜洗菜洗碗的钟点工,它把我的乐趣抢走了。
于是某一天我站了起来,在沟通了很多轮,AI花了很长时间定位并解决一个问题后,我冷冷地跟他说“你总结一下为什么花了这么长的时间定位上面这个问题,以及怎么引入这个问题的。好好反省,然后把结论更新到@AGENTS.md文档中的约定里面去,避免下一次犯重复错误。” 那一刻,我感觉自己得到了解放,感觉自己又无所不能了。人类从来不缺方向,缺的是规则,当规则的整理也是如此智能迭代,且能共享的情况下,执行力就有了基本的保障。
有了这些基本保障,那我们就拥有了一个高可用的军团:gemini 3做前端切图是最好的,审美也是最好的;claude opus编程是最快的,综合能力也是最强的;gpt5.2 codex在架构上调整是最稳的。他们的缺点跟优点一样明显,gpt的速度跟疯狂动物城里面的树懒一样感人,opus就是一个赶着准点下班的工作人员总想快速打发你走,gemini……嗯他是一个老实人一个老黄牛。他们像极了公司内部不同性格的员工,当他们披上了agents的外衣,就变了成千上万的员工,有些共种各样的外表和兴趣爱好,也形成了不同的专业能力。
我觉得大模型的标准还是会改,openai的API接口变成了事实的标准,后来claude提倡的MCP和skills也变成了行业公司,但是现在由于上下文大爆炸被逐渐打入冷宫的mcp方案,在tools方面还是一样显得格外格眼,我觉得某一天也可能会被进一步精简,毕竟渐进式加载的方案已经深入人心了。
变化还是在继续,无论是大模型的基础能力,还是工程化标准的进一步完善,我相信带来的变化不只是技术能力的提升,更重要的是人类各种经验总结提炼的方式,以及知识分享的方式。我想着早点拿到驾驶这辆车的钥匙,脑补一下,如果我带着一台电脑,电脑上装着一个离线模型,哪怕是minimax的m2.1,穿越到了二十年前,那得是多么震惊世界的一件事情啊,抬手一个软件就做了出来,再做个量化什么的简直不要太超前。
嗯,恍惚了一下,先把opencode跑起来,不耽误我继续睡觉……
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:赵武的自留地 白帽汇赵武 白帽汇赵武《做AI的驾驶员》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论