文章总结: OpenAI与Broadcom联合发布Jalapeño推理芯片,专门优化LLM推理性能与能效,标志着OpenAI首次深度参与硬件设计。同期ClaudeCode、Codex等AI开发工具密集更新,重点提升安全管控、MCP工具发现和性能优化。GitHub趋势显示MCP生态项目爆发式增长,如codebase-memory-mcp和OpenMontage一周获上万星,反映Agent开发基础设施正加速成熟。 综合评分: 78 文章分类: AI安全,安全工具,技术标准,安全开发,解决方案
OpenAI 联合 Broadcom 发布 Jalapeño 推理芯片:从软件到硬件的全面布局
原创
crossoverJie crossoverJie
crossoverJie
2026年6月26日 12:27 重庆
在小说阅读器读本章
去阅读
本周重磅
OpenAI 联合 Broadcom 发布 Jalapeño 推理芯片
OpenAI 和 Broadcom 搞了一颗叫 Jalapeño 的定制芯片,专门给 LLM 推理用的。目标很直接:提升推理性能、能效和规模化部署能力。
这是 OpenAI 第一次在硬件层面深度参与芯片设计。之前他们的推理基础设施基本全靠 NVIDIA GPU。Jalapeño 出来意味着 OpenAI 不想把推理层的控制权完全交出去——从成本和供应链安全的角度来看,这个动作不意外。
不过有个细节值得注意:这颗芯片是和 Broadcom 合作的,不是自研。Broadcom 在 ASIC 设计这块有很深的积累(Google TPU 早期也是找 Broadcom 合作的),说明 OpenAI 的优先级是快速落地,不是从零拉团队慢慢搞。
原文链接:OpenAI – Jalapeño Inference Chip[1]
Claude Code 双版本更新:sandbox 隔离 + /rewind + CPU 优化
Claude Code 两天发了两个版本(v2.1.187 和 v2.1.191),变化量不小。
v2.1.187 重点是安全和企业管控:
sandbox.credentials设置:阻止沙箱命令读取凭据文件和密钥环境变量,企业部署场景刚需- 组织管理员可以限制可用模型,被限制时有明确提示
- 全屏模式终于支持鼠标点击了
v2.1.191 重点是体验优化:
/rewind命令:误操作/clear之后可以恢复之前的对话,这个功能被低估了——以前不小心 clear 了只能重来- streaming 时 CPU 占用降了约 37%(合并 100ms 内的文本更新),笔记本用户应该能感觉到
- sandbox 网络权限对话框会记住你允许的 host,同一会话内不重复弹了
- MCP server 的 capability discovery 现在会重试瞬态网络错误
原文链接:
- Claude Code v2.1.191[2]
- Claude Code v2.1.187[3]
Codex 0.142.2:MCP Tool Search 默认开启
两个值得关注的变化:
- MCP tools 默认使用 tool search:以前 MCP 工具发现要显式配置,现在默认开了。工具发现能力改善,同时兼容旧模型和 provider。
- 系统代理支持:macOS 和 Windows 都支持了(PAC、WPAD、静态代理、bypass rules)。通过企业代理访问 API 的用户应该松口气了。
另外 Bedrock 凭据过期时现在会给出具体的恢复指引,不是之前那种泛泛的授权错误。
原文链接:Codex 0.142.2[4]
值得关注
OpenCode v1.17.10:MCP 资源读取 + Desktop 大改
这次更新覆盖面很广:MCP resource template listing 和 read tools,Agent 可以直接读 MCP 资源而不只是调工具了。新增 --mini CLI 模式。Desktop 端加了移动端底部导航、可折叠 server 区域、每个 tab 独立的 prompt 草稿。TUI 新增 diff viewer 对比主分支。
原文链接:OpenCode v1.17.10[5]
OpenHands cloud-1.39.0:组织管理 + 多模型路由
主要围绕企业级部署:自动组织归属、邀请链接免邮件、conversation 限制、OHE 多模型 LLM 发现与 BYOK 门控。想在团队里部署 OpenHands 的话,这次更新是实质性迭代。
原文链接:OpenHands cloud-1.39.0[6]
GitHub Trending
| 项目 | 语言 | ⭐ 总计 | 本周增长 | 一句话 | | — | — | — | — | — | | calesthio/OpenMontage[7] | Python | 20.9k | +12,948 | 开源 agentic 视频制作系统,12 条 pipeline | | DeusData/codebase-memory-mcp[8] | C | 14.4k | +9,589 | 高性能代码智能 MCP server,C 写的单二进制 | | Panniantong/Agent-Reach[9] | Python | 40.5k | +6,752 | 一站式 Agent 访问主流社交平台 | | google-research/timesfm[10] | Python | 25.5k | +3,915 | Google 预训练时序基础模型 | | penpot/penpot[11] | Clojure | 53.6k | +3,593 | Figma 的开源替代品 | | jamiepine/voicebox[12] | TypeScript | 34.0k | +3,583 | 开源 AI 语音工作室 | | asgeirtj/system_prompts_leaks[13] | JavaScript | 45.9k | +2,662 | 主流 AI 产品 system prompt 合集 | | stablyai/orca[14] | TypeScript | 7.1k | +1,397 | 并行 Agent 编排 ADE | | withastro/flue[15] | TypeScript | 6.7k | +1,415 | Astro 团队的沙箱 Agent 框架 |
两个重点说一下:
codebase-memory-mcp 是这周 MCP 生态里最火的项目。C 写的单二进制 MCP server,号称毫秒级索引整个代码库到持久化知识图谱,支持 158 种语言,查询延迟亚毫秒级,token 消耗减少 99%。这些指标挺激进的,但涨星速度说明社区确实需要一个高性能的代码索引方案来配合 Agent 用。
OpenMontage 定位有意思——不是又一个 AI 写代码的工具,而是把 AI coding assistant 变成视频制作工作室。12 条 pipeline、52 个工具、500+ agent skills,不是 demo 项目。一周涨了近 1.3 万 star,说明市场对 “Agent 做内容创作” 这个方向有兴趣。
总结
OpenAI 开始造芯片了,Code Agent 工具在同周密集更新,两个信号说明 AI 行业的投入在基础设施层和应用层同时加速。
芯片这事是个长期动作——推理成本是 AI 公司最大的运营支出之一,自研芯片能从根本上改变成本结构。但短期内对普通开发者没什么直接影响,不用急着关注。
应用层这边竞争已经从”能不能用”进入”好不好用”了:sandbox 安全管控、组织模型限制、MCP 工具发现、CPU 优化,这些都是在打磨生产级体验。如果你在用 Claude Code,/rewind 和 CPU 优化值得升级体验一下。
GitHub Trending 上 MCP 生态项目的集中爆发是个信号。codebase-memory-mcp、Agent-Reach 这类项目一周涨星数千,MCP 正在从协议规范变成有实际工具支撑的生态。做 Agent 开发的话,现在是关注 MCP 生态的好时机。
参考资料
[1]
OpenAI – Jalapeño Inference Chip: https://openai.com/index/openai-broadcom-jalapeno-inference-chip
[2]
Claude Code v2.1.191: https://github.com/anthropics/claude-code/releases/tag/v2.1.191
[3]
Claude Code v2.1.187: https://github.com/anthropics/claude-code/releases/tag/v2.1.187
[4]
Codex 0.142.2: https://github.com/openai/codex/releases/tag/rust-v0.142.2
[5]
OpenCode v1.17.10: https://github.com/anomalyco/opencode/releases/tag/v1.17.10
[6]
OpenHands cloud-1.39.0: https://github.com/OpenHands/OpenHands/releases/tag/cloud-1.39.0
[7]
calesthio/OpenMontage: https://github.com/calesthio/OpenMontage
[8]
DeusData/codebase-memory-mcp: https://github.com/DeusData/codebase-memory-mcp
[9]
Panniantong/Agent-Reach: https://github.com/Panniantong/Agent-Reach
[10]
google-research/timesfm: https://github.com/google-research/timesfm
[11]
penpot/penpot: https://github.com/penpot/penpot
[12]
jamiepine/voicebox: https://github.com/jamiepine/voicebox
[13]
asgeirtj/system_prompts_leaks: https://github.com/asgeirtj/system_prompts_leaks
[14]
stablyai/orca: https://github.com/stablyai/orca
[15]
withastro/flue: https://github.com/withastro/flue
往期推荐
AI Coding Agent 时代,我自己最常用的 4 个终端工具
从 Warp 换到 cmux:一个更适合 AI Agent 的终端
我做了一个 AI 版的 StarRocks 升级风险扫描工具,直接帮我定位到一个风险
Claude Fable 5:Anthropic 将 Mythos 级能力首次推向大众,编码和知识工作全面领先
点分享
点收藏
点点赞
点在看
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:crossoverJie crossoverJie crossoverJie《OpenAI 联合 Broadcom 发布 Jalapeño 推理芯片:从软件到硬件的全面布局》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。









评论