OpenAI联合Broadcom发布Jalapeño推理芯片:从软件到硬件的全面布局

admin 2026-06-30 06:58:56 网络安全文章 来源:ZONE.CI 全球网 0 阅读模式

文章总结: OpenAI与Broadcom联合发布Jalapeño推理芯片,专门优化LLM推理性能与能效,标志着OpenAI首次深度参与硬件设计。同期ClaudeCode、Codex等AI开发工具密集更新,重点提升安全管控、MCP工具发现和性能优化。GitHub趋势显示MCP生态项目爆发式增长,如codebase-memory-mcp和OpenMontage一周获上万星,反映Agent开发基础设施正加速成熟。 综合评分: 78 文章分类: AI安全,安全工具,技术标准,安全开发,解决方案


cover_image

OpenAI 联合 Broadcom 发布 Jalapeño 推理芯片:从软件到硬件的全面布局

原创

crossoverJie crossoverJie

crossoverJie

2026年6月26日 12:27 重庆

在小说阅读器读本章

去阅读

本周重磅

OpenAI 联合 Broadcom 发布 Jalapeño 推理芯片

OpenAI 和 Broadcom 搞了一颗叫 Jalapeño 的定制芯片,专门给 LLM 推理用的。目标很直接:提升推理性能、能效和规模化部署能力。

这是 OpenAI 第一次在硬件层面深度参与芯片设计。之前他们的推理基础设施基本全靠 NVIDIA GPU。Jalapeño 出来意味着 OpenAI 不想把推理层的控制权完全交出去——从成本和供应链安全的角度来看,这个动作不意外。

不过有个细节值得注意:这颗芯片是和 Broadcom 合作的,不是自研。Broadcom 在 ASIC 设计这块有很深的积累(Google TPU 早期也是找 Broadcom 合作的),说明 OpenAI 的优先级是快速落地,不是从零拉团队慢慢搞。

原文链接:OpenAI – Jalapeño Inference Chip[1]


Claude Code 双版本更新:sandbox 隔离 + /rewind + CPU 优化

Claude Code 两天发了两个版本(v2.1.187 和 v2.1.191),变化量不小。

v2.1.187 重点是安全和企业管控:

  • sandbox.credentials 设置:阻止沙箱命令读取凭据文件和密钥环境变量,企业部署场景刚需
  • 组织管理员可以限制可用模型,被限制时有明确提示
  • 全屏模式终于支持鼠标点击了

v2.1.191 重点是体验优化:

  • /rewind 命令:误操作 /clear 之后可以恢复之前的对话,这个功能被低估了——以前不小心 clear 了只能重来
  • streaming 时 CPU 占用降了约 37%(合并 100ms 内的文本更新),笔记本用户应该能感觉到
  • sandbox 网络权限对话框会记住你允许的 host,同一会话内不重复弹了
  • MCP server 的 capability discovery 现在会重试瞬态网络错误

原文链接

  • Claude Code v2.1.191[2]
  • Claude Code v2.1.187[3]

Codex 0.142.2:MCP Tool Search 默认开启

两个值得关注的变化:

  1. MCP tools 默认使用 tool search:以前 MCP 工具发现要显式配置,现在默认开了。工具发现能力改善,同时兼容旧模型和 provider。
  2. 系统代理支持:macOS 和 Windows 都支持了(PAC、WPAD、静态代理、bypass rules)。通过企业代理访问 API 的用户应该松口气了。

另外 Bedrock 凭据过期时现在会给出具体的恢复指引,不是之前那种泛泛的授权错误。

原文链接:Codex 0.142.2[4]


值得关注

OpenCode v1.17.10:MCP 资源读取 + Desktop 大改

这次更新覆盖面很广:MCP resource template listing 和 read tools,Agent 可以直接读 MCP 资源而不只是调工具了。新增 --mini CLI 模式。Desktop 端加了移动端底部导航、可折叠 server 区域、每个 tab 独立的 prompt 草稿。TUI 新增 diff viewer 对比主分支。

原文链接:OpenCode v1.17.10[5]


OpenHands cloud-1.39.0:组织管理 + 多模型路由

主要围绕企业级部署:自动组织归属、邀请链接免邮件、conversation 限制、OHE 多模型 LLM 发现与 BYOK 门控。想在团队里部署 OpenHands 的话,这次更新是实质性迭代。

原文链接:OpenHands cloud-1.39.0[6]


GitHub Trending

| 项目 | 语言 | ⭐ 总计 | 本周增长 | 一句话 | | — | — | — | — | — | | calesthio/OpenMontage[7] | Python | 20.9k | +12,948 | 开源 agentic 视频制作系统,12 条 pipeline | | DeusData/codebase-memory-mcp[8] | C | 14.4k | +9,589 | 高性能代码智能 MCP server,C 写的单二进制 | | Panniantong/Agent-Reach[9] | Python | 40.5k | +6,752 | 一站式 Agent 访问主流社交平台 | | google-research/timesfm[10] | Python | 25.5k | +3,915 | Google 预训练时序基础模型 | | penpot/penpot[11] | Clojure | 53.6k | +3,593 | Figma 的开源替代品 | | jamiepine/voicebox[12] | TypeScript | 34.0k | +3,583 | 开源 AI 语音工作室 | | asgeirtj/system_prompts_leaks[13] | JavaScript | 45.9k | +2,662 | 主流 AI 产品 system prompt 合集 | | stablyai/orca[14] | TypeScript | 7.1k | +1,397 | 并行 Agent 编排 ADE | | withastro/flue[15] | TypeScript | 6.7k | +1,415 | Astro 团队的沙箱 Agent 框架 |

两个重点说一下:

codebase-memory-mcp 是这周 MCP 生态里最火的项目。C 写的单二进制 MCP server,号称毫秒级索引整个代码库到持久化知识图谱,支持 158 种语言,查询延迟亚毫秒级,token 消耗减少 99%。这些指标挺激进的,但涨星速度说明社区确实需要一个高性能的代码索引方案来配合 Agent 用。

OpenMontage 定位有意思——不是又一个 AI 写代码的工具,而是把 AI coding assistant 变成视频制作工作室。12 条 pipeline、52 个工具、500+ agent skills,不是 demo 项目。一周涨了近 1.3 万 star,说明市场对 “Agent 做内容创作” 这个方向有兴趣。


总结

OpenAI 开始造芯片了,Code Agent 工具在同周密集更新,两个信号说明 AI 行业的投入在基础设施层和应用层同时加速。

芯片这事是个长期动作——推理成本是 AI 公司最大的运营支出之一,自研芯片能从根本上改变成本结构。但短期内对普通开发者没什么直接影响,不用急着关注。

应用层这边竞争已经从”能不能用”进入”好不好用”了:sandbox 安全管控、组织模型限制、MCP 工具发现、CPU 优化,这些都是在打磨生产级体验。如果你在用 Claude Code,/rewind 和 CPU 优化值得升级体验一下。

GitHub Trending 上 MCP 生态项目的集中爆发是个信号。codebase-memory-mcp、Agent-Reach 这类项目一周涨星数千,MCP 正在从协议规范变成有实际工具支撑的生态。做 Agent 开发的话,现在是关注 MCP 生态的好时机。

参考资料

[1]

OpenAI – Jalapeño Inference Chip: https://openai.com/index/openai-broadcom-jalapeno-inference-chip

[2]

Claude Code v2.1.191: https://github.com/anthropics/claude-code/releases/tag/v2.1.191

[3]

Claude Code v2.1.187: https://github.com/anthropics/claude-code/releases/tag/v2.1.187

[4]

Codex 0.142.2: https://github.com/openai/codex/releases/tag/rust-v0.142.2

[5]

OpenCode v1.17.10: https://github.com/anomalyco/opencode/releases/tag/v1.17.10

[6]

OpenHands cloud-1.39.0: https://github.com/OpenHands/OpenHands/releases/tag/cloud-1.39.0

[7]

calesthio/OpenMontage: https://github.com/calesthio/OpenMontage

[8]

DeusData/codebase-memory-mcp: https://github.com/DeusData/codebase-memory-mcp

[9]

Panniantong/Agent-Reach: https://github.com/Panniantong/Agent-Reach

[10]

google-research/timesfm: https://github.com/google-research/timesfm

[11]

penpot/penpot: https://github.com/penpot/penpot

[12]

jamiepine/voicebox: https://github.com/jamiepine/voicebox

[13]

asgeirtj/system_prompts_leaks: https://github.com/asgeirtj/system_prompts_leaks

[14]

stablyai/orca: https://github.com/stablyai/orca

[15]

withastro/flue: https://github.com/withastro/flue

往期推荐

AI Coding Agent 时代,我自己最常用的 4 个终端工具

从 Warp 换到 cmux:一个更适合 AI Agent 的终端

我做了一个 AI 版的 StarRocks 升级风险扫描工具,直接帮我定位到一个风险

Claude Fable 5:Anthropic 将 Mythos 级能力首次推向大众,编码和知识工作全面领先

点分享

点收藏

点点赞

点在看


免责声明:

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。

任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我

本文转载自:crossoverJie crossoverJie crossoverJie《OpenAI 联合 Broadcom 发布 Jalapeño 推理芯片:从软件到硬件的全面布局》

评论:0   参与:  0