2026-03-03 08:11:22 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 该文档介绍了如何为电商商品图文素材平台原型注入AI能力，通过接入DeepSeek文本生成、Qwen3VL图像分析和Seedream图像生成三种大模型API，实现图文处理与生成功能。具体步骤包括API密钥配置、请求路径构建、Token计费说明，并演示了串联使用Qwen3VL分析参考图后，用Seedream基于分析结果生成新商品主图的流程。 综合评分： 75 文章分类： AI安全,安全开发,应用安全

cover_image

Datawhale Easy-Vibe 开源学习 task4 为原型注入AI能力

网安杂谈网安杂谈

网安杂谈

2026年2月22日 00:26 山东

以下内容为自学习社区Datawhale开源课程Easy-Vibe学习笔记。课程地址为：https://github.com/datawhalechina/easy-vibe

task4 为原型注入AI能力

上一个学习任务中，我们利用AI IDE搭了一个电商商品图文素材平台，但实际上还只是空壳，这次任务，我们要给原型注入AI能力，让这个原型工具可以具备图文处理生成能力。

1.大模型API接入

AI API接入，本质上是将大模型能力（文本生成、代码生成、图像理解、语音处理等）通过标准化接口嵌入到你的系统架构中。API(应用程序编程接口)Key是请求AI服务的[通行证]它是一串密码字符串，用于身份验证和计费。

API 请求的具体路径，告诉服务器你要访问哪个功能。完整的请求地址通常由”基础 URL + Endpoint路径”构成。例如：

文本生成：基础URL (https://api.service.com) + Endpoint (/v1/chat/completions) = 完整URL https://api.service.com/v1/chat/completions

图像生成：基础URL (https://api.service.com) + Endpoint (/v1/images/generations) = 完整URL https://api.service.com/v1/images/generations

在本次任务中，准备调用三种大模型的api,分别是DeepSeek (用于文本生成)、Qwen3 VL (用于图像分析)、Seedream (用于图像生成)。Qwen3 VL和Seedream两个API可以串联使用：先用Qwen3 VL分析参考图，理解画面内容；再用Seedream基于分析参考图的提示词内容生成新图片。

API Key 通常有两种存储方式：硬编码在代码中，或通过环境变量（.env 文件）配置。硬编码方式简单直接，但密钥会随代码提交到仓库，存在泄露风险；环境变量方式将密钥与代码分离，更安全，是业界标准做法。

2.接入文本API deepseek

使用deepseek官方（https://www.deepseek.com/）的api接口，用于文本生成。

注：Token 用量计算（deepseek）

token 是模型用来表示自然语言文本的基本单位，也是我们的计费单元，可以直观的理解为“字”或“词”；通常1个中文词语、1个英文单词、1个数字或1个符号计为1个 token。

一般情况下模型中 token 和字数的换算比例大致如下：

1 个英文字符 ≈ 0.3 个 token。

1 个中文字符 ≈ 0.6 个 token。

但因为不同模型的分词不同，所以换算比例也存在差异，每一次实际处理token数量以模型返回为准。

3.接入图像转文字API

选择通义千问Qwen3 VL作为图像转文字大模型。这里调用硅基流动平台的api，当然也可以通过阿里的百炼平台。顺便发个硅基流动平台的邀请码有奖励：iMceJlEV，通过下面链接注册有奖励。https://cloud.siliconflow.cn/i/iMceJlEV。

Qwen VL (图像分析) 分析：风格、颜色、构图、关键元素

export&nbsp;async&nbsp;function&nbsp;analyzeReferenceImage(imageUrl:&nbsp;string)&nbsp;{&nbsp;&nbsp;// 使用 Qwen VL 分析图片&nbsp;&nbsp;const&nbsp;prompt = `请分析这张电商商品主图，提取设计元素。按以下JSON格式输出：&nbsp; {&nbsp; &nbsp;&nbsp;"description":&nbsp;"图片整体描述",&nbsp; &nbsp;&nbsp;"style":&nbsp;"设计风格（简约现代、复古经典等）",&nbsp; &nbsp;&nbsp;"colors": ["主色调",&nbsp;"辅助色"],&nbsp; &nbsp;&nbsp;"layout":&nbsp;"构图方式",&nbsp; &nbsp;&nbsp;"keyElements": ["关键设计元素1",&nbsp;"关键设计元素2"],&nbsp; &nbsp;&nbsp;"suggestedPrompt":&nbsp;"用于生成类似风格图片的提示词"&nbsp; }`
&nbsp;&nbsp;// Qwen 返回分析结果&nbsp;&nbsp;return&nbsp;{ style, colors, layout, keyElements, suggestedPrompt }}

4.接入图像生成API

选择Seedream 4.5生成图像。Seedream是字节跳动最新自主研发的图像生成大模型。该模型相较于4.0实现了全面提升，尤其在编辑一致性（如主体细节与光影色调的保持）、人像美化和小字生成方面体验升级。同时，模型的多图组合能力显著增强，推理能力与画面美学持续优化，能够更精准、更具艺术感地呈现创意。

根据前面识别出来的主图信息组装Prompt 将分析结果 + 商品信息组合，随后Seedream 根据描述生成新的商品主图。

export&nbsp;async&nbsp;function&nbsp;referenceToImage(referenceImageUrl, product) {&nbsp;&nbsp;// Step 1: Qwen 分析参考图&nbsp;&nbsp;const&nbsp;analysis =&nbsp;await&nbsp;analyzeReferenceImage(referenceImageUrl)
&nbsp;&nbsp;// Step 2: 组合分析结果 + 商品信息 → 生成 Prompt&nbsp;&nbsp;const&nbsp;prompt =&nbsp;`电商商品主图：${product.name}参考风格：${analysis.style}配色方案：${analysis.colors.join('、')}构图方式：${analysis.layout}商品特点：${product.sellingPoints}设计元素：${analysis.keyElements.join('、')}`
&nbsp;&nbsp;// Step 3: Seedream 根据 Prompt 生成图片&nbsp;&nbsp;const&nbsp;result =&nbsp;await&nbsp;generateImage(prompt)&nbsp;&nbsp;return&nbsp;{ analysis, prompt,&nbsp;imageUrl: result.url&nbsp;}}

实验商品的原始信息和主图是这样的。经过多次的折腾，终于可以根据上传的图片，文字，根据所需的角度，场景生成商品配图了。任务Task4就到这里啦。

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：网安杂谈网安杂谈网安杂谈《Datawhale Easy-Vibe 开源学习 task4 为原型注入AI能力》