文章总结: 本文解析了大模型核心参数与术语,包括Temperature控制创造力、Top-k与Top-p采样策略、上下文长度及Token定义,并阐述了智能体、模型幻觉及提示词注入等概念。文章最后推荐了《网络安全治理》一书,帮助安全从业者深入理解大模型安全风险与治理体系。 综合评分: 55 文章分类: AI安全,软文广告,安全意识
搞懂这些大模型术语,你才算真的入门AI
原创
高尉峰 高尉峰
ShadowRoot
2026年2月2日 15:39 陕西
想要真正地发挥大语言模型的强大能力,仅会输入提示词是远远不够的,您还需要掌握“调参”这门关键技能。模型参数如同模型的“大脑设置”,直接影响其输出的风格、准确性与创造性。然而,面对诸如temperature、top-p、token等专业术语,许多用户往往感到困惑甚至望而却步。
如果您对下图中这些参数的含义感到陌生,不清楚它们如何影响生成结果,下文将为您深入浅出地解析这些核心参数,助您从“只会提问”的初级用户,进阶为“懂调控”的高效使用者。
Temperature
用于调整从生成模型中抽样的程度,每次生成结果时,相同的提示可能会产生不同的输出。温度为0将始终产生相同的输出,温度越高随机性越大,该参数主要用于控制大语言模型 (LLM) 的创造力。
Top-k采样
Top-k是用来控制采样策略的,即将所有采样结果按照打分排名,取前k个字作为候选集,然后从中随机选一个作为下一个输出。当k=1时,就和贪心策略效果是一样的,总是选排名第一的那个。
Top-p采样
是一种动态选择候选词汇的方法。Top-p采样不是固定选择k个词汇,而是选择一组累计概率达到p的词汇集合(即从高到低加起来的概率)。这意味着Top-p采样可以根据当前的概率分布动态调整候选词汇的数量,从而更好地平衡生成的多样性和质量。
相比于Top-k来说,它的优点就是不用再纠结取几个字(也就是k值)作为候选集了,p值设置起来更方便,当然,两者也可以结合起来使用。
上下文长度
LLM的上下文长度是模型在任何时候可以推理的文本量,以词元为单位。更大的上下文窗口使LLM能够处理更长的输入,并将更多的信息整合到每个输出中。
一般来说,增加LLM的上下文窗口大小意味着更高的准确性、更少幻觉、更连贯的模型响应、更长的对话以及分析更长数据序列的能力。然而,增加上下文长度并非没有代价,它通常需要增加算力,导致成本增加,并且更容易受到对抗性攻击的影响。
词元(token)
在自然语言处理(NLP)中,词元化是指将较长的文本分解成更小、更易于处理的单元,即词元。根据不同的方法,这些词元可以是单词、词组或短语。LLM在处理任何输入之前,都会将文本分割成词元,从而更轻松地进行分析并生成响应。词元(token)是文本文件中最基本的数据单元,对于模型理解和处理信息至关重要。
智能体(Agent)
智能体的核心是大语言模型(LLM),因此,智能体又被称为LLM代理。智能体通过调用本地工具来获取最新信息,优化工作流程,并自主创建子任务,从而实现复杂的目标。换而言之,智能体的作用是让大模型干活,而不是只会回答问题。
模型幻觉
大模型在回答问题时,生成了看起来很合理、但实际上是错误、编造或无法被验证的信息。也就是说模型在骗你,要么你发现它在骗你,要么你真的被骗了。
提示词注入
提示词注入利用了提示词中“指令”和“输入数据”之间模糊的界限,从而导致模型行为发生改变,输出不合规的内容。
- 直接提示词注入:由用户直接输入恶意提示词。
- 间接提示词注入:LLM代理从文档、电子邮件或网站等其他来源读取恶意提示词。
如果您想了解完整的网络安全治理体系和大模型安全风险的相关知识,请阅读《网络安全治理:基于DevSecOps的理论与实践》,该书由本人联合网络安全领域顶尖专家倾心打造,机械工业出版社重磅出版!
无论你是安全从业者、CTO、渗透测试工程师,还是对网络安全治理充满好奇的技术爱好者,都可以从本书学到你想要的知识。
想购买的朋友可以在京东网、淘宝网、当当网等平台购买。
免责声明:
本文所载程序、技术方法仅面向合法合规的安全研究与教学场景,旨在提升网络安全防护能力,具有明确的技术研究属性。
任何单位或个人未经授权,将本文内容用于攻击、破坏等非法用途的,由此引发的全部法律责任、民事赔偿及连带责任,均由行为人独立承担,本站不承担任何连带责任。
本站内容均为技术交流与知识分享目的发布,若存在版权侵权或其他异议,请通过邮件联系处理,具体联系方式可点击页面上方的联系我。
本文转载自:ShadowRoot 高尉峰 高尉峰《搞懂这些大模型术语,你才算真的入门AI》
版权声明
本站仅做备份收录,仅供研究与教学参考之用。
读者将信息用于其他用途的,全部法律及连带责任由读者自行承担,本站不承担任何责任。










评论