2026-04-16 05:05:08 网络安全文章来源：ZONE.CI 全球网 0 阅读模式

文章总结： 本文详细介绍了在Windows11系统下使用LLaMA-Factory工具对Qwen2.5-1.5B模型进行无代码微调的全流程，包括环境配置、数据集准备、模型训练及部署。关键发现显示微调后模型成功建立了新的身份认知（从Yuki变为陈千语）。可操作建议涵盖Torch环境问题解决、LangChain部署方案，并提供了完整的代码示例实现本地化部署。 综合评分： 82 文章分类： AI安全,安全工具,安全开发,解决方案,安全培训

cover_image

从0到1，无代码微调并部署本地大语言模型LLM

原创

黑与白的边界黑与白的边界

黑与白的边界

2026年2月14日 15:35 广东

在小说阅读器读本章

去阅读

前言

LLM模型微调 能让大模型掌握特定行业的深度知识，能够实现AI虚拟主播，AI医生，AI程序员，AI网络安全工程师等特定领域的延展。更重要的是，当有本地部署的硬件条件限制时，能够让微调后小的大语言模型媲美百亿神经元的大语言模型

测试环境：windows11，RTX4070显卡

下面将手把手带你跑通无代码模型微调的全过程

环境安装

必要的工具：

git： https://git-scm.cn/ （方便拉取资源）
python： https://www.python.org/ （微调和运行必要环境）

流程：

创建文件夹，并拉取 llama-factory 项目

mkdir&nbsp;D:/LLM-Tuning
cd&nbsp;D:/LLM-Tuning
git&nbsp;clone&nbsp;--depth 1 https://github.com/hiyouga/LLaMA-Factory.git
cd&nbsp;LLaMA-Factory

安装LLaMA-Factory需要的环境

pip install -e&nbsp;".[torch,metrics]"
pip install modelscope

验证环境

python -c&nbsp;"import torch; print(torch.cuda.is_available()); print(torch.cuda.get_device_name(0))"

正常输出如下：

错误：正常来说安装完后验证环境会显示显卡型号，但是我在安装时，会出现报错，原因是它安装了错误的cuda版本，需要重新安装torch解决方法如下：
pip uninstall torch torchvision torchaudio

pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu126
如果其他版本请参考官网： https://pytorch.org/get-started/locally/

微调

这里用于演示，只对模型做一个自我认知的微调

准备数据集

拉取数据集

git&nbsp;clone&nbsp;https://www.modelscope.cn/datasets/DanKe123abc/yuki_identity_sft.git

修改数据集

下载完后，目录结构如下：

我们需要关注的是yuki_identity_sft.jsonl文件，用编辑器将下列文字全局替换：

Yuki => 陈千语
DanKe => 管理员

效果图如下：

准备本地模型

这里使用的是qwen2.5_1.5B用于演

下载模型

可以直接使用下面脚本下载

from&nbsp;modelscope&nbsp;import&nbsp;snapshot_download

download_dir =&nbsp;"D:\\Models\\Qwen2.5-1.5B-Instruct"

model_dir = snapshot_download(
&nbsp; &nbsp;&nbsp;'qwen/Qwen2.5-1.5B-Instruct',
&nbsp; &nbsp; cache_dir=download_dir,
&nbsp; &nbsp; revision='master'
)

print(f"下载完成！模型路径为:&nbsp;{model_dir}")

微调

配置数据集信息

打开D:\LLM-Tuning\LLaMA-Factory\data文件，将刚刚修改好的数据集yuki_identity_sft.jsonl文件拖入文件夹中
打开dataset_info.json文件，添加新配置：

"MytestData":&nbsp;{
&nbsp; &nbsp;&nbsp;"file_name":"yuki_identity_sft.jsonl",
&nbsp; &nbsp;&nbsp;"columns":&nbsp;{
&nbsp; &nbsp; &nbsp;&nbsp;"messages":&nbsp;"conversations"
&nbsp; &nbsp;&nbsp;},
&nbsp; &nbsp;&nbsp;"tags":&nbsp;{
&nbsp; &nbsp; &nbsp;&nbsp;"role_tag":&nbsp;"role",
&nbsp; &nbsp; &nbsp;&nbsp;"content_tag":&nbsp;"content",
&nbsp; &nbsp; &nbsp;&nbsp;"user_tag":&nbsp;"user",
&nbsp; &nbsp; &nbsp;&nbsp;"assistant_tag":&nbsp;"assistant"
&nbsp; &nbsp;&nbsp;},
&nbsp; &nbsp;&nbsp;"formatting":&nbsp;"sharegpt"
&nbsp;&nbsp;},

打开LLamaFactory微调面板

python -m llamafactory.cli webui

设置参数如图，其他的默认就行：

设置完后直接点击开始，模型就开始训练了，训练完后会出现下面提示：

验证模型

加载训练完后的lora模型

训练前后的大模型对比

训练前

训练后

观察图片可以发现，微调后qwen2.5认为自己是陈千语，自己由管理员开发的

大模型部署

下面不是新手向如果只是希望学习微调的在这里已经结束了，下面是本系列教程的后续，如何用langchain部署本地的LLM微调大语言模型

环境配置

安装需要的环境

pip install peft langchain langchain-huggingface

下面是样例代码

代码流程如下：加载基座模型->加载 LoRA 权重->合并权重->构建Langchain通道->调用模型

import&nbsp;torch
from&nbsp;transformers&nbsp;import&nbsp;AutoModelForCausalLM, AutoTokenizer, pipeline
from&nbsp;peft&nbsp;import&nbsp;PeftModel
from&nbsp;langchain_huggingface&nbsp;import&nbsp;HuggingFacePipeline
from&nbsp;langchain_core.prompts&nbsp;import&nbsp;PromptTemplate

BASE_MODEL_PATH =&nbsp;r'D:\Models\Qwen2.5-1.5B-Instruct\qwen\Qwen2___5-1___5B-Instruct'
LORA_PATH =&nbsp;r'D:\D_MyProject\LLM-Tuning\LLaMA-Factory\saves\Qwen2.5-1.5B\lora\train_2026-02-13-23-16-50\checkpoint-260'

print("1. 正在加载基座模型...")
tokenizer = AutoTokenizer.from_pretrained(BASE_MODEL_PATH, trust_remote_code=True)

base_model = AutoModelForCausalLM.from_pretrained(
&nbsp; &nbsp; BASE_MODEL_PATH,
&nbsp; &nbsp; torch_dtype=torch.float16,
&nbsp; &nbsp; device_map="auto",
&nbsp; &nbsp; trust_remote_code=True
)

print("2. 正在加载 LoRA 权重 ...")
model = PeftModel.from_pretrained(base_model, LORA_PATH)

print("3. 正在合并权重 ...")
model = model.merge_and_unload()

print("4. 构建 LangChain 管道...")
pipe = pipeline(
&nbsp; &nbsp;&nbsp;"text-generation",
&nbsp; &nbsp; model=model,
&nbsp; &nbsp; tokenizer=tokenizer,
&nbsp; &nbsp; max_new_tokens=200,
&nbsp; &nbsp; do_sample=True,
&nbsp; &nbsp; temperature=0.7,
&nbsp; &nbsp; repetition_penalty=1.1
)

llm = HuggingFacePipeline(pipeline=pipe)

print("\n=== 陈千语上线 ===\n")

respone = llm.invoke('你好，你是谁？')
print(f"{respone}")

演示效果

至此，我们成功的实现了大模型LLM从微调到部署，把之前的langchain串起来…

如果❤喜欢❤本系列教程，就点个关注吧，后续不定期更新~

免责声明：

本文所载程序、技术方法仅面向合法合规的安全研究与教学场景，旨在提升网络安全防护能力，具有明确的技术研究属性。

任何单位或个人未经授权，将本文内容用于攻击、破坏等非法用途的，由此引发的全部法律责任、民事赔偿及连带责任，均由行为人独立承担，本站不承担任何连带责任。

本站内容均为技术交流与知识分享目的发布，若存在版权侵权或其他异议，请通过邮件联系处理，具体联系方式可点击页面上方的联系我。

本文转载自：黑与白的边界黑与白的边界黑与白的边界《从0到1，无代码微调并部署本地大语言模型LLM》