Qwen3.5-9B模型微调实战：使用自有数据定制专属领域模型

张

张建站

2026/6/1 9:16:00

10分钟阅读

Qwen3.5-9B模型微调实战使用自有数据定制专属领域模型1. 为什么需要微调大模型大语言模型虽然能力强大但通用模型在特定领域的表现往往不尽如人意。想象一下你是一名法律从业者需要模型准确理解法律条文和案例或者是一名医生希望模型能给出专业的医疗建议。这时候通用模型就像是一个万金油虽然什么都知道一点但在专业领域却不够深入。微调(Fine-tuning)就是让通用大模型专精某个领域的有效方法。通过使用领域特定的数据对模型进行二次训练可以让模型掌握专业术语、理解领域知识、适应特定场景的表达方式。Qwen3.5-9B作为一款优秀的开源大模型提供了完整的微调支持让我们能够打造属于自己的专家级AI助手。2. 微调前的准备工作2.1 硬件环境配置微调大模型需要较强的计算资源。推荐使用配备高端GPU的云服务器比如星图平台的A100或H100实例。对于Qwen3.5-9B这样的9B参数模型使用QLoRA等高效微调技术后16GB显存的GPU也能胜任。如果你打算在本地进行微调至少需要显存16GB以上使用QLoRA内存32GB以上存储50GB以上可用空间用于存储模型和数据集2.2 软件环境搭建首先确保你的环境安装了Python 3.8或更高版本然后安装必要的依赖pip install torch transformers peft accelerate datasets对于GPU加速还需要安装对应版本的CUDA工具包。建议使用CUDA 11.7或11.8版本。3. 准备微调数据集3.1 数据格式要求Qwen3.5-9B的微调数据需要采用JSON Lines格式.jsonl每条数据是一个JSON对象包含instruction指令、input输入和output输出三个字段。例如{ instruction: 将以下法律条文翻译成通俗易懂的语言, input: 《民法典》第一百四十三条具备下列条件的民事法律行为有效(一)行为人具有相应的民事行为能力(二)意思表示真实(三)不违反法律、行政法规的强制性规定不违背公序良俗。, output: 一个法律行为要有效需要满足三个条件1)做这件事的人要有相应的能力2)是真心想做这件事3)不违反法律和道德规范。 }3.2 数据收集与清洗根据你的目标领域收集相关数据。例如法律领域法律条文、案例解析、合同范本等医疗领域医学文献、诊疗指南、医患对话等金融领域财经新闻、财报分析、投资策略等数据清洗时要注意去除敏感信息和隐私数据统一格式和术语确保数据的准确性和专业性保持适当的多样性建议准备至少1000-5000条高质量样本数据质量比数量更重要。4. 使用QLoRA进行高效微调4.1 QLoRA技术简介QLoRA(Quantized Low-Rank Adaptation)是一种高效微调技术它通过以下方式大幅降低显存需求将原始模型量化为4位精度只训练少量低秩适配器参数保持原始模型参数冻结这种方法可以将微调所需的显存降低到原来的1/3甚至更少同时保持接近全参数微调的效果。4.2 配置微调脚本创建一个Python脚本如finetune.py配置QLoRA微调参数from transformers import AutoModelForCausalLM, AutoTokenizer from peft import LoraConfig, get_peft_model import torch # 加载基础模型和分词器 model_name Qwen/Qwen1.5-9B tokenizer AutoTokenizer.from_pretrained(model_name) model AutoModelForCausalLM.from_pretrained(model_name, torch_dtypetorch.float16) # 配置QLoRA lora_config LoraConfig( r8, # 低秩矩阵的维度 lora_alpha32, # 缩放因子 target_modules[q_proj, k_proj, v_proj, o_proj], # 要适配的模块 lora_dropout0.05, biasnone, task_typeCAUSAL_LM ) # 应用QLoRA model get_peft_model(model, lora_config) model.print_trainable_parameters() # 查看可训练参数数量4.3 启动训练过程配置训练参数并启动微调from transformers import TrainingArguments, Trainer training_args TrainingArguments( output_dir./results, per_device_train_batch_size4, gradient_accumulation_steps4, num_train_epochs3, learning_rate2e-4, fp16True, save_steps500, logging_steps100, optimadamw_torch, report_totensorboard ) trainer Trainer( modelmodel, argstraining_args, train_datasettrain_dataset, # 你的训练数据集 data_collatordata_collator ) trainer.train()5. 监控训练与模型评估5.1 训练过程监控训练过程中可以监控以下指标损失值(loss)应该随着训练逐渐下降学习率(learning rate)按计划变化GPU显存使用情况确保不超过限制使用TensorBoard可以可视化训练过程tensorboard --logdir./results/runs5.2 模型性能评估训练完成后可以通过以下方式评估模型人工检查输入领域相关问题检查回答质量自动评估使用领域特定的评估数据集计算指标对比测试与微调前的模型进行对比示例评估代码# 加载微调后的模型 model AutoModelForCausalLM.from_pretrained(./results/final_model) tokenizer AutoTokenizer.from_pretrained(./results/final_model) # 测试模型 input_text 解释一下合同法中的要约概念 inputs tokenizer(input_text, return_tensorspt) outputs model.generate(**inputs, max_new_tokens200) print(tokenizer.decode(outputs[0], skip_special_tokensTrue))6. 模型合并与部署6.1 合并QLoRA适配器QLoRA微调后得到的是适配器权重需要与基础模型合并才能获得完整模型from peft import PeftModel # 加载基础模型 base_model AutoModelForCausalLM.from_pretrained(Qwen/Qwen1.5-9B) # 加载适配器 model PeftModel.from_pretrained(base_model, ./results/final_model) # 合并模型 merged_model model.merge_and_unload() merged_model.save_pretrained(./merged_model) tokenizer.save_pretrained(./merged_model)6.2 模型部署合并后的模型可以像普通模型一样部署。以下是使用FastAPI创建简单API的示例from fastapi import FastAPI from transformers import AutoModelForCausalLM, AutoTokenizer import torch app FastAPI() model AutoModelForCausalLM.from_pretrained(./merged_model, torch_dtypetorch.float16).cuda() tokenizer AutoTokenizer.from_pretrained(./merged_model) app.post(/generate) async def generate_text(prompt: str): inputs tokenizer(prompt, return_tensorspt).to(cuda) outputs model.generate(**inputs, max_new_tokens200) return {response: tokenizer.decode(outputs[0], skip_special_tokensTrue)}7. 微调后的模型使用建议经过微调的模型在特定领域表现会显著提升使用时要注意领域专注尽量在微调领域内使用模型跨领域表现可能不稳定提示工程适当调整提示词格式匹配微调时使用的指令模板持续迭代收集用户反馈持续优化数据集和微调策略安全审核专业领域内容要经过人工审核避免错误信息传播实际使用中你可以将微调模型集成到现有系统中比如法律咨询系统医疗问答机器人金融分析工具教育辅导应用获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。