Skip to content

LLaMA Factory:高效 LLM 微调平台

LLaMA Factory 是一个集成化、简单易用且高效的大型语言模型(LLM)训练与微调平台。它使开发者和研究者无需深入了解底层复杂的代码,即可在本地或云端对上百种预训练模型进行高效微调。

在 AI 训练营中使用 LLaMA Factory

1. 创建 LLaMA Factory 实例

在“AI 训练营”页面,选择 LLaMA Factory 并一键创建。

通过 AI 训练营创建 LLaMA Factory

2. 配置实例

在弹出的对话框中,您可以选择将工具部署到全新的实例或已有的实例中。

  • 新建实例:系统将为您创建一个全新的、预配置好环境的实例。 配置新实例确认新实例配置

  • 选择已有实例:将工具部署到您账户下已有的实例上。 选择已有实例进行部署

3. 访问 LLaMA Factory

创建成功后,在“快捷工具”中会出现 LLaMA Factory 的访问入口,点击即可进入其 WebUI 操作界面。 在快捷工具中访问 LLaMA Factory

通用微调流程

  1. 数据准备:上传或选择您的训练数据集。平台支持 JSON、CSV 等多种数据格式。
  2. 模型选择:从丰富的预置模型库中选择一个基础模型作为微调的起点。
  3. 参数配置
    • 微调方法:选择 LoRA, QLoRA, 或全参数微调等不同的训练策略。
    • 训练参数:设置学习率、批次大小(Batch Size)、训练轮数(Epoch)等关键参数。
    • 优化器:配置 AdamW, SGD 等优化器及相应的学习率调度策略。
  4. 开始训练:启动训练任务,并通过界面实时监控训练过程中的损失(Loss)变化等指标。
  5. 模型评估与导出:训练完成后,使用验证集评估模型性能,并将训练好的模型权重导出,以便后续部署和使用。

适用场景

  • 企业定制化:根据企业特定数据和需求,微调出符合业务场景的专业模型。
  • 垂直领域应用:为医疗、法律、金融等专业领域训练具备专门知识的语言模型。
  • 多语言与跨文化模型:训练支持多语言或特定语种的模型。
  • 学术研究:为学术研究和算法实验提供便捷的验证平台。
  • 个人项目:满足个人开发者对模型进行定制化改造的需求。

更多信息

欲了解更多关于 LLaMA Factory 的功能和高级用法,请访问 LLaMA Factory 官方文档