文档首页/
AI开发平台ModelArts/
最佳实践/
LLM大语言模型训练/
LLM大语言模型训练历史版本文档/
主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导(6.5.901)/
训练benchmark工具/
训练性能测试
更新时间:2025-07-29 GMT+08:00
训练性能测试
流程图
训练性能测试流程图如下图所示:
图1 训练性能测试流程

执行性能比较脚本
- 完成benchmark启动任务。
- 进入test-benchmark目录执行命令。
ascendfactory-cli performance <cfgs_yaml_file> --baseline <baseline> --o <output_dir>
- <cfgs_yaml_file>:性能测试配置的yaml文件地址,指代码目录中performance_cfgs.yaml相对或绝对路径,此配置文件为训练最优配置参数。
- --baseline <baseline>:<可选>GP-Ant8机器性能基线yaml文件路径,用户可自行修改,不填则使用工具自带基线配置,默认基线配置样例如下:
- --o <output_dir>: <可选>任务完成输出excel表格路径,默认为"./"当前所在路径。
查看性能结果
任务完成之后会在test-benchmark目录下生成excel表格:
性能结果LLaMAFactory_train_performance_benchmark_<版本号>_<时间戳>.xlsx
表格样例如下:
父主题: 训练benchmark工具