AI开发平台MODELARTS-ascendfactory-cli方式启动(推荐):步骤一:准备工作

时间:2025-03-12 09:40:52

步骤一:准备工作

  1. 完成准备工作内容,生成ascendfactory-cli工具。
  2. 创建test-benchmark目录,该目录存放训练生成的权重文件及训练日志。
    # 任意目录创建
    mkdir test-benchmark
  3. 修改config目录下yaml文件中model_name_or_path、dataset_dir和dataset或eval_dataset参数或其它内容,根据实际情况选择yaml文件;参数详解可参考表1
    config目录结构,请根据实际要求选择、修改文件:
    |──AscendFactory/examples/config/  # config配置文件
       |──performance_cfgs.yaml        # 微调性能配置yaml文件
       |──llama_factory_performance_cfgs_VL.yaml  # qwen2vl微调yaml配置文件
       |──accuracy_cfgs.yaml           # 训练精度配置yaml文件
       |──llama_factory_cfgs_posttrain.yaml  # RM、PPO、DPO训练阶段样例yaml文件
       |──llama_factory_performance_baseline.yaml # 性能基线配置
       |──llama_factory_accuracy_baseline.yaml    # 精度基线配置
    修改样例如下,根据自己实际要求修改相应yaml文件:
    # 默认参数;根据自己实际要求修改
    dataset_dir: /xxxx/benchmark/data/dataset
    dataset: gsm8k_train_alpaca
    model_name_or_path: /data/wulan1/model/qwen2.5-7b
    ## accuracy_cfgs.yaml
    eval_dataset: gsm8k_test

    样例yaml配置文件结构分为

    • base块:基础配置块。
    • ModelName块:该模型所需配置的参数,如qwen2.5-7b块。
    • exp_name:实验块,训练策略-序列长度所需参数配置。

    样例yaml文件仅展示常用实验配置,如需其他配置需根据样例自行添加,样例截图如下:

support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_train_91234.html