AI开发平台ModelArts-准备数据:上传数据到指定目录

时间:2025-02-12 15:14:13

上传数据到指定目录

将下载的原始数据存放在/mnt/sfs_turbo/training_data目录下。具体步骤如下:

  1. 进入到/mnt/sfs_turbo/目录下。
  2. 创建目录“training_data”,并将原始数据放置在此处。
    mkdir training_data 

    数据存放参考目录结构如下:

    ${workdir}  |── training_data       |── train-00000-of-00001-a09b74b3ef9c3b56.parquet  # 训练原始数据集       |── alpaca_gpt4_data.json                          # 微调数据文件
support.huaweicloud.com/bestpractice-modelarts/modelarts_llm_train_91055.html