检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
************ 响应参数: { "resultCode": "0404000", "resultDesc": "操作成功" } 父主题: 句子、敏感词训练接口 (SemanticKeywordTraining)
创建模型训练工程 创建工程 编辑训练代码(简易编辑器) 编辑训练代码(WebIDE) 模型训练 MindSpore样例 父主题: 模型训练
通过以下方式控制需要训练的参数列表。其中,“trainable_include_patterns”为需要训练的参数列表,“trainable_exclude_patterns”为不需要训练的参数列表。
“输出”数据默认配置为模型输出,代码参数为“train_url”,也支持用户根据1的算法代码自定义输出路径参数。 在创建训练作业时,填写输入路径和输出路径。 训练输入选择对应的OBS路径或者数据集路径,训练输出选择对应的OBS路径。 父主题: 训练过程读取数据
示例:Train_Fail。 数据集:从下拉框中选择预置数据集“HardDisk-Detect(HardDisk)”。 数据实例:从下拉框中选择故障硬盘训练数据集“HardDisk-Detect_Train_Fail”。
如何回到模型训练服务首页? 用户离开模型训练服务首页,如果需要回到首页,请单击界面左上角的“模型训练”,从下拉框中选择“模型训练”。 父主题: 模型训练服务首页
训练 上传数据至OBS并预热到SFS Turbo中 创建训练任务 父主题: 实施步骤
父主题: 人工智能
操作流程 模型训练服务操作流程如操作流程图所示。 图1 操作流程图 父主题: 使用模型训练服务快速训练算法模型
train_instance_type 是 String 训练作业选择的资源规格,请参考查询资源规格列表 train_instance_count 是 int 训练作业计算节点个数。
Tensorboard 在模型训练工程代码编辑界面控制台的Tensorboard页签中创建Tensorboard 新建模型训练工程,创建训练任务后,在任务详情的Tensorboard页签中创建Tensorboard 配置训练任务时,AI引擎选择PyTorch后可以创建TensorBoard
模型训练新建模型训练工程的时候,选择通用算法有什么作用? 通用算法目前包括:分类算法、拟合算法、聚类算法、其他类型。用户选择不同的通用算法类型,并勾选“创建入门模型训练代码”,便可以自动生成对应类型的代码模版。 父主题: 模型训练
LoRA训练 本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上,使用新的数据集进行LoRA微调以优化模型性能的过程。 训练前需要修改数据集路径、模型路径。脚本里写到datasets路径即可。
compute_environment: LOCAL_MACHINE debug: false distributed_type: MULTI_NPU downcast_bf16: 'no' gpu_ids: all machine_rank: 0 main_training_function
sh diffusers_lora_train.sh 启动SDXL LoRA训练服务 使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_sdxl_lora_train.sh 训练执行成功如下图所示。
LoRA训练 本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上,使用新的数据集进行LoRA微调以优化模型性能的过程。修改数据集路径、模型路径。脚本里写到datasets路径即可。
单击“登录”,进入NAIE服务官网。 依次选择“AI服务 > AI服务 > 模型训练服务 > 模型训练服务”,进入模型训练服务介绍页面。 单击“进入服务”,进入模型训练服务页面。 父主题: 产品介绍
启动SD1.5 Finetune训练服务 使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_finetune_train.sh 启动SDXL Finetune训练服务 使用ma-user用户执行如下命令运行训练脚本。
Finetune训练 本章节介绍SDXL&SD 1.5模型的Finetune训练过程。Finetune是指在已经训练好的模型基础上,使用新的数据集进行微调(fine-tuning)以优化模型性能。修改数据集路径、模型路径。
删除训练作业 功能介绍 删除训练作业。 此接口为异步接口,作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI DELETE /v1/{project_id}/training-jobs/{job_id} 参数说明如表1所示。