AI开发平台MODELARTS-使用MaaS调优模型:创建调优任务
创建调优任务
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。
- 在ModelArts Studio左侧导航栏中,选择“模型调优”进入任务列表。
- 单击“创建调优任务”进入创建页面,完成创建配置。
表2 创建调优任务 参数
说明
任务设置
任务名称
自定义调优任务名称。
支持1~64位,以中文、大小写字母开头,只包含中文、大小写字母、数字、中划线、下划线的名称。
描述
调优任务简介。支持1000字符。
模型设置
模型来源
单击“选择模型”,从“我的模型”列表中选择需要调优的模型。
选择调优类型
- 全参微调:直接在模型上训练,影响模型全量参数的微调训练,效果较好,收敛速度较慢,训练时间较长。
- LoRA微调:冻结原模型,通过往模型中加入额外的网络层,并只训练这些新增的网络层参数,效果接近或略差于全参训练,收敛速度快,训练时间短。
调优后的模型名称
设置调优后产生的新模型的名称。
支持1~64位,以中文、大小写字母开头,只包含中文、大小写字母、数字、下划线(_)、中划线(-)和(.)。
数据设置
添加数据集
选择存放训练数据集的OBS路径,必须选择到文件。
说明:数据集必须满足要求(请参见约束限制),否则调优会失败。
调优后模型权重保存路径
选择存放调优后的模型权重文件的OBS路径。
说明:权重文件要存放在空文件夹中,否则会覆盖原有文件。
超参设置
迭代步数/Iterations
设置模型参数/权重更新的次数。在调优过程中,每一个Iterations会消耗32条训练数据。
当数据集是数百量级,则建议迭代4~8个epoch(epoch表示整个数据集被完整地用于一次训练的次数);当数据集是数千量级,则建议迭代2~4个epoch;当数据集是更大数量,则建议迭代1~2个epoch。
总Iterations = 整个数据集完整训练需要的Iterations * epoch。例如,当一个数据集有3200条数据,完整训练一个数据集的Iterations为100,迭代2个epoch,总Iterations就是200。
取值范围:0~100000
默认值:1000
学习率/learning_rate
设置每个迭代步数(iteration)模型参数/权重更新的速率。学习率设置得过高会导致模型难以收敛,过低则会导致模型收敛速度过慢。
取值范围:0~0.1
默认值:0.00002
建议微调场景的学习率设置在10-5这个量级。
资源设置
资源池类型
资源池分为公共资源池与专属资源池。
- 公共资源池供所有租户共享使用。
- 专属资源池需单独创建,不与其他租户共享。
实例规格
选择实例规格,规格中描述了服务器类型、型号等信息,仅显示模型支持的资源
实例数
设置实例数。
更多选项
永久保存日志
选择是否打开“永久保存日志”开关。
- 开关关闭(默认关闭):表示不永久保存日志,则任务日志会在30天后会被清理。可以在任务详情页下载全部日志至本地。
- 开关打开:表示永久保存日志,此时必须配置“日志路径”,系统会将任务日志永久保存至指定的OBS路径。
事件通知
选择是否打开“事件通知”开关。
- 开关关闭(默认关闭):表示不启用 消息通知 服务。
- 开关打开:表示订阅消息通知服务,当任务发生特定事件(如任务状态变化或疑似卡死)时会发送通知。此时必须配置“主题名”和“事件”。
- “主题名”:事件通知的主题名称。单击“创建主题”,前往消息通知服务中创建主题。
- “事件”:选择要订阅的事件类型。例如“创建中”、“已完成”、“运行失败”等。
自动停止
当使用付费资源时,可以选择是否打开“自动停止”开关。
- 开关关闭(默认关闭):表示任务将一直运行直至完成。
- 开关打开:表示启用自动停止功能,此时必须配置自动停止时间,支持设置为“1小时”、“2小时”、“4小时”、6小时或“自定义”。启用该参数并设置时间后,运行时长到期后将会自动终止任务,准备排队等状态不扣除运行时长。
- 参数配置完成后,单击“提交”,创建调优任务。
在任务列表,当模型“状态”变成“已完成”时,表示模型调优完成。
- GaussDB数据库参数调优_GaussDB版本_高斯数据库参数调优
- 文档数据库服务DDS性能调优_MongoDB性能调优_华为云
- GaussDB性能怎么调_GaussDB性能调优_高斯数据库性能怎么调-华为云
- ModelArts模型训练_超参搜索简介_超参搜索算法
- ModelArts自动学习是什么_自动学习简介_零代码完成AI开发
- GaussDB硬件_金融级高可用_高斯数据库硬件-华为云
- GaussDB性能怎么调_华为gaussdb_gaussdb性能_gaussdb学习
- 华为云资料 2021年 7月刊
- ModelArts分布式训练_分布式训练介绍_分布式调测
- GaussDB计算性能_gaussdb递归_高斯数据库计算性能_华为云