检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
必须修改。指定输出目录。训练过程中生成的模型参数和日志文件将保存在这个目录下 logging_steps 2 用于指定模型训练过程中,多少步输出一次日志。日志包括了训练进度、学习率、损失值等信息。建议设置 max_steps 5000 非必填。表示训练step迭代次数。会自动计算得出。 save_steps 5000
init_or_rescheduled:代表本次启动为被调度后的首次运行,包括初次启动及调度恢复后的运行。 restarted:代表本次启动非被调度后的首次运行,为进程重启后的运行。 end_reason String 本次运行结束原因。 end_related_task String 引发本次运行结束的task
pending: 待启动,仅在线有这个状态。 waiting: 资源排队中,仅在线服务有这个状态。 progress Integer 部署进度,当状态是deploying时返回。 error_msg String 错误信息,当status为failed时,返回这个信息注明失败原因。
ckend:多卡推理启动后端,可选值为"ray"或者"mp",其中"ray"表示使用ray进行启动多卡推理,"mp"表示使用python多进程进行启动多卡推理。默认使用"mp"后端启动多卡推理。 高阶参数说明: --enable-prefix-caching:如果prompt的公
ckend:多卡推理启动后端,可选值为"ray"或者"mp",其中"ray"表示使用ray进行启动多卡推理,"mp"表示使用python多进程进行启动多卡推理。默认使用"mp"后端启动多卡推理。 --enforce-eager:未设置INFER_MODE环境变量时,部分模型会默认
ckend:多卡推理启动后端,可选值为"ray"或者"mp",其中"ray"表示使用ray进行启动多卡推理,"mp"表示使用python多进程进行启动多卡推理。默认使用"mp"后端启动多卡推理。 高阶参数说明: --enable-prefix-caching:如果prompt的公
ckend:多卡推理启动后端,可选值为"ray"或者"mp",其中"ray"表示使用ray进行启动多卡推理,"mp"表示使用python多进程进行启动多卡推理。默认使用"mp"后端启动多卡推理。 --enforce-eager:未设置INFER_MODE环境变量时,部分模型会默认
范围内任意整数。 定时停止:开启定时停止功能后,该Notebook实例将在运行时长超出您所选择的时长后,自动停止。 说明: 出于对用户任务进度的保护,在您设置的自动停止时间到达后,Notebook不会立即自动停止,可能会有2-5分钟的延迟(此过程正常计费),方便您进行续约。 填写
错误详情。 error_msg String 错误信息。 message String 任务的运行信息。 progress Float 任务当前进度百分比。 resource_id String 资源ID。 result Result object 任务结果。 status Integer
model_name String 模型名称。 model_version String 模型版本。 progress Float 任务当前进度百分比。 result Result object 任务结果。 status Integer 任务状态。 task_id String 任务ID。
ModelArts.3508 Failed to query the service monitoring information. 服务监控信息获取失败。 联系服务运维人员解决。 500 ModelArts.3509 Failed to query edge nodes. 节点查询失败。