检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
String ModelArts错误码。 error_msg String 具体错误信息。 状态码: 401 表6 响应Body参数 参数 参数类型 描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 状态码: 403 表7
"***05d1a553b4e188ea878e7dcb85***" } 状态码 状态码 描述 200 修改工作空间成功的响应参数。 错误码 请参见错误码。 父主题: 工作空间管理
false } ], "count" : 1, "total_count" : 1 } 状态码 状态码 描述 200 错误码 请参见错误码。 父主题: APP认证管理
"instance_count" : 1 } ] } ] } 状态码 状态码 描述 200 服务更新日志 错误码 请参见错误码。 父主题: 服务管理
"key" : "test", "value" : "1122" } ] } 状态码 状态码 描述 200 查询成功。 错误码 请参见错误码。 父主题: 训练管理
9/site-packages/transformers/dynamic_module_utils.py 问题4:Error waiting on exit barrier错误 错误截图: 报错原因:多线程退出各个节点间超时时间默认为300s,时间设置过短。 解决措施: 修改容器内torch/distributed/
异常 部署服务超时,错误信息:xxx Deploying timeout, details: %s 请根据错误信息定位和处理问题。 异常 启动服务失败,错误信息xxx Service %s started failed, error message: %s 请根据错误信息定位和处理问题。
ws/f1642618-43eb-4ab1-a0b1-9cc584182c60 响应示例 无 状态码 状态码 描述 204 OK 错误码 请参见错误码。 父主题: Workflow工作流管理
es/fa4ac58e-088b-4fd7-ae8c-b36fee50f884 响应示例 无 状态码 状态码 描述 204 OK 错误码 请参见错误码。 父主题: Workflow工作流管理
} ] } ] } } } ] } 状态码 状态码 描述 200 OK。 错误码 请参见错误码。 父主题: 资源管理
"run_count" : 2, "param_ready" : true } ] } 状态码 状态码 描述 200 OK 错误码 请参见错误码。 父主题: Workflow工作流管理
4096, "allocatable_gpus" : 0.5 } ] } 状态码 状态码 描述 200 服务部署规格列表。 错误码 请参见错误码。 父主题: 服务管理
}, "run_count" : 2, "param_ready" : true } 状态码 状态码 描述 200 OK 错误码 请参见错误码。 父主题: Workflow工作流管理
在pytorch镜像运行分布式作业时,设置NCCL日志级别,代码如下: import os os.environ["NCCL_DEBUG"] = "INFO" 会出现如下错误: job0879f61e-job-base-pda-2-0:712:71 2 [0] bootstrap.cc:37 NCCL WARN
训练作业失败,如何使用开发环境调试训练代码? 在创建训练作业前,推荐您先使用ModelArts开发环境调试训练代码,避免代码迁移过程中的错误。 直接使用线上notebook环境调试请参考使用JupyterLab开发模型。 配置本地IDE(Pycharm或者VsCode)联接云上环境调试请参考使用本地IDE开发模型。
9/site-packages/transformers/dynamic_module_utils.py 问题4:Error waiting on exit barrier错误 错误截图: 报错原因:多线程退出各个节点间超时时间默认为300s,时间设置过短。 解决措施: 修改容器内torch/distributed/
9/site-packages/transformers/dynamic_module_utils.py 问题4:Error waiting on exit barrier错误 错误截图: 报错原因:多线程退出各个节点间超时时间默认为300s,时间设置过短。 解决措施: 修改容器内torch/distributed/
9/site-packages/transformers/dynamic_module_utils.py 问题4:Error waiting on exit barrier错误 错误截图: 报错原因:多线程退出各个节点间超时时间默认为300s,时间设置过短。 解决措施: 修改容器内torch/distributed/
当接口调用出错时,会返回错误码及错误信息说明,错误响应的Body体格式如下所示。 { "error_msg": "The format of message is error", "error_code": "AS.0001" } 其中,error_code表示错误码,erro
状态码: 200 表3 响应Body参数 参数 参数类型 描述 error_code String 操作失败的错误码。 error_msg String 操作失败的错误信息。 results Array of BatchResponse objects 批量删除标注团队成员的结果。