检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 check_accept Boolean 是否验收通过,用于团队标注。
表6 Docker部署参数数据结构说明 参数 参数类型 说明 namespace String SWR组织名称,全局唯一。 image_name String 镜像名称。 image_tag String 镜像标签。
表9 Docker部署参数数据结构说明 参数 参数类型 说明 namespace String SWR组织名称,全局唯一。 image_name String 镜像名称。 image_tag String 镜像标签。
镜像保存时报错“BuildImage,True,Commit successfully|PushImage,False,Task is running.”
AccessKeyId=P19W9X830R1Z39P5X5M5&Expires=1606300137&x-obs-security-token=gQpjbi1ub3J0aC03jKj8N6gtS4VsdTTW3QFoHMtpMoFLtC...
图2 动态benchmark测试结果(示意图) 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.911)
表2 响应参数 参数 参数类型 说明 is_success Boolean 请求是否成功。 job_id Long 训练作业的ID。 job_name String 训练作业的名称。 job_desc String 训练作业的描述信息。
表4 DescribeSampleResp 参数 参数类型 描述 check_accept Boolean 是否验收通过,用于团队标注。可选值如下: true:验收通过 false:验收不通过 check_comment String 验收意见,用于团队标注。
labels Map<String,String> k8s标签,格式为key/value键值对。 tags Array of UserTag objects 资源标签,非特权池不能指定。 network NodeNetwork object 网络配置,非特权池不能指定。
图2 动态benchmark测试结果(示意图) 父主题: 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导(6.3.910)
用户可以通过先查看api_precision_compare_result_{timestamp}.csv文件的Forward Test Success和Backward Test Success,判断是否存在未通过测试的API,再查看api_precision_compare_details
表8 Docker部署参数数据结构说明 参数 参数类型 说明 namespace String SWR组织名称,全局唯一。 image_name String 镜像名称。 image_tag String 镜像标签。
表3 响应参数 参数 参数类型 说明 is_success Boolean 请求是否成功。 error_message String 调用失败时的错误信息。 调用成功时无此字段。 error_code String 调用失败时的错误码,具体请参见错误码。 调用成功时无此字段。
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error 使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed 华为云CCE集群纳管GPU裸金属服务器由于CloudInit
检查是否安装docker。 docker -v #检查docker是否安装 如尚未安装,运行以下命令安装docker。
"level" : "Info", "message" : "[Pod: modelarts-job-5bd61eea-9de2-4864-a0f7-5fae966171b5-worker-0] SuccessfulCreate: Created container",
": true } 失败响应示例 { "is_success": false, "error_message": "Error string", "error_code": "ModelArts.0105" } 状态码 状态码请参见表1。
请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 check_accept Boolean 是否验收通过,用于团队标注。
可选样本状态如下: __ALL__:已标注 __NONE__:未标注 __UNCHECK__:待验收 __ACCEPTED__:验收通过 __REJECTED__:已驳回 __UNREVIEWED__:待审核 __REVIEWED__:已审核 __WORKFORCE_SAMPLED
": true } 失败响应示例 { "is_success": false, "error_message": "Error string", "error_code": "ModelArts.0105" } 状态码 状态码请参见状态码。