检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
est文件导入。 dataset.import_data(path=None, anntation_config=None, **kwargs) 不同类型的数据集支持的导入方式如表1所示。 表1 不同数据集支持的导入方式 数据集类型 OBS目录导入 Manifest文件导入 备注
代码运行故障 Notebook运行代码报错,在'/tmp'中到不到文件 Notebook无法执行代码,如何处理? 运行训练代码,出现dead kernel,并导致实例崩溃 如何解决训练过程中出现的cudaCheckError错误? 如何处理使用opencv.imshow造成的内核崩溃?
服务预测失败 问题现象 在线服务部署完成且服务已经处于“运行中”的状态,向服务发起推理请求,预测失败。 原因分析及处理方法 服务预测需要经过客户端、外部网络、APIG、Dispatch、模型服务多个环节。每个环节出现都会导致服务预测失败。 图1 推理服务流程图 出现APIG.XX
Method Not Allowed 问题现象 服务预测报错:Method Not Allowed 原因分析 服务预测默认注册的API需要使用POST方法调用。如您使用了GET方法,APIG(API网关)将会拦截请求。 处理方法 使用POST方法调用。 父主题: 服务预测
使用CTS审计ModelArts服务 ModelArts支持云审计的关键操作 查看ModelArts相关审计日志
使用ModelArts Standard训练模型 模型训练使用流程 准备模型训练代码 准备模型训练镜像 创建调试训练作业 创建算法 创建生产训练作业 分布式模型训练 模型训练存储加速 增量模型训练 自动模型优化(AutoSearch) 模型训练高可靠性 管理模型训练作业
nodeNames 是 Array of strings 节点名称集合 响应参数 状态码:200 表3 响应Body参数 参数 参数类型 描述 nodeNames Array of strings 节点名称集合 状态码:404 表4 响应Body参数 参数 参数类型 描述 error_code
} ] } } } 状态码:404 Not Found。 { "error_code" : "ModelArts.50025001", "error_msg" : "Network not exist." } 状态码 状态码 描述 200 OK。 404 Not
} ] } } } 状态码:404 Not Found。 { "error_code" : "ModelArts.50015001", "error_msg" : "pool not found" } 状态码 状态码 描述 200 OK。 404 Not Found。
"modelarts_agency", "create_time" : 15657747821288 } ] } 状态码 状态码 描述 200 OK 400 Bad Request 401 Unauthorized 403 Forbidden 404 Not Found
"resource_requirements" : null, "advanced_config" : { } } ] } 状态码 状态码 描述 200 ok 错误码 请参见错误码。 父主题: 训练管理
\"failure_threshold\":\"10\",\"initial_delay_seconds\":\"12\"}}" } 状态码 状态码 描述 200 模型详情。 错误码 请参见错误码。 父主题: AI应用管理
"connectionStatus" : { } } } 状态码:404 Not Found。 { "error_code" : "ModelArts.50025001", "error_msg" : "Network not exist." } 状态码 状态码 描述 200 OK。 404 Not
329633162 +0000 UTC" } 状态码:500 Internal error { "error_code" : "ModelArts.50005000", "error_msg" : "internal error" } 状态码 状态码 描述 200 OK。 500 Internal
"value" : "v2" }, { "key" : "test", "value" : "1122" } ] } 状态码 状态码 描述 200 查询成功。 错误码 请参见错误码。 父主题: 训练管理
detection, and soundclassification)", "unit_en" : "minute" } ] } 状态码 状态码 描述 200 查询工作空间配额成功的响应参数。 错误码 请参见错误码。 父主题: 工作空间管理
"my_iam_user" } ] } 响应示例 状态码:200 修改工作空间成功的响应参数。 { "workspace_id" : "***05d1a553b4e188ea878e7dcb85***" } 状态码 状态码 描述 200 修改工作空间成功的响应参数。 错误码 请参见错误码。
GPU业务迁移至昇腾训练推理 ModelArts昇腾迁移调优工具总览 GPU训练业务迁移至昇腾的通用指导 基于AIGC模型的GPU推理业务迁移至昇腾指导 GPU推理业务迁移至昇腾的通用指导 基于advisor的昇腾训练性能自助调优指导 Dit模型PyTorch迁移与精度性能调优 msprobe工具使用指导
volumes属性列表 参数 是否必选 参数类型 说明 nfs 否 Object 共享文件系统类型的存储卷。仅支持运行于已联通共享文件系统网络的资源池的训练作业。具体说明请参见表6。 host_path 否 Object 主机文件系统类型的存储卷。仅支持运行于专属资源池中的训练作业。具体说明请参见表7。
上传OBS的文件规范: 文件名规范:不能有+、空格、制表符。 如不需要提前上传训练数据,请创建一个空文件夹用于存放工程后期生成的文件。如:“/bucketName/data-cat”。 如需要提前上传待标注的图片,请创建一个空文件夹,然后将图片文件保存在该文件夹下,图片的目录