正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需根据实际数据情况选择“数据集”或“OBS目录”。设置为“数据集”时,需填写“数据集名称”和“数据集版本”;设置为“OBS目录”时,需填写正确的OBS路径。 图2 输入输出设置-数据集 图3 输入输出设置-OBS目录 确认参数填写无误后,单击“创建”,完成数据处理任务的创建。
需根据实际数据情况选择“数据集”或“OBS目录”。设置为“数据集”时,需填写“数据集名称”和“数据集版本”;设置为“OBS目录”时,需填写正确的OBS路径。 图3 输入输出设置-数据集 图4 输入输出设置-OBS目录 确认参数填写无误后,单击“创建”,完成数据处理任务的创建。
原因分析 针对已发布的数据集,其对应的OBS目录下,发生了数据变化,如删除图片,导致此Manifest文件与当前OBS目录下的数据情况不符。使用此Manifest文件再次导入时,出现错误。
随后,通过Notebook将OBS中的数据上传至SFS Turbo,并对存储在SFS Turbo中的数据执行编辑操作。 预训练 预训练 介绍如何进行预训练,包括训练数据处理、超参配置、创建训练任务及性能查看。
模板输入 存储在OBS上的PyTorch模型包,确保您使用的OBS目录与ModelArts在同一区域。模型包的要求请参见模型包示例。 对应的输入输出模式 未定义模式,可覆盖,即创建模型时支持选择其他输入输出模式。 模型包规范 模型包必须存储在OBS中,且必须以“model”命名。
模板输入 存储在OBS上的PyTorch模型包,确保您使用的OBS目录与ModelArts在同一区域。模型包的要求请参见模型包示例。 对应的输入输出模式 未定义模式,可覆盖,即创建模型时支持选择其他输入输出模式。 模型包规范 模型包必须存储在OBS中,且必须以“model”命名。
模板输入 存储在OBS上的Caffe模型包,确保您使用的OBS目录与ModelArts在同一区域。模型包的要求请参见模型包示例。 对应的输入输出模式 未定义模式,可覆盖,即创建模型时支持选择其他输入输出模式。 模型包规范 模型包必须存储在OBS中,且必须以“model”命名。
删除存储到OBS中的数据及OBS桶。 Workflow:停止因运行Workflow作业而创建的训练作业和在线服务。删除存储到OBS中的数据及OBS桶。 开发环境(Notebook):删除Notebook实例。删除存储到OBS中的数据及OBS桶。
上传镜像 请参考上传镜像。 父主题: 多机多卡
重装的包与镜像装CUDA版本不匹配 问题现象 在现有镜像基础上,重新装了引擎版本,或者编译了新的CUDA包,出现如下错误: 1.“RuntimeError: cuda runtime error (11) : invalid argument at /pytorch/aten/src
训练作业日志中提示 “AttributeError: module '***' has no attribute '***'” 问题现象 训练日志中出现AttributeError: module '***' has no attribute '***'错误。如:AttributeError
模型的configuration包含了构建模型所需的所有信息的对象,需要尽可能完整。
创建训练作业提示错误码ModelArts.2763 问题现象 创建训练作业时,提示ModelArts.2763 : 选择的支持实例无效,请检查请求中信息的合法性。 原因分析 用户选择的训练规格资源和算法不匹配。 例如:算法支持的是GPU规格,创建训练作业时选择了ASCEND规格的资源类型
Pytorch1.0引擎提示“RuntimeError: std::exception” 问题现象 在使用pytorch1.0镜像时,必现如下报错: “RuntimeError: std::exception” 原因分析 pytorch1.0镜像中的libmkldnn软连接与原生torch
购买DevServer资源时如果无可选资源规格,需要联系华为云技术支持申请开通。 当容器需要提供服务给多个用户,或者多个用户共享使用该容器时,应限制容器访问Openstack的管理地址(169.254.169.254),以防止容器获取宿主机的元数据。
Dataset session = Session() Dataset.delete_dataset(session, dataset_id="68ZXdK6CZwgvUICOOdC") 参数说明 表1 请求参数 参数 是否必选 参数类型 描述 session 是 Object 会话对象
日志提示“Please upgrade numpy to >= xxx to use this pandas version” 问题现象 在安装其他包的时候,有依赖冲突,对numpy库有其他要求,但是发现numpy卸载不了。出现如下类似错误: your numpy version
AI应用管理 使用从训练或者从OBS中选择创建AI应用,推荐用户使用动态加载的方式导入,动态加载实现了模型和镜像的解耦,便于进行模型资产的保护。用户需要及时更新AI应用的相关依赖包,解决开源或者第三方包的漏洞。AI应用相关的敏感信息,需要解耦开,在“在线服务”部署时进行相应配置。
{"key": "name", "operator": "like", "value": ["trainjob"]}]) print(job_list) 参数说明 表1 get_job_list请求参数说明 参数 是否必选 参数类型 描述 session 是 Object 会话对象
两个参数填写的均是OBS路径。 “数据集输入位置”即原始数据存储的OBS路径。 “数据集输出位置”,指在ModelArts完成数据标注后,执行数据集发布操作后,在此指定路径下,按数据集版本,生成相关目录。包含ModelArts中使用的Manifest文件(包含数据及标注信息)。