检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建导出任务 将当前数据集的样本导出到指定的OBS路径下。仅支持图像分类、物体检测、图像分割和自由格式数据集。 dataset.export_data(path) 示例代码 导出数据集到OBS目录 from modelarts.session import Session from
创建和保存Pascal VOC文件 需要先创建包含Pascal VOC信息的对象,然后保存。Pascal VOC信息请见表2。路径支持本地和OBS,如果是OBS,需要Session信息。 pascal_voc.save_xml(xml_file_path, save_mode='w'
为AppStage开发中心添加使用人员 开发中心的用户数根据购买规格有相应的用户数量限制,组织管理员通过用户的添加或删除来合理管理开发中心的使用人员。 操作须知 组织管理员可将组织中的任一用户添加为开发中心用户,已添加的用户不可重复添加。 添加至开发中心“用户管理”中的用户称为开
总览Workflow工作流 功能介绍 获取Workflow工作流统计信息。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{proje
删除Workflow工作流 功能介绍 通过ID删除Workflow工作流。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI DELETE /v2/{pr
查询训练作业指定任务的运行指标 功能介绍 查询训练作业指定任务的运行指标。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/
查询Workflow待办事项 功能介绍 获取Workflow待办列表。 接口约束 无 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project
查询样本列表 功能介绍 分页查询样本列表。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datasets/{datase
向标注成员发送邮件 功能介绍 向标注成员发送邮件。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/datasets/{d
AppStage用户申请权限 当用户权限无法满足需求时,可提交权限申请由相应审批人审批同意后,拥有相应操作权限。用户如需访问AppStage的AI原生应用引擎、开发中心、运维中心等各中心则需分别申请相应中心的角色权限。 申请权限 登录AppStage首页。 支持租户管理员(华为账
日志文件的大小达到限制 问题现象 ModelArts训练作业在运行过程中报错,提示日志文件的大小已达到限制: modelarts-pope: log length overflow(max:1073741824; already: 107341771; new:90), process
训练作业进程异常退出 问题现象 训练作业运行失败,日志中出现如下类似报错: [Modelarts Service Log]Training end with return code: 137 原因分析 日志显示训练进程的退出码为137。训练进程表示用户的代码启动后的进程,所以这里
日志提示"write line error" 问题现象 在程序运行过程中,刷出大量错误日志“[ModelArts Service Log]modelarts-pipe: write line error”。并且问题是必现问题,每次运行到同一地方的时候,出现错误。 原因分析 出现该问题的可能原因如下:
日志提示“no socket interface found” 问题现象 在pytorch镜像运行分布式作业时,设置NCCL日志级别,代码如下: import os os.environ["NCCL_DEBUG"] = "INFO" 会出现如下错误: job0879f61e-jo
OOM导致训练作业失败 问题现象 因为OOM导致的训练作业失败,会有如下几种现象。 错误码返回137,如下图所示。 Modelarts Service Log Trainina end with return code: 137 Modelarts Service Log]handle
日志提示“No module name 'unidecode'” 问题现象 从mindspore开源gitee中master分支下载的tacotron2模型,修改配置文件后上传ModelArts准备训练,日志报错提示:No module name 'unidecode'。 原因分析
移除已纳管基础资源 如果不再使用环境下纳管的基础资源(除了CCE集群资源),可以将其移除。 如需移除Kubernetes类型环境下的CCE集群资源,请参考解绑CCE集群。 使用限制 移除环境下纳管的基础资源,会导致使用该环境部署组件时,无法选择使用已被移除的基础资源。 前提条件
查看容器日志 ServiceStage支持您查看容器部署方式部署组件的容器日志,用于排查和解决组件运行中出现的问题。 查看容器日志 登录ServiceStage控制台。 选择以下任意方式进入组件“日志”页面: 在“应用管理”页面,单击组件所属应用名称,在“组件列表”单击待操作组件名称,在左侧导航栏选择“运维
删除仓库授权 本章节指导您删除不再使用的仓库授权。仓库授权删除后: 可能会导致使用容器部署方式基于源码构建创建并部署的组件,升级单个组件版本配置、批量升级组件版本配置时失败。 也可能会导致源码构建任务启动构建任务时失败。 前提条件 待删除仓库授权已创建,请参考创建仓库授权。 删除仓库授权
管理镜像 获取镜像下载地址 登录ServiceStage控制台。 选择“部署源管理 > 镜像仓库 > 我的镜像”。 在“仓库组织管理”右侧下拉列表框,选择组织。 在镜像仓库列表,单击镜像仓库名称,进入镜像仓库详情页。 在“镜像版本”页签,可以获取镜像版本下载指令。 单击待下载镜像