检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
所能使用的ModelArts功能、资源不同 希望了解ModelArts的权限控制能力细节,期望理解其概念和实操方法 ModelArts的大部分权限管理能力均基于统一身份认证服务(Identity and Access Management,简称IAM)来实现,在您继续往下阅读之前
入“DELETE”后单击“确认”,可删除此用户的授权。删除生效后,此用户将无法继续使用ModelArts的相关功能。 批量清空所有授权 在“权限管理”页面,单击授权列表上方的“清空授权”,输入“DELETE”后单击“确认”,可删除当前账号下的所有授权。删除生效后,此账号及其所有I
自定义镜像的功能,即选择预置框架名称后,在预置框架版本下拉列表中选择“自定义”。 此功能与直接基于预置框架创建算法的区别仅在于,镜像是由用户自行选择的。用户可以基于预置框架制作自定义镜像。基于预置框架制作自定义镜像可参考使用基础镜像构建新的训练镜像章节。 完全自定义镜像: 订阅算法和预置框架涵盖了大部分的训练
规则,对协议为TCP、源地址为0.0.0.0/0、端口为8080的请求放行。 否 str cluster_id 专属资源池ID,默认为空,不使用专属资源池。使用专属资源池部署服务时需确保集群状态正常;配置此参数后,则使用集群的网络配置,vpc_id参数不生效;与下方real-time
际时间为准。 获取路径:Support-E,在此路径中查找下载ModelArts 6.3.910 版本。 说明: 如果上述软件获取路径打开后未显示相应的软件信息,说明您没有下载权限,请联系您所在企业的华为方技术支持下载获取。 基础镜像 西南-贵阳一: swr.cn-southwest-2
用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。 execution_id 是 String 工作流执行ID。 请求参数 无 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 created_at String 创建时间。 name
docker logs -f 39c9ceedb1f6 一般在做推理镜像时,部分日志是直接存储在容器内部的,所以需要进入容器看日志。注意:重点对应日志中是否有ERROR(包括,容器启动时、API执行时)。 牵扯部分文件用户组不一致的情况,可以在宿主机用root权限执行命令进行修改 docker
本地运行的启动方式: init_or_rescheduled:代表本次启动为被调度后的首次运行,包括初次启动及调度恢复后的运行。 restarted:代表本次启动非被调度后的首次运行,为进程重启后的运行。 end_reason String 本次运行结束原因。 end_related_task
而NVIDIA驱动程序需要使用这些函数来解析当前正在运行的内核和其他相关信息。 安装过程中的提示均选OK或YES,安装好后执行reboot重启机器,再次登录后执行命令查看GPU卡信息。 nvidia-smi -pm 1 #该命令执行时间较长,请耐心等待,作用为启用持久模式
00条,否则会导入失败。 说明: 为保证数据安全,请勿输入敏感信息,例如明文密码。 自动重启 - 打开开关后,可以设置重启次数和是否启用无条件自动重启。 打开自动重启开关后,当由于环境问题导致训练作业异常时,系统将自动修复异常或隔离节点,并重启训练作业,提高训练成功率。为了避免丢
iam:tokens:assume 使用委托获取用户临时认证凭据(必需) 基本功能 BSS bss:balance:view 在ModelArts控制台创建资源后,页面展示账号当前余额 表2 管理工作空间 业务场景 依赖的服务 依赖策略项 支持的功能 工作空间 IAM iam:users:listUsers
node_rank:当前节点的编号。 log_dir:msrun组网和各个进程的日志输出地址。 join:训练进程拉起后,msrun进程是否仍存在,默认配置为“True”,等待所有进程退出后再退出。 cluster_time_out:集群组网超时时间,默认是“600s”,可通过环境变量“MSR
可。 使用PyCharm ToolKit连接Notebook 本地IDE(VS Code) 当用户创建完成支持SSH的Notebook实例后,使用VS Code的开发者可以通过以下三种方式连接到开发环境中:VS Code一键连接Notebook、VS Code ToolKit连接Notebook、VS
String 排序的方式。该字段必须与sort_by同时使用。 缺省值: desc 枚举值: asc:表示升序排列, desc:降序排列。 请求参数 无 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 total Integer 总数。 count Integer
本地运行的启动方式: init_or_rescheduled:代表本次启动为被调度后的首次运行,包括初次启动及调度恢复后的运行。 restarted:代表本次启动非被调度后的首次运行,为进程重启后的运行。 end_reason String 本次运行结束原因。 end_related_task
的apis字段读取所配置的推理接口信息。 表3 params结构 参数 是否必选 参数类型 描述 url 是 String 模型推理接口的请求路径。 param_name 是 String 参数名,不超过64个字符。 param_type 是 String JSON Schema
data_sources=data_sources, work_path=work_path, schema=schemas) 参数说明 表1 请求参数 参数 是否必选 参数类型 描述 session 是 Object 会话对象,初始化方法请参见Session鉴权。 dataset_name
方式二:根据创建训练作业生成的训练作业对象终止。 job_instance.control_job() 参数说明 表1 control_job_by_id请求参数说明 参数 是否必选 参数类型 描述 session 是 Object 会话对象,初始化方法请参考Session鉴权。 job_id 是
job_info = job_instance.get_job_info() print(job_info) 参数说明 表1 Estimator请求参数说明 参数 是否必选 参数类型 描述 session 是 Object 会话对象,初始化方法请参考Session鉴权。 job_id 是
"like", "value": ["trainjob"]}]) print(job_list) 参数说明 表1 get_job_list请求参数说明 参数 是否必选 参数类型 描述 session 是 Object 会话对象,初始化方法请参考Session鉴权。 offset 否