搜索_华为云

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

可纠正ECC错误（单比特ECC错误），不影响业务。观测方式：nvidia-smi -a中查询到Volatile Correctable记录。 L2: 不可纠正ECC错误（多比特ECC错误），当次业务受损，重启进程可恢复。观测方式：nvidia-smi -a中查询到Volatile Uncorrectable记录。 L3:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
计算规格说明 - AI开发平台ModelArts

仍未支付欠款，那么付费资源（如计算规格、OBS桶）、等都将被冻结，资源进入保留期。保留期的资源不支持任何操作。如果用户在宽限期内充值，则华为云会自动扣取欠费金额（含宽限期内产生的费用）保留期到期时仍未支付欠款（含宽限期内产生的费用），则付费资源将释放，数据无法恢复。宽限期和保留期的详细规则请参见宽限期保留期。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
训练作业卡死检测 - AI开发平台ModelArts

tch-norm以后，每一个iter里面每个batch-norm层都要做同步，通信量很大，而且要所有节点同步。解决方案2 关掉sync-batch-norm，或者升pytorch版本，升级pytorch到1.10。问题现象3 作业卡在tensorboard中，出现报错： writer

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
推理业务迁移评估表 - AI开发平台ModelArts

性能预期：QPS 20/s - 业务访问方式推理业务访问：“客户端 -> 云服务” 或 “云客户端 -> 云服务”。推理业务时延要求，客户端到云服务端到端可接受时延。例如：当前是“客户端 -> 云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Lite Cluster资源开通 - AI开发平台ModelArts

授权允许ModelArts代表用户去访问其他云服务。进入到ModelArts控制台的“权限管理”页面，单击“添加授权”，根据提示进行操作。更新委托如果之前给ModelArts创过委托授权，此处可以更新授权。进入到ModelArts控制台的“资源管理>AI专属资源池>弹性集群Cluster

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

查询DevServer实例详情查询DevServer实例详情。删除DevServer实例删除DevServer实例。实时同步用户所有DevServer实例状态实时同步用户所有DevServer实例状态。启动DevServer实例启动DevServer实例。停止DevServer实例

 帮助中心 > AI开发平台ModelArts > API参考
ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

员非法调用。所以在预测请求的header信息中包含的是调用者的身份信息，在body部分是需要进行预测的内容。 header的部分需要按照华为云的相关机制进行认证，body部分需要根据模型的要求如前处理脚本的要求，如自定义镜像的要求进行输入。处理方法 Header：在调用指南页

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

折扣以及促销优惠等减免的金额。基于官网价的优惠金额。抹零金额华为云产品定价精度为小数点后8位（单位：元），因此在计费过程中会产生小数点后8位的资源使用费用。而在实际扣费时，仅扣除到小数点后2位，小数点后第3位到第8位部分金额会被舍弃，这种舍弃部分的金额称作抹零金额。以第一个计费周期为例，抹零金额为：0

帮助中心 > AI开发平台ModelArts > 计费说明
AI Gallery简介 - AI开发平台ModelArts

Gallery使用限制目前自动学习产生的模型暂不支持发布到AI Gallery。订阅或购买主要是获取AI资产的使用配额和使用权，支持在配额定义的约束下，有限地使用AI资产。使用AI资产时，可能需要消耗硬件资源，硬件资源费用将根据实际使用情况，由华为云ModelArts等管理控制台向使用方收取。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
依赖和委托 - AI开发平台ModelArts

用户在使用ModelArts服务的过程中，为了简化用户的操作，ModelArts后台可以代替用户完成一些工作，如训练作业启动前自动下载用户OBS桶中的数据集到作业空间、自动转储训练作业日志到用户OBS桶中。 ModelArts服务不会保存用户的Token认证凭据，在后台异步作业中操作用户的资源（如OBS桶）前，需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

获取ModelArts终端节点服务地址购买连接ModelArts终端节点创建DNS内网域名 VPC访问在线服务提交工单，提供账号ID给华为云技术支持，用于获取ModelArts终端节点服务地址。购买连接ModelArts终端节点登录虚拟私有云（VPC）管理控制台，单击左侧导航栏中的“VPC

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

Miniconda3 (python 3.7.13) 安装文件到基础容器镜像中的 /tmp 目录 COPY Miniconda3-py37_4.12.0-Linux-x86_64.sh /tmp # 安装 Miniconda3 到基础容器镜像的 /home/ma-user/miniconda3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
VS Code ToolKit连接Notebook - AI开发平台ModelArts

Settings”，配置用户登录信息。图6 登录插件输入如下用户登录信息，单击“登录”。 Name：自定义用户名，仅用于VS Code页面展示，不与任何华为云用户关联。 AK、SK：在“账号中心 > 我的凭证 > 访问密钥”中创建访问密钥，获取AK、SK（参考链接）。选择站点：此处的站点必须和

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
模型的自定义镜像制作流程 - AI开发平台ModelArts

镜像用于推理。图3 模型的自定义镜像制作场景三约束限制自定义镜像中不能包含恶意代码。创建模型的自定义镜像大小不超过50GB。对于同步请求模式的模型，如果预测请求时延超过60s，会造成请求失败，甚至会有服务业务中断的风险，预测请求时延超过60s时，建议制作异步请求模式的模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
修改训练作业优先级 - AI开发平台ModelArts

给子账号配置"设置作业为高优先级"权限默认用户权限可选择优先级1和2，配置了"设置作业为高优先级"权限的用户可选择优先级1~3。使用主用户账号登录华为云的管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。在统一身份认证服务页面的左侧导航选择“权限管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
更新Notebook实例 - AI开发平台ModelArts

原来已经建立的链接依然有效，当链接关闭后失效；新打开建立的链接只允许当前设置的IP进行访问。此处的IP地址，请填写外网IP地址。如果用户使用的访问机器和华为云ModelArts服务的网络有隔离，则访问机器的外网地址需要在主流搜索引擎中搜索“IP地址查询”获取，而不是使用ipconfig或ifconfig/ip命令在本地查询。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

服务实例只能调度到指定节点，指定节点不存在则失败。preferred表示弱亲和，服务实例倾向于调度到指定节点，指定节点不满足调度条件，则会调度到其他节点。 pool_infos 否 Array of AffinityPoolInfo objects 配置亲和策略到指定的集群，并指定集群的节点。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
切换Lite Server服务器操作系统 - AI开发平台ModelArts

当前裸金属服务器状态为停止状态。目标操作系统必须是该Region下的IMS公共镜像或者私有共享镜像。在BMS控制台切换操作系统获取操作系统镜像。由华为云官方提供给客户操作系统镜像，在IMS镜像服务的共享镜像处进行接收即可，参考如下图操作。图1 共享镜像切换操作系统。对Lite Ser

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

--Dockerfile --test_app.py “Dockerfile” From ubuntu:18.04 # 配置华为云的源，安装 python、python3-pip 和 Flask RUN cp -a /etc/apt/sources.list /etc/apt/sources

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
Lite Server使用流程 - AI开发平台ModelArts

用。首先请联系客户经理确认Server资源方案，部分规格为受限规格，因此需要申请开通您所需的资源规格。 Server所需资源可能会超出华为云默认提供的资源配额（如ECS、EIP、SFS），因此需要提交工单提升资源配额。为子用户账号开通Server功能所需的基础权限。由于Mo

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读

总条数： 770

上一页
1
...
34
35
36
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

ModelArts在线服务处于运行中时，如何填写request header和request body？ - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

更新Notebook实例 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

Lite Server使用流程 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线