搜索_华为云

设置断点续训练 - AI开发平台ModelArts

设置断点续训练什么是断点续训练断点续训练是指因为某些原因（例如容错重启、资源抢占、作业卡死等）导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。 checkp

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

如果您需要为企业中的员工设置不同的权限访问ModelArts资源，以达到不同员工之间的权限隔离，您可以使用统一身份认证服务（Identity and Access Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
创建训练任务 - AI开发平台ModelArts

创建训练任务针对专属池场景，应注意挂载的目录设置和调试时一致。登录ModelArts管理控制台，检查当前帐号是否已完成访问授权的配置。如果未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
设置在线服务故障自动重启 - AI开发平台ModelArts

设置在线服务故障自动重启场景描述当系统检测到Snt9b硬件故障时，自动复位Snt9B芯片并重启推理在线服务，提升了推理在线服务的恢复速度。约束限制仅支持使用Snt9b资源的同步在线服务。只支持针对整节点资源复位，请确保部署的在线服务为8*N卡规格，请谨慎评估对部署在该节点的其他服务的影响。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

credential：访问密钥（AK/SK） content 是 String 授权内容。当授权类型是委托，该字段为委托名称。当授权类型是访问密钥，该字段为访问密钥ID（AK）。 secret_key 否 String 秘密访问密钥（SK）。仅当授权类型为访问密钥时，需要该字段。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
训练作业 - AI开发平台ModelArts
训练作业 - AI开发平台ModelArts

训练作业 OBS操作相关故障云上迁移适配故障硬盘限制故障外网访问限制权限问题 GPU相关问题业务代码问题预置算法运行故障训练作业运行失败专属资源池创建训练作业训练作业性能问题 Ascend相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除
用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

myhuaweicloud.com。原因分析在Notebook中访问公网需要通过代理，访问huawei.com不通过公网代理，huaweicloud.com域名在no_proxy/NO_PROXY中包含，就访问不了。解决方式执行以下命令查看在no_proxy/NO_PROXY中是否包含huaweicloud

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
VS Code中设置远端默认安装的插件 - AI开发平台ModelArts

VS Code中设置远端默认安装的插件在VS Code的配置文件settings.json中添加remote.SSH.defaultExtensions参数，如自动安装Python和Maven插件，可配置如下。 "remote.SSH.defaultExtensions": [

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code使用技巧
工作空间 - AI开发平台ModelArts
工作空间 - AI开发平台ModelArts

便于管理和使用。工作空间支持3种访问控制： PUBLIC：租户（主账号和所有子账号）内部公开访问。 PRIVATE：仅创建者和主账号可访问。 INTERNAL：创建者、主账号、指定IAM子账号可访问当授权类型为INTERNAL时需要指定可访问的子账号的账号名，可选择多个。每个

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错问题现象 ModelArts SDK在OBS下载文件时，目标路径设置为文件名，在本地IDE运行不报错，部署为在线服务时报错。代码如下： session.obs.download_file（obs_path,

帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
管理AI Gallery镜像 - AI开发平台ModelArts

资产发布上架后，准确、完整的资产介绍有助于提升资产的排序位置和访问量，能更好的支撑用户使用该资产。在镜像详情页，选择“镜像介绍”页签，单击右侧“编辑介绍”。编辑镜像基础设置和镜像描述。表1 镜像介绍的参数说明参数名称说明基础设置中文名称显示镜像的名称，不可编辑。 README

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ - AI开发平台ModelArts

AI引擎Scikit_Learn0.18.1的运行环境怎么设置？在ModelArts的算法管理页面，创建算法时勾选“显示旧版镜像”，选择XGBoost-Sklearn引擎即可。 ModelArts创建算法操作请参见创建算法。 ModelArts创建训练作业操作请参见创建训练作业。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
管理AI Gallery模型 - AI开发平台ModelArts

资产发布上架后，准确、完整的资产介绍有助于提升资产的排序位置和访问量，能更好的支撑用户使用该资产。在模型详情页，选择“模型介绍”页签，单击右侧“编辑介绍”。编辑模型基础设置和模型描述。表1 模型介绍的参数说明参数名称说明基础设置中文名称显示模型的名称，不可编辑。许可证模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
自动学习中偏好设置的各参数训练速度大概是多少 - AI开发平台ModelArts

自动学习中偏好设置的各参数训练速度大概是多少偏好设置中： performance_first：性能优先，训练时间较短，模型较小。对于TXT、图片类训练速度为10毫秒。 balance：平衡。对于TXT、图片类训练速度为14毫秒。 accuracy_first：精度优先，训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 模型训练
推理精度测试 - AI开发平台ModelArts

max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行human_eval等生成式回答（生成式回答是对整体进行评测，少一个字符就可能会导致判断错误）时，max_out_len设置建议长一些，比如512，至少包含第一个回答的全部字段。 batc

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ ModelArts训练平台预置了部分NCCL环境变量，如表1所示。这些环境变量建议保持默认值。表1 预置的环境变量环境变量说明 NCCL_SOCKET_IFNAME 指定通信的网卡名称。 NCCL_IB_GID_INDEX 系统设置的默认值为3，表示使用RoCE

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
管理AI Gallery数据集 - AI开发平台ModelArts

选择数据集支持用于什么类型的训练模型。运行平台选择数据集额外支持的运行平台。设置运行平台后，当资产上架后，该资产支持通过订阅的方式同步到所选运行平台使用。设置运行平台后，单击“设置”，在弹窗中可以自定义设置运行平台的资产标签，且标签可以被一起同步至运行平台。数据集描述 - 资产

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
推理精度测试 - AI开发平台ModelArts

host：与起服务的host保持一致，比如起服务为0.0.0.0,host设置也为0.0.0.0。 service_port：服务端口，与启动服务时的端口保持，比如8080。 max_out_len：在运行类似mmlu、ceval等判别式回答时，max_out_len建议设置小一些，比如16。在运行human_ev

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
通过SSH工具远程使用Notebook - AI开发平台ModelArts

前提条件创建一个Notebook实例，并开启远程SSH开发，配置远程访问IP白名单。该实例状态必须处于“运行中”，具体参见创建Notebook实例章节。在Notebook实例详情页面获取开发环境访问地址（例如：dev-modelarts-cnnorth4.huaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
用户AK-SK认证模式 - AI开发平台ModelArts

在“我的凭证 > 访问密钥”中，单击“新增访问密钥”。在“新增访问密钥”弹窗中，填写该密钥的描述说明，单击“确定”。根据提示单击“立即下载”，下载密钥。密钥文件会直接保存到浏览器默认的下载文件夹中，文件名为“credentials.csv”，可打开文件查看访问密钥（Access

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权

总条数： 998

上一页
1
2
3
4
5
...
50
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

设置断点续训练 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

设置在线服务故障自动重启 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

训练作业 - AI开发平台ModelArts

用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

VS Code中设置远端默认安装的插件 - AI开发平台ModelArts

工作空间 - AI开发平台ModelArts

ModelArts SDK下载文件目标路径设置为文件名，部署服务时报错 - AI开发平台ModelArts

管理AI Gallery镜像 - AI开发平台ModelArts

AI引擎Scikit_Learn0.18.1的运行环境怎么设置？ - AI开发平台ModelArts

管理AI Gallery模型 - AI开发平台ModelArts

自动学习中偏好设置的各参数训练速度大概是多少 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

通过SSH工具远程使用Notebook - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线