搜索_华为云

修复Standard专属资源池故障节点 - AI开发平台ModelArts

启节点操作。当资源池处于驱动升级状态时，该资源池无法进行重启节点操作。节点重启成功后，可能出现短暂不可用现象，是正在拉起业务服务及健康检查，请耐心等待。删除/退订节点：如果是“按需计费”的资源池，您可单击操作列的“删除”，即可实现对单个节点的资源释放。如果想批量删除节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
启动推理服务 - AI开发平台ModelArts

查看卡IP，在其中一个宿主机上执行。 for i in $(seq 0 7);do hccn_tool -i $i -ip -g;done 检查卡之间的网络是否通。 # 在另一个机器上执行，29.81.3.172是上一步输出的ipaddr的值 hccn_tool -i 0 -ping

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
批量添加样本 - AI开发平台ModelArts

MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name 否 String 导入表格数据集，数据库名字。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

如何在ModelArts的Notebook中构建一个新镜像并用于模型部署。登录ModelArts控制台，在左侧导航栏中选择“全局配置”，检查是否配置了访问授权。如果未配置，请先配置访问授权。参考使用委托授权完成操作。登录ModelArts控制台，在左侧导航栏中选择“开发环境 >

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
查询数据集详情 - AI开发平台ModelArts

String MRS集群ID。可登录MRS控制台查看。 cluster_mode String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name String MRS集群名称。可登录MRS控制台查看。 database_name String 导入表格数据集，数据库名字。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
启动智能任务 - AI开发平台ModelArts

是否必选参数类型描述 envs 否 Map<String,String> 运行模型需要的环境变量键值对，可选填，默认为空。为确保您的数据安全，在环境变量中，请勿输入敏感信息。 instance_count 否 Integer 模型部署的实例数，即计算节点的个数。 model_id

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

7 Ubuntu20.04.6可能有兼容性问题，请优先使用低于该版本的操作系统。不满足以上镜像规范，所制作的镜像使用可能会出现故障，请用户检查镜像规范，并参考Notebook自定义镜像故障基础排查自行排查，如未解决请联系华为技术工程师协助解决。操作流程准备一台Linux环境，这里以ECS为例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

专业版。使用PyCharm ToolKit提交训练作业，社区版和专业版都支持。已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。已创建当前使用账号的访问密钥，并获得对应的AK和SK。如果未创建，请参见创建访问密钥（AK和SK）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
获取智能任务的信息 - AI开发平台ModelArts

InfConfig 参数参数类型描述 envs Map<String,String> 运行模型需要的环境变量键值对，可选填，默认为空。为确保您的数据安全，在环境变量中，请勿输入敏感信息。 instance_count Integer 模型部署的实例数，即计算节点的个数。 model_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

待。当Notebook状态变为“运行中”时，表示Notebook已创建并启动完成。如果创建Notebook启动失败，建议参考调试要点进行检查。在Notebook列表，单击实例名称，进入实例详情页，查看Notebook实例配置信息。挂载OBS并行文件系统：在Notebook实

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
查询数据集列表 - AI开发平台ModelArts

String MRS集群ID。可登录MRS控制台查看。 cluster_mode String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name String MRS集群名称。可登录MRS控制台查看。 database_name String 导入表格数据集，数据库名字。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
依赖和委托 - AI开发平台ModelArts

越权的问题。为了控制委托授权的越权风险，ModelArts服务的权限管理功能要求只有租户管理员才能为用户配置委托，由管理员保证委托授权的安全性。委托授权的最小化管理员在配置委托授权时，应严格控制授权的范围。 ModelArts为用户异步自动化完成作业的准备、清理等操作，所需

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
分页查询智能任务列表 - AI开发平台ModelArts

InfConfig 参数参数类型描述 envs Map<String,String> 运行模型需要的环境变量键值对，可选填，默认为空。为确保您的数据安全，在环境变量中，请勿输入敏感信息。 instance_count Integer 模型部署的实例数，即计算节点的个数。 model_id String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
部署推理服务 - AI开发平台ModelArts

创建pod 在节点自定义目录${node_path}下执行如下命令创建pod。 kubectl apply -f config.yaml 检查pod启动情况，执行下述命令。如果显示“1/1 running”状态代表启动成功。 kubectl get pod -A 图1 启动pod成功

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

/cuda_11.7.1_515.65.01_linux.run --toolkit --samples --silent 安装好后执行以下命令检查安装结果： /usr/local/cuda/bin/nvcc -V PyTorch2.0安装和CUDA验证指南。 PyTorch2.0所需环境为Python3

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
创建Notebook实例 - AI开发平台ModelArts

一个账户最多创建10个Notebook。创建Notebook实例登录ModelArts管理控制台，在左侧导航栏中选择“权限管理”，检查是否配置了访问授权。如果未配置，请先配置访问授权。参考使用委托授权完成操作。图1 查看委托配置信息登录ModelArts管理控制台，在左侧导航栏中选择“开发空间

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

book调试（Notebook调试方法与使用Notebook进行代码调试相同）。创建多机多卡训练作业登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

Notebook中调试完后，如果镜像有修改，可以保存镜像用于后续训练，具体操作请参见保存Notebook镜像环境。创建单机多卡训练作业登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如果未完成，请参考使用委托授权针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
PD分离部署使用说明 - AI开发平台ModelArts

8089；端口设置顺序必须与global rank table文件中各全量和增量节点顺序一致，否则会报错。确保scheduler实例和P、D实例之间网络通畅，检查代理设置例如no_proxy环境变量，避免scheduler访问P、D实例时走不必要的网关。前提条件已完成推理环境镜像制作，具体参见准备推理环境。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
部署推理服务 - AI开发平台ModelArts

创建pod 在节点自定义目录${node_path}下执行如下命令创建pod。 kubectl apply -f config.yaml 检查pod启动情况，执行下述命令。如果显示“1/1 running”状态代表启动成功。 kubectl get pod -A 图1 启动pod成功

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

总条数： 542

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修复Standard专属资源池故障节点 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

批量添加样本 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

查询数据集详情 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机单卡训练作业 - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

分页查询智能任务列表 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线