搜索_华为云

创建Notebook实例 - AI开发平台ModelArts

String EFS专属存储盘uri，只有当category为EFS，同时ownership为DEDICATED时必填。登录弹性文件服务控制台，在文件系统列表中，单击文件系统名称进入详情页。其中，“共享路径”即为此参数的参数值。 id 否 String EFS专属存储盘ID，只有当cat

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

env。在Notebook的Terminal中执行如下命令。其中，my-env是虚拟环境名称，用户可自定义。conda详细参数可参考conda官网。 conda create --quiet --yes -n my-env python=3.6.5 创建完成后，执行conda info

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

不同的计费模式的消费情况。此案例中的单价仅为示例，且计算出的费用为估算值。单价的变动和实际场景中计算出来的费用可能会有偏差。请以华为云官网发布的数据为准。在使用ModelArts进行AI开发时，会将数据保存至OBS、EVS或SFS中，此时会产生单独的存储计费，具体费用以OBS、EVS和SFS的计费标准为准。

帮助中心 > AI开发平台ModelArts > 计费说明
使用CES监控Lite Server资源 - AI开发平台ModelArts

instance_id，npu Snt9B Snt9C 40 npu_network_port_link_status NPU网口link状态 NPU卡的对应网口link状态 - 0：UP 1：DOWN instance_id，npu 41 npu_roce_tx_rate NPU网卡上行速率

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

使用自定义镜像训练模型时，训练作业在容器中的挂载点参考如表2所示。表2 训练作业挂载点介绍挂载点是否只读备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache 否

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
配置Lite Server网络 - AI开发平台ModelArts

公网端口：建议选择区间为20000-30000，保证该端口号不冲突。实例类型：单击“服务器”，选择Server服务器。网卡：选择服务器网卡。。私网端口：端口号22。单击“确定”。父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
创建开发环境实例 - AI开发平台ModelArts

名（当前CCE不支持挂载子目录）。如果type为“evs”类型，该值不需要填写。 volume_size 否 Integer EVS存储盘大小，最小为5GB，最大为4096GB，缺省值为5GB；如果type为OBS类型，该值不需要填写。 mount_path 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
启动推理服务 - AI开发平台ModelArts

"ignore_eos": false, "stream": false }' 服务的API与vLLM官网相同，此处介绍关键参数。详细参数解释请参见官网https://docs.vllm.ai/en/stable/dev/sampling_params.html。 e

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

基础镜像一般选用“ubuntu 18.04”的官方镜像，或者nvidia官方提供的带cuda驱动的镜像。相关镜像直接到dockerhub官网查找即可。构建流程：安装所需的apt包、驱动，配置ma-user用户、导入conda环境、配置Notebook依赖。推荐使用Docker

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

模型训练中的精度问题。支持精度预检，可扫描训练模型中的所有API进行API复现，给出精度情况的诊断和分析。精度比对，对PyTorch整网API粒度的数据dump、精度比对，进而定位训练场景下的精度问题支持溢出检测功能，判断是否存在输入正常但输出存在溢出的API，从而判断是否为正常溢出。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

"use_beam_search":true, "best_of":2, "length_penalty":2 }' 服务的API与vLLM官网相同，此处介绍关键参数。详细参数解释请参见官网https://docs.vllm.ai/en/stable/dev/sampling_params.html。表1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
使用AWQ量化 - AI开发平台ModelArts

co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step3 权重格式离线转换（可选）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

kps:domainKeypairs:list kps:domainKeypairs:createkmskey KMS kms:cmk:list 挂载SFS Turbo盘 SFS Turbo SFS Turbo FullAccess 子账号对SFS目录的读写操作权限。专属池Notebook实例挂载SFS（公共

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
部署推理服务 - AI开发平台ModelArts

"use_beam_search":true, "best_of":2, "length_penalty":2 }' 服务的API与vLLM官网相同，此处介绍关键参数。详细参数解释请参见官网https://docs.vllm.ai/en/stable/dev/sampling_params.html。表1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

"use_beam_search":true, "best_of":2, "length_penalty":2 }' 服务的API与vLLM官网相同，此处介绍关键参数。详细参数解释请参见官网https://docs.vllm.ai/en/stable/dev/sampling_params.html。表1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
使用AWQ量化 - AI开发平台ModelArts

co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step3 权重格式离线转换（可选）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。 Step3 权重格式离线转换（可选）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

参考线下容器镜像构建及调试章节，构建容器镜像并调试，镜像构建及调试与单机单卡相同。上传镜像，参考单机单卡训练的上传镜像章节操作。准备数据登录coco数据集下载官网地址：https://cocodataset.org/#download 下载coco2017数据集的Train（18GB）、Val images（1GB）、Train/Val

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
创建生产训练作业 - AI开发平台ModelArts

必选，根据不同的资源类型，选择所需的资源规格。当“输入”参数选择“数据存储位置”时，在选择资源池规格时可以单击右侧的“获取输入数据大小”，检查输入数据的大小是否超出数据盘的容量限制，避免训练过程中出现内存不足的情况。须知：资源规格为“GPU:n*tnt004”（n表示具体数字）的资源不支持多进程的训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

Python *.*.* 检查是否已安装Python通用包管理工具pip。如果Python安装过程中没有安装通用包管理工具pip，则参见pip官网完成pip安装，推荐pip版本小于24.0。在本地环境执行命令pip --version，显示如下内容说明pip已安装。 C:\Users\xxx>pip

帮助中心 > AI开发平台ModelArts > SDK参考

总条数： 859

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Notebook实例 - AI开发平台ModelArts

在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

配置Lite Server网络 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

上传数据和算法至SFS（首次使用时需要） - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线