搜索_华为云

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

认证时，由于ModelArts生成的在线服务API不支持domain范围的token，因此需获取使用范围为project的Token信息，即scope参数的取值为project。预测文件的本地路径既可使用绝对路径（如Windows格式"D:/test.png"，Linux格式"/opt/data/test

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
创建资源池 - AI开发平台ModelArts

String 指定资源池节点的容器引擎空间大小。表10 network 参数是否必选参数类型描述 name 是 String 网络名称，即网络详情中的metadata.name字段的值。用户接口通过指定网络名称创建网络，系统会自动创建子网，用户无法创建子网。默认将创建在第一个子网下。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

Step4 制作自定义镜像 Step5 上传镜像至SWR服务 Step6 在ModelArts上创建训练作业前提条件已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。 Step1 创建OBS桶和文件夹在OBS服务中创建桶和文件夹，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
开发第一条Workflow - AI开发平台ModelArts

Gallery>资产集市>算法，搜索自动学习算法-图像分类。单击算法右侧的“订阅”。在弹出的窗口中，勾选“我已阅读并同意《数据安全与隐私风险承担条款》和《华为云AI Gallery服务协议》”后，单击“继续订阅”。订阅完成后，单击“前往控制台”，选择云服务区域为“华北-北京四”，单击“确定”后系

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

推理服务基础参数说明如下： -model ${container_model_path}：模型地址，模型格式是HuggingFace的目录格式。即Step2 准备权重文件上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用推理模型量化章节转换后的权重。 --max-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

推理服务基础参数说明如下： -model ${container_model_path}：模型地址，模型格式是HuggingFace的目录格式。即Step2 准备权重文件上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用推理模型量化章节转换后的权重。 --max-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

Step4 制作自定义镜像 Step5 上传镜像至SWR服务 Step6 在ModelArts上创建训练作业前提条件已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。 Step1 创建OBS桶和文件夹在OBS服务中创建桶和文件夹，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
查询服务详情 - AI开发平台ModelArts

time_unit String 调度时间单位，可选DAYS/HOURS/MINUTES。 type String 调度类型，当前仅支持取值为stop，即运行指定时间后自动停止。请求示例 GET https://{endpoint}/v1/{project_id}/services/{service_id}

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
推理精度测试 - AI开发平台ModelArts

S：表示支持多个模型服务实例,同时支持模型并行，如 0,1:2,3 默认0卡; QUANTIZATION：为量化选项，不传入默认为None即不启用量化；支持w8a8、w8a16，需配套对应的权重使用。 GPU_MEMORY_UTILIZATION：NPU使用的显存比例，复用原vLLM的入参名称，默认为0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911）
创建Workflow数据集导入节点 - AI开发平台ModelArts

Label的列表 import_annotated 用于导入智能标注结果的任务，是否导入原数据集中已标注的样本到待确认，默认值为"false"即不导入原数据集中已标注的样本到待确认。可选值如下： true：导入原数据集中已标注的样本到待确认 false：不导入原数据集中已标注的样本到待确认

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
部署推理服务 - AI开发平台ModelArts

具体参数说明如下： --model ${container_model_path}：模型地址，模型格式是HuggingFace的目录格式。即Step3 上传代码包和权重文件上传的HuggingFace权重文件存放目录。如果使用的是训练后模型转换为HuggingFace格式的地址，还需要有Tokenizer原始文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

info”，完整输出下图内容则为正常。如果命令未按照下图完整输出（比如命令报错或只输出了上半部分没有展示下面的进程信息），则需要先尝试恢复npu-smi工具（提交工单联系华为云技术支持），将npu-smi恢复后，再进行新版本的固件驱动安装。图6 检查npu-smi工具工具检查正常后，进行固件和驱动安装。固件和驱动安装时，注意安装顺序：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

ADD run.sh /home/mind/ CMD /bin/bash /home/mind/run.sh 完成镜像构建后，将镜像注册至华为云容器镜像服务SWR中，用于后续在ModelArts上部署推理服务。使用适配后的镜像在ModelArts部署在线推理服务。在obs中创建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

资源分组名称，如果需要指定多个参数，可以使用--groups group1 --groups group2。 --args Array of String 否传入主类的参数，即应用程序参数。如果需要指定多个参数，可以使用--args arg1 --args arg2。 -q / --quiet Bool 否提交DLI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
准备镜像环境 - AI开发平台ModelArts

com/GPOUP_NAME/pytorch_2_1_ascend:20240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.910） > 准备工作
部署推理服务 - AI开发平台ModelArts

--speculative-model ${container_draft_model_path}：投机草稿模型地址，模型格式是HuggingFace的目录格式。即Step1 上传权重文件上传的HuggingFace权重文件存放目录。投机草稿模型为与--model入参同系列，但是权重参数远小于--mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
准备镜像环境 - AI开发平台ModelArts

com/GPOUP_NAME/pytorch_2_1_ascend:20240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像环境 - AI开发平台ModelArts

com/GPOUP_NAME/pytorch_2_1_ascend:20240606 步骤六编写Config.yaml文件 k8s有两种方式来管理对象：命令式，即通过Kubectl指令直接操作对象。声明式，通过定义资源YAML格式的文件来操作对象。首先给出单个节点训练的config.yaml文件模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.911） > 准备工作
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

|-------- data_batch_2 |-------- ... 其中“DDP”为创建训练作业时的“代码目录”，“main.py”为上文代码示例（即创建训练作业时的“启动文件”），“cifar-10-batches-py”为解压后的数据集文件夹（放在input_dir文件夹下）。如果使

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
部署推理服务 - AI开发平台ModelArts

--speculative-model ${container_draft_model_path}：投机草稿模型地址，模型格式是HuggingFace的目录格式。即Step1 上传权重文件上传的HuggingFace权重文件存放目录。投机草稿模型为与--model入参同系列，但是权重参数远小于--mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）

总条数： 964

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

通过Token认证的方式访问在线服务 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

开发第一条Workflow - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

ma-cli dli-job提交DLI Spark作业支持的命令 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线