搜索_华为云

推理场景介绍 - AI开发平台ModelArts

程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.910版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
查询Workflow Execution - AI开发平台ModelArts

strings 使用这个参数的工作流节点。 format String 数据格式。 constraint Map<String,Object> 限制条件。表15 WorkflowDagPolicies 参数参数类型描述 use_cache Boolean 是否使用缓存。请求示例

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询AI应用详情 - AI开发平台ModelArts

package_name String 依赖包名称。请确保包名正确且存在。不能含有中文及特殊字符&!'"<>=。 restraint String 版本限制条件，当且仅当package_version存在时必填，取值包含： EXACT：和指定的版本完全一致。 ATLEAST：不低于指定的版本。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
安装Gallery CLI配置工具 - AI开发平台ModelArts

于在云服务本地进行训练、部署推理。 Gallery CLI配置工具支持将单个超过5GB的文件从本地上传至AI Gallery仓库中。约束限制 Gallery CLI配置工具下载文件时依赖集群的公网访问权限，所以在使用CLI时要求集群配置NAT网关，具体操作请参见公网NAT网关。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
审计与日志 - AI开发平台ModelArts

出于分析或审计等目的，用户可以开启ModelArts的日志记录功能。在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。对接云审计服务的配置方法请参见查看审计日志章节。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
创建训练作业 - AI开发平台ModelArts

String 训练作业名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 workspace_id 否 String 指定作业所处的工作空间，默认值为“0”。 description 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 annotations

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数即其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
运行第一条Workflow - AI开发平台ModelArts

删除实例，避免产生不必要的费用。如果您购买了套餐包，可优先选择您对应规格的套餐包，在“配置费用”页签会显示您的套餐余量，以及超出的部分如何计费，请您关注，避免造成不必要的资源浪费。节点配置数据标注参数配置 labeling_input：选择预先创建的数据集即可，版本可以不用选择。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数即其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
推理场景介绍 - AI开发平台ModelArts

程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.911版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
查询训练作业详情 - AI开发平台ModelArts

String 训练作业名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 workspace_id String 指定作业所处的工作空间，默认值为“0”。 description String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 create_time

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

提前规划资源的使用额度和时长。在欠费时，您需要及时（15天之内）续费以避免您的文件系统资源被清空。购买的SFS可以用于存储数据和代码。如何购买弹性文件服务？容器镜像服务SWR 容器镜像服务分为企业版和共享版。共享版计费项包括存储空间和流量费用，目前均免费提供给您。企业版支持按需计费模式。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
终止训练作业 - AI开发平台ModelArts

String 训练作业名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 workspace_id String 指定作业所处的工作空间，默认值为“0”。 description String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 create_time

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

batch服务类型必选。批量任务输出结果的OBS路径。 instance_count 是 Integer 公共参数。模型部署的实例数，当前限制最大实例数为128，如需使用更多的实例数，需提交工单申请。 additional_properties 否 Map<String,Mode

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

"num_turns": 3, "chat": { "turn_1": { "Human": "<|Human|>: 如何保障工作中遵循正确的安全准则？<eoh>\n", "Inner Thoughts": "<|Inner Thoughts|>:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
设置断点续训练 - AI开发平台ModelArts

练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。 ModelArts Standard中如何实现断点续训练在ModelArts Standard训练中实现断点续训练或增量训练，建议使用“训练输出”功能。在创建训练作业时，设置训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案本章节提供了推理服务访问公网的方法。应用场景推理服务访问公网地址的场景，如：输入图片，先进行公网OCR服务调用，然后进行NLP处理；进行公网文件下载，然后进行分析；分析结果回调给公网服务终端。方案设计从推理服

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
发布Workflow到ModelArts - AI开发平台ModelArts

elArts的Workflow页面中查看新发布的工作流，进入Workflow详情，单击“配置”进行参数配置。工作流相关的配置执行操作可参考如何使用Workflow。基于release()方法，提供了release_and_run()方法，支持用户在开发态发布并运行工作流，节省了前往console配置执行的操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow

总条数： 945

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理场景介绍 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

查询AI应用详情 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

在ModelArts Standard运行GPU训练作业的准备工作 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线