搜索_华为云

创建开发环境实例 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。请求消息请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 name 是 String 实例名称，长度限制为64个字符，支持大小写字母、数字、中划线和下划线。 profile_id 是 String 配置ID，当前支持： Ascend-Power-Engine

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
数据集版本发布失败 - AI开发平台ModelArts

请参考OBS权限管理，为当前IAM用户配置“作用范围”为“全局级服务”的“Tenant Administrator”策略，即拥有OBS服务所有操作权限。如果需要限制此IAM用户操作，仅为此用户配置OBS相关的最小化权限项，具体操作请参见创建ModelArts自定义策略。检查OBS桶是否具备权限。下

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

W8A8量化什么是W8A8量化 W8A8量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。约束限制支持SmoothQuant（W8A8）量化的模型列表请参见支持的模型列表。激活量化支持动态per-token和静态per-tensor，支持非对称量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
更新模型服务的单个属性 - AI开发平台ModelArts

String 链路追踪ID。表6 响应Body参数参数参数类型描述 update_time String 本次更新时间，仅触发服务配置升级时会返回，比如修改config参数，可根据此时间从服务更新记录中过滤出此次的更新结果；修改描述或启停服务不会返回此参数。 resource_ids

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

UnprocessableEntity 请求格式正确，但是由于含有语义错误，无法响应。 429 TooManyRequests 表明请求超出了客户端访问频率的限制或者服务端接收到多于它能处理的请求。建议客户端读取相应的Retry-After首部，然后等待该首部指出的时间后再重试。 500 InternalServerError

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Storage Service）作为存储的方案，OBS用于存储模型文件、训练数据、代码、日志等，提供了高可靠性的数据存储解决方案。约束限制如果要使用自动重启功能，资源规格必须选择八卡规格，只有llama3-8B/70B支持该功能。本案例仅支持在专属资源池上运行。支持的模型列表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
管理Workflow Execution - AI开发平台ModelArts

strings 使用这个参数的工作流节点。 format 否 String 数据格式。 constraint 否 Map<String,Object> 限制条件。表5 DataRequirement 参数是否必选参数类型描述 name 是 String 训练数据的名称。填写1-64位，

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
推理场景介绍 - AI开发平台ModelArts

程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts 6.3.908版本，请参考软件配套版本获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

100，数量需和--request-rate的数量对应。 --max-tokens：输入+输出限制的最大长度，模型启动参数--max-input-length值需要大于该值。 --max-prompt-tokens：输入限制的最大长度，推理时最大输入tokens数量，模型启动参数--max-tota

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

rc3-py_3.9-hce_2.0.2409-aarch64-snt9b-20241213131522-aafe527 SWR上拉取。约束限制本文档适配昇腾云ModelArts 6.3.912版本，请参考表2获取配套版本的软件包和镜像，请严格遵照版本配套关系使用本文档。确保容器可以访问公网。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

of dataset versions has reached the quota limit. 数据集的版本计数已达到配额限制数据集的版本计数已达到配额限制 400 ModelArts.4715 Incorrect data analysis result. 数据分析任务结果错误

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
订阅免费模型 - AI开发平台ModelArts

HiLens技能。搜索业务所需的免费模型，请参见查找资产。单击目标模型进入详情页面。在详情页面您可以查看模型的“描述”、“交付”、“限制”、“版本”和“评论”等信息。在详情页面单击“订阅”。如果订阅的是非华为云官方资产，则会弹出“温馨提示”页面，勾选并阅读《数据安全与隐私风险承担条款》和《华为云AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Cluster上的训练方案。训练框架使用的是ModelLink。本方案目前仅适用于企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.909版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
创建导入任务 - AI开发平台ModelArts

import_origin 否 String 数据来源。可选值如下： obs：OBS桶（默认值） dws：GaussDB(DWS)服务 dli：DLI服务 rds：RDS服务 mrs：MRS服务 inference：推理服务 import_path 是 String 导入的OBS路径或manifest路径。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

模型推荐的参数与NPU卡数设置不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
创建训练作业 - AI开发平台ModelArts

参数类型说明 job_name 是 String 训练作业名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 job_desc 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 config 是 Object 创建训练作业需要的参数。详情请参见表3。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
更新开发环境实例信息 - AI开发平台ModelArts

实例ID。请求消息请求参数如表2所示表2 请求参数参数是否必选参数类型说明 description 否 String 配置描述，长度限制为512字符，不可包含特殊字符&<>"'/。 spec 否 Object 实例定义，如表3 spec定义数据结构说明所示。表3 spec定义数据结构说明

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）

总条数： 702

上一页
1
...
28
29
30
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建开发环境实例 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

更新模型服务的单个属性 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

管理Workflow Execution - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

更新开发环境实例信息 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线