搜索_华为云

更新Workflow Execution - AI开发平台ModelArts

StepExecution 参数是否必选参数类型描述 step_name 否 String 节点的名称，在一个DAG中唯一，1到64位只包含中英文，数字，空格，下划线（_）和中划线（-），并且以中英文开头。 duration 否 Integer Execution执行的运行时长。 type

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在MaaS体验模型服务 - AI开发平台ModelArts

在ModelArts Studio大模型即服务平台，运行中的模型服务可以在“模型体验”页面在线体验模型服务的推理效果。前提条件在“模型部署”的服务列表存在“运行中”的模型服务。操作步骤登录ModelArts管理控制台。在左侧导航栏中，选择“ModelArts Studio”进入ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧导航栏中选择“部署上线 > 在线服务”，默认进入“在线服务”列表。在部署完成的目标服务中，单击操作列的“修改”，进入“修改服务”页面。在选择模型及配置中，单击“增加模型版本进行灰度发布”添加新版本。图1 灰度发布您可以设置两个版本的流量占比，服务调用请求

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
创建AI应用 - AI开发平台ModelArts

有效。取值范围： true：默认值，复制镜像模式，无法极速创建AI应用，SWR源目录中的镜像更改或删除不影响服务部署。 false：不复制镜像模式，可极速创建AI应用，更改或删除SWR源目录中的镜像会影响服务部署。 initial_config 否 String 模型配置文件转

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

约束限制本文档适配昇腾云ModelArts 6.3.907版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc2。确保容器可以访问公网。 Server驱动版本要求23

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

弹性集群Cluster”页面中的Standard资源池页签中，单击“购买AI专属资源池”，选择“计费模式”为“包年/包月”，在页面最下方勾选“自动续费”。购买成功后开通自动续费在ModelArts控制台“AI专属资源池 > 弹性集群Cluster”页面中的Standard资源池页签中，单击包年

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

务器的缓存目录下。 gallery-cli download {repo_id} {文件名} {文件名} 其中，“repo_id”如何获取，文件名如何获取。如下所示，表示下载文件“config.json”和“merges.txt”到服务器的缓存目录“/test”下，当回显“100%”时表示下载完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
执行微调训练任务 - AI开发平台ModelArts

训练完成后，请参考查看日志和性能章节查看指令微调的日志和性能。 1、如训练过程中遇到“NPU out of memory”“Permission denied” 问题可参考附录：微调训练常见问题解决。 2、训练中遇到"ImportError: This modeling file requires

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
在ModelArts中1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

在ModelArts中1个节点的专属资源池，能否部署多个服务？支持。在部署服务时，选择专属资源池，在选择“计算节点规格”时选择“自定义规格”，设置小一些或者选择小规格的服务节点规格，当资源池节点可以容纳多个服务节点规格时，就可以部署多个服务。如果使用此方式进行部署推理，选择的

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何创建AI应用，部署模型并启动推理服务，在线预测服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建，并打开Notebook。 Step2 准备权重文件将OBS中的模型权重上传到Notebook的工作目录/home

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

获取训练作业支持的AI预置框架功能介绍获取训练作业支持的AI预置框架。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建，并打开Notebook。 Step2 准备模型代码包和权重文件将OBS中的模型权重和表1获取的AscendCloud-3rdLLM-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务介绍如何在Notebook中配置NPU环境，部署并启动推理服务，完成精度测试和性能测试。如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
通过运行的实例保存成容器镜像 - AI开发平台ModelArts

通过运行的实例保存成容器镜像功能介绍运行的实例可以保存成容器镜像，保存的镜像中，安装的依赖包（pip包）不丢失，VS Code远程开发场景下，在Server端安装的插件不丢失。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
推理服务精度评测 - AI开发平台ModelArts

evaluation/mme_eval/data/eval/目录中。获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation/mme_eval目录中，代码目录结构如下。 mme_eval ├──metric.py

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
策略及授权项说明 - AI开发平台ModelArts

IAM项目和企业项目，表示此授权项对应的自定义策略，可以在IAM和企业管理两个服务中给用户组授权并生效。如果仅支持IAM项目，不支持企业项目，表示仅能在IAM中给用户组授权并生效，如果在企业管理中授权，则该自定义策略不生效。关于IAM项目与企业项目的区别，详情请参见：IAM与企业管理的区别。

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
管理AI Gallery中的AI应用 - AI开发平台ModelArts

查看环境变量的值：单击，可以查看当前环境变量的值。新增环境变量：单击“新增”，在编辑环境变量弹窗中配置“变量名称”和“变量值”，单击“确定”完成配置。修改环境变量：单击，在编辑环境变量弹窗中修改“变量名称”或“变量值”，单击“确定”完成配置。删除环境变量：单击，确认永久删除环境变量，单击“确定”完成删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
新建消息订阅Subscription - AI开发平台ModelArts

为Workflow工作流添加消息订阅功能。工作流已订阅的事件发生时，会产生消息提醒。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
执行训练任务 - AI开发平台ModelArts

*****”关键字打印训练完成后，请参考查看日志和性能章节查看指令微调的日志和性能。如训练过程中遇到“NPU out of memory”“Permission denied” 问题可参考附录：训练常见问题解决。训练中遇到"ImportError: This modeling file requires

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）

总条数： 1328

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

更新Workflow Execution - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？ - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

在ModelArts中1个节点的专属资源池，能否部署多个服务？ - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

通过运行的实例保存成容器镜像 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

策略及授权项说明 - AI开发平台ModelArts

管理AI Gallery中的AI应用 - AI开发平台ModelArts

新建消息订阅Subscription - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线