搜索_华为云

查询服务详情 - AI开发平台ModelArts

status String 服务状态，取值包含： running：运行中，服务正常运行。 deploying：部署中，服务正在部署，包含打镜像和调度资源部署。 concerning：告警，后端实例部分存在异常。 failed：失败，服务部署失败，失败原因可以看事件和日志标签页。 stopped：停止。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询开发环境实例列表 - AI开发平台ModelArts

参数类型说明 namespace String SWR组织名称，全局唯一。 image_name String 镜像名称。 image_tag String 镜像标签。 annotations Map<String,String> 注解信息，可扩展字段，缺省值为NULL。表9

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
发布免费算法 - AI开发平台ModelArts

在“资产版本”填写新的版本号。阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》。单击“发布”。发布使用容器镜像导入的资产时，后台会进行资产安全扫描，如果扫描发现资产有问题，则资产发布失败并邮件通知发布者。编辑资产详情资产发布成功后，发布者可以进

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
在推理生产环境中部署推理服务 - AI开发平台ModelArts

根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图3 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
advisor调优总体步骤 - AI开发平台ModelArts

parallel(pp)为4。训练过程中发现每个step耗时均显著增大，基于dynamic_profile方式采集profiling并上传至OBS。选择任意镜像如PyTorch，创建一个2U8GB CPU规格（如果CPU资源充足，建议创建8U32G的分析环境）的notebook开发环境。在notebook中使用performance

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
调用MaaS部署的模型服务 - AI开发平台ModelArts

模型服务的API与vLLM相同，表1仅介绍关键参数，详细参数解释请参见vLLM官网Sampling Parameters。使用昇腾云909镜像的模型，开启流式输出时，需要新增stream_options参数，值为{"include_usage":true}，才会打印token数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

根据需要自定义应用的名称和版本。模型来源选择“从对象存储服务（OBS）中选择”，元模型选择转换后模型的存储路径，AI引擎选择“Custom”，引擎包选择准备镜像中上传的推理镜像。系统运行架构选择“ARM”。图3 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在Step4 制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，切换一个conda环境。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
部署在线服务 - AI开发平台ModelArts

批量任务输出结果的OBS路径。 req_uri 是 String 批量任务中调用的推理接口，即模型镜像中暴露的REST接口，需要从模型的config.json文件中选取一个api路径用于此次推理；如使用ModelArts提供的预置推理镜像，则此接口为“/”。 mapping_type 是 String 输入

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
Lite Cluster资源开通 - AI开发平台ModelArts

操作系统：可以指定实例的操作系统。容器引擎：容器引擎是Kubernetes最重要的组件之一，负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互，以管理镜像和容器。此处支持选择Docker和Containerd。Container

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
DevServer权限 - AI开发平台ModelArts

iam:users:listUsers iam:projects:listProjects vpc.*.list eps.*.list evs.*.list ims.*.list ims.*.get √ × 查询DevServer实例列表 GET /v1/{project_id}/dev-servers mod

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

在模型转换阶段通过--configFile参数指定配置文件，并且在配置文件中配置input_shape及dynamic_dims动态参数。其中input_shape的-1表示动态shape所在的维度，dynamic_dims指定动态维度的取值范围，例如“[1~4],[8],[16]”表示该动态维度支持1、2、3、4、8、6共六种大小。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误联网下载SimSun.ttf时可能会遇到网络问题在运行finetune_ds.sh 时遇到报错父主题： Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误联网下载SimSun.ttf时可能会遇到网络问题在运行finetune_ds.sh 时遇到报错父主题： Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
代码运行故障 - AI开发平台ModelArts

运行训练代码，出现dead kernel，并导致实例崩溃如何解决训练过程中出现的cudaCheckError错误？如何处理使用opencv.imshow造成的内核崩溃？使用Windows下生成的文本文件时报错找不到路径？创建Notebook文件后，右上角的Kernel状态为“No

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

String batch服务类型必选。批量任务中调用的推理接口，即模型镜像中暴露的REST接口，需要从模型的config.json文件中选取一个api路径用于此次推理；如使用ModelArts提供的预置推理镜像，则此接口为/。 mapping_type 否 String batc

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
语言模型推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，运行静态benchmark验证。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

静态benchmark验证本章节介绍如何进行静态benchmark验证。已经上传benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x.x.x.zip并解压，无需重复执行。进入benchmark_tools目录下，运行静态benchmark验证。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
模型推理代码编写说明 - AI开发平台ModelArts

详细示例请参见使用自定义依赖包的模型配置文件示例。然后通过如下示例代码，实现了“saved_model”格式模型的加载推理。当前推理基础镜像使用的python的logging模块，采用的是默认的日志级别Warning，即当前只有warning级别的日志可以默认查询出来。如果想要

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

动态分档模型转换需要使用配置文件，指定输入格式为“ND”，并在config文件中配置ge.dynamicDims和input_shape使用，在input_shape中将输入shape的动态维度设为-1，并在ge.dynamicDims中指定动态维度的档位，更多配置项可以参考官方文档。如果网络模型只有一个输入

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移

总条数： 804

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询服务详情 - AI开发平台ModelArts

查询开发环境实例列表 - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

DevServer权限 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法 - AI开发平台ModelArts

代码运行故障 - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线