搜索_华为云

查看诊断报告 - AI开发平台ModelArts

attention算子耗时最长且降频比率最高，因此降频严重影响了整体的训练性能。对于降频问题，用户通常无法自行解决，需要联系服务方如华为云技术支持排查机器的温度和功耗。图11 降频分析 AICPU Issues 下图展示了高优先级的AICPU问题，AICPU算子单步计算耗时313秒，GridSampl

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
开发Workflow的核心概念介绍 - AI开发平台ModelArts

示例： example = ServiceData(service_id = "**") # 通过ModelArts的在线服务，获取对应服务的服务ID，描述指定的在线服务。用于服务更新的场景。表8 SWRImage 属性描述是否必填数据类型 swr_path 容器镜像的SWR路径

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
订阅免费模型 - AI开发平台ModelArts

在“AI应用管理 > AI应用 > 我的订阅”页面，选择并展开订阅的目标模型。在版本列表单击“部署”，可以将订阅的ModelArts模型部署为“在线服务”、“批量服务”或“边缘服务”，详细操作步骤请参见部署服务。使用订阅的HiLens技能：在“产品订购 > 订单管理 > AI Ga

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

如果需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何在创建AI应用，部署并启动推理服务，在线预测在线服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
发布本地AI应用到AI Gallery - AI开发平台ModelArts

动”，完成订单信息确认后单击“确定”开始构建AI应用。当AI应用状态变为“运行中”时，表示启动成功。在AI应用详情页的“应用”页签，可以在线体验应用。父主题：发布和管理AI Gallery中的AI应用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
管理AI Gallery数据集 - AI开发平台ModelArts

、使用方法等信息。编辑完成后，单击“确认”保存修改。管理数据集文件预览文件在数据集详情页，选择“数据集文件”页签。单击文件名称即可在线预览文件内容。仅支持预览大小不超过10MB、格式为文本类或图片类的文件。下载文件在数据集详情页，选择“数据集文件”页签。单击操作列的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
模型的自定义镜像制作流程 - AI开发平台ModelArts

json文件中配置。当业务可提供正常服务时，健康检查接口返回健康状态，否则返回异常状态。如果要实现无损滚动升级，必须配置健康检查接口。自定义镜像如果需要在“在线服务”模块使用OBS外部存储挂载功能，需要新建一个OBS挂载专属目录如“/obs-mount/”，避免选择存量目录覆盖已有文件。OBS挂载

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
ModelArts最佳实践案例列表 - AI开发平台ModelArts

场景说明基于ModelArts Standard一键完成商超商品识别模型部署在线服务物体检测此案例以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程。第三方推理框架迁移到ModelArts Standard推理自定义引擎

 帮助中心 > AI开发平台ModelArts > 最佳实践
管理ModelArts服务的委托授权 - AI开发平台ModelArts

该接口支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。若没有授权，ModelArts服务的数据管理、训练管理、开发环境、在线服务等功能将不能正常使用。调用查看授权列表接口查看用户的授权信息。在管理用户授权时，可以调用删除授权接口删除指定用户的授权或者删除全量用户的授权。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
查询支持的服务部署规格 - AI开发平台ModelArts

是否查询专属资源池支持的服务部署规格列表，默认为false。 infer_type 否 String 推理方式，枚举值如下： real-time：在线服务，默认值 batch：批量服务 edge: 边缘服务 limit 否 String 指定每一页返回的最大条目数，默认为1000。 offset

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

SWR OperateAccess 必选 CES云监控授予子用户使用CES云监控服务的权限。通过CES云监控可以查看ModelArts的在线服务和对应模型负载运行状态的整体情况，并设置监控告警。 CES FullAccess 必选 SMN消息服务授予子用户使用SMN消息服务的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
使用AWQ量化 - AI开发平台ModelArts

Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
投机推理使用说明 - AI开发平台ModelArts

平均可以生成3个有效token，即用1.5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
使用AWQ量化 - AI开发平台ModelArts

Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

Step3 权重格式离线转换（可选） AutoAWQ量化完成后，使用int32对int4的权重进行打包。昇腾上使用int8对权重进行打包，在线转换会增加启动时间，可以提前对权重进行转换以减少启动时间，转换步骤如下：进入llm_tools/AutoAWQ代码目录下执行以下脚本：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
依赖和委托 - AI开发平台ModelArts

业务场景依赖的服务委托授权项说明在线服务 LTS lts:groups:create lts:groups:list lts:topics:create lts:topics:delete lts:topics:list 建议配置，在线服务配置LTS日志上报。批量服务 OBS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
新建Workflow Execution - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects 数据约束条件。 value 否 Map<String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
管理Workflow StepExecution - AI开发平台ModelArts

dataset：数据集 obs：OBS swr：SWR model_list：AI应用列表 label_task：标注任务 service：在线服务 conditions 否 Array of Constraint objects 数据约束条件。 value 否 Map<String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

越大，生成文本的多样性就越高。 1 top_k 选择在模型的输出结果中选择概率最高的前K个结果。 20 在对话框中输入问题，查看返回结果，在线体验对话问答。图7 体验模型服务后续操作如果不再需要使用此模型服务，建议清除相关资源，避免产生不必要的费用。在MaaS服务的“模型

 帮助中心 > AI开发平台ModelArts > 快速入门
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

若需要部署量化模型，需在Notebook中进行模型权重转换后再部署推理服务。在推理生产环境中部署推理服务介绍如何创建AI应用，部署模型并启动推理服务，在线预测服务。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

总条数： 314

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看诊断报告 - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

管理AI Gallery数据集 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

管理ModelArts服务的委托授权 - AI开发平台ModelArts

查询支持的服务部署规格 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线