搜索_华为云

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

选择此模型支持部署服务的类型，部署上线时只支持部署为此处选择的部署类型，例如此处只选择在线服务，那您导入后只能部署为在线服务。当前支持“在线服务”、“批量服务”和“边缘服务”。确认信息填写无误，单击“立即创建”，完成模型的创建。在模型列表中，您可以查看刚创建的模型及其对应的版本。当模型状态变更为“正

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
推理服务测试 - AI开发平台ModelArts

推理服务在线测试支持文件、图片、json三种格式。通过部署为在线服务Predictor可以完成在线推理预测。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景：部署在线服务Predictor的推理预测

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错 - AI开发平台ModelArts

部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错导入模型时，需同时将对应的推理代码及配置文件放置在模型文件夹下。使用Python编码过程中，推荐采用相对导入方式（Python import）导入自定义包。如果ModelArts推理框架代码内部存在同名包，

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 在线服务
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的训练、推理代码如下表所示，请提前准备好。获取模型软件包和权重文件本方案支持的模型对应的软件和依赖包获取地址如表1所示，模型列表、对应的开源权重获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的训练、推理代码如下表所示，请提前准备好。获取模型软件包和权重文件本方案支持的模型对应的软件和依赖包获取地址如表1所示，模型列表、对应的开源权重获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
从AI Gallery订阅模型 - AI开发平台ModelArts

“自定义模型”列表，单击“AI Gallery订阅模型”，跳转至“AI Gallery”模型列表，选择模型进行订阅。将订阅模型部署为服务针对订阅模型，支持将模型一键部署为服务。在“订阅模型”列表，单击“版本数量”，在右侧展开版本列表，当订阅模型的版本列表的状态显示为“就绪”时表示模型可以使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
查询数据处理的算法类别 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 offset 否 Integer 分页列表的起始页，默认为0。 limit 否 Integer 指定每一页返回的最大条目数，取值范围[1,1000]，默认为1000。请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用kv-cache-int8量化 - AI开发平台ModelArts

che-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

che-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

che-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

che-int8量化和FP16、BF16、AWQ、smoothquant的组合。 kv-cache-int8量化支持的模型请参见支持的模型列表和权重文件。本章节介绍如何在Notebook使用tensorRT量化工具实现推理量化。 Step1使用tensorRT量化工具进行模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
删除训练作业版本 - AI开发平台ModelArts

删除训练作业版本功能介绍删除训练作业一个版本。此接口为异步接口，作业状态请通过查询训练作业列表和查询训练作业版本详情接口获取。 URI DELETE /v1/{project_id}/training-jobs/{job_id}/versions/{version_id} 参数说明如表1所示。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
删除可视化作业 - AI开发平台ModelArts

删除可视化作业功能介绍删除可视化作业。此接口为异步接口，作业状态请通过查询可视化作业列表与查询可视化作业详情接口获取。 URI DELETE /v1/{project_id}/visualization-jobs/{job_id} 参数说明如表1所示。表1 参数说明参数是否为必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingfac

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
停止可视化作业 - AI开发平台ModelArts

停止可视化作业功能介绍停止可视化作业。此接口为异步接口，作业状态请通过查询可视化作业列表与查询可视化作业详情接口获取。 URI POST /v1/{project_id}/visualization-jobs/{job_id}/stop 参数说明如表1所示。表1 参数说明参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
开发环境的应用示例 - AI开发平台ModelArts

创建开发环境实例的流程如下：调用认证鉴权接口获取用户Token，在后续的请求中需要将Token放到请求消息头中作为认证。调用查询支持的镜像列表接口查看开发环境的镜像类型和版本。调用创建Notebook实例接口创建一个Notebook实例。调用查询Notebook实例详情接口根

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
专属资源池VPC打通 - AI开发平台ModelArts

资源利用率。登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，在“网络”页签，单击网络列表中某个网络操作列的“打通VPC”。图1 打通VPC 在打通VPC弹框中，打开“打通VPC”开关，在下拉框中选择可用的VPC和子网。需要打通的对端网络不能和当前网段重叠。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
审核并验收团队标注任务结果 - AI开发平台ModelArts

团队标注成员完成后，团队审核者可以对标注结果进行审核。登录ModelArts管理控制台，左侧菜单栏选择“数据准备>数据标注”，在数据标注页面选择“我参与的”，在任务列表“操作”列单击“审核”，发起审核。图1 发起审核在审核页面中，审核人员可以查看“未审核”、“已审核”、“审核通过”、“审核不通过”的样本。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

运行完成的工作流会自动部署为相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”直接跳转进入在线服务详情页，或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

步骤六：预测分析运行完成的工作流会自动部署相应的在线服务，您只需要在相应的服务详情页面进行预测即可。在服务部署节点单击“实例详情”或者在ModelArts管理控制台，选择“模型部署 > 在线服务”，单击生成的在线服务名称，即可进入在线服务详情页。在服务详情页，单击选择“预测”页签。

帮助中心 > AI开发平台ModelArts > 快速入门

总条数： 1185

上一页
1
...
12
13
14
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

部署在线服务时，自定义预测脚本python依赖包出现冲突，导致运行出错 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

从AI Gallery订阅模型 - AI开发平台ModelArts

查询数据处理的算法类别 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

删除训练作业版本 - AI开发平台ModelArts

删除可视化作业 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

停止可视化作业 - AI开发平台ModelArts

开发环境的应用示例 - AI开发平台ModelArts

专属资源池VPC打通 - AI开发平台ModelArts

审核并验收团队标注任务结果 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现口罩检测 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线