搜索_华为云

动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

动态shape 在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在Ascend场景上，算子需要指定具体的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：per-group Step1 模型量化可以在Huggingfac

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

使用ma-cli obs-copy命令复制OBS数据使用ma-cli obs-copy [SRC] [DST]可以实现本地和OBS文件或文件夹的相互复制。 $ma-cli obs-copy -h Usage: ma-cli obs-copy [OPTIONS ] SRC

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务在ModelArts的开发环境Notebook中可以部署推理服务进行调试。 Step1 准备Notebook 参考准备Notebook完成Notebook的创建，并打开Notebook。 Step2 准备模型代码包和权重文件将OBS中的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
查询用户镜像组列表 - AI开发平台ModelArts

查询用户镜像组列表功能介绍查询用户镜像信息概览，以镜像名称作为聚合的信息。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查看授权列表 - AI开发平台ModelArts

查看授权列表功能介绍查看授权列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/authorizations 表1 路径参数

 帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
查询训练作业版本列表 - AI开发平台ModelArts

查询训练作业版本列表功能介绍根据作业ID查看指定的训练作业版本。 URI GET /v1/{project_id}/training-jobs/{job_id}/versions 参数说明如表1所示。表1 路径参数参数是否必选参数类型说明 project_id 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型针对ModelArts目前不支持的AI引擎，您可以针对该引擎构建自定义镜像，并将镜像导入ModelArts，创建为模型。本文详细介绍如何使用自定义镜像完成模型的创建，并部署成在线服务。操作流程如下：本地构建镜像：在本地制作自定义镜像包，镜像包

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查看ModelArts模型详情 - AI开发平台ModelArts

查看ModelArts模型详情查看模型列表当模型创建成功后，您可在模型列表页查看所有创建的模型。模型列表页包含以下信息。表1 模型列表参数说明模型名称模型的名称。最新版本模型的当前最新版本。状态模型当前状态。部署类型模型支持部署的服务类型。版本数量模型的版本数量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
订阅Workflow - AI开发平台ModelArts

订阅Workflow 在AI Gallery中，您可以查找并订阅免费的Workflow。订阅成功的Workflow通过AI Gallery导入后可以直接在ModelArts控制台使用。 AI Gallery中分享的Workflow支持免费订阅，但在使用过程中如果消耗了硬件资源进行

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
查询训练作业指定任务的运行指标 - AI开发平台ModelArts

查询训练作业指定任务的运行指标功能介绍查询训练作业指定任务的运行指标。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
发布Workflow到AI Gallery - AI开发平台ModelArts

发布Workflow到AI Gallery Workflow支持发布到AI Gallery，分享给其他用户使用，执行如下代码即可完成发布。 workflow.release_to_gallery() 发布完成后可前往gallery查看相应的资产信息，资产权限默认为private，可在资产的console页面自行修改。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案问题现象裸金属服务器EulerOS 2.8系统下，使用yum update -y命令，导致软件NetworkManagre-config-server升级到高版本，出现SSH链接故障无法访问。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表1。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化，量化方法为per-group。 Step1 模型量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 推理模型量化
训练性能测试 - AI开发平台ModelArts

训练性能测试流程图训练性能测试流程图如下图所示：图1 训练性能测试流程执行训练任务进入test-benchmark目录执行训练命令，可以多次执行，卡数及其它配置参考NPU卡数取值表按自己实际情况决定。单机<可选>： # 默认8卡 benchmark-cli train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
解析Manifest文件 - AI开发平台ModelArts

解析Manifest文件解析Manifest文件，支持本地和OBS。如果是OBS，需要Session信息。 manifest.parse_manifest(manifest_path, encoding='utf-8') 示例代码通过Manifest路径来解析获取Manifest的信息。

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > Manifest管理
查询工作空间配额 - AI开发平台ModelArts

查询工作空间配额功能介绍查询工作空间配额。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/workspaces/{workspace_id}/quotas

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
训练性能测试 - AI开发平台ModelArts

训练性能测试流程图训练性能测试流程图如下图所示：图1 训练性能测试流程执行训练任务进入test-benchmark目录执行训练命令，可以多次执行，卡数及其它配置参考NPU卡数取值表按自己实际情况决定。单机<可选>： # 默认8卡 benchmark-cli train

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
在Notebook上安装配置Grafana - AI开发平台ModelArts

在Notebook上安装配置Grafana 适用场景本章节适用于在ModelArts Standard的Notebook中安装配置Grafana。前提条件已创建CPU或GPU类型的Notebook实例，并处于运行中。打开Terminal。操作步骤在Terminal中依

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）

总条数： 1418

上一页
1
...
64
65
66
...
71
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

动态shape - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用ma-cli obs-copy命令复制OBS数据 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

查询用户镜像组列表 - AI开发平台ModelArts

查看授权列表 - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

订阅Workflow - AI开发平台ModelArts

查询训练作业指定任务的运行指标 - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

解析Manifest文件 - AI开发平台ModelArts

查询工作空间配额 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线