搜索_华为云

使用AWQ量化工具转换权重 - AI开发平台ModelArts

使用AWQ量化工具转换权重 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表1。本章节介绍如何在Notebook使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
配置IAM权限 - AI开发平台ModelArts

配置IAM权限使用华为云主账号创建一个开发者用户组user_group，将开发者账号加入用户组user_group中。具体操作请参见Step1 创建用户组并加入用户。创建自定义策略。使用华为云主账号登录控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入IAM服务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite Server上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模型的训练过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Kohya框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 Stable Diffusion（简称SD）是一种基于扩散过程的图像生成模型，应用于文生图场景，能够帮助用户生成图像。方案概览本方案介绍了在ModelArts Lite Server上使用昇腾计算资源Ascend Snt9B开展SDXL和SD1.5模型的训练过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。多模态只支持hf上下载的awq权重，可跳过步骤一。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败问题现象用户创建模型时，构建镜像失败，失败日志中提示下载obs文件失败（Get object size from OBS failed！）。图1 下载obs文件失败用户创建模型时，事件提示：复制模型文件失败，请检查OBS权限是否正常（Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

W4A16量化大模型推理中，模型权重数据类型（weight），推理计算时的数据类型（activation）和kvcache一般使用半精度浮点FP16或BF16。量化指将高比特的浮点转换为更低比特的数据类型的过程。例如int4、int8等。模型量化分为weight-only量化，

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
模型管理权限 - AI开发平台ModelArts

模型管理权限表1 模型管理细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目导入模型 POST /v1/{project_id}/models modelarts:model:create obs:bucket:ListAllMybuckets obs

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
创建工作空间 - AI开发平台ModelArts

创建工作空间功能介绍创建工作空间（"default"为系统预留的默认工作空间名称，不能使用）。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1/{

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
创建Notebook实例 - AI开发平台ModelArts

uri 否 String EFS专属存储盘uri，只有当category为EFS，同时ownership为DEDICATED时必填。登录弹性文件服务控制台，在文件系统列表中，单击文件系统名称进入详情页。其中，“共享路径”即为此参数的参数值。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？使用场景当前Notebook默认内置的引擎环境不能满足用户诉求，用户可以新建一个conda env按需搭建自己的环境。本小节以搭建一个“python3.6.5和tensorflow1.2.0

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） ComfyUI是一款基于节点工作流的Stable Diffusion操作界面。通过将Stable Diffusion的流程巧妙分解成各个节点，成功实现了工作流的精确定制和可靠复现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
工作空间管理权限 - AI开发平台ModelArts

工作空间管理权限表1 工作空间管理细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目创建工作空间 POST /v1/{project_id}/workspaces modelarts:workspace:create - √ √ 查询工作空间列表 GET

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
计费样例 - AI开发平台ModelArts
计费样例 - AI开发平台ModelArts

计费样例计费场景一某用户于2023/03/18 15:30:00使用一个按需计费的公共资源池进行训练，规格配置如下：规格：CPU: 8 核 32GB (modelarts.vm.cpu.8ud) 计算节点个数：1个用了一段时间后，于2023/03/20 10:30:00停止训练作业

 帮助中心 > AI开发平台ModelArts > 计费说明
身份认证与访问控制 - AI开发平台ModelArts

身份认证与访问控制身份认证用户访问ModelArts的方式有多种，包括ModelArts控制台、API、SDK，无论访问方式封装成何种形式，其本质都是通过ModelArts提供的REST风格的API接口进行请求。 ModelArts的接口均需要进行认证鉴权以此来判断是否通过身份认证

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
查询工作空间详情 - AI开发平台ModelArts

查询工作空间详情功能介绍查询工作空间详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/workspaces/{workspace_id

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

表2 训练作业挂载点介绍挂载点是否只读备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache 否裸机规格支持，挂载宿主机NVMe的硬盘。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
使用CES监控Lite Server资源 - AI开发平台ModelArts

使用CES监控Lite Server资源场景描述 Lite Server的监控能力依赖于CES云监控服务。本文主要介绍如何对接CES云监控服务，对Lite Server上的资源和事件进行监控。监控方案介绍监控概述请参考BMS官方文档。除文档所列支持的镜像之外，目前还支持Ubuntu20.04

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
Standard模型部署 - AI开发平台ModelArts

Standard模型部署 ModelArts Standard提供模型、服务管理能力，支持多厂商多框架多功能的镜像和模型统一纳管。通常AI模型部署和规模化落地非常复杂。例如，智慧交通项目中，在获得训练好的模型后，需要部署到云、边、端多种场景。如果在端侧部署，需要一次性部署到不同规格

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Standard资源池节点故障定位 - AI开发平台ModelArts

Standard资源池节点故障定位节点故障定位对于Standard资源池，ModelArts平台在识别到节点故障后，通过给K8S节点增加污点的方式（taint）将节点隔离避免新作业调度到该节点而受到影响，并且使本次作业不受污点影响。当前可识别的故障类型如下，可通过隔离码及对应检测方法定位故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池

总条数： 415

上一页
1
...
13
14
15
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用AWQ量化工具转换权重 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

用户创建模型时构建镜像或导入文件失败 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

模型管理权限 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？ - AI开发平台ModelArts

SDXL&SD1.5 ComfyUI基于Lite Cluster适配NPU推理指导（6.3.906） - AI开发平台ModelArts

工作空间管理权限 - AI开发平台ModelArts

计费样例 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

查询工作空间详情 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

Standard模型部署 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线