搜索_华为云

推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化工具转换权重使用SmoothQuant量化工具转换权重使用kv-cache-int8量化使用GPTQ量化父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）推理场景介绍部署推理服务推理性能测试推理精度测试推理模型量化附录：基于vLLM不同模型推理支持最小卡数和最大序列说明附录：大模型推理常见问题父主题： LLM大语言模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
部署推理服务 - AI开发平台ModelArts

部署推理服务非分离部署推理服务分离部署推理服务父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
删除授权 - AI开发平台ModelArts
删除授权 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 user_id 否 String 用户ID，当user_id为all时，表示删除所有IAM子用户的授权。请求参数无响应参数无请求示例删除指定用户的授权 DELETE

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务场景描述本案例介绍如何在Snt9B上进行分布式训练任务，其中Cluster资源池已经默认安装volcano调度器，训练任务默认使用volcano job形式下发lite池集群。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。专属资源池驱动检查登录ModelArts控制台，单击“专属资源池 > 弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 准备工作
在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

使用自动学习产生的模型只能在ModelArts上部署上线，无法下载至本地使用。使用自定义算法或者订阅算法训练生成的模型，会存储至用户指定的OBS路径中，供用户下载。父主题： Standard模型训练

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
添加资源标签 - AI开发平台ModelArts

路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。 resource_id 是 String 资源ID，如Notebook实例ID。请求参数表2 请求Body参数参数是否必选参数类型描述 tags

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建导入任务 - AI开发平台ModelArts

cluster_id 否 String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。可选值如下： 0：普通集群 1：安全集群 cluster_name 否 String MRS集群名称。可登录MRS控制台查看。 database_name

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
从OBS导入数据到数据集场景介绍 - AI开发平台ModelArts

导入方式 OBS导入数据方式分为“OBS目录”和“Manifest文件”两种。 OBS目录：指需要导入的数据集已提前存储至OBS目录中。此时需选择用户具备权限的OBS路径，且OBS路径内的目录结构需满足规范，详细规范请参见从OBS目录导入数据规范说明。当前只有“图像分类”、“物体检测”、

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

模型训练和服务部署，工作流发布至运行态后，部分运行的开关默认关闭，节点全部运行。用户可在权限管理页面打开开关，选择指定的场景进行运行。部分运行能力支持同一个节点被定义在不同的运行场景中，但是需要用户自行保证节点之间数据依赖的正确性。另外，部分运行能力仅支持在运行态进行配置运行，不支持在开发态进行调试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。专属资源池驱动检查登录ModelArts控制台，单击“专属资源池 > 弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。专属资源池驱动检查登录ModelArts控制台，单击“专属资源池 > 弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 准备工作
上传数据至OBS（首次使用时需要） - AI开发平台ModelArts

参考线下容器镜像构建及调试章节，构建容器镜像并调试，镜像构建及调试与单机单卡相同。上传镜像，参考单机单卡训练的上传镜像章节操作。操作步骤登录Imagenet数据集下载官网地址，下载Imagenet21k数据集：http://image-net.org/ 下载格式转换后的anno

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Standard。资源规格需要使用专属资源池中的昇腾Snt9B资源，请参考创建资源池购买资源。推荐使用“西南-贵阳一”Region上的昇腾资源。专属资源池驱动检查登录ModelArts控制台，单击“专属资源池 > 弹性集群”，选择创建的专属资源池。图1 查看专属资源池在专属池详情页可查看驱动及固件版本。如下图显示Ascend驱动为7

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910） > 准备工作
执行微调训练任务 - AI开发平台ModelArts

可根据自己要求适配 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配 dataset identity,alpaca_en_demo 【可选】注册在dataset_info.json文件数据集名称。如选用定义数据请参考准备数据（可选）配置dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

即删除。欠费后，您可以在“费用中心”查看欠费详情。为了防止相关资源不会被停止服务或者逾期释放，您需要及时进行还款或充值。查询欠费步骤登录管理控制台。单击页面右上角的“费用”进入“费用中心”页面。在“总览”页面可以查看到当前的欠费金额。如果存在欠费，请及时充值。更多关于欠费还款操作，请参见如何进行欠费还款。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
线下容器镜像构建及调试 - AI开发平台ModelArts

牵扯部分文件用户组不一致的情况，可以在宿主机用root权限执行命令进行修改 docker exec -u root:root 39c9ceedb1f6 bash -c "chown -R ma-user:ma-user /cache" 针对调试中遇到的错误，可以直接在容器实例里修改，

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

后面称模板机）的实例ID信息，如果制作镜像不清理“/var/lib/cloud/*”就会导致用该镜像再重装模板机时，cloud-init根据残留目录（含实例ID）判断已经执行过一次，进而不会再执行user-data里面的脚本。而使用该镜像的服务器B和C，由于实例ID信息和镜像中

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？ - AI开发平台ModelArts

资源规格训练时为什么训练速度差不多？如果用户的代码中训练任务是单进程的，使用Notebook 8核64GB，72核512GB训练的速度是基本一致的，例如用户用的是2核4GB的资源，使用4核8GB，或者8核64GB效果是一样的。如果用户的代码中训练任务是多进程的，使用Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook

总条数： 2112

上一页
1
...
76
77
78
...
106
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理模型量化 - AI开发平台ModelArts

主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

删除授权 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

在ModelArts中训练好后的模型如何获取？ - AI开发平台ModelArts

添加资源标签 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

从OBS导入数据到数据集场景介绍 - AI开发平台ModelArts

在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

上传数据至OBS（首次使用时需要） - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

欠费后，ModelArts的资源是否会被删除？ - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线