搜索_华为云

训练中的权重转换说明 - AI开发平台ModelArts

scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：如果用户要自定义数据处理脚本并且单独执行，同样以 llama2 为例。注意脚本中的python命令分别有Hugging Face 转 Megatron格式，以及Megatron

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

s://github.com/vllm-project/vllm/tree/v0.3.2，版本：v0.3.2）。仅支持FP16和BF16数据类型推理。适配的CANN版本是cann_8.0.rc2，驱动版本是23.0.5。本案例仅支持在专属资源池上运行。支持的模型列表本方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

状态变为“已冻结”，您将无法对处于保留期的包年/包月资源执行任何操作。保留期到期后，如果包年/包月资源池仍未续费，那么计算资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于续费的详细介绍请参见续费概述。父主题：计费模式

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 OBS上传下载上传本地文件或文件夹至OBS，从OBS下载文件或文件夹到本地。使用PyCharm上传数据至Notebook 前提条件本地已安装2019.2-2023.2之间（包含2019.2和2023.2）版本的PyCharm专业版。SSH

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
使用AWQ量化 - AI开发平台ModelArts

A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查询AI应用列表 - AI开发平台ModelArts

状态码： 200 表4 响应Body参数参数参数类型描述 models Array of ModelListItem objects 模型元数据信息。 total_count Integer 不分页的情况下符合查询条件的总模型数量。 count Integer 符合查询条件的模型数量。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
SDXL Diffusers框架基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info 如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

output2=obs://bucket/output2 --input String 否训练的输入信息，指定后，训练任务将会把对应OBS上的数据下载到训练容器，并将数据存储路径通过指定的参数传递给训练脚本。如果需要指定多个参数，可以使用--input data_path1=obs://bucket/data1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
非分离部署推理服务 - AI开发平台ModelArts

l-len，推荐使用4096或8192。 --dtype：模型推理的数据类型。支持FP16和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。如果不指定，则根据输入数据自动匹配数据类型。使用不同的dtype会影响模型精度。如果使用开源权重，建议不指定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
查看训练作业日志 - AI开发平台ModelArts

泄露。下载训练日志仅保留30天，超过30天会被清理。如果用户需要永久保存日志，请单击系统日志窗口右上角下载按钮下载日志至本地保存，支持批量下载多节点日志。用户也可以在创建训练作业时打开永久保存日志按钮，保存训练日志至指定OBS路径。针对使用Ascend规格创建的训练作业，部

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
资源池监控 - AI开发平台ModelArts

minimun：最小值统计 sum：求和统计 average：平均值统计 sampleCount：采样统计 period 否 String 监控数据粒度，单位为秒。可选值如下： 60：粒度为1分钟，默认值 300：粒度为5分钟 900：粒度为15分钟 3600：粒度为1小时请求参数无

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建并管理工作空间 - AI开发平台ModelArts

默认无限制，支持设置1~100000。 GB 智能标注GPU规格使用时长默认无限制，支持设置1~60000。分钟工作空间的配额值修改完成后，单击“提交修改”，当“配额值”数据刷新表示修改成功。修改工作空间工作空间创建成功后，支持修改信息。在ModelArts管理控制台的左侧导航栏中，选择“工作空间”进入工作空间列表。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard准备工作
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.4.2版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询支持的镜像列表 - AI开发平台ModelArts

参数参数类型描述 current Integer 当前页数。 data Array of ImageResponse objects 数据。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 ImageResponse

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

"type": "integer" } } } } }] apis定义提供AI应用对外Restfull api数据定义，用于定义AI应用的输入、输出格式。创建AI应用填写apis。在创建的AI应用部署服务成功后，进行预测时，会自动识别预测类型。创建

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

query-string 查询参数，可选，查询参数前面需要带一个“？”，形式为“参数名=参数取值”，例如“limit=10”，表示查询不超过10条数据。例如您需要获取“华北-北京一”区域的Token，则需使用“华北-北京一”区域的Endpoint（iam.cn-north-1.myhuaweicloud

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
管理训练容器环境变量 - AI开发平台ModelArts

作业元信息环境变量如何修改环境变量用户可以在创建训练作业页面增加新的环境变量，也可以设置新的取值覆盖当前训练容器中预置的环境变量值。为保证数据安全，请勿输入敏感信息，例如明文密码。训练容器中预置的环境变量训练容器中预置的环境变量如下面表格所示，包括表1、表2、表3、表4、表5、表6、表7。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.5.0版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。支持的模型列表和权重文件本方案支持vLLM的v0.5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

ry CLI配置工具下载文件。获取待下载的文件名在AI Gallery页面的资产详情页，如果是模型资产，则选择“模型文件”页签，如果是数据集资产，则选择“文件版本”页签，获取“文件名称”。下载单个文件在服务器执行如下命令，可以从AI Gallery仓库下载单个文件到服务器的缓存目录下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南

总条数： 1260

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练中的权重转换说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

使用PyCharm Toolkit插件连接Notebook - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

FLUX.1基于DevServer适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

SDXL Diffusers框架基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

资源池监控 - AI开发平台ModelArts

创建并管理工作空间 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线