搜索_华为云

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

将训练启动脚本中的“NODE_RANK="$VC_TASK_INDEX"”修改为“NODE_RANK="$RANK_AFTER_ACC"”。将训练启动脚本中的“MASTER_ADDR="${VC_WORKER_HOSTS%%,*}"”修改为“MASTER_ADDR="${MA_VJ_NAME}-$

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
更新服务配置 - AI开发平台ModelArts

当使用此方式时，输入数据目录下的文件只能以.csv为后缀，且需配置mapping_rule参数，以表达推理请求体中各个参数对应到csv的索引。 cluster_id 否 String 可选，部署服务时使用的资源池ID。对于rel-time和batch服务类型，为旧版专属资源池I

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询数据集的团队标注任务列表 - AI开发平台ModelArts

5：验收结果同步中。验收任务改为异步，新增验收结果同步中的状态，此时不允许发起新的验收任务，也不允许继续当前验收，任务名称的地方提示用户同步中。 6：已创建。owner创建完任务，未启动，仅owner/manager可见任务列表。 7：验收采样中。发起验收改为异步，新增验收采样中的状

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用基础镜像 - AI开发平台ModelArts

进行训练时，需要修改 install.sh 中的 transformers 的版本。由默认 transformers==4.45.0 修改为：transformers==4.44.2 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

进行训练时，需要修改 install.sh 中的 transformers 的版本。由默认 transformers==4.45.0 修改为：transformers==4.44.2 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

需要去掉模型文件目录下存在dockerfile文件。图2 构建日志：dockerfile文件目录有问题 pip软件包版本不匹配，需要修改为日志中打印的存在的版本。图3 pip版本不匹配构建日志中出现报错：“exec /usr/bin/sh: exec format error”。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
配置ModelArts委托授权 - AI开发平台ModelArts

能够满足企业对权限最小化的安全管控要求。角色与策略相关介绍请参考权限基本概念。 “新增委托 > 权限配置 > 普通模式” 在服务列表右侧勾选“全选”。图5 普通模式 “新增委托 > 权限配置 >高权限模式 ” 高权限模式下，配置的权限范围较大，适用于有管理员权限需求的用户。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
使用基础镜像 - AI开发平台ModelArts

进行训练时，需要修改 install.sh 中的 transformers 的版本。由默认 transformers==4.45.0 修改为：transformers==4.44.2 以创建llama2-13b预训练作业为例，执行脚本0_pl_pretrain_13b.sh时，命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

进行训练时，需要修改 install.sh 中的 transformers 的版本。由默认 transformers==4.47.0 修改为：transformers==4.44.2 以创建llama2-13b预训练作业为例，执行脚本0_pl_pretrain_13b.sh时，命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
复制数据至容器中空间不足 - AI开发平台ModelArts

况，导致空间不足。请排查是否使用的是GPU资源。如果使用的是CPU规格的资源，“/cache”与代码目录共用10G，会造成内存不足，请更改为使用GPU资源。请在代码中添加环境变量来解决。 import os os.system('export TMPDIR=/cache') 父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用基础镜像 - AI开发平台ModelArts

进行训练时，需要修改 install.sh 中的 transformers 的版本。由默认 transformers==4.47.0 修改为：transformers==4.44.2 以创建llama2-13b预训练作业为例，执行脚本0_pl_pretrain_13b.sh时，命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

进行训练时，需要修改 install.sh 中的 transformers 的版本。由默认 transformers==4.45.0 修改为：transformers==4.44.2 以创建llama2-13b预训练作业为例，执行脚本0_pl_pretrain_13b.sh时，命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
查询团队标注任务详情 - AI开发平台ModelArts

5：验收结果同步中。验收任务改为异步，新增验收结果同步中的状态，此时不允许发起新的验收任务，也不允许继续当前验收，任务名称的地方提示用户同步中。 6：已创建。owner创建完任务，未启动，仅owner/manager可见任务列表。 7：验收采样中。发起验收改为异步，新增验收采样中的状

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

1）如果本地已有权重，请将MODEL_ID修改为权重路径； MODEL_ID = "deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct" 2）如果量化Deepseek-V2-236B模型，请将num_gpus改为8； device_map = cal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

1）如果本地已有权重，请将MODEL_ID修改为权重路径； MODEL_ID = "deepseek-ai/DeepSeek-Coder-V2-Lite-Instruct" 2）如果量化Deepseek-V2-236B模型，请将num_gpus改为8； device_map = cal

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 量化
查询AI应用列表 - AI开发平台ModelArts

building_failed：构建失败 description 否 String 描述信息，可支持模糊匹配。 offset 否 Integer 指定要查询页的索引，默认为“0”。 limit 否 Integer 指定每一页返回的最大条目数，默认为“1000”。 sort_by 否 String 指定排序字段，枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
kv-cache-int8量化 - AI开发平台ModelArts

json文件，里面是提取的per-tensor的scale值。内容示例如下：注意：抽取完成后，可能提取不到model_type信息，需要手动将model_type修改为指定模型，如"llama"。当前社区vllm只支持float8的kv_cache量化，抽取脚本中dtype类型是"float8_e4m3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 量化

总条数： 861

上一页
1
2
3
4
5
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

查询数据集的团队标注任务列表 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

复制数据至容器中空间不足 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线