搜索_华为云

精度问题概述 - AI开发平台ModelArts

为了更好地了解这种计算差异，并且能够正确区分正常计算差异和引起模型精度问题的异常差异，本指南提供了算子问题定位工具集详细的使用场景和使用步骤，方便用户自行或在支持下排查可能的数值计算精度问题。当用户将大语言模型或者其他类型深度神经网络的训练从GPU迁移到昇腾AI处理器时，可能出现以下不同现象的模型精度问题。一般包括：

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

可以在几乎不影响推理精度情况下，可以有效提升推理性能（吞吐等）。本文主要应用FASP对LLM进行剪枝压缩。约束限制 FASP剪枝当前仅支持Llama系列、Llama2系列、Llama3系列、Qwen2系列的NLP模型。安装AscendModelNano AscendMode

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
日志提示"write line error" - AI开发平台ModelArts

处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。 import os os.system("ulimit -c 0") 排查数据集大小，checkpoint保存文件大小，是否占满了磁盘空间。必现的问题，使用本

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
训练启动脚本说明和参数配置 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

}, { "from": "assistant", "value": "我是Qwen-VL,一个支持视觉输入的大模型。" } ] }, { "id": "identity_1", "conversations":

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

}, { "from": "assistant", "value": "我是Qwen-VL,一个支持视觉输入的大模型。" } ] }, { "id": "identity_1", "conversations":

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
训练启动脚本说明和参数配置 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

获取路径：Support-E，登录后在此路径中查找下载ModelArts 6.3.911 版本。说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像包 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
部署在线服务 - AI开发平台ModelArts

部署在线服务predictor和transformer参数说明参数是否必选参数类型描述 service_name 否 String 服务名称，支持1-64位可见字符（含中文），只能以英文大小写字母或者中文字符开头，名称可以包含字母、中文、数字、中划线、下划线。 description

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询训练作业列表 - AI开发平台ModelArts

指定要查询页的索引，默认为1。“page”可选的范围为[1，65535]。 sortBy 否 String 指定查询的排序方式，默认是作业名称“job_name”，目前支持的排序还有作业描述“job_desc”，作业状态“status”，运行时长“duration”，作业版本数“version_count”以及创建时间

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
查询服务对象列表 - AI开发平台ModelArts

service_instance3 ...]，列表中元素“service_instance”对象即为服务管理章节描述的可调用服务接口。支持按照检索参数查询服务列表，返回满足检索条件的服务list，检索参数如表1所示。在查询列表时，返回list的同时，默认会打印模型列表的详细信息，如表2和表3所示。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

OBS桶与ModelArts不在同一个区域导致。没有他人OBS桶的访问权限。 ModelArts上没有配置委托授权。 OBS文件加密上传导致。ModelArts不支持OBS加密文件。 OBS桶的权限和访问ACL设置不正确导致。创建训练作业时，代码目录和启动文件设置有误。处理办法查看OBS桶与ModelArts是否在同一个区域

 帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

注意填写有效的Token描述信息，避免误删除导致构建失败。无需使用时及时删除Token，避免信息泄露。图3 克隆GitHub的私有仓库（目前只支持Personal Access Token授权）图4 获取Personal Access Token 查看代码库信息在Name下方列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
配置IAM权限 - AI开发平台ModelArts

FullAccess、SWR OperateAccess、SWR ReadOnlyAccess仅限容器镜像服务企业版使用，目前企业版已暂停公测。非企业版用户暂不支持使用此权限。因此需要在此勾选“SWR Admin” 策略。选择授权范围方案为“所有资源”，单击“确定”。精细化授权管理如果您需要进行

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
训练启动脚本说明和参数配置 - AI开发平台ModelArts

不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2 llama2-7b SEQ_LEN=4096 TP(tensor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
读取文件报错，如何正确读取文件 - AI开发平台ModelArts

read(img_path), np.uint8), 1) 在MXNet环境下使用torch包，请您尝试如下方法先进行导包： import os os.sysytem('pip install torch') import torch 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

文件名中的xxx表示具体的时间戳，以包名的实际时间为准。获取路径：Support-E 如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像包 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch_2_1_ascend:pytorch_2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
资源管理 - AI开发平台ModelArts
资源管理 - AI开发平台ModelArts

资源管理查询OS的配置参数查询插件模板查询节点列表批量删除节点批量重启节点查询事件列表创建网络资源查询网络资源列表查询网络资源删除网络资源更新网络资源查询资源实时利用率创建资源池查询资源池列表查询资源池删除资源池更新资源池资源池监控资源池统计

 帮助中心 > AI开发平台ModelArts > API参考
创建Workflow数据集导入节点 - AI开发平台ModelArts

标签与标签之间的分隔符，默认为逗号分隔，分隔符需转义。分隔符仅支持一个字符，必须为大小写字母，数字和“!@#$%^&*_=|?/':.;,”其中的某一字符。否 str sample_label_separator 文本与标签之间的分隔符，默认为Tab键分隔，分隔符需转义。分隔符仅支持一个字符，必须为大小写字母，数字和“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点

总条数： 1473

上一页
1
...
68
69
70
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

精度问题概述 - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

读取文件报错，如何正确读取文件 - AI开发平台ModelArts

SDXL基于Lite Server适配PyTorch NPU的LoRA训练指导（6.3.905） - AI开发平台ModelArts

资源管理 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线