搜索_华为云

部署推理服务 - AI开发平台ModelArts

nci7。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_work_dir}为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.904）
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

', type=str, default=os.path.join(file_dir, 'input_dir')) parser.add_argument('--output_dir', type=str, default=os.path.join(file_dir, 'output_dir'))

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
查询训练作业列表 - AI开发平台ModelArts

TaskResponse 参数参数类型描述 role String 异构训练作业的任务角色。枚举值： learner（支持GPU\CPU规格） worker（支持CPU规格） algorithm algorithm object 算法配置。 task_resource FlavorResponse

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
创建Workflow数据集导入节点 - AI开发平台ModelArts

标签与标签之间的分隔符，默认为逗号分隔，分隔符需转义。分隔符仅支持一个字符，必须为大小写字母，数字和“!@#$%^&*_=|?/':.;,”其中的某一字符。否 str sample_label_separator 文本与标签之间的分隔符，默认为Tab键分隔，分隔符需转义。分隔符仅支持一个字符，必须为大小写字母，数字和“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
查询训练作业参数列表 - AI开发平台ModelArts

String 指定查询的排序方式，默认是作业参数名称“config_name”，目前支持的排序还有作业参数描述“config_desc”及参数创建时间 “create_time”。sample的配置类型不支持“create_time”的排序方式。 order 否 String 可选值有以下两种。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

导入AI应用提示单个模型文件超过5G限制问题现象在导入AI应用时，提示单个模型文件大小超过5G限制。原因分析在不使用动态加载的情况下，系统对单个模型文件的限制大小为5G，超过时无法进行导入。处理方法精简模型文件后，重新导入。使用动态加载功能进行导入。图1 使用动态加载

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > AI应用管理
模型转换失败时如何查看日志和定位原因？ - AI开发平台ModelArts

配置以上的环境变量之后，再重新转换模型，导出对应的日志和dump图进行分析：报错日志中搜到“not support onnx data type”，表示MindSpore暂不支持该算子。报错日志中搜到“Convert graph to om failed”，表示CANN模块进行图编译存在保存，需要结合CANN的报错日志和dump图进行具体分析。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 常见问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E网站。说明：如果没有下载权限，请联系您所在企业的华为方技术支持下载获取。权重和词表文件包含了本教程使用到的HuggingFace原始权重文件和Tokenizer。标记器(Tokenizer)是N

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
安装VS Code软件 - AI开发平台ModelArts

2版本进行远程连接。 VS Code安装指导如下：图2 Windows系统下VS Code安装指导 Linux系统下，执行命令sudo dpkg -i code_1.85.2-1705561292_amd64.deb安装。 Linux系统用户，需要在非root用户进行VS Code安装。父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

”，或称为LF）分隔各行，行内容以英文逗号（即字符“,”）分隔各列。文件内容不能包含中文字符，列内容不应包含英文逗号、换行符等特殊字符，不支持引号语法，建议尽量以字母及数字字符组成。训练数据：训练数据列数一致，总数据量不少于100条不同数据（有一个特征取值不同，即视为不同数据）。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习 > 准备数据
LoRA微调训练 - AI开发平台ModelArts

手动修改训练参数和tokenizer文件，具体请参见训练tokenizer文件说明。由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

5版本，若非该版本号则在代码开始处执行： import os os.system('pip install numpy==1.18.5') 如果依旧有报错情况，将以上代码修改为： import os os.system('pip install numpy==1.18.5') os.system('pip install

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

0.rc1 PyTorch pytorch_2.1.0 PyTorch_npu 2.1.0.post3-20240413 Step1 检查系统环境 SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
附录：指令微调训练常见问题 - AI开发平台ModelArts

packages that were not found in your environment: flash_attn 根因：昇腾环境暂时不支持flash_attn接口规避措施：修改dynamic_module_utils.py文件，将180-184行代码注释掉 vim /hom

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

文件名中的xxx表示具体的时间戳，以包的实际时间为准。获取路径：Support-E网站。说明：如果没有软件下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像西南-贵阳一：swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorc

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Notebook cache盘告警上报 - AI开发平台ModelArts

收到邮件后单击“订阅确认”。此时该订阅记录将处于已确认的状态。创建告警行动规则行动规则即为告警触发时，AOM以怎样的方式来告知用户。启用告警行动规则后，系统根据关联SMN主题与消息模板来发送告警通知。更多详情请参考AOM用户指南。根据界面提示填写行动规则名称，选择行动规则类型，选择上一步创建

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
Standard资源池节点故障定位 - AI开发平台ModelArts

is corrupted”告警。 A050109 GPU 其他 GPU其他错误。检测到的其他GPU错误，通常为硬件问题，请联系技术人员支持。 A050147 IB 链路 IB网卡异常。 ibstat查看网卡非Active状态。 A050121 NPU 其他 npu dcmi接口检测到driver异常。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
如何在ModelArts上获得RANK_TABLE_FILE进行分布式训练？ - AI开发平台ModelArts

env | grep RANK 在训练作业中，您可以在训练启动脚本的首行加入如下代码，把RANK_TABLE_FILE的值打印出来： 1 os.system('env | grep RANK') 父主题：功能咨询

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

重新发送。 import os os.environ['PS_VERBOSE'] = '2' os.environ['PS_RESEND'] = '1' 其中，“os.environ['PS_VERBOSE'] = '2'”为打印所有的通信信息。“os.environ['PS_RESEND']

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
线下容器镜像构建及调试 - AI开发平台ModelArts

建议通过开源的官方镜像来构建，例如PyTorch的官方镜像。建议容器分层构建，单层容量不要超过1G、文件数不大于10w个。分层时，先构建不常变化的层，例如：先OS，再cuda驱动，再Python，再pytorch，再其他依赖包。不建议把数据、代码放到容器镜像里。因为对应内容应该是经常变动的，会导致频繁的容器镜像构建操作。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡

总条数： 1606

上一页
1
...
73
74
75
...
81
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

创建Workflow数据集导入节点 - AI开发平台ModelArts

查询训练作业参数列表 - AI开发平台ModelArts

导入AI应用提示单个模型文件超过5G限制 - AI开发平台ModelArts

模型转换失败时如何查看日志和定位原因？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

安装VS Code软件 - AI开发平台ModelArts

创建预测分析自动学习项目时，对训练数据有什么要求？ - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

SD1.5基于DevServer适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

Notebook cache盘告警上报 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

如何在ModelArts上获得RANK_TABLE_FILE进行分布式训练？ - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线