搜索_华为云

性能调优总体原则和思路 - AI开发平台ModelArts

ling数据后，可通过该工具自动扫描profiling数据，工具分析完数据后会给出可能的性能问题点及调优建议，用户可以根据调优建议做相应的修改适配。目前该工具对CV类模型给出的调优建议较多，LLM类建议稍少，但是总体都有性能提升，实测大约可提升10%~30%的性能，并且已经在多个迁移性能调优项目中实际应用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优
查询团队标注任务详情 - AI开发平台ModelArts

成验收，此时不允许发起新的验收任务，只能继续完成当前验收任务。 3：通过。团队标注任务已完成。 4：驳回。manager再次启动任务，重新修改标注和审核工作。 5：验收结果同步中。验收任务改为异步，新增验收结果同步中的状态，此时不允许发起新的验收任务，也不允许继续当前验收，任务名称的地方提示用户同步中。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查找Workflow工作流 - AI开发平台ModelArts

设置完成后，单击“确定”即可。同时可支持对Workflow显示列进行排序，单击表头中的箭头，就可对该列进行排序。编辑Workflow名称和标签通过修改Workflow的名称和标签，方便快速查找Workflow。在ModelArts管理控制台，左侧菜单栏单击“开发空间>Workflow”。进入Workflow列表页。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
身份认证与访问控制 - AI开发平台ModelArts

使用本地IDE远程SSH连接ModelArts的Notebook开发环境时，需要用到密钥对进行鉴权认证。同时支持白名单访问控制，即设置允许远程接入访问这个Notebook的IP地址。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
VS Code一键连接Notebook - AI开发平台ModelArts

执行，可以在下方的Terminal中看到代码输出信息。如果执行较长时间的训练作业，建议使用nohup命令后台运行，否则SSH窗口关闭或者网络断连会影响正在运行的训练作业，命令参考： nohup your_train_job.sh > output.log 2>&1 & tail

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
Notebook Cache盘告警上报 - AI开发平台ModelArts

单击主题名称“操作”列的“添加订阅”。订阅成功后，一旦满足告警条件，那么就会收到通知。选择合适的协议，如邮件，短信等，并填写终端，如邮件地址，手机号等。单击确认。此时订阅总数中会出现一条记录，但是处于未确认的状态。收到邮件后单击“订阅确认”。此时该订阅记录将处于已确认的状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用CodeLab免费体验Notebook - AI开发平台ModelArts

域，单击切换规格，修改规格类型。图3 切换规格资源监控。在使用过程中，如果想了解资源使用情况，可在右侧区域选择“Resource Monitor”，展示“CPU使用率”和“内存使用率”。图4 资源监控分享副本到AI Gallery。单击右上角的，将修改后的Notebook样例保存分享到AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
训练作业容错检查 - AI开发平台ModelArts

shm 无大于1GB 磁盘空间-/cache目录 disk-size cache 无大于32GB ulimit检查 ulimit 使用IB网络时 max locked memory > 16000 open files > 1000000 stack size > 8000 max

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

AOE自动调优更多介绍可参考Ascend转换工具功能说明。自动高性能算子生成工具自动高性能算子生成工具AKG（Auto Kernel Generator），可以对深度神经网络模型中的算子进行优化，并提供特定模式下的算子自动融合功能，可提升在昇腾硬件后端上运行模型的性能。 AKG的配置也是在模型转换阶段进行配置（

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
Yaml配置文件参数配置说明 - AI开发平台ModelArts

model_name_or_path /home/ma-user/ws/tokenizers/Qwen2-72B 必须修改。加载tokenizer与Hugging Face权重时，对应的存放绝对或相对路径。请根据实际规划修改。 do_train true 指示脚本执行训练步骤，用来控制是否进行模型训练的。如果设

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
推理场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化是否支持W8A8量化是否支持W8A16量化是否支持 kv-cache-int8量化开源权重获取地址 1 llama-7b √ √ √ √ √ https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

907版本新增如下内容：文档和代码中新增对mistral和mixtral模型的适配，并添加训练推荐配置。文档准备镜像步骤中，仅提供：直接使用基础镜像方案、ECS中构建新镜像方案，删除使用Notebook创建镜像方案。文档中新增对 llama3 支持长序列文本（sequence_length >

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
AIGC工具tailor使用指导 - AI开发平台ModelArts

本工具支持x86和ARM的系统环境，使用前需要安装以下软件。表2 安装软件及步骤软件安装步骤 mindspore-lite 安装版本：2.2.10 下载地址：https://www.mindspore.cn/lite/docs/zh-CN/r2.2/use/downloads.html 需要下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
日志提示"Permission denied" - AI开发平台ModelArts

${MA_VJ_NAME}:6666替换。分析代码中是否存在并发读写同一文件的逻辑，如有则进行修改。如用户使用多卡的作业，那么可能每张卡都会有同样的读写数据的代码，可参考如下代码修改。 import moxing as mox from mindspore.communication

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

载至训练容器的“${MA_JOB_DIR}/demo-code”目录中，demo-code为OBS存放代码路径的最后一级目录，可以根据实际修改。使用自定义镜像创建训练作业时，在代码目录下载完成后，镜像的启动命令会被自动执行。启动命令的填写规范如下：如果训练启动脚本用的是py文件，例如train

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

将准备好的sshd启动脚本文件上传至OBS的训练代码目录下。创建自定义镜像训练作业。 “代码目录”选择存有sshd启动脚本文件的OBS地址。 “启动命令”需要适配sshd启动脚本，如下所示： bash ${MA_JOB_DIR}/demo-code/start_sshd.sh

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

5版本，若非该版本号则在代码开始处执行： import os os.system('pip install numpy==1.18.5') 如果依旧有报错情况，将以上代码修改为： import os os.system('pip install numpy==1.18.5') os.system('pip install

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
查询指定节点池详情 - AI开发平台ModelArts

tags Array of UserTag objects 资源标签，非特权池不能指定。 network NodeNetwork object 网络配置，非特权池不能指定。 extendParams Map<String,String> 自定义配置，比如设置节点dockerSize："extendParams":

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理

总条数： 1217

上一页
1
...
46
47
48
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

性能调优总体原则和思路 - AI开发平台ModelArts

查询团队标注任务详情 - AI开发平台ModelArts

查找Workflow工作流 - AI开发平台ModelArts

身份认证与访问控制 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

使用CodeLab免费体验Notebook - AI开发平台ModelArts

训练作业容错检查 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

查询指定节点池详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线