搜索_华为云

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

源，不同资源规格有不同的容量。 k8s磁盘的驱逐策略是90%，所以可以正常使用的磁盘大小应该是“cache目录容量 x 0.9”。裸机的本地磁盘为物理磁盘，无法扩容，如果存储的数据量大，建议使用SFS存放数据，SFS支持扩容。 GPU规格的资源表1 GPU cache目录容量

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

查看Personal Access Token步骤如下：登录Github，打开设置页面。单击“Developer settings”。单击“Personal access tokens > Generate new token”。验证登录账号。填写Token描述并选择权限，选择私有仓库访问权限，单击“Generate

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

ta_url”。您需要在训练代码中添加超参，默认为“data_url”。使用“data_url”当做训练数据输入的本地路径。检查报错的路径是否存在由于用户本地开发的代码需要上传至ModelArts后台，训练代码中涉及到依赖文件的路径时，用户设置有误的场景较多。推荐通用的解

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

图3 司乘安全算法将用户本地开发完成的模型，使用自定义镜像构建成ModelArts Standard推理平台可以用的模型。具体操作请参考从0-1制作自定义镜像并创建模型。在ModelArts管理控制台，使用创建好的模型部署为在线服务。登录云监控服务CES管理控制台，设置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

参微调训练、LoRA微调训练数据集下载链接下载数据集。可通过两种方式，将数据集上传至SFS Turbo中。方式一：将下载的原始数据通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目录下。创建目录“training_data”，将原始

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

精度对齐长训Loss比对结果使用Msprobe工具分析偏差 Loss对齐结果父主题： Dit模型PyTorch迁移与精度性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：云上迁移适配故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

确保容器可以访问公网。 Step1 检查环境请参考Lite Server资源开通，购买Lite Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买Lite Server资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

参微调训练、LoRA微调训练数据集下载链接下载数据集。可通过两种方式，将数据集上传至SFS Turbo中。方式一：将下载的原始数据通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/sfs_turbo/目录下。创建目录“training_data”，将原始

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

性能调优 Profiling数据采集使用Advisor工具分析生成调优建议调优前后性能对比父主题： Dit模型PyTorch迁移与精度性能调优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

om格式的模型转换能力，在ModelArts中逐步增加.mindir格式的支持能力。下线模型转换后是否有替代功能？您可以通过链接下载ATC模型转换工具，按照指导，在线下转换成.om格式模型。 ModelArts中是否还会增加模型转换的能力？ ModelArts开发环境中在贵阳一Regio

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
Standard数据准备 - AI开发平台ModelArts

Standard数据准备在ModelArts数据集中添加图片对图片大小有限制吗？如何将本地标注的数据导入ModelArts？在ModelArts中数据标注完成后，标注结果存储在哪里？在ModelArts中如何将标注结果下载至本地？在ModelArts中进行团队标注时，为什么团队成员收不到邮件？

帮助中心 > AI开发平台ModelArts > 常见问题
PyTorch迁移精度调优 - AI开发平台ModelArts

PyTorch迁移精度调优精度问题概述精度调优总体思路精度调优前准备工作 msprobe精度分析工具使用指导父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
APP认证管理 - AI开发平台ModelArts

查询APP详情删除APP 增加AppCode 重置AppCode 删除AppCode 重置AppSecret 获取用户绑定APP的api列表注册API并授权给APP 删除API 授权API至APP 更新API授权解除API对APP的授权获取API授权关系列表创建API 查询API

帮助中心 > AI开发平台ModelArts > API参考
推理模型量化 - AI开发平台ModelArts

推理模型量化使用AWQ量化使用SmoothQuant量化使用kv-cache-int8量化使用GPTQ量化使用llm-compressor工具量化父主题：主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

2.1.0 步骤一：检查环境请参考Lite Server资源开通，购买Lite Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买Lite Server资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
日志提示“Unexpected keyword argument passed to optimizer” - AI开发平台ModelArts

迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

令中涉及到组织名称“deep-learning”也请替换为自定义的值。单击右上角“登录指令”，获取登录访问指令，本文选择复制临时登录指令。以root用户登录本地环境，输入复制的SWR临时登录指令。上传镜像至容器镜像服务镜像仓库。使用docker tag命令给上传镜像打标签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型

总条数： 709

上一页
1
...
19
20
21
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts训练中不同规格资源“/cache”目录的大小是多少？ - AI开发平台ModelArts

在JupyterLab使用Git克隆代码仓 - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

端到端运维ModelArts Standard推理服务方案 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

日志提示“Out of bounds nanosecond timestamp” - AI开发平台ModelArts

MindSpore日志提示“ retCode=0x91, [the model stream execute failed]” - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告 - AI开发平台ModelArts

日志提示“CUDNN_STATUS_NOT_SUPPORTED. ” - AI开发平台ModelArts

Standard数据准备 - AI开发平台ModelArts

PyTorch迁移精度调优 - AI开发平台ModelArts

APP认证管理 - AI开发平台ModelArts

推理模型量化 - AI开发平台ModelArts

Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

日志提示“Unexpected keyword argument passed to optimizer” - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线