搜索_华为云

Pytorch Mox日志反复输出 - AI开发平台ModelArts

不断销毁重建，Mox也就会不断的被导入，导致打印很多Mox的版本信息。处理方法为避免训练作业Pytorch Mox日志反复输出的问题，需要您在“启动文件”中添加如下代码，当“MOX_SILENT_MODE = “1””时，可在日志中屏蔽mox的版本信息： import os os

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

构建超时中断，即会出现“Model image build task timed out”提示，不显示详细的构建日志。处理方法预先准备需要编译下载的依赖包，减少依赖包下载和编译的时间。可通过线下wheel包方式安装运行环境依赖。线下wheel包安装，需确保wheel包与模型文件放在同一目录。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
Standard数据准备 - AI开发平台ModelArts

如何将两个ModelArts数据集合并？在ModelArts中同一个账户，图片展示角度不同是为什么？在ModelArts中智能标注完成后新加入数据需要重新训练吗？在ModelArts中如何将图片划分到验证集或者训练集？在ModelArts中物体检测标注时能否自定义标签？ ModelArts数据集新建的版本找不到怎么办？

帮助中心 > AI开发平台ModelArts > 常见问题
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

如果使用Server资源，请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906） > 准备工作
如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

k”路径下。 ln -s建立软连接如果代码中涉及文件绝对路径，由于Notebook调试与训练作业环境不同，可能会导致文件绝对路径不一致，需要修改代码内容。推荐使用软链接的方式解决该问题，用户只需提前建立好软链接，代码中的地址可保持不变。新建软链接： # ln -s 源目录/文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
训练脚本存放目录说明 - AI开发平台ModelArts

... └─QwenVL ├── train/<commit_id> # 本教程中需要的模型代码 └── Dockerfile # 构建镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
部署的在线服务状态为告警 - AI开发平台ModelArts

业务内存不正常。请检查推理代码是否存在内存溢出或者内存泄漏的问题。模型运行异常。请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。实例pod数量异常。如果您曾经找过运维人员删除过异常的实例pod，事件中可能会出现告警“服务异常，不正常的实例数为XX

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
模型训练使用流程 - AI开发平台ModelArts

训练数据除了训练数据集，也可以是预测模型。在创建训练作业前，需要先准备好训练数据。当训练数据可以直接使用，无需二次处理时，可以直接将数据上传至OBS桶。在创建训练作业时，训练的输入参数位置可以直接填写OBS桶路径。当训练数据集的数据未标注或者需要进一步的数据预处理，可以先将数据导入Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

档。训练资源需要使用单机8卡。确保容器可以访问公网。 Step1 检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
msprobe精度比对 - AI开发平台ModelArts

循环体 debugger.stop() # 一般在训练循环末尾结束工具。 debugger.step() # 在训练循环的最后需要重置工具，非循环场景不需要。具体的config.json的配置要求请参见介绍。创建比对compare.json文件。单卡场景 { "npu_path":

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
VS Code ToolKit连接Notebook - AI开发平台ModelArts

代码上传至云端。在VS Code中打开要执行的代码文件，在执行代码之前需要选择合适的Python版本路径，单击下方默认的Python版本路径，此时在上方会出现该远程环境上所有的python版本，选择自己需要的版本即可。图14 选择Python版本对于打开的代码文件，单击ru

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制推理部署使用的服务框架是vLLM（官网地址：https://github.com/vllm-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。准备代码准备AscendCloud-6.3.908-xxx.zip。准备镜像准备推理模型适用的容器镜像。准备Notebook 本案例在Notebook上部署推理服务进行调试，因此需要创建Notebook。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。 EPOCH 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。 TRAIN_ITERS SN / GBS * EPOCH 非必填。表示训练step迭代次数，根据实际需要修改。 SEED 1234 随机种子数。每次数据采样时，保持一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
部署在线服务 - AI开发平台ModelArts

mapping_rule 否 Map 输入参数与csv数据的映射关系，仅当mapping_type为csv时需要填写。映射规则与模型配置文件config.json中输入参数的定义方式相似，只需要在每一个基本类型（string/number/integer/boolean）的参数下配置inde

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.

帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

须选择“预置框架”。如果使用“自定义算法”创建训练作业，则可以把相关文件放置在配置的“代码目录”下，“启动方式”必须选择“预置框架”。需要在创建训练作业前将相关文件上传至OBS路径下，文件打包要求请参见安装文件规范。安装文件规范请根据依赖包的类型，在代码目录下放置对应文件：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
剪枝 - AI开发平台ModelArts
剪枝 - AI开发平台ModelArts

常用的剪枝技术包括：结构化稀疏剪枝、半结构化稀疏剪枝、非结构化稀疏剪枝。 FASP剪枝 FASP剪枝是一种结构化稀疏剪枝方法，能有效降低模型显存以及需要部署的资源依赖，减小推理过程中的计算量，降低增量推理时延，提升吞吐。 FASP (Fast and Accurate Structured

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

Uncorrectable记录。 L3: 错误未被抑制，可能影响后续业务，需要重置卡或重启节点。观测方式：Xid事件中包含95事件。(Remapped的Pending记录只作为提示，当业务空闲时进行卡重置触发重映射即可) L4: 需要换卡，SRAM Uncorrectable>4或者Remapped

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
模型调试 - AI开发平台ModelArts
模型调试 - AI开发平台ModelArts

python包的下载源。 pip_packages 否 List conda虚拟环境需要使用的python包，如tensorflow，pillow等。 conda_packages 否 List conda虚拟环境需要使用的conda包，如指定python版本。表4 params结构参数

 帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理

总条数： 1509

上一页
1
...
58
59
60
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Pytorch Mox日志反复输出 - AI开发平台ModelArts

创建模型失败，提示模型镜像构建任务超时，没有构建日志 - AI开发平台ModelArts

Standard数据准备 - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

如何保证训练和调试时文件路径保持一致 - AI开发平台ModelArts

训练脚本存放目录说明 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

SDXL基于DevServer适配PyTorch NPU的Finetune训练指导（6.3.905） - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

VS Code ToolKit连接Notebook - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

Yolov8基于DevServer适配MindSpore Lite推理指导（6.3.909） - AI开发平台ModelArts

在ModelArts上如何创建引用第三方依赖包的训练作业？ - AI开发平台ModelArts

剪枝 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

模型调试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线