搜索_华为云

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

因此删除它。默认该文件在/root/nccl-tests直接删除即可。从内核中卸载nvidia相关的所有进程。在安装nvidia驱动时，必须把内核中加载nvidia相关的进程卸载，否则会失败。具体操作请参考卸载nvidia驱动。若遇到加载到内核的nvidia进程循环依赖，无法从内核中卸载n

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
创建Workflow数据集版本发布节点 - AI开发平台ModelArts

已存在的数据集或者标注任务进行版本发布，每个版本相当于数据的一个快照，可用于后续的数据溯源。主要应用场景如下：对于数据标注这种操作，可以在标注完成后自动帮助用户发布新的数据集版本，结合as_input的能力提供给后续节点使用。当模型训练需要更新数据时，可以使用数据集导入节点先

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
训练过程读取数据 - AI开发平台ModelArts

训练过程读取数据在ModelArts上训练模型，输入输出数据如何配置？如何提升训练效率，同时减少与OBS的交互？大量数据文件，训练过程中读取数据效率低？使用Moxing时如何定义路径变量？父主题： Standard训练作业

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

成。查看数据特征分析结果。 “版本选择”：在右侧下拉框中选择进行对比的版本。也可以只选择一个版本。 “类型”：选择需要分析的类型。支持“all”、“train”、“eval”和“inference”。 “数据特征指标”：在右侧下拉框中勾选需要展示的指标。详细指标说明请参见支持分析指标及其说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
创建开发环境实例 - AI开发平台ModelArts

排到队的剩余时间，单位为秒。 end_timestamp Integer 实例排队的预计停止时间，13位时间戳。 rank Integer 实例在队列中的排位。表27 user字段数据结构说明参数参数类型说明 id String 用户ID。 name String 用户名。表28

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

创建Notebook实例后无法打开页面，如何处理？如何在Notebook中安装外部库？开发环境中不同Notebook规格资源“/cache”目录的大小在Notebook中，如何使用昇腾多卡进行调试？更多 AI应用管理导入模型时，模型配置文件中的安装包依赖参数如何编写？使用自定义镜像创建在线服务，如何修改默认端口？

帮助中心 > AI开发平台ModelArts > 成长地图
管理同步在线服务 - AI开发平台ModelArts

管理同步在线服务查看在线服务详情查看在线服务的事件管理在线服务生命周期修改在线服务配置在云监控平台查看在线服务性能指标集成在线服务API至生产环境中应用父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

device=/dev/davinci0：挂载NPU设备，示例中挂载了1张卡davinci0。 ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
开发Workflow命令参考 - AI开发平台ModelArts

配置Workflow的输入输出目录创建Workflow节点构建Workflow多分支运行场景编排Workflow 发布Workflow 在Workflow中更新已部署的服务 Workflow高阶能力父主题：使用Workflow实现低代码AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

源池。假设您计划购买包年/包月的专属资源池，可在ModelArts控制台“专属资源池 > 弹性集群 > 资源池”中，单击“创建”，选择“计费模式”为“包年/包月”，在页面左下角查看所需费用。费用指的是专属资源池根据所选配置计算的费用。计费周期包年/包月资源的计费周期是根据您购

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

device=/dev/davinci0：挂载NPU设备，示例中挂载了1张卡davinci0。 ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

${container_name} bash Step6 安装Decord Decord是一个高性能的视频处理库，在昇腾环境中安装需要修改一些源码进行适配。 Decord建议安装在 /home/ma-user/lib中。安装x264 mkdir /home/ma-user/lib && cd /home/ma-user/lib

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
按需转包年/包月 - AI开发平台ModelArts

登录管理控制台，单击左侧导航栏的图标，选择“人工智能 > ModelArts”。在ModelArts列表页，选择“专属资源池 > 弹性集群”，选中目标专属资源池。在“操作 > 更多 > 转包周期”。在弹出的“转包周期”页面，确认无误后单击“确定”。图1 转包周期选择弹性集群的

 帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

假设您计划购买按需计费的专属资源池，可在ModelArts控制台“专属资源池 > 弹性集群 > 资源池”中，单击“创建”，选择“计费模式”为“按需计费”，在页面左下角查看所需费用。费用指的是资源池根据所选配置计算的费用。按需计费的公共资源池不支持在控制台直接购买，您可在进行AI开发（包括运行自动学习作业/Workf

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

copy_parallel(src,dst) torch.distributed.barrier() 建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
ModelArts Standard使用流程 - AI开发平台ModelArts

ModelArts Standard训练模型。 Standard的推理部署功能提供了界面化的推理部署生产环境，AI模型开发完成后，在Standard中可以纳管AI模型并快速部署为推理服务，您可以进行在线推理预测，也可以通过调用API把AI推理能力集成到自己的IT平台。具体请参见推理部署使用场景。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
计费相关 - AI开发平台ModelArts
计费相关 - AI开发平台ModelArts

ModelArts自动学习所创建项目一直在扣费，如何停止计费？如果不再使用ModelArts，如何停止收费？训练作业如何收费？为什么项目删除完了，仍然还在计费？欠费后，ModelArts的资源是否会被删除？部署后的AI应用是如何收费的？ Notebook中的EVS存储可以使用套餐包吗？

帮助中心 > AI开发平台ModelArts > 常见问题
训练的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

用本服务API需要project级别的Token，即调用获取用户Token接口时，请求body中“auth.scope”的取值需要选择“project”，请求示例如下所示。在构造请求中以调用获取用户Token接口为例说明了如何调用API。 { "auth": { "identity":

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

/root && \ usermod -a -G root ma-user 其他现象，可以在已有的训练故障案例查找。建议与总结用户使用自定义镜像训练作业时，建议按照训练作业自定义镜像规范制作镜像。文档中同时提供了端到端的示例供用户参考。父主题：训练作业运行失败

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败

总条数： 1459

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

创建Workflow数据集版本发布节点 - AI开发平台ModelArts

训练过程读取数据 - AI开发平台ModelArts

分析ModelArts数据集中的数据特征 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

管理同步在线服务 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导（6.3.909） - AI开发平台ModelArts

开发Workflow命令参考 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

Qwen-VL基于DevServer适配Pytorch NPU的推理指导(6.3.906) - AI开发平台ModelArts

Open-Sora-Plan1.0基于DevServer适配PyTorch NPU训练推理指导（6.3.907） - AI开发平台ModelArts

按需转包年/包月 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

ModelArts Standard使用流程 - AI开发平台ModelArts

计费相关 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

自定义镜像训练作业失败定位思路 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线