搜索_华为云

如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

止因运行Workflow工作流而创建的训练作业和部署的服务。同时，也需清理存储到OBS中的数据。自动学习：自动学习运行时会收取费用，使用完请及时停止自动学习、停止因运行自动学习而创建的训练作业和部署的服务。同时，也需清理存储到OBS中的数据。 Notebook实例：运行中的N

帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

环境变量，如表2所示。表2 建议增加的环境变量环境变量建议值说明 NCCL_IB_TIMEOUT 18 用于控制IB通信超时时间，算法为“4.096 µs * 2 ^ timeout”。如出现NCCL通信超时问题可适当调大，最大可调整至22。较大的值可能会影响性能，设置为18相对平衡。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 创建训练作业
在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

设置模型参数/权重更新的次数。在调优过程中，每一个Iterations会消耗32条训练数据。参见表3 学习率/learning_rate 设置每个迭代步数（iteration）模型参数/权重更新的速率。学习率设置得过高会导致模型难以收敛，过低则会导致模型收敛速度过慢。参见表3 资源设置资源池类型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
自定义模型规范 - AI开发平台ModelArts

“train_params.json” 必选文件，训练参数文件，定义了模型训练的必要参数，例如训练方式、超参信息。该参数会显示在微调工作流的“作业设置”页面的算法配置和超参数设置里面。代码示例请参见train_params.json示例。 “dataset_readme.md” 必选文件，数据集要求

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
部署模型为在线服务 - AI开发平台ModelArts

数，即上文提到的输入请求类型。图2 查看服务的调用指南调用指南中的输入参数取决于您选择的AI应用来源：如果您的元模型来源于自动学习或预置算法，其输入输出参数由ModelArts官方定义，请直接参考“调用指南”中的说明，并在预测页签中输入对应的JSON文本或文件进行服务测试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业
创建训练任务 - AI开发平台ModelArts

训练作业”，默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： cd ${MA_JOB_DIR}/demo && python

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
迁移环境准备 - AI开发平台ModelArts

Diffusion模型迁移到Ascend上进行推理。方式二 ModelArts Lite DevServer：该环境为裸机开发环境，主要面向深度定制化开发场景。优点：支持深度自定义环境安装，可以方便的替换驱动、固件和上层开发包，具有root权限，结合配置指导、初始化工具及容器镜像可以快速搭建昇腾开发环境。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建训练任务 - AI开发平台ModelArts

训练作业”，默认进入“训练作业”列表。单击“创建训练作业”进入创建训练作业页面。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： ln -s /home/ma-user/work/coco /home/ma-user/coco

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机多卡
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

spawn命令启动训练作业。创建训练作业的关键参数如表1所示。表1 创建训练作业（预置框架）参数名称说明创建方式选择“自定义算法”。启动方式选择“预置框架”，引擎选择“PyTorch”，PyTorch版本根据训练要求选择。代码目录选择OBS桶中训练code文

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
自定义镜像规范 - AI开发平台ModelArts

“train_params.json” 必选文件，训练参数文件，定义了模型训练的必要参数，例如训练方式、超参信息。该参数会显示在微调工作流的“作业设置”页面的算法配置和超参数设置里面。代码示例请参见train_params.json示例。 “dataset_readme.md” 必选文件，数据集要求

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
创建Workflow模型注册节点 - AI开发平台ModelArts

) # 算法超参的值使用Placeholder对象来表示，支持int, bool, float, str四种类型 ] ), # 训练使用的算法对象，示例中使用AIGallery订阅的算法；部分算法超参的值如果无需修改，则在para

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
自定义镜像使用场景 - AI开发平台ModelArts

安全可信，基于安全加固最佳实践，访问策略、用户权限划分、开发软件漏洞扫描、操作系统安全加固等方式，确保镜像使用的安全性。 ModelArts的自定义镜像使用场景当用户对深度学习引擎、开发库有特殊需求场景的时候，预置镜像已经不能满足用户需求。ModelArts提供自定义镜像功能支持用户自定义运行引擎。 Model

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

run”，驱动包名称为“Ascend-hdk-型号-npu-driver_版本号_linux-aarch64.run”，商用版是权限受控，仅华为工程师和渠道用户有权限下载，下载地址请见固件驱动包下载链接。 arch cat /etc/os-release 图5 查看机器操作系统版本及架构

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
AI Gallery使用流程 - AI开发平台ModelArts

到AI Gallery、将Workflow工作流发布到AI Gallery、将ModelArts AI应用发布到AI Gallery、发布算法到AI Gallery。发布到AI Gallery中的资产，也支持在ModelArts中订阅使用，具体可参见从AI Gallery订阅模型、从AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
查询数据处理任务的版本详情 - AI开发平台ModelArts

task_version_id String 数据处理任务的版本ID。 template TemplateParam object 算法模板，如算法ID和参数等。 unmodified_sample_count Integer 处理后无修改的图片数量。 update_time Long

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建训练任务 - AI开发平台ModelArts

在左侧导航栏中选择“模型训练 > 训练作业”，默认进入“训练作业”列表。在“创建训练作业”页面，填写相关参数信息，然后单击“提交”。创建方式：选择“自定义算法”。启动方式：选择“自定义”。镜像：选择上传的自定义镜像。启动命令： cd /home/ma-user/work/code/Swin-Transformer

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
发布数据 - AI开发平台ModelArts
发布数据 - AI开发平台ModelArts

“仅自己可见”：表示只有当前账号可以查看并使用该资产。单击“保存”，完成修改。关联资产数据集可以关联Notebook和算法。当数据集关联了Notebook或算法时，Notebook或算法页面也显示关联了数据集。选择“关联资产”页签，单击右上方的“编辑”，在搜索框中输入待关联资产的ID，单击“关联”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

“nvidia-smi”是一个NVIDIA GPU监视器命令行工具，用于查看GPU的使用情况和性能指标，可以帮助用户进行GPU优化和故障排除。但是建议在业务软件或训练算法中，避免频繁使用“nvidia-smi”命令功能获取相关信息，存在锁死的风险。出现D+进程后可以尝试如下方法：方法1：可以根据ps -aux查到的进程号，

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
Standard功能介绍 - AI开发平台ModelArts

Standard功能介绍 Standard自动学习 Standard Workflow Standard数据管理 Standard开发环境 Standard模型训练 Standard模型部署 Standard资源管理 Standard支持的AI框架父主题：功能介绍

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
计费项 - AI开发平台ModelArts
计费项 - AI开发平台ModelArts

计费项自动学习/Workflow计费项数据管理计费项开发环境计费项模型训练计费项 AI应用计费项推理部署计费项专属资源池计费项

 帮助中心 > AI开发平台ModelArts > 计费说明

总条数： 471

上一页
1
...
17
18
19
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

如何查看ModelArts中正在收费的作业？ - AI开发平台ModelArts

在ModelArts创建分布式训练时如何设置NCCL环境变量？ - AI开发平台ModelArts

在ModelArts Studio基于Llama3-8B模型实现新闻自动分类 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

AI Gallery使用流程 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

发布数据 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

Standard功能介绍 - AI开发平台ModelArts

计费项 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线