搜索_华为云

迁移过程使用工具概览 - AI开发平台ModelArts

通过指定模型输出进行可对比的误差分析（精度）。模型自动调优工具 AOE(Ascend Optimization Engine)是一个昇腾设备上模型运行自动调优工具，作用是充分利用有限的硬件资源，以满足算子和整网的性能要求。在推理场景下使用，可以对于模型的图和算子运行内置的知识库进行自动优化，以提升模型的运行效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
ModelArts计费模式概述 - AI开发平台ModelArts

ModelArts计费模式概述 ModelArts服务提供包年/包月和按需计费两种计费模式，以满足不同场景下的用户需求。如您需要快速了解ModelArts服务不同计费模式的具体价格，请参见ModelArts价格详情。包年/包月：一种预付费模式，即先付费再使用，按照订单的购买周期

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
数据集版本发布失败 - AI开发平台ModelArts

标注信息不满足切分条件出现此故障时，建议根据如下建议，修改标注数据后重试。多标签的样本（即一张图片包含多个标签），至少需要有2张。如果启动训练时，设置了数据集切分功能，如果多标签的数据少于2张，会导致数据集切分失败。建议检查您的标注信息，保证标注多标签的图片，超过2张。数据集切分后，训

 帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

在创建训练作业页面配置环境变量“ROUTE_PLAN”，取值为“true”，具体操作请参见管理训练容器环境变量。代码示例训练作业的启动脚本示例如下。启动脚本中设置plog生成后存放在“/home/ma-user/modelarts/log/modelarts-job-{id}/worker-{ind

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？问题现象在高性能8卡GPU的裸金属上的训练任务突然变慢，以前1个epoch约2小时执行完成，最近1个epoch需要2天才能执行完成，并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

对于首次使用ModelArts新用户，请直接新增委托即可。一般用户新增普通用户权限即可满足使用要求。如果有精细化权限管理的需求，可以自定义权限按需设置。如果未获得委托授权，当打开“访问授权”页面时，ModelArts会提醒您当前用户未配置授权，需联系此IAM用户的管理员账号进行委托授权。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
附录：训练常见问题 - AI开发平台ModelArts

问题4：Error waiting on exit barrier错误错误截图：报错原因：多线程退出各个节点间超时时间默认为300s，时间设置过短。解决措施：修改容器内torch/distributed/elastic/agent/server/api.py文件参数： vim

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：方式一 ModelArts Notebook：该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方notebook示例可直接运行。缺点：由于是容器化环境因此不如裸机方式

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
测试用户权限 - AI开发平台ModelArts

测试用户权限由于权限配置需要等待15-30分钟生效，建议在配置完成后，等待30分钟，再执行如下验证操作。使用用户组02中任意一个子用户登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。首次登录会提示修改密码，请根据界面提示进行修改。验证ModelArts权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
Lite Server高危操作一览表 - AI开发平台ModelArts

Lite Server高危操作一览表 ModelArts Lite Server在日常操作与维护过程中涉及的高危操作，需要严格按照操作指导进行，否则可能会影响业务的正常运行。高危操作风险等级说明：高：对于可能直接导致业务失败、数据丢失、系统不能维护、系统资源耗尽的高危操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

where the trained ckpt file') args = parser.parse_args() ... # 下载的代码无需设置，后续涉及训练数据和输出路径数据使用data_url和train_url即可 #下载数据参数至容器本地，在代码中使用local_data_path代表训练输入位置

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
准备环境 - AI开发平台ModelArts
准备环境 - AI开发平台ModelArts

创建SFS Turbo文件系统前提条件：创建SFS Turbo文件系统前，确认已有可用的VPC。图4 创建SFS Turbo 需要由IAM用户设置SFS Turbo FullAccess权限，用于授权ModelArts云服务使用SFS Turbo。详细操作指导请参考创建SFS Turbo文件系统。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 准备工作
SDXL Diffusers框架基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info 如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询服务更新日志 - AI开发平台ModelArts

的流量权重，仅当infer_type为real-time时需要配置，多个权重相加必须等于100；当在一个在线服务中同时配置了多个模型版本且设置不同的流量权重比例时，持续地访问此服务的预测接口，ModelArts会按此权重比例将预测请求转发到对应的模型版本实例。 specification

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

#HuggingFace格式转换magatron格式后权重文件 ├── saved_dir_for_ma_output #训练输出保存权重，根据实际训练需求设置 ├── BaiChuan2-13B ├── logs #训练过程中日志（loss、吞吐性能）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 准备工作
SFT全参微调数据处理 - AI开发平台ModelArts

erCase'， 'BertWordPieceCase'，'GPT2BPETokenizer'， 'PretrainedFromHF']，设置为PretrainedFromHF。 - tokenizer-name-or-path：tokenizer的存放路径。 - handler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
订阅免费算法 - AI开发平台ModelArts

订阅。如果订阅的是非华为云官方资产，则会弹出“温馨提示”页面，勾选并阅读《数据安全与隐私风险承担条款》和《华为云AI Gallery服务协议》后，单击“继续订阅”才能继续进行算法订阅。算法被订阅后，详情页的“订阅”按钮显示为“已订阅”，订阅成功的资产也会展示在“我的Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

单击案例链接商超商品识别，进入模型详情页。完成模型订阅。在模型详情页，单击“订阅”，阅读并勾选同意《数据安全与隐私风险承担条款》和《华为云AI Gallery服务协议》，单击“继续订阅”。订阅模型完成后，页面的“订阅”按钮显示为“已订阅”。从模型详情页进入ModelArts控制台的订阅列表。在模型详

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
创建工作空间 - AI开发平台ModelArts

参数类型描述 - String 状态码： 500 表9 响应Body参数参数参数类型描述 - String 请求示例创建工作空间。设置工作空间名称为“test-workspace”，授权类型为“internal”，授权的IAM用户名称为“test”。 POST https

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
SFT全参微调数据处理 - AI开发平台ModelArts

erCase'， 'BertWordPieceCase'，'GPT2BPETokenizer'， 'PretrainedFromHF']，设置为PretrainedFromHF。 - tokenizer-name-or-path：tokenizer的存放路径。 - handler

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练

总条数： 851

上一页
1
...
38
39
40
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

迁移过程使用工具概览 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

准备环境 - AI开发平台ModelArts

SDXL Diffusers框架基于Devserver适配PyTorch NPU推理指导（6.3.902） - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

创建工作空间 - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线