搜索_华为云

创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

创建算法功能介绍创建一个算法。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/algorithms 表1 路径参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

否则训练会失败。配置节点间SSH免密互信涉及代码适配和训练作业参数配置，本文提供了一个操作示例。准备一个预装OpenSSH的自定义镜像，使用的训练框架是MPI或Horovod。准备一个sshd启动脚本文件“start_sshd.sh”。 MY_SSHD_PORT=${MY

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
创建ModelArts人工标注作业 - AI开发平台ModelArts

参数名称说明数据集名称选择支持当前标注类型的数据集。添加标签集（声音分类） “声音分类”类型的标注作业可以添加标签集。设置标签名称：在标签名称文本框中，长度为1～1024字符。添加标签：单击“添加标签”可增加多个标签。标签管理（语音分割） “语音分割”类型的标注作业，支持标签管理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

打开网站后请输入SN编码“2102313LNR10P5100077”，若失效可以提工单至华为云ModelArts查询。 Atlas 800训练服务器的网卡配置问题机头网卡配置是什么？有以下两类网卡：四个2*100GE网卡，为RoCE网卡，插在NPU板。一个4*25G

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

i.com不通过公网代理，huaweicloud.com域名在no_proxy/NO_PROXY中包含，就访问不了。解决方式执行以下命令查看在no_proxy/NO_PROXY中是否包含huaweicloud.com域名。 env | grep -i no_proxy 如果包

 帮助中心 > AI开发平台ModelArts > 故障排除 > API/SDK
重置节点后无法正常使用？ - AI开发平台ModelArts

Lite的CCE集群在资源池上只有一个节点，且用户设置了volcano为默认调度器时，在ModelArts侧进行重置节点的操作后，节点无法正常使用，节点上的POD会调度失败。原因分析在ModelArts侧进行节点重置后，modelarts-os会向节点添加准入污点，进行节点准入，而因

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

ModelArts中注册镜像镜像上传后，可在SWR中查看已上传的镜像。但在ModelArts中还需要完成镜像注册后，才能在后续的Notebook中使用。登录ModelArts管理控制台，在左侧导航栏选择“资产管理 > 镜像管理”，然后在“镜像管理”页面右上角单击“注册镜像”。在“

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

精度一般问题不大，step_loss都是一个较小值。训练过程中，训练日志会在最后的Rank节点打印。可以使用可视化工具TrainingLogParser查看loss收敛情况。其它注意事项默认500step保存一个checkpoint，可以通过在启动脚本里添加参数--checkpointing_steps=num修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
（可选）配置镜像预热 - AI开发平台ModelArts

io/dockerconfigjson类型。若需添加多个密钥，可以单击“+”新增密钥数。添加镜像预热配置若需添加多个镜像，可单击此按键。图2 预置镜像预热图3 预置镜像选择图4 自定义镜像预热创建密钥所需的仓库地址、用户名、密码、可以参考对应租户的SWR登录指令。图5 创建密钥

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

为了保证训练结果中输出Summary文件，在编写训练脚本时，您需要在脚本中添加收集Summary相关代码。 TensorFlow引擎的训练脚本中添加Summary代码，具体方式请参见TensorFlow官方网站。注意事项运行中的可视化作业不单独计费，当停止Notebook实例时，计费停止。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
网卡名称错误 - AI开发平台ModelArts

package - torch.distributed — PyTorch 2.3 documentation 父主题：常见错误原因和解决方法

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 常见错误原因和解决方法
使用Msprobe工具分析偏差 - AI开发平台ModelArts

偏差，所以对第一个Step进行比对分析。此处使用Msprobe的整网Dump和比对分析功能。首先安装社区Msprobe工具，命令如下： pip install mindstudio-probe 使能工具进行数据Dump分析。本实验可在train.py中如下两处添加使能代码：其中config

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
使用前必读 - AI开发平台ModelArts

或其他要求。可用区一个可用区（AZ）是一个或多个物理数据中心的集合，有独立的风火水电，AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连，以满足用户跨AZ构建高可用性系统的需求。项目区域默认对应一个项目，这个项目由系统预置

 帮助中心 > AI开发平台ModelArts > API参考
准备物体检测数据 - AI开发平台ModelArts

在同一区域。数据集要求保证图片质量：不能有损坏的图片；目前支持的格式包括jpg、jpeg、bmp、png。不要把明显不同的多个任务数据放在同一个数据集内。为了保证模型的预测准确度，训练样本跟真实使用场景尽量相似。为保证模型的泛化能力，数据集尽量覆盖可能出现的各种场景。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是 Hugging

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
配置多分支节点数据 - AI开发平台ModelArts

配置多分支节点数据功能介绍仅用于存在多分支执行的场景，在编写构建工作流节点时，节点的数据输入来源暂不确定，可能是多个依赖节点中任意一个节点的输出。只有当依赖节点全部执行完成后，才会根据实际执行情况自动获取有效输出作为输入。使用案例 from modelarts import

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
查询预置算法 - AI开发平台ModelArts

thms 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求消息请求参数如表2所示。表2 查询检索参数参数是否必选参数类型说明 per_page 否 Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理业务迁移到昇腾的通用流程，可参考GPU推理业务迁移至昇腾的通用指导。由于Huggingface网站的限制，访问Stable Diffusion链接时需使用代理服务器，否则可能无法访问网站。在Stable Diffusion迁移适配时，更多的时候是在适配Diffusers和Stable

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
Lite Cluster资源开通 - AI开发平台ModelArts

为线性或条带化。线性逻辑卷是将一个或多个物理卷整合为一个逻辑卷，实际写入数据时会先往一个基本物理卷上写入，当存储空间占满时再往另一个基本物理卷写入。条带化是指创建逻辑卷时指定条带化，当实际写入数据时会将连续的数据分成大小相同的块，然后依次存储在多个物理卷上，实现数据的并发读写从而

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
ECS获取和上传基础镜像 - AI开发平台ModelArts

ECS获取和上传基础镜像 Step1 创建ECS 下文中介绍如何在ECS中构建一个训练镜像，请参考ECS文档购买一个Linux弹性云服务器。完成网络配置、高级配置等步骤，可根据默认选择，或进行自定义。创建完成后，单击“远程登录”，后续安装Docker等操作均在该ECS上进行。注

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像

总条数： 1803

上一页
1
...
4
5
6
...
91
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建算法 - AI开发平台ModelArts

自定义镜像训练作业配置节点间SSH免密互信 - AI开发平台ModelArts

创建ModelArts人工标注作业 - AI开发平台ModelArts

哪里可以了解Atlas800训练服务器硬件相关内容 - AI开发平台ModelArts

用户执行huaweicloud.com相关API超时 - AI开发平台ModelArts

重置节点后无法正常使用？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

SD1.5基于Lite Server适配PyTorch NPU Finetune训练指导（6.3.904） - AI开发平台ModelArts

（可选）配置镜像预热 - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

准备物体检测数据 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

查询预置算法 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

ECS获取和上传基础镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线