搜索_华为云

配额管理 - AI开发平台ModelArts
配额管理 - AI开发平台ModelArts

配额管理查询OS的配额

 帮助中心 > AI开发平台ModelArts > API参考
日志提示"write line error" - AI开发平台ModelArts

处理方法如果在训练作业的工作目录下有core文件生成，可以在启动脚本最前面加上如下代码，来关闭core文件产生。 import os os.system("ulimit -c 0") 排查数据集大小，checkpoint保存文件大小，是否占满了磁盘空间。必现的问题，使用本

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
创建训练作业 - AI开发平台ModelArts

亲和组大小，affinity_type为hyperinstance时必填，系统会将affinity_group_size个task调度到一个超节点内组成亲和组。用户向超节点资源池投递训练作业，如果未设置亲和组大小，系统会默认赋值为1。表48 JobEndpointsReq 参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

i7。 ${work_dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，work_dir为宿主机中工作目录，目录下存放着训练所需代码、数据等文件。container_dir为要挂载到的容器中的目录。为方便两个地址可以相同。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

上，这样会导致下载数据很慢。在训练作业中，使用如下代码进行“.tar”包解压： import moxing as mox import os mox.file.copy_parallel("obs://donotdel-modelarts-test/AI/data/PyTorch-1

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
批量重启节点 - AI开发平台ModelArts

ls/{pool_name}/nodes/batch-reboot { "nodeNames" : [ "os-node-created-vrvrq", "os-node-created-4jczv" ] } 响应示例状态码： 200 OK。 { "job_id" :

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
配置ModelArts委托授权 - AI开发平台ModelArts

新增委托：如果没有委托可选，可以在新增委托中创建委托权限。对于首次使用ModelArts的用户，需要新增委托。 “新增委托 > 委托名称” 系统自动创建委托名称，用户可以手动修改。 “新增委托 > 授权方式” 角色授权：IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
FLUX.1基于DevSever适配PyTorch NPUFintune&Lora训练指导（6.3.911） - AI开发平台ModelArts

import re import shutil import os import copy input_file_path = 'pixart-sigma-toy-dataset' input_json = os.path.join(input_file_path, 'InternData'

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

AI处理器控制CPU频率 ma_node_npu_ctrl_cpu_frequency_hertz 昇腾系列AI处理器控制CPU频率赫兹（Hz） >0 系统态（专属池用户态） NA NA NA AI处理器Vector CORE利用率 ma_container_npu_vector_core_util

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

', type=str, default=os.path.join(file_dir, 'input_dir')) parser.add_argument('--output_dir', type=str, default=os.path.join(file_dir, 'output_dir'))

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
（可选）Session鉴权 - AI开发平台ModelArts

境变量HUAWEICLOUD_SDK_AK和HUAWEICLOUD_SDK_SK。 __AK = os.environ["HUAWEICLOUD_SDK_AK"] __SK = os.environ["HUAWEICLOUD_SDK_SK"] # 如果进行了加密还需要进行解密操作

 帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
NPU日志收集上传 - AI开发平台ModelArts

ak、sk、obs_dir替换为前面步骤中获取到的值，然后把该脚本上传到要收集NPU日志的节点上。 import json import os import sys import hashlib import hmac import binascii from datetime import

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
创建ModelArts人工标注作业 - AI开发平台ModelArts

音频（声音分类、语音内容、语音分割）文本（文本分类、命名实体、文本三元组）视频参数填写无误后，单击页面右下角“创建”。标注作业创建完成后，系统自动跳转至数据标注管理页面，针对创建好的标注作业，您可以执行智能标注、发布、修改和删除等操作。图片（图像分类、物体检测、图像分割）图2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
读取文件报错，如何正确读取文件 - AI开发平台ModelArts

read(img_path), np.uint8), 1) 在MXNet环境下使用torch包，请您尝试如下方法先进行导包： import os os.sysytem('pip install torch') import torch 父主题： OBS操作相关故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > OBS操作相关故障
日志提示“No module name 'unidecode'” - AI开发平台ModelArts

处理方法将requirements.txt中的Unidecode改为unidecode。建议与总结您可以在训练代码里添加一行： os.system('pip list') 然后运行训练作业，查看日志中是否有所需要的模块。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

String 模型名称，名称只能字母，中文开头，为字母、数字、下划线、中文或者中划线组成的合法字符，支持1-64个字符。如果未输入该参数，系统会自动生成模型name。 model_version 是 String 模型版本，格式需为“数值.数值.数值”，其中数值为1-2位正整数。

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
编写训练代码 - AI开发平台ModelArts

如何安装C++的依赖库？训练作业中如何判断文件夹是否复制完毕？如何在训练中加载部分训练好的参数？训练作业的启动文件如何获取训练作业中的参数？训练作业中使用os.system('cd xxx')无法进入相应的文件夹？训练作业如何调用shell脚本，是否可以执行.sh文件？训练代码中，如何获取依赖文件所在的路径？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

run”，商用版是权限受控，仅华为工程师和渠道用户有权限下载，下载地址请见固件驱动包下载链接。 arch cat /etc/os-release 图5 查看机器操作系统版本及架构下文均以适配EulerOS 2.0（SP10）和aarch64架构的包为例来进行讲解。安装固件和驱动包。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
从Manifest文件导入规范说明 - AI开发平台ModelArts

Manifest文件可以由用户、第三方工具或ModelArts数据标注生成，其文件名没有特殊要求，可以为任意合法文件名。为了ModelArts系统内部使用方便，ModelArts数据标注功能生成的文件名由如下字符串组成：“DatasetName-VersionName.manifes

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
配置IAM权限 - AI开发平台ModelArts

"Effect": "Allow" } ] } 创建自定义策略时，建议将项目级云服务和全局级云服务拆分为两条策略，便于授权时设置最小授权范围。此处的“Policy1”为项目级云服务、“Policy2”为全局级云服务。了解更多。将自定义策略授权给开发者用户组user_group。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置

总条数： 1362

上一页
1
...
64
65
66
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配额管理 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

批量重启节点 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

FLUX.1基于DevSever适配PyTorch NPUFintune&Lora训练指导（6.3.911） - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

创建ModelArts人工标注作业 - AI开发平台ModelArts

读取文件报错，如何正确读取文件 - AI开发平台ModelArts

日志提示“No module name 'unidecode'” - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

编写训练代码 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

从Manifest文件导入规范说明 - AI开发平台ModelArts

配置IAM权限 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线