搜索_华为云

OOM导致训练作业失败 - AI开发平台ModelArts

释放一些不需要的tensor，使用过的，如下： del tmp_tensor torch.cuda.empty_cache() 必现的问题，使用本地Pycharm远程连接Notebook调试超参。如果还存在问题，可能需要提工单进行定位，甚至需要隔离节点修复。建议与总结在创建训练作业前，推荐您先使用M

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
查询算法列表 - AI开发平台ModelArts

total Integer 查询到当前用户名下的所有算法总数。 count Integer 查询到当前用户名下的所有符合查询条件的算法总数。 limit Integer 查询到当前用户名下的所有算法限制个数。 offset Integer 查询到当前用户名下的所有算法查询偏移量。 sort_by

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
文生图模型训练推理 - AI开发平台ModelArts

1基于DevSever适配PyTorch NPU Finetune&Lora训练指导（6.3.911） Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） SD3.5基于Lite Server适配PyTorch NPU的推理指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践
通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

通过API接口查询模型详情，model_name返回值出现乱码问题现象通过API接口查询模型详情，model_name返回值出现乱码。例如model_name为query_vec_recall_model，但是api接口返回结果是query_vec_recall_model_b。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
数据准备与处理 - AI开发平台ModelArts

数据准备与处理数据准备使用流程创建ModelArts数据集导入数据到ModelArts数据集处理ModelArts数据集中的数据标注ModelArts数据集中的数据发布ModelArts数据集中的数据版本分析ModelArts数据集中的数据特征导出ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

权限设置为755或750，权限不能过于宽松，以保证用户隔离和安全。修改方法如下。 chomd 755 /home/ma-user chomd 750 /home/ma-user 排查密钥是否是和实例绑定的一致。停止实例，进入实例详情页。更新密钥：单击“认证”旁边的编辑按钮，然后单击“立即创建”创建并选择新密钥。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” 问题现象在安装其他包的时候，有依赖冲突，对numpy库有其他要求，但是发现numpy卸载不了。出现如下类似错误： your numpy version is

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查询节点池列表 - AI开发平台ModelArts

String 节点池名称。用户可进行指定，若未指定将会使用默认名称。表5 NodePoolSpec 参数参数类型描述 resources PoolResource object 节点池中的资源信息列表，包括资源规格和相应规格的资源数量，自定义配置等。表6 PoolResource

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询服务对象列表 - AI开发平台ModelArts

查询服务对象列表获取当前用户服务对象列表。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景1：查询当前用户所有服务对象 1 2 3 4 5 6 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
语言模型推理性能测试 - AI开发平台ModelArts

选择性添加，选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。 --num-scheduler-steps: 需和服务启动时配置的num-scheduler-steps一致。默认为1 脚本运行完后，测试结果保存在benchmark_serving.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
从OBS目录导入数据规范说明 - AI开发平台ModelArts

400000 0.266667 其中x_center、y_center、width和height分别表示归一化后的目标框中心点x坐标、归一化后的目标框中心点y坐标、归一化后的目标框宽度、归一化后的目标框高度。只支持JPG、JPEG、PNG、BMP格式的图片，单张图片大小不能超过5MB，且单次上传的图片总大小不能超过8MB。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 导入数据到ModelArts数据集 > 从OBS导入数据到ModelArts数据集
查询服务监控信息 - AI开发平台ModelArts

请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户Token。通过调用IAM服务获取用户Token接口获取（响应消息头中X-Subject-Token的值）。响应参数状态码： 200 表4 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Finetune训练 - AI开发平台ModelArts

py {数据集路径pokemon-dataset路径} meta_cap.json 创建default_config.yaml文件，并将以下配置粘贴进去。 compute_environment: LOCAL_MACHINE debug: false distributed_type:

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
使用CTS审计ModelArts服务 - AI开发平台ModelArts

使用CTS审计ModelArts服务 ModelArts支持云审计的关键操作查看ModelArts相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

AlgorithmJobConfig object 算法配置信息，如启动文件等。 resource_requirements 否 Array of ResourceRequirement objects 算法资源约束。可不设置。设置后，在算法使用于训练作业时，控制台会过滤可用的公共资源池。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建和修改工作空间 - AI开发平台ModelArts

iam_endpoint为IAM的终端节点。 user_name为IAM用户名。 user_password为用户登录密码。 domain_name为用户所属的帐号名。 cn-north-1为项目名，代表服务的部署区域。返回状态码“201 Created”，在响应Header中获取

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

arts/code/main.py”。超参当资源规格为单机多卡时，需要指定超参world_size和rank。当资源规格为多机时（即实例数大于 1），无需设置超参world_size和rank，超参会由平台自动注入。方式二：使用自定义镜像功能，通过torch.distributed

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
ModelArts Standard资源管理 - AI开发平台ModelArts

ModelArts Standard资源管理 Standard资源池功能介绍创建Standard专属资源池管理Standard专属资源池

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？问题现象创建模型时，元模型来源指定的OBS目录下存放了自定义的文件和文件夹，都会复制到镜像中去。复制进去的路径是什么，怎么读取对应的文件或者文件夹里面的内容？原因分析通过OBS导入模型时，ModelArts会将指

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

AlgorithmJobConfig object 算法配置信息，如启动文件等。 resource_requirements 否 Array of ResourceRequirement objects 算法资源约束。可不设置。设置后，在算法使用于训练作业时，控制台会过滤可用的公共资源池。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 2372

上一页
1
...
84
85
86
...
119
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OOM导致训练作业失败 - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

文生图模型训练推理 - AI开发平台ModelArts

通过API接口查询模型详情，model_name返回值出现乱码 - AI开发平台ModelArts

数据准备与处理 - AI开发平台ModelArts

报错“Connection permission denied (publickey)”如何解决 - AI开发平台ModelArts

日志提示“Please upgrade numpy to >= xxx to use this pandas version” - AI开发平台ModelArts

查询节点池列表 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

从OBS目录导入数据规范说明 - AI开发平台ModelArts

查询服务监控信息 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

使用CTS审计ModelArts服务 - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

创建和修改工作空间 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+GPU） - AI开发平台ModelArts

ModelArts Standard资源管理 - AI开发平台ModelArts

创建模型时，OBS文件目录对应镜像里面的目录结构是什么样的？ - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线