搜索_华为云

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

Mindspore版本与CANN版本，CANN版本与Ascend驱动/固件版本均有严格的匹配关系，版本不匹配会导致训练失败。前提条件已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。 Step1 创建OBS桶和文件夹在OBS服务中创建桶

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

_cuda_frame failed with error code 0” 原因分析出现该问题的可能原因如下： pytorch1.4引擎与之前pytorch1.3版本兼容性问题。处理方法在images之后添加contigous。 images = images.cuda()

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
报错“Load key "C:/Users/xx/test1/xxx.pem": invalid format”如何解决？ - AI开发平台ModelArts

密钥文件内容不正确或格式不正确。解决方法请使用正确的密钥文件进行远程访问，如果本地没有正确的密钥文件或文件已损坏，可以尝试：登录控制台，搜索“数据加密服务 DEW”，选择“密钥对管理 > 账号密钥对”页签，查看并下载正确的密钥文件。如果密钥不支持下载且已无法找到之前下载的密钥，建议

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

“nv_peer_mem”是一个Linux内核模块，它允许支持P2P(Peer-to-Peer)的NVIDIA GPU直接进行内存访问(DMA)。这意味着数据可以直接在多个GPU之间传输，而无需经过CPU或系统内存，这可以显著降低延迟并提高带宽。所以既然nccl-tests能正常测试，但是达

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

Shell登录训练容器，且训练作业必须处于“运行中”状态。前提条件：给子账号配置允许使用Cloud Shell的权限使用主用户账号登录华为云的管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。在统一身份认证服务页面的左侧导航选择“权限管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
查看Standard专属资源池详情 - AI开发平台ModelArts

CPU使用率该指标用于统计测量对象的CPU使用率。百分比（Percent） 0～100% 内存利用率该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。百分比（Percent） 0～100% GPU显卡使用率该指标用于统计测量对象已使用的显卡占显卡容量的百分比。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
导入模型 - AI开发平台ModelArts
导入模型 - AI开发平台ModelArts

导入模型功能包括：初始化已存在的模型，根据模型ID生成模型对象。创建模型。模型对象的属性，请参见查询模型详情。示例模型文件以PyTorch为例，编写模型文件。PyTorch模型包结构可参考模型包规范介绍。 OBS桶/目录名 ├── resnet │ ├── model

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

0镜像时，必现如下报错： “RuntimeError: std:exception” 原因分析 PyTorch1.0镜像中的libmkldnn软连接与原生torch的冲突，具体可参看文档。处理方法按照issues中的说明，应该是环境中的库冲突了，因此在启动脚本最开始之前，添加如下代码。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

否 String 数据输入类型，支持数据存储位置（OBS）、ModelArts数据集两种方式。 attributes 否 Array of Map<String,String> objects 数据输入为数据集时的相关属性。枚举值： data_format：数据格式。 data_

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

的pip依赖包。处理方法重新构建镜像。在构建镜像的dockerfile文件中安装pip依赖包，例如安装Flask依赖包。 # 配置华为云的源，安装 python、python3-pip 和 Flask RUN cp -a /etc/apt/sources.list /etc/apt/sources

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
查询训练作业详情 - AI开发平台ModelArts

dataset object 数据输入信息为数据集。 obs obs object 数据输入输出信息为OBS方式。表19 dataset 参数参数类型描述 id String 训练作业的数据集ID。 version_id String 训练作业的数据集版本ID。 obs_url String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
LoRA训练 - AI开发平台ModelArts
LoRA训练 - AI开发平台ModelArts

LoRA训练本章节介绍SDXL&SD 1.5模型的LoRA训练过程。LoRA训练是指在已经训练好的模型基础上，使用新的数据集进行LoRA微调以优化模型性能的过程。启动SD1.5 LoRA训练服务使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_lora_train

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
查询所有Notebook实例列表 - AI开发平台ModelArts

响应Body参数参数参数类型描述 current Integer 当前页数。 data Array of NotebookResp objects 数据。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 NotebookResp

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建开发环境实例 - AI开发平台ModelArts

否 String 存储路径。如果type为“obs”类型，该值必须填写，该值需为有效的OBS桶路径，且以“/”结束。不能指定为OBS桶的根目录，需指定为OBS桶下的具体目录。如果type为“obsfs”类型，该值需为有效的OBS并行文件系统的桶名（当前CCE不支持挂载子目录）。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
模型包结构介绍 - AI开发平台ModelArts

本示例，请参见自定义脚本代码示例。如果您在导入元模型过程中遇到问题，可联系华为云技术支持协助解决故障。模型包结构示例 TensorFlow模型包结构发布该模型时只需要指定到“ocr”目录。 OBS桶/目录名 |── ocr | ├── model 必选：固定子目录名称，用于放置模型相关文件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
新建Workflow Execution - AI开发平台ModelArts

String 输入数据的名称，支持1到64位只包含英文、数字、下划线（_）和中划线（-）的字符。 type 否 String 输入项类型。枚举值如下： dataset：数据集 obs：OBS data_selector：数据选择 data 否 Object 输入项数据。 value 否

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
重启可视化作业 - AI开发平台ModelArts

重启可视化作业功能介绍重启可视化作业。此接口为异步接口，作业状态请通过查询可视化作业列表与查询可视化作业详情接口获取。 URI POST /v1/{project_id}/visualization-jobs/{job_id}/restart 参数说明如表1所示。表1 参数说明参数是否为必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 可视化作业
ModelArts Standard资源监控概述 - AI开发平台ModelArts

当AOM的监控模板不能满足用户诉求时，用户可以使用Grafana可视化工具来查看与分析监控指标。Grafana支持灵活而又复杂多样的监控视图和模板，为用户提供基于网页仪表面板的可视化监控效果，使用户更加直观地查看到实时资源使用情况。将Grafana的数据源配置完成后，就可以通过Grafana查看AOM保存的所有ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
新建Workflow工作流 - AI开发平台ModelArts

String 输入数据的名称，支持1到64位只包含英文、数字、下划线（_）和中划线（-）的字符。 type 否 String 输入项类型。枚举值如下： dataset：数据集 obs：OBS data_selector：数据选择 data 否 Object 输入项数据。 value 否

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询开发环境实例详情 - AI开发平台ModelArts

String> 扩展参数。表12 storage定义数据结构说明参数参数类型说明 type String 存储类型。当前支持“obs”、“obsfs” 和“evs”，其中，obsfs类型当前仅支持部分专属资源池。若您需要挂载OBS并行文件系统，请提工单。 location Object

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）

总条数： 2092

上一页
1
...
91
92
93
...
105
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

日志提示“max_pool2d_with_indices_out_cuda_frame failed with error code 0” - AI开发平台ModelArts

报错“Load key "C:/Users/xx/test1/xxx.pem": invalid format”如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

导入模型 - AI开发平台ModelArts

PyTorch1.0引擎提示“RuntimeError: std:exception” - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

LoRA训练 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

新建Workflow Execution - AI开发平台ModelArts

重启可视化作业 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

新建Workflow工作流 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线