搜索_华为云

分布式训练功能介绍 - AI开发平台ModelArts

相关章节创建单机多卡的分布式训练（DataParallel）：介绍单机多卡数据并行分布式训练原理和代码改造点。创建多机多卡的分布式训练（DistributedDataParallel）：介绍多机多卡数据并行分布式训练原理和代码改造点。示例：创建DDP分布式训练（PyTorch

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
日志提示"Permission denied" - AI开发平台ModelArts

directory 原因分析出现该问题的可能原因如下： [Errno 13]Permission denied: '/xxx/xxxx' 上传数据时文件所属与文件权限未修改，导致训练作业以work用户组访问时没有权限了。在代码目录中的.sh复制到容器之后，需要添加“x”可执行权限。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

智能边缘平台（Intelligent EdgeFabric）通过纳管您的边缘节点，提供将云上应用延伸到边缘的能力，联动边缘和云端的数据，满足客户对边缘计算资源的远程管控、数据处理、分析决策、智能化的诉求。 ModelArts支持将模型通过智能边缘平台IEF，在边缘节点将模型部署为一个Web服务。您可以通过API接口访问边缘服务。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线 > 功能咨询
推理服务测试 - AI开发平台ModelArts

即文本、图片、json格式。 data 是 String 针对files、images类型的数据，该参数为其本地路径，如 : data = "/home/ma-user/work/test.jpg" 针对json类型的数据，该参数可以是其本地路径，如： data = "/home/ma-user/work/test

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
ModelArts Standard自动学习所创建项目一直在扣费，如何停止计费？ - AI开发平台ModelArts

自动学习作业而创建的服务。操作完成后，ModelArts服务即停止计费。登录OBS控制台，进入自己创建的OBS桶中，删除存储在OBS中的数据。操作完成后，OBS服务即停止计费。对于使用专属资源池创建的自动学习作业：登录ModelArts控制台，在自动学习作业列表中，删除正在

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
推理业务迁移评估表 - AI开发平台ModelArts

例如：ResNet-50、YOLOv5模型使用FP16。BertLarge使用FP32。 - 模型变更频率模型变更场景如下：数据增量，模型算子未变更。数据增量，模型算子变化，例如：网络结构变化。 AI框架版本升级，使用了新版本算子。例如：每半年对模型进行一次变更，变更的内容包含模型结构，并升级AI框架。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
启动/停止/删除实例 - AI开发平台ModelArts

book可以执行停止操作。 Notebook停止后： “/home/ma-user/work”目录以及动态挂载在“/data”下的目录下的数据会保存，其余目录下内容会被清理。例如：用户在开发环境中的其他目录下安装的外部依赖包等，在Notebook停止后会被清理。您可以通过保存镜像

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
部署预测分析服务 - AI开发平台ModelArts

单击“预测”进行测试，预测完成后，右侧“返回结果”区域输出测试结果。如模型准确率不满足预期，可在“数据标注”页签，重新进行模型训练及模型部署。如果您对模型预测结果满意，可根据界面提示调用接口访问在线服务。输入代码：其中预测分析要求数据集中数据的预测列名称为class，否则会导致预测失败。 { "data":

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

的InputShape来确定，由于后端指定了ascend，这些tensor都是在昇腾设备的显存中，用户需要在对应的tensor中填入数据，这些数据也会被搬移到显存中，进一步对于Inputs输入的内容进行处理。 data = convert_img(input_image) in_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
线下容器镜像构建及调试 - AI开发平台ModelArts

设置python路径的环境变量）。测试训练启动脚本。优先使用手工进行数据复制的工作并验证一般在镜像里不包含训练所用的数据和代码，所以在启动镜像以后需要手工把需要的文件复制进去。建议数据、代码和中间数据都放到"/cache"目录，防止正式运行时磁盘占满（请见ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
模型配置文件编写说明 - AI开发平台ModelArts

metrics 否 object数据结构模型的精度信息，包括平均数、召回率、精确率、准确率，metrics object数据结构说明如表2所示。结果会显示在模型详情页面的“模型精度”模块。 apis 否 api数据结构数组表示模型接收和返回的请求样式，为结构体数据。即模型可对外提供的Restful

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

ping命令是一种基于ICMP协议（Internet Control Message Protocol）的网络诊断工具，利用ICMP协议向目标主机发送数据包并接收返回的数据包来判断网络连接质量。当安全组的入方向规则中没有包含ICMP协议，就会出现ping不通的问题。处理方法在当前安全组的入方向规则

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
发布Notebook - AI开发平台ModelArts

单击编辑框右侧的对勾完成编辑。保存成功的标签信息会在资产搜索页成为过滤分类条件。图5 添加标签关联资产 Notebook可以关联数据集资产。当Notebook关联了数据集时，数据集页面也显示关联了Notebook。选择“关联资产”页签，单击右上方的“编辑”，在搜索框中输入待关联资产的ID，单击“关联”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
查看ModelArts模型详情 - AI开发平台ModelArts

同步请求：单次推理，可同步返回结果（约<60s）。例如: 图片、较小视频文件。异步请求：单次推理，需要异步处理返回结果（约>60s）。例如: 实时视频推理、大视频文件。创建时间模型的创建时间。描述模型的描述。操作部署：将模型发布为在线服务、批量服务或边缘服务。创建新版本：创建新的模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
使用VS Code创建并调试训练作业 - AI开发平台ModelArts

设置输入路径在输入框选择输入数据所在的路径，如图9所示。图8 填写训练输入路径选择挂载SFS路径时，下拉框只显示有权限的SFS路径，显示“只读”的文件夹只支持只读功能，不显示的读写均支持。可参考权限管理文档修改SFS Turbo权限。图9 输入数据设置完成界面设置训练输出路

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
训练作业卡死检测 - AI开发平台ModelArts

使用pytorch中的dataloader读数据时，作业卡在读数据过程中，日志停在训练的过程中并不再更新日志。解决方案4 用dataloader读数据时，适当减小num_worker。常见案例：训练最后一个epoch卡死问题现象通过日志查看数据切分是否对齐，如果未对齐，容易导致部

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Controlnet训练 - AI开发平台ModelArts

竞争力。本章节介绍SDXL&SD 1.5模型的Controlnet训练过程。 Step1 处理fill50k数据集使用ma-user用户在容器上执行如下命令解压数据集。 cd /home/ma-user/datasets/fill50k unzip conditioning_images

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

该指标用于统计每秒从磁盘读出的数据量。只考虑被容器使用的数据盘。千字节/秒（Kilobytes/Second） ≥0 NA NA NA 磁盘写入速率 ma_node_disk_write_rate_kilobytes_seconds 该指标用于统计每秒写入磁盘的数据量。只考虑被容器使用的数据盘。千

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

ts CommonOperations”已生效。在“服务列表”中选择ModelArts，进入ModelArts主界面，单击“数据管理>数据集>创建数据 > 集”，如果可以成功访问对应的OBS路径，表示全局级服务的“OBS Administrator”已生效。创建ModelArts自定义策略

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

ts CommonOperations”已生效。在“服务列表”中选择ModelArts，进入ModelArts主界面，单击“数据管理>数据集>创建数据 > 集”，如果可以成功访问对应的OBS路径，表示全局级服务的“OBS Administrator”已生效。创建ModelArts自定义策略

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > FAQ

总条数： 1848

上一页
1
...
87
88
89
...
93
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分布式训练功能介绍 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

在线服务和边缘服务有什么区别？ - AI开发平台ModelArts

推理服务测试 - AI开发平台ModelArts

ModelArts Standard自动学习所创建项目一直在扣费，如何停止计费？ - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

部署预测分析服务 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

GPU裸金属服务器无法Ping通如何解决 - AI开发平台ModelArts

发布Notebook - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

使用VS Code创建并调试训练作业 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

Controlnet训练 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

使用ModelArts时提示“权限不足”，如何解决？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线