搜索_华为云

常见错误原因和解决方法 - AI开发平台ModelArts

常见错误原因和解决方法显存溢出错误网卡名称错误联网下载SimSun.ttf时可能会遇到网络问题在运行finetune_ds.sh 时遇到报错父主题： Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912）
更新服务配置 - AI开发平台ModelArts

pnt004(需申请)/modelarts.vm.ai1.snt3(需申请)/custom(仅支持在部署到专属资源池时使用)，需申请的规格请提交工单，由ModelArts运维工程师添加权限。若配置为custom，需同时指定custom_spec参数。 weight 否 Integer real-time类型必选。权重

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
Lite Cluster高危操作一览表 - AI开发平台ModelArts

点管理、扩缩容、驱动升级、带本地盘机型的本地盘数据丢失等。高不可恢复。修改网络安全组可能影响ModelArts侧基本功能，包括但不限于节点管理、扩缩容、驱动升级等。中改回原有内容。网络修改/删除集群关联网段。影响ModelArts侧基本功能，包括但不限于节点管理、扩缩容、驱动升级等。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
删除资源池 - AI开发平台ModelArts

Integer 指定可用区扩容时，指定可用区的节点数。表10 network 参数参数类型描述 name String 网络名称；用户接口通过指定网络名称创建网络，系统会自动创建子网，用户无法创建子网。默认将创建在第一个子网下。表11 PoolDriver 参数参数类型描述 gpuVersion

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
精度校验 - AI开发平台ModelArts
精度校验 - AI开发平台ModelArts

dtype=np.float32) image = np.frombuffer(image.tobytes(), np.float32) # 保存网络输入为二进制文件 image.tofile("input_data.bin") 将基准模型的输出保存到文本文件。本例中输出节点名称为ou

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
查询资源池 - AI开发平台ModelArts

Integer 指定可用区扩容时，指定可用区的节点数。表10 network 参数参数类型描述 name String 网络名称；用户接口通过指定网络名称创建网络，系统会自动创建子网，用户无法创建子网。默认将创建在第一个子网下。表11 PoolDriver 参数参数类型描述 gpuVersion

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
预测API的域名停用公告 - AI开发平台ModelArts

如果您使用的是VPC内部节点访问ModelArts推理的在线服务，预测API切换域名后，由于内网VPC无法识别公网域名，请提交工单联系华为云技术支持打通网络。父主题：产品变更公告

 帮助中心 > AI开发平台ModelArts > 服务公告 > 产品变更公告
创建ModelArts数据增强任务 - AI开发平台ModelArts

欺骗判别网络。两个网络相互对抗、不断调整参数，最终目的是使判别网络无法判断生成网络的输出结果是否真实。训练中获得的生成器网络可用于生成与输入图片相似的图片，用作新的数据集参与训练。基于Gan网络生成新的数据集不会生成相应的标签。图像生成过程不会改动原始数据，新生成的图片或xml文件保存在指定的输出路径下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
查询资源池列表 - AI开发平台ModelArts

Integer 指定可用区扩容时，指定可用区的节点数。表11 network 参数参数类型描述 name String 网络名称；用户接口通过指定网络名称创建网络，系统会自动创建子网，用户无法创建子网。默认将创建在第一个子网下。表12 PoolDriver 参数参数类型描述 gpuVersion

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
设置断点续训练 - AI开发平台ModelArts

url_0" 。 train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
模型训练存储加速 - AI开发平台ModelArts

url_0" 。 train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

不满足以上镜像规范，所制作的镜像使用可能会出现故障，请用户检查镜像规范，并参考Notebook自定义镜像故障基础排查自行排查，如未解决请联系华为技术工程师协助解决。操作流程准备一台Linux环境，这里以ECS为例。在ECS中构建镜像（本文档提供了Dockflie样例文件）。将构建的镜像推到SWR。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
增量模型训练 - AI开发平台ModelArts

url_0" 。 train_url = args_opt.train_url # 初始定义的网络、损失函数及优化器，详细请参见MindSpore保存与加载。 # 1.初始定义的网络,以“ResNet50”为例。详细请参见ResNet50。 net = resnet50(args_opt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

install.sh modellink 在执行 install.sh 安装命令时，需要确认机器是否已连通网络。若无法连通网络或无法git clone下载代码，用户则需要找到已连通网络的机器（本章节以Linux系统机器为例）将下载完成的源码放置代码目录：AscendFactory/third-party下，命令如下

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
方案概述 - AI开发平台ModelArts
方案概述 - AI开发平台ModelArts

Server资源，请参考Lite Server资源开通，购买Server资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。父主题： DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
推理业务迁移评估表 - AI开发平台ModelArts

云服务”模式，客户端请求应答可接受的最长时延为2秒。 - 模型参数规模，是否涉及分布式推理 10B/100B，单机多卡推理。 - 能否提供实际模型、网络验证的代码和数据等信息提供实际模型、网络验证的代码和数据。提供与业务类型类似的开源模型，例如GPT3 10B/13B。提供测试模型以及对应的Demo代码路径（开源或共享）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

Client开启，此时服务器会分配私有IP。如果关闭DH Client，则服务器无法获取私有IP。图2 查看NetworkManager配置图3 查看网络配置命令“yum update -y”或“yum update NetworkManagre-config-server”，都会将Net

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

的大小限制是12MB，超过12MB时，请求会被拦截。如果是从ModelArts console的预测页签进行的预测，由于console的网络链路的不同，此时要求请求体的大小不超过8MB。因此，尽量避免请求体大小超限。如果有高并发的大流量推理请求，请提工单联系专业服务支持。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
迁移过程使用工具概览 - AI开发平台ModelArts

自动高性能算子生成工具AKG AKG（Auto Kernel Generator）对深度神经网络中的算子进行优化，并提供特定模式下的算子自动融合功能。提升在昇腾硬件后端上运行网络的性能。 AKG由三个基本的优化模块组成：规范化、自动调度和后端优化。规范化：为了解决poly

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
上传远端文件至JupyterLab - AI开发平台ModelArts

输入有效的远端文件URL后，系统会自动识别上传文件名称，单击“上传”，开始上传文件。图3 输入有效的远端文件URL 图4 远端文件上传成功异常处理远端文件上传失败。可能是网络原因。请先在浏览器中输入该远端文件的URL地址，测试该文件是否能下载。图5 远端文件上传失败父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab

总条数： 412

上一页
1
...
7
8
9
...
21
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

常见错误原因和解决方法 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

Lite Cluster高危操作一览表 - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

精度校验 - AI开发平台ModelArts

查询资源池 - AI开发平台ModelArts

预测API的域名停用公告 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

查询资源池列表 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

方案概述 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

ModelArts在线服务预测请求体大小限制是多少？ - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

上传远端文件至JupyterLab - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线