搜索_华为云

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的Server资源和Ascend Snt9B单机。表1 环境要求名称版本 CANN cann_8.0.rc3 驱动 24.1.rc1 PyTorch 2.1.0 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

utosearch/yaml-templates 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数参数参数类型描述 yaml_templates

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
Lite Server部署推理服务 - AI开发平台ModelArts

--install-for-all 安装完成后再使用如下命令查看是否安装正确。 npu-smi info -t board -i 1 | egrep -i "software|firmware" 检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导
获取自动化搜索作业yaml模板的内容 - AI开发平台ModelArts

bs/autosearch/yaml-templates/{algorithm_type}/{algorithm_name} 表1 路径参数参数是否必选参数类型描述 algorithm_type 是 String 搜索算法类型。 algorithm_name 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询专属资源池作业统计信息 - AI开发平台ModelArts

workloads 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 作业所属的资源池。请求参数无响应参数状态码：200 表2 响应Body参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询资源实时利用率 - AI开发平台ModelArts

MetricsItem objects 指标列表。表3 MetricsItem 参数参数类型描述 table table object 资源列表。 metadata ResourceMetricsMetadata object 资源指标的元信息。表4 table 参数参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

作，请参见设置告警规则。登录管理控制台。在“服务列表”中选择“管理与监管 > 云监控服务”，进入“云监控服务”管理控制台。在左侧导航栏，选择“云服务监控 > ModelArts”。查看监控图表。查看在线服务监控图表：单击目标在线服务“操作”列的“查看监控指标”。查看模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
与其他云服务的关系 - AI开发平台ModelArts

ModelArts使用云监控服务（Cloud Eye Service，简称CES）监控在线服务和对应模型负载，执行自动实时监控、告警和通知操作。CES的更多信息请参见《云监控服务用户指南》。与云审计的关系 ModelArts使用云审计服务（Cloud Trace Service，

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts使用云监控服务（Cloud Eye Service，简称CES）监控在线服务和对应模型负载，执行自动实时监控、告警和通知操作。CES的更多信息请参见《云监控服务用户指南》。与云审计的关系 ModelArts使用云审计服务（Cloud Trace Service，

帮助中心 > AI开发平台ModelArts > 常见问题 > 历史文档待下线
管理模型训练作业 - AI开发平台ModelArts

管理模型训练作业查看训练作业详情查看训练作业资源占用情况查看模型评估结果查看训练作业事件查看训练作业日志修改训练作业优先级使用Cloud Shell调试生产训练作业重建、停止或删除训练作业管理训练容器环境变量查看训练作业标签父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
MoXing - AI开发平台ModelArts
MoXing - AI开发平台ModelArts

MoXing 使用MoXing复制数据报错如何关闭Mox的warmup Pytorch Mox日志反复输出 moxing.tensorflow是否包含整个TensorFlow，如何对生成的checkpoint进行本地Fine Tune？训练作业使用MoXing复制数据较慢，重复打印日志

 帮助中心 > AI开发平台ModelArts > 故障排除
训练过程中无法找到so文件 - AI开发平台ModelArts

9.0训练环境中tf-1.12训练会报该错。编译环境和训练环境的cuda版本不一致时，可参考如下处理方法：在业务执行前加如下命令，检查是否能找到so文件。如果已经找到so文件，执行2；如果没有找到，执行3。 import os; os.system(find /usr -name

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

但是达不到预期，可能是nv_peer_mem异常。处理方法查看nv_peer_mem是否已安装。 dpkg -i | grep peer 如果未安装则需要安装，安装方法参考装机指导。如果已安装则进入下一检测项。查看该软件是否已经加载至内核。 lsmod | grep peer 如果没有则需要重新加载至内核，执行如下命令进行加载：

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

Snt9B和300IDUO。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.912软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

填写参数（2）当AI应用状态变为正常时，表示创建完成。图6 AI应用创建完成步骤五部署服务单击AI应用名称，进入AI应用详情页，单击部署在线服务。图7 部署在线服务填写如下服务部署参数。名称：服务的名称，按照实际需要填写是否自动停止：如果配置自动停止，服务会按照配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

--served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
断点续训和故障快恢说明 - AI开发平台ModelArts

lora微调不支持断点续训启动前需检查latest_checkpointed_iteration.txt文件中内容是否与所需iter_000xxxx数字（表示训练后保存权重对应迭代次数）保持一致，不一致则修改latest_checkpointed_iteration.txt内容与iter_000xxxx保持一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
计费FAQ - AI开发平台ModelArts
计费FAQ - AI开发平台ModelArts

如何查看ModelArts消费详情？如果不再使用ModelArts，如何停止收费？为什么项目删除完了，仍然还在计费？欠费后，ModelArts的资源是否会被删除？ ModelArts Standard数据管理相关计费FAQ ModelArts Standard自动学习所创建项目一直在扣费，如何停止计费？

帮助中心 > AI开发平台ModelArts > 计费说明
获取支持的超参搜索算法 - AI开发平台ModelArts

所有超参搜索算法的列表。表3 search_algo_list 参数参数类型描述 name String 超参搜索算法的名称。 params Array of params objects 超参搜索算法的参数列表。 description String 超参搜索算法的描述。表4 params

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 1353

上一页
1
...
63
64
65
...
68
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

MiniCPM-V2.6基于Lite Server适配PyTorch NPU训练指导（6.3.912） - AI开发平台ModelArts

获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

在DevServer上部署SD WebUI推理服务 - AI开发平台ModelArts

Lite Server部署推理服务 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的内容 - AI开发平台ModelArts

查询专属资源池作业统计信息 - AI开发平台ModelArts

查询资源实时利用率 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

管理模型训练作业 - AI开发平台ModelArts

MoXing - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

计费FAQ - AI开发平台ModelArts

获取支持的超参搜索算法 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线