搜索_华为云

升级Standard专属资源池驱动 - AI开发平台ModelArts

的操作列，单击“ > 驱动升级”。在“驱动升级”弹窗中，会显示当前专属资源池的驱动类型、实例数量、当前版本、目标版本、升级方式、升级范围和开启滚动开关。目标版本：在目标版本下拉框中，选择一个目标驱动版本。对于资源池新增加的节点，可能会与资源池原有节点驱动不一致，为了保持驱动一

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
MaaS使用场景和使用流程 - AI开发平台ModelArts

I云服务进行全面适配和优化，使得精度和性能显著提升。开发者无需从零开始构建模型，只需选择合适的预训练模型进行微调或直接应用，减轻模型集成的负担。零代码、免配置、免调优模型开发平台结合与100+客户适配、调优开源大模型的行业实践经验，沉淀了大量适配昇腾，和调优推理参数的最佳实践

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
Standard资源池节点故障定位 - AI开发平台ModelArts

A050104 GPU 显存 ECC错误到达64次。通过nvidia-smi -a查询到Retired Pages中，Single Bit和Double Bit之和大于64。 A050148 GPU 其他 infoROM告警。执行nvidia-smi的返回信息中包含“infoROM

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
如何上传数据至OBS？ - AI开发平台ModelArts

善的桶管理和对象管理操作。推荐使用此工具创建桶或上传对象。obsutil是一款用于访问管理OBS的命令行工具，对于熟悉命令行程序的用户，obsutil是执行批量处理、自动化任务的好的选择。如果您的业务环境需要通过API或SDK执行数据上传操作，或者您习惯于使用API和SDK，推

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

容器引擎是Kubernetes最重要的组件之一，负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互，以管理镜像和容器。其中Containerd调用链更短，组件更少，更稳定，占用节点资源更少，Containerd和Docker差异对比请见容器引擎。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
扩缩容Standard专属资源池 - AI开发平台ModelArts

式，例如用户可以在包周期的资源池中创建按需的节点。如果用户不指定该参数，创建的节点计费模式和资源池保持一致。在“专属资源池扩缩容”页面，设置“资源配置 > 可用区”，可用区可选择随机分配和指定AZ。选择随机分配时，扩缩容完成后，节点的可用区分布由系统后台随机选择。选择指定A

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
服务韧性 - AI开发平台ModelArts
服务韧性 - AI开发平台ModelArts

性。本章主要阐述ModelArts服务受入侵的检测响应能力、防抖动的能力、域名合理使用、内容安全检测等能力。安全防护套件覆盖和使用堡垒机，增强入侵检测和防御能力 ModelArts服务部署主机层、应用层、网络层和数据层的安全防护套件。及时检测主机层、应用层、网络层和数据层的安全入侵行为。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

提供机柜、节点、加速卡、任务多场景故障感知和检测提供节点级、作业级、容器级，多级故障恢复，保障千卡作业稳定训练多种资源形态集群模式，开箱即提供好Kubernetes集群，直接使用，方便高效节点模式，客户可采用开源或自研框架，自行构建集群，更强的掌控力和灵活性零改造迁移提供业界通用

 帮助中心 > AI开发平台ModelArts > 产品介绍
Lite Server高危操作一览表 - AI开发平台ModelArts

如果升级/修改操作系统内核或者驱动，很可能导致驱动和内核版本不兼容，从而导致OS无法启动，或者基本功能不可用。相关高危命令如：apt-get upgrade。高如果需要升级/修改，请联系华为云技术支持。切换或者重置操作系统。服务器在进行过“切换或者重置操作系统”操作后，EVS系统盘ID发生变化，和下单时订单中的EVS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

常见问题 MindSpore Lite问题定位指南模型转换报错如何查看日志和定位？日志提示Compile graph failed 日志提示Custom op has no reg_op_name attr 父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
PyTorch迁移性能调优 - AI开发平台ModelArts

PyTorch迁移性能调优性能调优总体原则和思路自动诊断工具MA-Advisor使用指导性能可视化工具Ascend-Insight使用指导性能可视化工具与性能分析工具父主题： GPU训练业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
查询专属资源池作业列表 - AI开发平台ModelArts

oads 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 pool_name 是 String 作业所属的命名空间。表2 Query参数参数是否必选参数类型描述 type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

弹性集群Lite Cluster资源池弹性节点Server资源池包括vCPU、GPU和NPU。 ModelArts提供了包年/包月的AI专属资源池，包括Standard资源池、弹性集群Lite Cluster资源池和弹性节点Server资源池假设您计划购买包年/包月的Standard专属

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
修复Standard专属资源池故障节点 - AI开发平台ModelArts

修复Standard专属资源池故障节点 Standard专属资源池支持对故障节点进行修复操作，目前提供了替换节点、高可用冗余节点、重置节点和重启节点等方式。华为云技术支持在故障定位和性能诊断时，部分运维操作需要用户授权才可进行，本章节同时也介绍了如何进行授权操作。故障节点处理方式替换节点：替换节

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

etron官网进行查看，或者对于模型结构中的输入进行shape的打印，并明确输入的batch。一般来说，推理时指定的inputShape和用户的业务及推理场景紧密相关，可以通过原始模型推理脚本或者网络模型进行判断。需要把Notebook中的模型下载到本地后，再放入netron官网中，查看其inputShape。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

通过nvidia-smi -a查询到Retired Pages中，Single Bit和Double Bit之和大于64。发起维修流程。 NT_GPU_CARD_LOSE GPU 掉卡 GPU卡丢失。节点规格的GPU卡数和以下任意值不相等： lspci可见GPU卡数。 nvidia-smi可见卡数。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
模型的自定义镜像制作流程 - AI开发平台ModelArts

模型的自定义镜像制作流程如果您使用了ModelArts不支持的AI引擎开发模型，也可通过制作自定义镜像，导入ModelArts创建为模型，并支持进行统一管理和部署为服务。制作流程场景一：预置镜像的环境软件满足要求，只需要导入模型包，就能用于创建模型，通过镜像保存功能制作。具体案例参考在Not

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
依赖和委托 - AI开发平台ModelArts

如图1所示，用户向ModelArts授权后，ModelArts使用委托授权的临时凭证访问和操作用户资源，协助用户自动化一些繁琐和耗时的操作。同时，委托凭证会同步到用户的作业中（Notebook实例和训练作业），用户在作业中可以使用委托凭证自行访问自己的资源。在ModelArts服务中委托授权有两种方式：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

弹性文件服务（Scalable File Service，SFS）提供按需扩展的高性能文件存储（NAS），可以在裸金属服务器中通过网络协议挂载使用，SFS支持NFS和CIFS的网络协议。在使用裸金属服务器时，将数据放在SFS盘中，并发建立多个NFS链接、并发的读写数据、做大模型训练。但有时候会出现读

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server

总条数： 485

上一页
1
...
18
19
20
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

升级Standard专属资源池驱动 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

Standard资源池节点故障定位 - AI开发平台ModelArts

如何上传数据至OBS？ - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

扩缩容Standard专属资源池 - AI开发平台ModelArts

服务韧性 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

Lite Server高危操作一览表 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

PyTorch迁移性能调优 - AI开发平台ModelArts

查询专属资源池作业列表 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

修复Standard专属资源池故障节点 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

使用SFS盘出现报错rpc_check_timeout:939 callbacks suppressed - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线