搜索_华为云

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML 问题现象华为云裸金属服务器，NVIDIA驱动卸载后重新安装。（1）已卸载原有版本NVIDIA驱动和CUDA版本，且已安装新版本的NVIDIA驱动和CUDA版本

 帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

识别出此图片的数字是“2”。本案例中使用的MNIST是比较简单的用做demo的数据集，配套算法也是比较简单的用于教学的神经网络算法。这样的数据和算法生成的模型仅适用于教学模式，并不能应对复杂的预测场景。即生成的模型对预测图片有一定范围和要求，预测图片必须和训练集中的图片相似（黑底白字）才可能预测准确。

帮助中心 > AI开发平台ModelArts > 快速入门
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

配置ModelArts委托授权章节中介绍的一键式自动授权方式创建的委托的权限比较大，基本覆盖了依赖服务的全部权限。如果华为云账号已经能满足您的要求，则不需要创建独立的IAM用户，您可以跳过本章节，不影响您使用MaaS服务的功能。 ModelArts作为一个完备的AI开发平台，支持用户对其进行细粒度的权限配置，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
创建Notebook实例 - AI开发平台ModelArts

SSH密钥对名称，可以在云服务器控制台（ECS）“密钥对”页面创建和查看。表4 VolumeReq 参数是否必选参数类型描述 capacity 否 Integer 存储容量，EVS默认5G，最大限制4096G。 category 是 String 支持的存储类型。不同存储类型的差异，详见开发环境中如何选择存储。枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
使用自动分组智能标注作业 - AI开发平台ModelArts

启动任务提交成功后，界面右上角显示此任务的进度。等待任务执行完成后，您可以查看自动分组任务的历史记录，了解任务状态。查看自动分组结果在数据集详情页面的“全部”页签中，展开“筛选条件”，将“样本属性”设置为自动分组任务中的“属性名称”，并通过设置样本属性值，筛选出分组结果。图2 查看自动分组结果查看自动分组的历史任务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

流水账单”中，“消费时间”即按需产品的实际使用时间。查看自动学习和Workflow的账单自动学习和Workflow运行时，在进行训练作业和部署服务时，会产生不同的账单。训练作业产生的账单可参考查看训练作业的账单查询。部署服务产生的账单可参考查看在线服务的账单查询。查看Notebook的账单登录

 帮助中心 > AI开发平台ModelArts > 计费说明
查询服务对象列表 - AI开发平台ModelArts

total_count Integer 不分页的情况下，符合查询条件的总服务数量。 count Integer 当前查询结果的服务数量，不设置offset、limit查询参数时，count与total相同。 services service结构数组查询到的服务集合。表3 service结构

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

909软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E 说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

MindSpore Lite问题定位指南模型转换报错如何查看日志和定位？日志提示Compile graph failed 日志提示Custom op has no reg_op_name attr 父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

版本为5.4.0-144-generic。第二条命令为重新生成GRUB引导程序的配置文件，用于在启动计算机时加载操作系统，命令将使用新安装的内核镜像更新GRUB的配置文件，以便在下次启动时加载新的内核。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

据和算法至OBS（首次使用时需要）。 ECS服务器和SFS的共享硬盘在相同的VPC或者对应VPC能够互联。 ECS服务器基础镜像需要用Ubuntu 18.04的。 ECS服务器和SFS Turbo需要在同一子网中。操作步骤在ECS服务器中设置华为云镜像源。 sudo sed -i

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

912软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取路径：Support-E，在此路径中查找下载ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
查询数据集列表 - AI开发平台ModelArts

数据集版本名称。 with_column_header Boolean 发布的CSV文件的第一行是否为列名，对于表格数据集有效。可选值如下： true：发布的CSV文件的第一行是列名 false：发布的CSV文件的第一行不是列名表12 LabelStats 参数参数类型描述 attributes

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Lite Cluster资源配置流程 - AI开发平台ModelArts

Cluster资源案例下文提供一个快速配置的案例，配置完成后您可登录到节点查看加速卡信息并完成一个训练任务。在运行此案例前，您需要购买资源，购买资源的步骤请参考Lite Cluster资源开通。登录节点。（推荐）方式1：通过绑定公网IP的方式客户可以为需要登录的节点绑定公网IP，然后可以通

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

如果是在公共资源池部署服务，可等待其他用户释放资源后，再进行服务部署。如果是在专属资源池部署服务，在满足模型需求的前提下，尝试选用更小的容器规格或自定义规格，进行服务部署；如果当前资源池的资源确实不够，也可以考虑将资源池扩容后再进行服务部署。公共资源池扩容，请联系系统管理员。专属资源池扩容，可参考扩缩容资源池。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
查询服务详情 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 terminati

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

ize。文档中针对数据集预处理时，handler-name参数的说明，新增不同 handler 对训练数据的拼接和推理prompt的构造等说明。支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908）
查询训练作业详情 - AI开发平台ModelArts

String 算法的代码目录下载到训练容器内的本地路径。规则如下：必须为/home下的目录； v1兼容模式下，当前字段不生效；当code_dir以file://为前缀时，当前字段不生效。 working_dir String 运行算法时所在的工作目录。规则：v1兼容模式下，当前字段不生效。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业列表 - AI开发平台ModelArts

total Integer 查询到当前用户名下的所有作业总数。 count Integer 查询到当前用户名下的所有符合查询条件的作业总数。 limit Integer 查询作业的每页条目数。最小为1，最大为50。 offset Integer 查询作业的页数，最小为0。例如设置为0，则表示从第一页开始查询。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
部署推理服务 - AI开发平台ModelArts

开启图模式后，服务第一次响应请求时会有一个较长时间的图编译过程，并且会在当前目录下生成.torchair_cache文件夹来保存图编译的缓存文件。当服务第二次启动时，可通过缓存文件来快速完成图编译的过程，避免长时间的等待，并且基于图编译缓存文件来启动服务可获得更优的推理性能，因此请在有图编译缓存文件的前提下启动服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）

总条数： 1765

上一页
1
...
18
19
20
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

使用自动分组智能标注作业 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？ - AI开发平台ModelArts

ECS服务器挂载SFS Turbo存储 - AI开发平台ModelArts

FlUX.1基于DevServer适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线