搜索_华为云

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error 问题现象在Vnt1 GPU裸金属服务器（Ubuntu18.04系统），安装NVIDIA 470+CUDA 11.4后使用“nvidia-smi”和“nvcc -

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

up 在镜像管理中注册和查看镜像。按需配置。保存镜像 SWR SWR Admin SWR Admin为SWR最大权限，用于：开发环境运行的实例，保存成镜像。使用自定义镜像创建开发环境Notebook实例。按需配置。使用SSH功能 ECS ecs:serverKeypairs:list

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Lite Cluster资源配置流程 - AI开发平台ModelArts

识。配置流程图1 Lite Cluster资源配置流程图表1 Cluster资源配置流程配置顺序配置任务场景说明 1 配置Lite Cluster网络购买资源池后，需要弹性公网IP并进行网络配置，配置网络后可通过公网访问集群资源。 2 配置kubectl工具 kub

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

进入到授权页面，为子账号配置权限。图1 为用户组授权配置授权前，请先了解ModelArts各模块使用到的最小权限要求，如表1所示。配置ModelArts使用权限。在搜索框搜索ModelArts。ModelArts FullAccess权限和ModelArts Common

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
测试用户权限 - AI开发平台ModelArts

正常打开页面，表示当前用户具备SFS的操作权限。验证ECS权限。在左上角的服务列表中，选择ECS服务，进入ECS管理控制台。在ECS管理控制台，单击右上角的“购买弹性云服务器”，如果能正常打开页面，表示当前用户具备ECS的操作权限。验证VPC权限。在左上角的服务列表中，选择VPC服务，进入VPC管理控制台。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
Yaml配置文件参数配置说明 - AI开发平台ModelArts

Yaml配置文件参数配置说明本小节主要详细描述demo_yaml配置文件、配置参数说明，用户可根据实际自行选择其需要的参数。表1 模型训练脚本参数参数示例值参数说明 model_name_or_path /home/ma-user/ws/model/Qwen2-72B

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
配置Lite Server软件环境 - AI开发平台ModelArts

配置Lite Server软件环境 NPU服务器上配置Lite Server资源软件环境 GPU服务器上配置Lite Server资源软件环境父主题： Lite Server资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
（可选）工作空间配置 - AI开发平台ModelArts

（可选）工作空间配置 ModelArts支持设置子用户的细粒度权限、不同工作空间之间资源隔离。ModelArts工作空间帮您实现项目资源隔离、多项目分开结算等功能。如果您开通了企业项目管理服务的权限，可以在创建工作空间的时候绑定企业项目ID，并在企业项目下添加用户组，为不同的用户组设置细粒度权限供组里的用户使用。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】本代码包中集成了不同模型（包括llama2、llama3、Qwen、Qwen1.5 ......）的训练脚本，并可通过不同模型中的训练脚本一键式运行。训练脚本可判断是否完成预处理后的数据和权重转换的模型。如果未完成，则执行脚本，自动完成数据预处理和权重转换的过程。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

此时无论DH Cient是否关闭，服务器都可以获取分配IP。当服务器没有网卡配置文件时，DH Client开启，此时服务器会分配私有IP。如果关闭DH Client，则服务器无法获取私有IP。图2 查看NetworkManager配置图3 查看网络配置命令“yum update

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
配置ModelArts委托授权 - AI开发平台ModelArts

elArts会提醒您当前用户未配置授权，需联系此IAM用户的管理员账号进行委托授权。添加授权登录ModelArts管理控制台，在左侧导航栏选择“权限管理”，进入“权限管理”页面。单击“添加授权”，进入“访问授权”配置页面，根据参数说明进行配置。表1 参数说明参数说明 “授权对象类型”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
配置ModelArts基本使用权限 - AI开发平台ModelArts

配置ModelArts基本使用权限场景描述 Step1 创建用户组并加入用户 Step2 为用户配置云服务使用权限 Step3 为用户配置ModelArts的委托访问授权 Step4 测试用户权限父主题：典型场景配置实践

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
（可选）配置镜像预热 - AI开发平台ModelArts

AI专属资源池 > 弹性集群Cluster”，在“Lite资源池”页签中，单击某个资源池名称，进入资源池详情。单击左侧“配置管理”，进入资源池配置管理页面。图1 配置管理在镜像预热中单击编辑图标，填写镜像预热信息。表1 镜像预热参数参数名称说明镜像来源可选择“预置”或“自定义”的镜像。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
配置Workflow参数 - AI开发平台ModelArts

配置Workflow参数功能介绍参数相关的配置使用Placeholder对象来表示，以占位符的形式实现用户数据运行时配置的能力，当前支持的数据类型包括：int、str、bool、float、Enum、dict、list。开发者可根据场景需要，将节点中的相关字段（如算法超参）通

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案问题现象创建出3台GPU裸金属服务器，使用A节点制作镜像，用于在CCE纳管裸金属服务器时，使用该镜像，但是纳管后发现服务器A纳管失败，剩下两台服务器纳管成功。原因分析在CCE纳管过程中，需要通过cloudinit

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
场景描述 - AI开发平台ModelArts
场景描述 - AI开发平台ModelArts

使用ModelArts时，如何根据需要开通的功能配置子账号相应权限。权限列表子账号的权限，由主用户来控制，主用户通过IAM的权限配置功能设置用户组的权限，从而控制用户组内的子账号的权限。此处的授权列表均按照ModelArts和其他服务的系统预置策略来举例。表1 服务授权列表

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

modelarts:workspace:get 创建训练作业和查看训练日志。建议配置。仅在严格授权模式开启后，需要显式配置左侧权限。 modelarts:workspace:getQuotas 查询工作空间配额。如果开通了工作空间功能，则需要配置此权限。按需配置。 modelarts:tag:list

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

选或组合筛选。给子账号配置查看所有Notebook实例的权限当子账号被授予“listAllNotebooks”和“listUsers”权限时，在Notebook页面上，单击“查看所有”，可以看到IAM项目下所有子账号创建的Notebook实例。配置该权限后，也可以在Note

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
配置MaaS访问授权 - AI开发平台ModelArts

配置MaaS访问授权配置ModelArts委托授权创建IAM用户并授权使用MaaS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
典型场景配置实践 - AI开发平台ModelArts

典型场景配置实践个人用户快速配置ModelArts访问权限配置ModelArts基本使用权限给子账号配置开发环境基本使用权限给子账号配置训练作业基本使用权限给子账号配置部署上线基本使用权限给子账号配置查看所有Notebook实例的权限管理员和开发者权限分离不允许子账号使用公共资源池创建作业

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理

总条数： 1986

上一页
1
...
5
6
7
...
100
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

测试用户权限 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

配置Lite Server软件环境 - AI开发平台ModelArts

（可选）工作空间配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

裸金属服务器Euler OS升级NetworkManager-config-server导致SSH链接故障解决方案 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

配置ModelArts基本使用权限 - AI开发平台ModelArts

（可选）配置镜像预热 - AI开发平台ModelArts

配置Workflow参数 - AI开发平台ModelArts

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

场景描述 - AI开发平台ModelArts

给子账号配置训练作业基本使用权限 - AI开发平台ModelArts

给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

配置MaaS访问授权 - AI开发平台ModelArts

典型场景配置实践 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线