搜索_华为云

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

命令，将必要的内核模块加载到系统中。但有时候也可能需要手动执行该命令。例如，在更新了NVIDIA驱动后，需要重新加载新版本的内核模块才能使变更生效。此外，如果使用了多个NVIDIA显卡，每个显卡都需要加载相应的内核模块才能正常工作。在这种情况下，也需要手动执行“nvidia-m

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

专属资源池扩容，可参考扩缩容资源池。如果磁盘空间不够，可以尝试重试，使实例调度到其他节点。如果单实例仍磁盘空间不足，请联系系统管理员，更换合适的规格。如果是大模型导入的模型部署服务，请确保专属资源池磁盘空间大于1T（1000GB）。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

ker-0.log?AWSAccessKeyId=GFGTBKOZENDD83QEMZMV&Expires=1641896599&Signature=BedFZHEU1oCmqlI912UL9mXlhkg%3D" } 返回字段表示日志的obs路径。复制至浏览器即可看到对应效果。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
升级Standard专属资源池驱动 - AI开发平台ModelArts

专属资源池状态处于运行中，且专属池中的节点需要含有GPU/Ascend资源。对于逻辑资源池，需要开启节点绑定后才能进行驱动升级，请提交工单联系华为工程师开启节点绑定。驱动升级操作登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
Notebook的自定义镜像制作方法 - AI开发平台ModelArts

不满足以上镜像规范，所制作的镜像使用可能会出现故障，请用户检查镜像规范，并参考Notebook自定义镜像故障基础排查自行排查，如未解决请联系华为技术工程师协助解决。构建后需要注册镜像用户的自定义镜像构建完成后，需要在ModelArts“镜像管理”页面注册后，方可在Notebook中使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

获取ModelArts终端节点服务地址购买连接ModelArts终端节点创建DNS内网域名 VPC访问在线服务提交工单，提供账号ID给华为云技术支持，用于获取ModelArts终端节点服务地址。购买连接ModelArts终端节点登录虚拟私有云（VPC）管理控制台，单击左侧导航栏中的“VPC

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

费规格资源较少，排队概率高。规格选择卡数尽量少，如可以选择1卡，相比于选择8卡排队几率大大降低。可以尝试使用其他Region（如北京四切换为上海一）。如果有长期的资源使用诉求，可以购买独占使用的专属资源池。如果是专属资源池，建议您进行以下排查：排查专属资源池中是否存在其

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
发布免费模型 - AI开发平台ModelArts

数，默认关闭，即无限制使用。如果打开路数限制，除了设置资产免费使用的路数，还可以设置到期后是否续订。阅读并同意《华为云AI Gallery数字内容发布协议》和《华为云AI Gallery服务协议》。单击“发布”。发布使用容器镜像导入的资产时，后台会进行资产安全扫描，如果扫描

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
查询DevServer实例详情 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

在专属资源池列表中，在需要删除的资源池的右侧操作列选择“ > 删除”。在“删除资源池”页面，需在文本框中输入“DELETE”，单击“确定”，删除资源池。可切换“训练作业”、“推理服务”、“开发环境”页签查看资源池上创建的训练作业、部署的推理服务、创建的Notebook实例。图1 删除资源池释放游离节点

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像包 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.912) - AI开发平台ModelArts

ModelArts 6.3.912 版本。说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。基础镜像包 swr.cn-southwest-2.myhuaweicloud.com/atelier/pytorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
multi-lora - AI开发平台ModelArts
multi-lora - AI开发平台ModelArts

轻量化适配：无需改变原始模型结构，通过低秩矩阵的调整即可适配不同任务。多任务并行：支持同时加载多个LoRA模块，使得VLLM可以在不同任务间快速切换，提高多任务推理的效率。约束限制 multi-lora特性不能和Chunked Prefill特性一起使用。 multi-lora特性使用说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

排查/home/ma-user/.ssh目录权限是否为755/750，不是该权限请修改。连接时如果报错密钥无权限，排查密钥是否为自己的密钥（可能使用了重名密钥），请更换密钥后重新连接实例。本地排查检查配置是否正确。打开config文件进行检查：Host必须放在每组配置的第一行，作为每组配置的唯一ID。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

登录ModelArts管理控制台，在“AI专属资源池 > 弹性集群Cluster”页面，进入“Standard资源池”页签中，单击资源名称进入资源详情。在资源详情页，切换到“规格”页签，在规格列表中复制“计量ID”。图5 复制计量ID 进入“费用中心 > 流水和明细账单”页面。选择“明细账单”，在账单列

 帮助中心 > AI开发平台ModelArts > 计费说明
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

Management，简称IAM）进行精细的权限管理。该服务提供用户身份认证、权限分配、访问控制等功能，可以帮助您安全的控制云服务资源的访问。如果华为账号已经能满足您的要求，不需要通过IAM对用户进行权限管理，您可以跳过本章节，不影响您使用ModelArts服务的其他功能。 IAM是提供

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ngFace的目录格式。即Step2 准备权重文件上传的HuggingFace权重文件存放目录。如果使用了量化功能，则使用推理模型量化章节转换后的权重。 --max-num-seqs：最大同时处理的请求数，超过后拒绝访问。 --max-model-len：推理时最大输入+最大输出

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
启动DevServer实例 - AI开发平台ModelArts

停止失败： REBOOTING: 重启中： REBOOT_FAILED: 重启失败； CHANGINGOS: 切换操作系统中： CHANGINGOS_FAILED: 切换操作系统失败： REINSTALLINGOS: 重装操作系统中： REINSTALLINGOS_FAILED。重装操作系统失败。

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

明。 AscendSpeed是用于模型并行计算的框架，其中包含了许多模型的输入处理方法。获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明本教程需要使用到的AscendCloud-6.3.909中的AscendCloud-LLM-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
修改训练作业优先级 - AI开发平台ModelArts

给子账号配置"设置作业为高优先级"权限默认用户权限可选择优先级1和2，配置了"设置作业为高优先级"权限的用户可选择优先级1~3。使用主用户账号登录华为云的管理控制台，单击右上角用户名，在下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。在统一身份认证服务页面的左侧导航选择“权限管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业

总条数： 1268

上一页
1
...
56
57
58
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

服务部署、启动、升级和修改时，资源不足如何处理？ - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

Notebook的自定义镜像制作方法 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

ModelArts中的作业为什么一直处于等待中？ - AI开发平台ModelArts

发布免费模型 - AI开发平台ModelArts

查询DevServer实例详情 - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.912) - AI开发平台ModelArts

multi-lora - AI开发平台ModelArts

VS Code连接开发环境失败时的排查方法 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

IAM - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

启动DevServer实例 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

修改训练作业优先级 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线