搜索_华为云

Standard资源池节点故障定位 - AI开发平台ModelArts

可纠正ECC错误（单比特ECC错误），不影响业务。观测方式：nvidia-smi -a中查询到Volatile Correctable记录。 L2: 不可纠正ECC错误（多比特ECC错误），当次业务受损，重启进程可恢复。观测方式：nvidia-smi -a中查询到Volatile Uncorrectable记录。

帮助中心 > AI开发平台ModelArts > 故障排除 > 资源池
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

获取路径：Support-E 请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-3rdLLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
认证鉴权 - AI开发平台ModelArts
认证鉴权 - AI开发平台ModelArts

认证鉴权调用接口有如下两种认证方式，您可以选择其中一种进行认证鉴权。推荐使用AK/SK认证，其安全性比Token认证要高。 Token认证：通过Token认证通用请求。 AK/SK认证：通过AK（Access Key ID）/SK（Secret Access Key）加密调用请求。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
VS Code手动连接Notebook - AI开发平台ModelArts

Code。通过简单配置，即可用本地IDE远程连接到ModelArts的Notebook开发环境中，调试和运行代码。本章节介绍基于VS Code环境访问Notebook的方式。前提条件已下载并安装VS Code。详细操作请参考安装VS Code软件。用户本地PC或服务器的操作系统中建议先安装Python环境，详见VSCode官方指导。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
使用SDK调测单机训练作业 - AI开发平台ModelArts

framework_type=Ascend-Powered-Engine。 Session初始化。代码如下：这里只列出最常用的一种方式，更多方式请参考《Session鉴权章节》 from modelarts.session import Session session = Session()

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
提交训练作业报错“Invalid OBS path” - AI开发平台ModelArts

该问题可以通过以下方法排查：如果是首次使用ModelArts的新用户，需要登录ModelArts管理控制台，在权限管理页面完成访问授权配置，推荐使用委托授权的方式。完成访问授权配置后，再次提交作业即可。请排查所填写的Data Path in OBS是否存在，文件夹下是否有数据文件，如果没有，需要在OBS创建目录并上传训练数据到该目录。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > PyCharm Toolkit使用
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.906代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

取。模型软件包结构说明 AscendCloud-6.3.907代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

开启滚动：开启开关后，支持滚动升级的方式进行驱动升级。当前支持“按节点比例”和“按实例数量”两种滚动方式。按节点比例：每批次驱动升级的实例数量为“节点比例*资源池实例总数”。按实例数量：可以设置每批次驱动升级的实例数量。对于不同的升级方式，滚动升级选择实例的策略会不同：如果升级方式为安全升级，则

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

LoRA微调LoRA(Low-Rank Adaptation)：微调是一种用于调整大型预训练模型的高效微调技术。这种方法主要针对如何在保持模型大部分参数固定的同时，通过引入少量可训练参数来调整模型以适应特定任务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
ModelArts支持哪些AI框架？ - AI开发平台ModelArts

ModelArts支持哪些AI框架？ ModelArts的开发环境Notebook、训练作业、模型推理（即AI应用管理和部署上线）支持的AI框架及其版本，不同模块的呈现方式存在细微差异，各模块支持的AI框架请参见如下描述。统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像，包括Mind

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

取。模型软件包结构说明 AscendCloud-6.3.910代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

取。模型软件包结构说明 AscendCloud-6.3.911代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.911） > 准备工作
Pytorch Mox日志反复输出 - AI开发平台ModelArts

INFO:root:Using OBS-Python-SDK-3.1.2 原因分析 Pytorch通过spawn模式创建了多个进程，每个进程会调用多进程方式使用Mox下载数据。此时子进程会不断销毁重建，Mox也就会不断的被导入，导致打印很多Mox的版本信息。处理方法为避免训练作业Pytorch

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

525+CUDA 12.0”更换为“NVIDIA 515+CUDA 11.7”。操作步骤卸载原有版本的NVIDIA和CUDA。查看使用apt包管理方式安装的nvidia软件包，执行如下命令实现查看和卸载。 dpkg -l | grep nvidia dpkg -l | grep cuda

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

配置完IAM权限之后，需要在ModelArts页面为子账号设置ModelArts访问授权，允许ModelArts访问OBS、SWR、IEF等依赖服务。此方式只允许主用户为子账号进行配置。因此，本示例中，管理员账号需为所有用户完成访问授权的配置。使用主用户的账号登录ModelArts服务管理控

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.909代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

请联系您所在企业的华为方技术支持下载获取。模型软件包结构说明 AscendCloud-6.3.908代码包中AscendCloud-LLM代码包结构介绍如下，训练脚本以分类的方式集中在scripts文件夹中： |──llm_train # 模型训练代码包 |──AscendSpeed

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
授权API至APP - AI开发平台ModelArts

授权API至APP 功能介绍将指定的API授权给APP。API的认证方式必须为APP认证，APP的创建用户必须是API所属服务的创建者，且请求用户对API所属服务必须有更新权限。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
升级Standard专属资源池驱动 - AI开发平台ModelArts

开启滚动：开启开关后，支持滚动升级的方式升级驱动。当前支持“按节点比例”和“按实例数量”两种滚动方式。按节点比例：每批次驱动升级的实例数量为“节点比例*资源池实例总数”。按实例数量：每批次驱动升级的实例数量为设置的实例数量。对于不同的升级方式，滚动升级选择节点的策略会不同：如果升级方式为安全升级，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 745

上一页
1
...
7
8
9
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Standard资源池节点故障定位 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

认证鉴权 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

使用SDK调测单机训练作业 - AI开发平台ModelArts

提交训练作业报错“Invalid OBS path” - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ModelArts支持哪些AI框架？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Pytorch Mox日志反复输出 - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

Step3 为用户配置ModelArts的委托访问授权 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

授权API至APP - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线