搜索_华为云

管理员和开发者权限分离 - AI开发平台ModelArts

权限，包括对自己实例的创建、启动、停止、删除等权限以及周边依赖服务的权限。普通开发者不需要ModelArts专属资源池的操作权限，也不需要查看其他用户的Notebook实例。图1 账号关系示意图配置管理员权限管理员账号需要拥有ModelArts专属资源池的完全控制权限，以及

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
训练作业卡死检测 - AI开发平台ModelArts

来判断资源使用率是否有变化。如果没有变化，则判定作业卡死。系统预置了卡死检测的环境变量“MA_HANG_DETECT_TIME=30”，表示30分钟内进程IO无变化则判定作业卡死。如果需要修改卡死检测时间，则可以修改环境变量“MA_HANG_DETECT_TIME”的值，具体操作指导请参见管理训练容器环境变量。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

升级为WebSocket：打开开关图2 升级为WebSocket 单击“下一步”，确认配置后“提交”，完成在线服务的部署。返回在线服务列表页，查看服务状态变为“运行中”，表示服务部署成功。 WebSocket在线服务调用 WebSocket协议本身不提供额外的认证方式。不管自定义镜像里面是ws

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
为什么通过Manifest文件导入失败？ - AI开发平台ModelArts

解决方案方法1（推荐），建议将此数据集重新发布版本，然后再使用新版本的Manifest文件导入。方法2，修改您本地的Manifest文件，查找OBS目录下的数据变更，根据变更同步修改Manifest。确保Manifest文件与OBS目录下的数据现状相同，然后使用修改后的Manifest文件导入。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

model_baseline_performance表示调优前模型执行时间，单位为ms。 model_performance_improvement表示调优后模型执行时间减少百分比。 model_result_performance表示调优后模型执行时间。 repo_summary中的信息表示调优过程中使用到的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
上传本地文件至JupyterLab - AI开发平台ModelArts

后执行ls /home/ma-user/work命令查看下载到Notebook中的文件。或者在JupyterLab左侧导航中显示下载的文件，如果没有显示，请刷新后查看，如图14所示。图13 打开Terminal 图14 查看下载到Notebook中的文件异常处理通过OBS下

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.912) - AI开发平台ModelArts

和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.910软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.912软件包中的AscendCloud-AIGC-6.3.912-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

initialize NVML: Driver/library version mismatch 处理方法执行命令：lsmod | grep nvidia，查看内核中是否残留旧版nvidia，显示如下： nvidia_uvm 634880 8 nvidia_drm

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

/pretrain_gpt2.sh & 图3 开始预训练实时查看训练日志，监控程序。 tail -f nohup.out 如果显示如下信息，表示模型训练完成。图4 模型训练完成在训练过程中观察单GPU卡的利用率，如下：图5 GPU利用率查看生成的模型checkpoint。本示例生成的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
计费概述 - AI开发平台ModelArts
计费概述 - AI开发平台ModelArts

按照资源实际使用时长计费。计费项 ModelArts服务的计费项由ModelArts计算资源费用和对象存储、云硬盘等基础资源费用组成。表1 计费项计费项计费项说明适用的计费模式计费公式适用的功能模块计算资源费用计费因子：包括vCPU、GPU和NPU。按需计费的资源，按购买规格和时长计费

 帮助中心 > AI开发平台ModelArts > 计费说明
团队标注使用说明 - AI开发平台ModelArts

针对启用团队标注功能的数据标注任务，支持创建团队标注任务，将标注任务指派给不同的团队，由多人完成标注任务。同时，在成员进行数据标注过程中，支持发起验收、继续验收以及查看验收报告等功能。团队标注功能是以团队为单位进行管理，数据集启用团队标注功能时，必须指定一个团队。一个团队可以添加多个成员。一个账号最多可添加10个团队。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

新安装的包与镜像中带的CUDA版本不匹配。处理方法必现的问题，使用本地Pycharm远程连接Notebook调试安装。先远程登录到所选的镜像，使用“nvcc -V”查看目前镜像自带的CUDA版本。重装torch等，需要注意选择与上一步版本相匹配的版本。建议与总结在创建训练作业前，推荐您先使用Mode

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
训练权重转换说明 - AI开发平台ModelArts

任务不同调整参数target-pipeline-parallel-size，默认为1。权重转换完成后，需要将转换后的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

任务不同调整参数target-pipeline-parallel-size，默认为1。权重转换完成后，需要将转换后的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

任务不同调整参数target-pipeline-parallel-size，默认为1。权重转换完成后，需要将转换后的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

任务不同调整参数target-pipeline-parallel-size，默认为1。权重转换完成后，需要将转换后的文件与原始Hugging Face模型中的文件进行对比，查看是否缺少如tokenizers.json、tokenizer_config.json、special_tokens_map.json等to

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

配的情况。如果上述方法还出现了错误，可以去notebook里面调试打印CUDA_VISIBLE_DEVICES变量，或者用以下代码测试，查看结果是否返回的是True。 import torch torch.cuda.is_available() 建议与总结在创建训练作业前，推

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

视化作业流程 Step1 创建开发环境并在线打开 Step2 上传Summary数据 Step3 启动TensorBoard Step4 查看训练看板中的可视化数据 Step1 创建开发环境并在线打开在ModelArts控制台，进入“开发空间 > Notebook”页面，创建T

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
包年/包月 - AI开发平台ModelArts
包年/包月 - AI开发平台ModelArts

第二个计费周期为：2023/04/08 23:59:59 ~ 2023/05/08 23:59:59 您需要为每个计费周期预先付费，计费公式如表2所示。表2 计费公式资源类型计费公式资源单价计算资源实例规格单价 * 计算节点个数 * 购买时长请参见ModelArts价格详情中的“规格价格”。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式

总条数： 1722

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

管理员和开发者权限分离 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

为什么通过Manifest文件导入失败？ - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.912) - AI开发平台ModelArts

LLaVA-NeXT基于DevServer适配Pytorch NPU训练微调指导（6.3.912） - AI开发平台ModelArts

GPU裸金属服务器更换NVIDIA驱动后执行nvidia-smi提示Failed to initialize NVML - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

计费概述 - AI开发平台ModelArts

团队标注使用说明 - AI开发平台ModelArts

重装的包与镜像装CUDA版本不匹配 - AI开发平台ModelArts

训练权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

包年/包月 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线