搜索_华为云

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

如上发现reboot后内核为4.18.0-147.5.1.6.h998.eulerosv2r9.x86_64，和当前内核版本h934不一致，则需要重新设置内核版本与当前版本一致。查看当前内核版本，并且锁定reboot后默认启动的内核版本，执行如下命令： grub2-set-default 'EulerOS

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
模型包结构介绍 - AI开发平台ModelArts

rvice.py, 只允许放置一个，customize_service.py依赖的文件可以直接放model目录下 Custom模型包结构，与您自定义镜像中AI引擎有关。例如自定义镜像中的AI引擎为TensorFlow，则模型包采用TensorFlow模型包结构。父主题：创建AI应用规范参考

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建AI应用规范参考
moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导方案概览本文档从模型部署的环境配置、模型转换、模型推理等方面进行介绍moondream2模型在ModelArts DevServer上部署，支持NPU推理场景。本方案目前仅适用于部分企业客户，完成本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
获取用户绑定APP的api列表 - AI开发平台ModelArts

获取用户绑定APP的api列表功能介绍获取用户绑定app的API列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905）本文档主要介绍如何在ModelArts Lite DevServer上，使用PyTorch_npu+华为自研Ascend Snt9B硬件，完成Open-Sora训练和推理。资源规格要求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
附录：指令微调训练常见问题 - AI开发平台ModelArts

附录：指令微调训练常见问题问题1：在训练过程中遇到NPU out of memory 解决方法：将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考各个模型深度学习训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
训练作业卡死检测定位 - AI开发平台ModelArts

训练作业卡死检测定位什么是训练作业卡死检测训练作业在运行中可能会因为某些未知原因导致作业卡死，如果不能及时发现，就会导致无法及时释放资源，从而造成极大的资源浪费。为了节省训练资源成本，提高使用体验，ModelArts提供了卡死检测功能，能自动识别作业是否卡死，并在日志详情界面

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业卡死
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

配置授权功能介绍配置ModelArts授权。若没有授权，ModelArts训练管理、开发环境、数据管理、在线服务等功能将不能正常使用。该API支持管理员给IAM子用户设置委托，支持设置当前用户的访问密钥。调用该API需要在IAM系统里配置Security Administrator权限。

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
查询资源池的所有标签 - AI开发平台ModelArts

查询资源池的所有标签功能介绍查询用户当前项目下资源池的所有标签，默认查询所有工作空间，无权限的工作空间不返回标签数据。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI

帮助中心 > AI开发平台ModelArts > API参考 > 资源标签管理
使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

使用JupyterLab在线开发和调试代码 JupyterLab是一个交互式的开发环境，可以使用它编写Notebook、操作终端、编辑MarkDown文本、打开交互模式、查看csv文件及图片等功能。可以说，JupyterLab是开发者们下一阶段更主流的开发环境。 ModelArt

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
Notebook中快速使用MoXing - AI开发平台ModelArts

Notebook中快速使用MoXing 本文档介绍如何在ModelArts中调用MoXing Framework接口。进入ModelArts，创建Notebook实例登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间>Notebook”，进入“Notebook”管理页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
查询超参搜索某个trial的结果 - AI开发平台ModelArts

查询超参搜索某个trial的结果功能介绍根据传入的trial_id，查询指定trial的搜索结果。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询服务更新日志 - AI开发平台ModelArts

01（最多支持2位小数，小数点后第3位做四舍五入处理）。 ascend_a310 Integer Ascend芯片个数，可选，默认不使用，不支持与gpu同时配置。表8 UpdateResult 参数参数类型描述 result Boolean 操作结果，true代表成功，false表示操作失败。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

请务必设置 PYTHONUNBUFFERED=1, 以免日志丢失。 ENV PYTHONUNBUFFERED=1 # 设置容器镜像默认用户与工作目录。 USER ma-user WORKDIR /home/ma-user Dockerfile需要重点关注以下几点：为镜像增加模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

获取动态挂载OBS实例信息列表功能介绍获取动态挂载OBS实例信息列表。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{pr

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

续费概述续费简介包年/包月专属资源池到期后会影响ModelArts正常使用。如果您想继续使用，需要在指定的时间内为专属资源池续费，否则资源会自动释放，数据丢失且不可恢复。续费操作仅适用于包年/包月专属资源池，按需计费专属资源池不需要续费，只需要保证账户余额充足即可。专属资

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？问题现象在高性能8卡GPU的裸金属上的训练任务突然变慢，以前1个epoch约2小时执行完成，最近1个epoch需要2天才能执行完成，并且执行“nvidia-smi”也明显变很卡顿。原因分析根据现象描述可能出现了nvidia-smi

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的模型软件包如下表所示，请提前准备好。软件配套版本本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.906-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 准备工作

总条数： 1302

上一页
1
...
58
59
60
...
66
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

moondream2基于DevServer适配PyTorch NPU推理指导 - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

Open-Sora 1.0基于DevServer适配PyTorch NPU训练指导（6.3.905） - AI开发平台ModelArts

附录：指令微调训练常见问题 - AI开发平台ModelArts

训练作业卡死检测定位 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

查询资源池的所有标签 - AI开发平台ModelArts

使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

查询超参搜索某个trial的结果 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线