搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

ODE_DIR目录，则可以使用scripts/tools/sync_with_obs.py工具将其它节点的权重文件同步上传到主节点。修改代码如图3。图3 多机同步权重文件代码上传至OBS 将llm_train文件上传至OBS中。结合准备数据、准备权重、准备代码，将数据集、原

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
VS Code手动连接Notebook - AI开发平台ModelArts

本章节介绍基于VS Code环境访问Notebook的方式。前提条件已下载并安装VS Code。详细操作请参考安装VS Code软件。用户本地PC或服务器的操作系统中建议先安装Python环境，详见VSCode官方指导。创建一个Notebook实例，并开启远程SSH开发。该实例状态必须处于

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
查询数据集列表 - AI开发平台ModelArts

Boolean 是否同步更新智能标注数据。可选值如下： true：同步更新智能标注数据 false：不同步更新智能标注数据 is_synchronize_data Boolean 是否同步更新数据：如上传文件、同步数据源、导入的未标注文件同步分配至团队成员。可选值如下： true：同步更新数据至团队成员

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery大模型开源社区，通过大模型为用户提供服务，普及大模型行业。AI Gallery提供了大量基于昇腾云底座适配的三方开源大模型，同步提供了可以快速体验模型的能力、极致的开发体验，助力开发者快速了解并学习大模型。构建零门槛线上模型体验，零基础开发者开箱即用，初学者三行代码使用所有模型

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
查询Notebook实例详情 - AI开发平台ModelArts

实例创建的时间，UTC毫秒。 duration Long 实例运行时长，以创建时间为起点计算，即“创建时间+duration > 当前时刻”时，系统会自动停止实例。 enable Boolean 是否启用自动停止功能。 type String 自动停止类别。 timing：自动停止。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
不同机型的对应的软件配套版本 - AI开发平台ModelArts

由于弹性集群资源池可选择弹性裸金属或弹性云服务器作为节点资源，不同机型的节点对应的操作系统、适用的CCE集群版本等不相同，为了便于您制作镜像、升级软件等操作，本文对不同机型对应的软件配套版本做了详细介绍。裸金属服务器的对应的软件配套版本表1 裸金属服务器类型卡类型 RDMA网络协议

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
管理Lite Cluster节点 - AI开发平台ModelArts

池获得和之前相同的总节点个数。仅有一个节点时，无法进行删除/退订/释放操作。续费/开通自动续费/修改自动续费对于包年/包月的节点，在“节点管理”页签中提供了续费、开通自动续费和修改自动续费功能，并支持对多个节点进行批量操作。重置节点 “节点管理”页签中提供节点重置的功能。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

准备一台具有Docker功能的机器，如果没有，建议申请一台弹性云服务器并购买弹性公网IP，并在准备好的机器上安装必要的软件。 ModelArts提供了ubuntu系统的脚本，方便安装docker。本地Linux机器的操作等同ECS服务器上的操作，请参考本案例。登录ECS控制台，购买弹性云服务器，镜像选择“公共镜像”，推荐使用ubuntu18

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
在ModelArts中图像分类和物体检测具体是什么？ - AI开发平台ModelArts

识别出每个物体的位置、数量、名称，适合图片中有多个主体的场景，针对下图检测出图片包含树和汽车。图2 物体检测父主题： Standard自动学习

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard自动学习
在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

生的Summary文件先上传到OBS并行文件系统，并确保OBS并行文件系统与ModelArts在同一区域。在Notebook中启动TensorBoard时，Notebook会自动从挂载的OBS并行文件系统目录中读取Summary数据。 Step3 启动TensorBoard 在开

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

IDL中的WebSocket API由W3C标准化。 WebSocket使得客户端和服务器之间的数据交换变得更加简单，允许服务端主动向客户端推送数据。在WebSocket API中，浏览器和服务器只需要完成一次握手，两者之间就可以建立持久性的连接，并进行双向数据传输。前提条件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
服务启动失败 - AI开发平台ModelArts

模型可以正常启动，但是因为镜像中启用的端口非8080，或者镜像启用的端口与创建模型时配置的端口不一致，导致部署服务时register-agent无法与模型通信，超过一定时间后（最长20分钟）认为模型启动失败。需要检查两个地方：自定义镜像中的代码开放的端口和创建模型界面上配置的端口。确认两处端口保持一致。模型

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
修改工作空间配额 - AI开发平台ModelArts

修改工作空间配额功能介绍修改工作空间配额。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI PUT /v1/{project_id}/workspaces/{workspace_id}/quotas

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
训练作业卡死检测 - AI开发平台ModelArts

期内，作业所有进程IO都没有变化，则进入资源利用率检测阶段。资源利用率：在作业进程IO没有变化的情况下，采集一定时间段内的GPU利用率或NPU利用率，并根据这段时间内的GPU利用率或NPU利用率的方差和中位数来判断资源使用率是否有变化。如果没有变化，则判定作业卡死。系统预置了

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
Lite Cluster资源配置流程 - AI开发平台ModelArts

//查看卡信息图15 查看卡信息训练任务大概会运行两小时左右，训练完成后自动停止。若想停止训练任务，可执行下述命令关闭进程，查询进程后显示已无运行中python进程。 pkill -9 python ps -ef 图16 关闭训练进程父主题： Lite Cluster资源配置

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
手动部署推理服务 - AI开发平台ModelArts

手动部署推理服务前提条件已经完成资源购买。约束限制脚本中的镜像是在西南-贵阳一区域，请在西南-贵阳一区域上部署推理服务。步骤一：检查环境 SSH登录机器后，检查NPU设备检查。如果驱动版本不是24.1.0，请先升级驱动和对应固件。 npu-smi info -t board

帮助中心 > AI开发平台ModelArts > 最佳实践 > DeepSeek系列模型推理 > DeepSeek模型基于ModelArts Lite Server适配MindIE推理部署指导 > 部署推理服务
Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

Discriminator对生成结果的质量进行规范，提高生成视频的清晰度。引入预训练的唇音同步判别模型Pre-trained Lip-sync Expert，作为衡量生成结果的唇音同步性的额外损失，可以更好的保证生成结果的唇音同步性。方案概览本方案介绍了在ModelArts的Lite Serve

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
查看ModelArts模型详情 - AI开发平台ModelArts

模型的版本数量。请求模式在线服务的请求模式。同步请求：单次推理，可同步返回结果（约<60s）。例如: 图片、较小视频文件。异步请求：单次推理，需要异步处理返回结果（约>60s）。例如: 实时视频推理、大视频文件。创建时间模型的创建时间。描述模型的描述。操作部署：将模型发布为在线服务、批量服务或边缘服务。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

GPU A系列裸金属服务器如何进行RoCE性能带宽测试？ GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？如何将Ubuntu20.04内核版本从低版本升级至5.4.0-144-generic？如何禁止Ubuntu 20.04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容

 帮助中心 > AI开发平台ModelArts > 常见问题
训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

如下方法：方法1：可以根据ps -aux查到的进程号，使用kill -9强制关闭进程。 sudo kill -9 <进程ID> 方法2：如果方法1执行后无法消除D+进程，请尝试重启服务器。父主题： Lite Server

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server

总条数： 1399

上一页
1
...
10
11
12
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

VS Code手动连接Notebook - AI开发平台ModelArts

查询数据集列表 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

查询Notebook实例详情 - AI开发平台ModelArts

不同机型的对应的软件配套版本 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

在ECS上构建自定义镜像并在Notebook中使用 - AI开发平台ModelArts

在ModelArts中图像分类和物体检测具体是什么？ - AI开发平台ModelArts

在JupyterLab中使用TensorBoard可视化作业 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

修改工作空间配额 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

手动部署推理服务 - AI开发平台ModelArts

Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

Lite Server - AI开发平台ModelArts

训练速度突然下降以及执行nvidia-smi卡顿如何解决？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线