搜索_华为云

准备MaaS资源 - AI开发平台ModelArts

准备MaaS资源在使用MaaS服务时，需要先完成OBS桶、资源池等准备工作。准备OBS桶在ModelArts Studio大模型即服务平台创建自定义模型、调优或压缩模型时，需要在对象存储服务OBS中创建OBS桶，用于存放模型权重文件、训练数据集或者是存放永久保存的日志。创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
快速开始 - AI开发平台ModelArts
快速开始 - AI开发平台ModelArts

快速开始 ModelArts SDK目前仅支持在ModelArts开发环境Notebook和本地PC两种环境使用。 ModelArts SDK不支持在训练作业和在线服务中使用。 ModelArts SDK已经集成在ModelArts开发环境Notebook中，可以直接使用，无需进行Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考
部署在线服务 - AI开发平台ModelArts

Service，并且提供在线的测试UI与监控能力，服务一直保持运行。 batch为批量服务，批量服务可对批量数据进行推理，完成数据处理后自动停止。 edge表示边缘服务，通过华为云智能边缘平台，在边缘节点将模型部署为一个Web Service，需提前在IEF（智能边缘服务）创建好节点。 vpc_id 否 String

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel,

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 AWQ(W4A16/W8A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见表3。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

”实例。图1 选择指标源通过“全量指标”或“按普罗语句添加”方式选择一个或多个关注的指标。图2 添加指标关于更多指标浏览方法请参考华为云帮助中心“应用运维管理 AOM> 用户指南（2.0）> 指标浏览”。容器级别的指标介绍表1 容器级别的指标分类名称指标指标含义

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型在ModelArts中创建训练作业，并完成模型训练，在得到满意的模型后，可以将训练后得到的模型导入至模型管理，方便统一管理，同时支持将模型快速部署上线为服务。约束与限制针对使用订阅算法的训练作业，无需推理代码和配置文件，其生成的模型可直接导入ModelArts。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
VS Code连接Notebook方式介绍 - AI开发平台ModelArts

VS Code连接Notebook方式介绍 Visual Studio Code (VS Code) 是一个流行的代码编辑器，它支持多种编程语言和开发环境。支持通过VS Code连接和使用Jupyter Notebook。当用户创建完成支持SSH的Notebook实例后，使用VS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
VS Code一键连接Notebook - AI开发平台ModelArts

VS Code一键连接Notebook 视频介绍前提条件已经创建Notebook实例，实例已经开启SSH连接，实例状态为运行中。请参考创建Notebook实例。实例的密钥文件已经下载至本地的如下目录或其子目录中： Windows：C:\Users\{{user}} Mac/Linux:

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过VS Code远程使用Notebook实例
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

API概览 ModelArts服务所提供的接口均为自研接口。通过ModelArts服务自研接口，您可以使用ModelArts Workflow、开发环境、训练管理、AI应用管理及服务管理功能。工作流管理表1 Workflow API 说明获取Workflow列表获取Workflow列表信息。

帮助中心 > AI开发平台ModelArts > API参考
GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？问题现象 GP Ant8支持RoCE网卡， Ubuntu20.04场景，在进行nccl-tests时，总线带宽理论峰值可达90GB/s，但实际测试下来的结果只有35GB/s。原因分析 “nv_peer_mem”是一个Linu

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
ModelArts Standard资源监控概述 - AI开发平台ModelArts

ModelArts Standard资源监控概述为了满足用户对资源使用的监控诉求，ModelArts Standard提供了多种监控查看方式。方式一：通过ModelArts Standard控制台查看您在可通过ModelArts控制台的总览页或各模块资源监控页签查看监控指标。具体涉及以下几个方面：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
如何导入大文件到Notebook中？ - AI开发平台ModelArts

如何导入大文件到Notebook中？大文件（大于100MB的文件）针对大文件，建议使用OBS服务上传文件。使用OBS客户端，将本地文件上传至OBS桶中，然后使用ModelArts SDK从OBS下载文件至Notebook本地。使用OBS客户端上传文件的操作指导：上传文件。使用ModelArts

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备训练Llama2-13B模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
ModelArts统一镜像列表 - AI开发平台ModelArts

ModelArts统一镜像列表统一镜像列表 ModelArts提供了ARM+Ascend规格的统一镜像，包括MindSpore、PyTorch。适用于开发环境，模型训练，服务部署，请参考统一镜像列表。表1 MindSpore 预置镜像适配芯片适用范围 mindspore_2

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > ModelArts支持的预置镜像列表
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

准备镜像准备训练Llama2-13B模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置Standard物理机环境操作。镜像地址本教程中用到的训练的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址配套版本训练基础镜像

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
上传本地文件至JupyterLab - AI开发平台ModelArts

上传本地文件至JupyterLab Notebook的JupyterLab中提供了多种方式上传文件。上传文件要求对于大小不超过100MB的文件直接上传，并展示文件大小、上传进度及速度等详细信息。对于大小超过100MB不超过50GB的文件可以使用OBS中转，系统先将文件上传O

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志问题现象 ModelArts训练作业使用MoXing复制数据较慢。重复打印日志“INFO:root:Listing OBS”。原因分析复制数据慢的可能原因如下：直接从OBS上读数据会造成读数据变成训练的瓶颈，导致迭代缓慢。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查当制作的自定义镜像使用出现故障时，请用户按照如下方法排查：用户自定义镜像没有ma-user用户及ma-group用户组；用户自定义镜像中/home/ma-user目录，属主和用户组不是ma-user和ma-group；用户自定义镜像必

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障

总条数： 1231

上一页
1
...
52
53
54
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备MaaS资源 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

快速开始 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

VS Code连接Notebook方式介绍 - AI开发平台ModelArts

VS Code一键连接Notebook - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

GPU A系列裸金属服务器RoCE带宽不足如何解决？ - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

如何导入大文件到Notebook中？ - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

ModelArts统一镜像列表 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

训练作业使用MoXing复制数据较慢，重复打印日志 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线