搜索_华为云

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

用户自定义镜像必须满足用户目录/home/ma-user权限为750，不能为其他权限；用户自定义镜像使用远程SSH功能，OpenSSH版本要兼容或高于8.0；用户制作的自定义镜像，在本地执行docker run启动，无法正常运行；用户自行安装了Jupyterlab服务导致

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
查询服务详情 - AI开发平台ModelArts

列表或者ModelArts管理控制台获取。 model_name String 模型名称。 model_version String 模型版本。 source_type String 模型来源，当模型是由自动学习产生时，返回此字段，取值为：auto。 status String 模型实例运行状态，取值为：

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
查询训练作业参数详情 - AI开发平台ModelArts

训练作业的数据集。 dataset_id String 训练作业的数据集ID。 dataset_version_id String 训练作业的数据集版本ID。 data_source JSON Array 训练作业使用的多数据集。详情请查看表4。 engine_type Integer 训练作业的引擎类型。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
我的Gallery介绍 - AI开发平台ModelArts

我的主页展示个人的成长值数据。成长值可以通过“签到”和发布资产获取，每天只能签到一次。说明：成长值相关数据和功能当前是Beta版本，在正式版本发布前可能会发生变化。我的资产 > 算法展示个人发布和订阅的算法列表。 “我的发布”：可以查看个人发布的算法信息，如浏览量、收藏

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
查询节点池的节点列表 - AI开发平台ModelArts

分页单次查询返回数。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下： v2 kind String 资源类型。可选值如下： NodeList：节点列表 metadata NodeListMetadata

帮助中心 > AI开发平台ModelArts > API参考 > 节点池管理
查询资源规格列表 - AI开发平台ModelArts

分页数目。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下： v1 kind String 资源类型。可选值如下： ResourceFlavorList：资源规格列表 metadata

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询节点列表 - AI开发平台ModelArts

分页单次查询返回数。请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下： v2 kind String 资源类型。可选值如下： NodeList：节点列表 metadata NodeListMetadata

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
Notebook中构建新镜像 - AI开发平台ModelArts

sh脚本，会git clone下载Megatron-LM、MindSpeed、ModelLink源码（install.sh中会自动下载配套版本，若手动下载源码还需修改版本）至llm_train/AscendSpeed文件夹中。下载的源码文件结构如下： |——AscendCloud-LLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
使用kv-cache-int8量化 - AI开发平台ModelArts

kv-cache-int8量化支持的模型请参见表3。 per-tensor静态量化场景在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

WebSocket连接的建立打开Postman（需选择8.5 以上版本，以10.12.0为例）工具，单击左上角，选择“File>New”，弹出新建对话框，选择“WebSocket Request”（当前为beta版本）功能：图1 选择WebSocket Request功能在新建

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的传输协议
基于ModelArts performance advisor插件的昇腾PyTorch性能调优步骤 - AI开发平台ModelArts

profile、dynamic_profile等多种采集方式。任意torch_npu版本均支持torch_npu.profiler.profile方式，而其他采集方式则要求特定版本的torch_npu（2024年0630之后版本）。推荐升级torch_npu后使用dynamic_profile方

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
在推理生产环境中部署推理服务 - AI开发平台ModelArts

于缓存文件与实际推理不匹配而报错。若要使用eagle投机，配置环境变量，使eagle投机对齐实验室版本实现。目前默认开启此模式，若不开启，目前vllm0.6.0版本与实验室版本权重无法对齐，会导致小模型精度问题。 export EAGLE_USE_SAFE_AI_LAB_STYLE=1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
获取训练作业日志的文件名 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。 version_id 是 Long 训练作业的版本ID。请求消息无请求参数。响应消息相应参数如表2所示。表2 响应参数参数参数类型说明 is_success Boolean

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
使用kv-cache-int8量化 - AI开发平台ModelArts

kv-cache-int8量化支持的模型请参见表3。 per-tensor静态量化场景在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
查询事件列表 - AI开发平台ModelArts

Warning：异常请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 apiVersion String API版本。可选值如下： v1 kind String 资源类型。可选值如下： EventList：事件列表 metadata EventListMeta

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
使用kv-cache-int8量化 - AI开发平台ModelArts

kv-cache-int8量化支持的模型请参见表3。 per-tensor静态量化场景在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

被服务器接收，且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。例如，切换到HTTP的新版本协议。 200 OK 接口调用成功。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求，但未处理完成。

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
创建训练作业 - AI开发平台ModelArts

framework_version='PyTorch-1.4.0-python3.6', # 常用框架版本 train_instance_type="modelarts.p3.large.public"

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

docker tag [镜像名称1:版本名称1] [镜像仓库地址]/[组织名称]/[镜像名称2:版本名称2] [镜像名称1:版本名称1]：${image_name}:${image_version}请替换为您所要上传的实际镜像的名称和版本名称。 [镜像仓库地址]：可在SWR控制台上查询，即1

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

docker tag [镜像名称1:版本名称1] [镜像仓库地址]/[组织名称]/[镜像名称2:版本名称2] [镜像名称1:版本名称1]：${image_name}:${image_version}请替换为您所要上传的实际镜像的名称和版本名称。 [镜像仓库地址]：可在SWR控制台上查询，即1

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业

总条数： 1366

上一页
1
...
60
61
62
...
69
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

查询服务详情 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

我的Gallery介绍 - AI开发平台ModelArts

查询节点池的节点列表 - AI开发平台ModelArts

查询资源规格列表 - AI开发平台ModelArts

查询节点列表 - AI开发平台ModelArts

Notebook中构建新镜像 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用WebSocket协议的方式访问在线服务 - AI开发平台ModelArts

基于ModelArts performance advisor插件的昇腾PyTorch性能调优步骤 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

获取训练作业日志的文件名 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

查询事件列表 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU多机多卡训练作业 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线