搜索_华为云

查询支持的服务部署规格 - AI开发平台ModelArts

batch：批量服务 edge: 边缘服务 limit 否 String 指定每一页返回的最大条目数，默认为1000。 offset 否 String 返回数据的起始偏移量，默认为0。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
查询AI应用列表 - AI开发平台ModelArts

状态码：200 表4 响应Body参数参数参数类型描述 models Array of ModelListItem objects 模型元数据信息。 total_count Integer 不分页的情况下符合查询条件的总模型数量。 count Integer 符合查询条件的模型数量。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

output2=obs://bucket/output2 --input String 否训练的输入信息，指定后，训练作业将会把对应OBS上的数据下载到训练容器，并将数据存储路径通过指定的参数传递给训练脚本。如果需要指定多个参数，可以使用--input data_path1=obs://bucket/data1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

规则类型：选择“指标告警规则”。配置方式：选择“PromQL”。设置告警规则详情。默认规则：选择“自定义”。命令行输入框(排除值为2的为无效数据)： sum(nt_npg{type="NT_NPU_CARD_LOSE"} !=2) by (cluster_name, node_ip

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
使用AWQ量化 - AI开发平台ModelArts

A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

A16支持128和-1，W8A16支持-1。 --w-bit：量化比特数，W4A16设置4，W8A16设置8。 --calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。检查环境。 SSH登录机器后，检查NPU设备检查。运行如下命令，返回NPU设备信息。 npu-smi info 如

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
非分离部署推理服务 - AI开发平台ModelArts

l-len，推荐使用4096或8192。 --dtype：模型推理的数据类型。支持FP16和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。如果不指定，则根据输入数据自动匹配数据类型。使用不同的dtype会影响模型精度。如果使用开源权重，建议不指定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

l-len，推荐使用4096或8192。 --dtype：模型推理的数据类型。支持FP16和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。如果不指定，则根据输入数据自动匹配数据类型。使用不同的dtype会影响模型精度。如果使用开源权重，建议不指定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

l-len，推荐使用4096或8192。 --dtype：模型推理的数据类型。支持FP16和BF16数据类型推理。float16表示FP16，bfloat16表示BF16。如果不指定，则根据输入数据自动匹配数据类型。使用不同的dtype会影响模型精度。如果使用开源权重，建议不指定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
停止Notebook实例 - AI开发平台ModelArts

ebook。 SSH：可以通过SSH协议远程连接Notebook。 ssh_keys Array of strings SSH密钥对名称列表，允许设置多个密钥对实现同时对SSH实例的访问。 service String 访问Notebook的途径，枚举值如下： NOTEBOOK：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

s，--privileged，--cap-add的启动命令，在模型发布时将会置空。 “apis定义” 提供模型对外Restfull api数据定义，用于定义模型的输入、输出格式。apis定义填写规范请参见模型配置文件编写说明中的apis参数说明，示例代码请参见apis参数代码示例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
查询支持的镜像列表 - AI开发平台ModelArts

参数参数类型描述 current Integer 当前页数。 data Array of ImageResponse objects 数据。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 ImageResponse

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

None 服务介绍 ModelArts产品产品介绍 03:19 了解什么是ModelArts ModelArts自动学习视频介绍 02:59 ModelArts自动学习简介 ModelArts CodeLab 视频介绍 04:16 ModelArts CodeLab介绍 JupyterLab

帮助中心 > AI开发平台ModelArts > 视频帮助
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本的软件包，请严格遵照版本配套关系使用本文档。推理部署使用的服务框架是vLLM。vLLM支持v0.4.2版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。支持的模型列表本方案支持的模型列表、对应的开源权重获取地址如表1所示。表1 支持的模型列表和权重获取地址

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
查询服务列表 - AI开发平台ModelArts

finished：只有批量服务会有这个状态，表示运行完成。 is_opened_sample_collection String 是否打开数据采集，默认“false”。 transition_at Number 服务状态转化时间。 is_free Boolean 服务是否是免费规格类型。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

{ "type": "integer" } } } } }] apis定义提供模型对外Restfull api数据定义，用于定义模型的输入、输出格式。创建模型填写apis。在创建的模型部署服务成功后，进行预测时，会自动识别预测类型。创建模型时不填写

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
（可选）配置镜像预热 - AI开发平台ModelArts

预置：可选择SWR服务上自有的或他人共享的镜像。自定义：可直接填写镜像地址。添加镜像密钥若本租户不具有预热镜像的权限（即非公开/非本租户私有/非他人共享的镜像），此时需要添加镜像密钥。在开启镜像密钥开关后，选择命名空间及对应密钥。创建密钥方法可参考创建密钥，密钥类型须为kubernetes.io/dockerconfigjson类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

ry CLI配置工具下载文件。获取待下载的文件名在AI Gallery页面的资产详情页，如果是模型资产，则选择“模型文件”页签，如果是数据集资产，则选择“文件版本”页签，获取“文件名称”。下载单个文件在服务器执行如下命令，可以从AI Gallery仓库下载单个文件到服务器的缓存目录下。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南

总条数： 1549

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询支持的服务部署规格 - AI开发平台ModelArts

查询AI应用列表 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

SD1.5&SDXL ComfyUI、WebUI、Diffusers套件适配PyTorch NPU的推理指导（6.3.912） - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

停止Notebook实例 - AI开发平台ModelArts

从容器镜像中导入模型文件创建模型 - AI开发平台ModelArts

查询支持的镜像列表 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

（可选）配置镜像预热 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线