搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

s/llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/examples/llama#int8-kv-cache。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
查看Standard专属资源池详情 - AI开发平台ModelArts

准。在“基本信息”的“网络”中，可单击关联的资源池中的数字，查看关联的资源池。在扩展信息中可以查看监控、作业、节点、规格、事件、标签，详细介绍见下文。查看资源池中的作业在资源池详情页，切换到“作业”页签。您可以查看该资源池中运行的所有作业，如果当前有作业正在排队，可以查看作业在资源池排队的位置。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
使用MaaS压缩模型 - AI开发平台ModelArts

说明：需要为消息通知服务中创建的主题添加订阅，当订阅状态为“已确认”后，方可收到事件通知。订阅主题的详细操作请参见添加订阅。使用消息通知服务会产生相关服务费用，详细信息请参见计费说明。自动停止当使用付费资源时，可以选择是否打开“自动停止”开关。开关关闭（默认关闭）：表示任务将一直运行直至完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用ModelArts Studio的Llama3.1-8B模型框架实现对话问答 - AI开发平台ModelArts

在弹出的“访问授权”窗口中，授权对象类型：所有用户（或根据实际情况配置）委托选择：新增委托权限配置：普通用户选择完成后勾选“我已经详细阅读并同意《ModelArts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。

帮助中心 > AI开发平台ModelArts > 快速入门
获取训练作业支持的公共规格 - AI开发平台ModelArts

BillingInfo object 资源规格计费信息。 flavor_info FlavorInfoResponse object 资源规格详细信息。 attributes Map<String,String> 其他规格属性。表5 BillingInfo 参数参数类型描述 code

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
数据标注场景介绍 - AI开发平台ModelArts

本分类”、“命名实体”、“文本三元组”、“语音分割”类型的数据集。不同类型数据集支持的功能列表其中，不同类型的数据集，支持不同的功能，详细信息请参见表1。表1 不同类型数据集支持的功能数据集类型标注类型人工标注智能标注团队标注图片图像分类支持支持支持物体检测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
查询模型对象列表 - AI开发平台ModelArts

支持按照检索参数查询模型列表，返回满足检索条件的模型list，检索参数如表1所示。在查询列表时，返回list的同时，会打印模型列表的详细信息，如表2和表3所示。当前支持最大获取150个模型对象。表1 查询检索参数说明参数是否必选参数类型说明 model_name

帮助中心 > AI开发平台ModelArts > SDK参考 > 模型管理
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

配置CES云监控和SMN消息通知使用权限。ModelArts推理部署的在线服务详情页面内有调用次数详情，单击可查看该在线服务的调用次数随时间详细分布的情况。如果想进一步通过CES云监控查看ModelArts的在线服务和对应模型负载运行状态的整体情况，需要给子账号授予CES权限。如果只是查看监控，给子账号授予CES

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
使用AWQ量化工具转换权重 - AI开发平台ModelArts

gface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。在“运行时长控制”选择是否指定运行时长。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

版本和描述信息。单击“确定”保存镜像。在“组织”下拉框中选择一个组织。如果没有组织，可以单击右侧的“立即创建”，创建一个组织。创建组织的详细操作请参见创建组织。同一个组织内的用户可以共享使用该组织内的所有镜像。镜像会以快照的形式保存，保存时间长短跟镜像大小有关，请耐心等待。此时不可再操作实例。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
使用AWQ量化 - AI开发平台ModelArts

gface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

gface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/latest/quantization/auto_awq.html。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
训练启动脚本说明和参数配置 - AI开发平台ModelArts

sh 中的具体python指令运行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。若用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以 llama2-70b 预训练为例：表1 模型训练脚本参数参数示例值参数说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

sh中的具体python指令，并在Notebook环境中运行执行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。若用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以llama2-13b预训练为例：表1 模型训练脚本参数参数示例值参数说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
管理员和开发者权限分离 - AI开发平台ModelArts

权对象”选择管理员的账号，选择“新增委托”，“权限配置”选择“普通用户”。管理员不做权限控制，此处默认使用普通用户委托即可。勾选“我已经详细阅读并同意《 ModelArts服务声明》”，单击“创建”。测试管理员用户权限。使用管理员用户登录ModelArts管理控制台。在登

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

是否必选参数说明 -v / --verbose Bool 否显示详细的信息开关，默认关闭。示例：在ModelArts Notebook里查看所有镜像缓存。 ma-cli image df 示例：显示镜像缓存占用磁盘的详细信息。 ma-cli image df --verbose 使用ma-cli

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
使用MaaS调优模型 - AI开发平台ModelArts

说明：需要为消息通知服务中创建的主题添加订阅，当订阅状态为“已确认”后，方可收到事件通知。订阅主题的详细操作请参见添加订阅。使用消息通知服务会产生相关服务费用，详细信息请参见计费说明。自动停止当使用付费资源时，可以选择是否打开“自动停止”开关。开关关闭（默认关闭）：表示任务将一直运行直至完成。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
部署模型为在线服务 - AI开发平台ModelArts

在线服务”，默认进入“在线服务”列表。在“在线服务”列表中，单击左上角“部署”，进入“部署”页面。在“部署”页面，填写在线服务相关参数。填写基本信息，详细参数说明请参见表1。表1 基本信息参数说明参数名称说明 “名称” 在线服务的名称，请按照界面提示规则填写。 “是否自动停止” 启用该

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将AI应用部署为实时推理作业
查询服务对象列表 - AI开发平台ModelArts

支持按照检索参数查询服务列表，返回满足检索条件的服务list，检索参数如表1所示。在查询列表时，返回list的同时，默认会打印模型列表的详细信息，如表2和表3所示。表1 查询检索参数说明参数是否必选参数类型描述 session 是 Object 会话对象，初始化方法见Session鉴权。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理

总条数： 485

上一页
1
...
16
17
18
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

查看Standard专属资源池详情 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

使用ModelArts Studio的Llama3.1-8B模型框架实现对话问答 - AI开发平台ModelArts

获取训练作业支持的公共规格 - AI开发平台ModelArts

数据标注场景介绍 - AI开发平台ModelArts

查询模型对象列表 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

将AI Gallery中的模型部署为AI应用 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线