搜索_华为云

使用kv-cache-int8量化 - AI开发平台ModelArts

径是examples/llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/exam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

径是examples/llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/exam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

Downloading VS Code Server locally"超过10分钟以上，如何解决？问题现象原因分析当前本地网络原因，导致远程自动安装VS Code Server时间过长。解决方法打开VS Code，选择“Help>About”，并记下“Commit”的ID码。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
使用kv-cache-int8量化 - AI开发平台ModelArts

径是examples/llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/exam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

设置断点后单击“调试”，可实现代码逐步调试，查看中间变量值。图9 “调试”按钮图10 通过设置断点实现代码调试可单击“运行”按钮，通过日志观察是否能正常训练。图11 “运行”按钮图12 训练日志步骤3：使用ModelArts Notebook进行开发调试使用ModelArts N

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

failed” 问题现象 VS Code连接远端Notebook时报错“XHR failed”。原因分析可能是所在环境的网络有问题，无法自动下载VS Code Server，请手动安装。解决方法打开VS Code，选择“Help>About”，并记下“Commit”的ID码。

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──{output_dir} #{OUTPUT_SAVE_DIR}或yaml文件{output_dir}参数设置值 # 自动生成数据目录结构 |── preprocessed_data |──converted_hf2mg_weight_TP${TP}PP${PP}

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

"cn-north-1" } } } } 其中，加粗的斜体字段需要根据实际值填写： iam_endpoint为IAM的终端节点。 user_name为IAM用户名。 user_password为用户登录密码。 domain_name为用户所属的账号名。 cn-no

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
使用kv-cache-int8量化 - AI开发平台ModelArts

径是examples/llama/convert_checkpoint.py。执行convert_checkpoint.py脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorRT-LLM/tree/main/exam

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907） > 推理模型量化
创建训练作业 - AI开发平台ModelArts

train_instance_type 是 String 训练作业选择的资源规格，请参考查询资源规格列表 train_instance_count 是 int 训练作业计算节点个数。 framework_type 否 String 训练作业选择的引擎规格，请参考查询引擎规格列表。 framework_version

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
续费概述 - AI开发平台ModelArts
续费概述 - AI开发平台ModelArts

说明手动续费包年/包月专属资源池从购买到被自动删除之前，您可以随时在ModelArts控制台为专属资源池续费，以延长专属资源池的使用时间。自动续费开通自动续费后，专属资源池会在每次到期前自动续费，避免因忘记手动续费而导致资源被自动删除。在一个包年/包月专属资源池生命周期的

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
MoXing进阶用法的样例代码 - AI开发平台ModelArts

当读取OBS文件时，实际调用的是HTTP连接读取网络流，注意要记得在读取完毕后将文件关闭。为了防止忘记文件关闭操作，推荐使用with语句，在with语句退出时会自动调用mox.file.File对象的close()方法： 1 2 3 import moxing as mox with mox.file

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

通过API接口选择自定义镜像导入创建模型，配置了运行时依赖，没有正常安装pip依赖包。原因分析自定义镜像导入不支持配置运行时依赖，系统不会自动安装所需要的pip依赖包。处理方法重新构建镜像。在构建镜像的dockerfile文件中安装pip依赖包，例如安装Flask依赖包。 #

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
配置授权 - AI开发平台ModelArts
配置授权 - AI开发平台ModelArts

统里配置Security Administrator权限。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/authorizations

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
发布Notebook - AI开发平台ModelArts

修改封面图和二级标题在发布的资产详情页面，单击右侧的“编辑”，选择上传新的封面图，为资产编辑独特的主副标题。编辑完成之后单击“保存”，封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图4 修改封面图和二级标题编辑标签单击标签右侧的出现标签编辑框，在下拉框中勾选该资产对应的标签。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
数据标注场景介绍 - AI开发平台ModelArts

ModelArts为用户提供了标注数据的能力：人工标注：用户创建单人标注作业，对数据进行手工标注。智能标注：在标注一定量的数据情况下，用户可以通过启动智能标注任务对数据进行自动标注，提高标注的效率。团队标注：对于大批量的数据，用户可以通过创建团队标注作业，进行多人协同标注。人工标注对于不同类型的数据，用户可

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
动态挂载OBS并行文件系统 - AI开发平台ModelArts

置”页签，单击“添加数据存储”，设置挂载参数。设置本地挂载目录，在“/data/”目录下输入一个文件夹名称，例如：demo。挂载时，后台自动会在Notebook容器的“/data/”目录下创建该文件夹，用来挂载OBS文件系统。选择存放OBS并行文件系统下的文件夹，单击“确定”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 SmoothQuant(W8A8)量化方案能降低模型显存以及需要部署的卡数。也能同时降低首token时延和增量推理时延。支持SmoothQuant(W8A8)量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用SmoothQuant量化工具实现推理量化。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化

总条数： 1466

上一页
1
...
62
63
64
...
74
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用ModelArts PyCharm插件调试训练ResNet50图像分类模型 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

续费概述 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

MoXing进阶用法的样例代码 - AI开发平台ModelArts

自定义镜像导入配置运行时依赖无效 - AI开发平台ModelArts

配置授权 - AI开发平台ModelArts

发布Notebook - AI开发平台ModelArts

数据标注场景介绍 - AI开发平台ModelArts

动态挂载OBS并行文件系统 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

使用SmoothQuant量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线