搜索_华为云

推理性能测试 - AI开发平台ModelArts

--benchmark-csv：结果保存路径，如benchmark_serving.csv。 --served-model-name：选择性添加，选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完后，测试结果保存在benchmark_serving.csv中，示例如下图所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
使用AWQ量化 - AI开发平台ModelArts

--calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
查看模型评估结果 - AI开发平台ModelArts

的适配和修正，分为三个方面：添加输出目录、复制数据集到本地、映射数据集路径到OBS。添加输出目录添加输出目录的代码比较简单，即在代码中添加一个输出评估结果文件的目录，被称为train_url，也就是页面上的训练输出位置。并把train_url添加到使用的函数analysis中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
数据管理（旧版） - AI开发平台ModelArts

查询数据集的统计信息查询数据集监控数据查询数据集的版本列表创建数据集标注版本查询数据集版本详情删除数据集标注版本查询样本列表批量添加样本批量删除样本查询单个样本信息获取样本搜索条件分页查询团队标注任务下的样本列表查询团队标注的样本信息查询数据集标签列表创建数据集标签

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API
使用AWQ量化 - AI开发平台ModelArts

--calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
查询开发环境实例详情 - AI开发平台ModelArts

链接仓库协议。当前支持：ssh，https。 url String 链接仓库地址。 credential Object 证书信息，请参见表30。表21 credential字段数据结构说明参数参数类型说明 ssh_private_key String ssh私有证书。 access_token

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
监控资源 - AI开发平台ModelArts
监控资源 - AI开发平台ModelArts

操作二：单击图例“cpuUsage”、“gpuMemUsage”、“gpuUtil”、“memUsage”“npuMemUsage”、“npuUtil”、可以添加或取消对应参数的使用情况图。操作三：鼠标悬浮在图片上的时间节点，可查看对应时间节点的占用率情况。表1 参数说明参数说明 cpuUsage

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
发布和管理AI Gallery中的AI应用 - AI开发平台ModelArts

发布和管理AI Gallery中的AI应用发布本地AI应用到AI Gallery 将AI Gallery中的模型部署为AI应用管理AI Gallery中的AI应用父主题： AI Gallery（新版）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
安装Gallery CLI配置工具 - AI开发平台ModelArts

在服务器的任意目录下（本文以“/gallerycli”为例）新建CLI配置文件“config.env”，包含如下配置信息。 # IAM相关配置 iam_url=https://iam.myhuaweicloud.com/v3/auth/tokens iam_project=cn-north-7 iam_timeout=15

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
使用kv-cache-int8量化 - AI开发平台ModelArts

0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。执行如下脚本进行权重转换生成量化系数，详细参数解释请参见https://github.com/NVIDIA/TensorR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

or_output/plog”文件夹下。若用户需要修改，可添加并自定义该变量。 CONVERT_MG2HF TRUE 训练完成的权重文件默认不会自动转换为Hugging Face格式权重。如果需要自动转换，则在运行脚本添加变量CONVERT_MG2HF并赋值TRUE。如果用户后续

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
使用AWQ量化工具转换权重 - AI开发平台ModelArts

--calib-data：数据集路径，推荐使用：https://huggingface.co/datasets/mit-han-lab/pile-val-backup，注意需指定到val.jsonl的上一级目录。详细说明可以参考vLLM官网：https://docs.vllm.ai/en/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
AI Gallery（新版） - AI开发平台ModelArts

AI Gallery（新版） AI Gallery使用流程发布和管理AI Gallery模型发布和管理AI Gallery数据集发布和管理AI Gallery项目发布和管理AI Gallery镜像发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
AI Gallery简介 - AI开发平台ModelArts

AI Gallery简介 AI Gallery算法、镜像、模型、Workflow等AI数字资产的共享，为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体，提供安全、开放的共享及交易环节，加速AI资产的开发与落地，保障AI开发生态链上各参与方高效地实现各自的商业价值。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
使用MaaS调优模型 - AI开发平台ModelArts

在“任务记录”区域，可以看到“作业类型”为“权重格式转换”的任务。图1 权重格式转换场景二：将Checkpoint添加为调优后模型版本。在“Checkpoint列表”页面的“操作”列，单击“添加为调优后模型版本”。在“添加为调优后模型版本”页面，配置相关信息，然后单击“创建”。系统将会检查自定义权重中存在的问题，校验过程中将会收取少量费用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用kv-cache-int8量化 - AI开发平台ModelArts

Step1使用tensorRT量化工具进行模型量化，必须在GPU环境在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。量化脚本convert_checkpoint

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

Step1使用tensorRT量化工具进行模型量化在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。量化脚本convert_checkpoint

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

Step1使用tensorRT量化工具进行模型量化在GPU机器上使用tensorRT 0.9.0版本工具进行模型量化，工具下载使用指导请参见https://github.com/NVIDIA/TensorRT-LLM/tree/v0.9.0。量化脚本convert_checkpoint

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

下拉框中选择“统一身份认证”，进入统一身份认证（IAM）服务。添加开发环境使用权限和依赖服务SWR权限。在统一身份认证服务页面的左侧导航选择“权限管理 > 权限”，单击右上角的“创建自定义策略”，设置策略。添加开发环境使用权限。 “策略名称”：设置自定义策略名称，例如：notebook。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
训练作业进程异常退出 - AI开发平台ModelArts

通过关键代码段 + 退出码尝试去搜索引擎寻找解决办法。，通过训练日志排查问题通过日志判断出问题的代码范围。修改代码，在问题代码段添加打印，输出更详细的日志信息。再次运行作业，判断出问题的代码段。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题

总条数： 2651

上一页
1
...
9
10
11
...
133
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查看模型评估结果 - AI开发平台ModelArts

数据管理（旧版） - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询开发环境实例详情 - AI开发平台ModelArts

监控资源 - AI开发平台ModelArts

发布和管理AI Gallery中的AI应用 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

使用AWQ量化工具转换权重 - AI开发平台ModelArts

AI Gallery（新版） - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

训练作业进程异常退出 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线