搜索_华为云

推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍两个精度测评工具。如何使用opencompass工具开展语言模型的推理精度测试，数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen；以及使用lm-eval工具开展语言模型的推理精度测试，数据集包含

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
准备数据（可选） - AI开发平台ModelArts

集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/LLaMAFacto

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
部署推理服务 - AI开发平台ModelArts

部署推理服务本章节介绍如何使用vLLM 0.3.2框架部署并启动推理服务。前提条件已准备好Server环境，具体参考资源规格要求。推荐使用“西南-贵阳一”Region上的Server和昇腾Snt9b资源。确保容器可以访问公网。 Step1 检查环境 SSH登录机器后，检查

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
管理团队和团队成员 - AI开发平台ModelArts

继续单击右上角“团队标注>标注人员管理”，进入成员管理页面。图3 进入标注人员管理页（1）图4 进入标注人员管理页（2）添加成员：单击页面“添加成员”，选择成员名称，单击确定。在操作列，选择“发送邮件”，可将该标注任务以邮件的方式发送至该标注成员。修改成员信息：单击操作列的“修改”，可修改该成员的角色。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
设置断点续训练 - AI开发平台ModelArts

练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。 ModelArts Standard中如何实现断点续训练在ModelArts Standard训练中实现断点续训练或增量训练，建议使用“训练输出”功能。在创建训练作业时，设置训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
准备数据（可选） - AI开发平台ModelArts

集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/LLaMAFacto

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据（可选） - AI开发平台ModelArts

集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/LLaMAFacto

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 准备工作
准备数据（可选） - AI开发平台ModelArts

gpt格式的微调数据集；使用自定义数据集时，请更新dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/AscendFactory/data目录下。具体步骤如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 准备工作
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何使用opencompass工具开展语言模型的推理精度测试，数据集是ceval_gen、mmlu_gen、math_gen、gsm8k_gen、humaneval_gen。约束限制确保容器可以访问公网。当前的精度测试仅适用于语言模型精度验证，不适用

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
自定义脚本代码示例 - AI开发平台ModelArts

get_session(), # 推理部署需要定义tf.saved_model.tag_constants.SERVING标签 tags=[tf.saved_model.tag_constants.SERVING], """ signature_d

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
准备数据（可选） - AI开发平台ModelArts

集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/LLaMAFacto

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
Notebook中快速使用MoXing - AI开发平台ModelArts

Notebook中快速使用MoXing 本文档介绍如何在ModelArts中调用MoXing Framework接口。进入ModelArts，创建Notebook实例登录ModelArts管理控制台，在左侧菜单栏中选择“开发空间>Notebook”，进入“Notebook”管理页面。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 在Notebook中使用Moxing命令
使用前必读 - AI开发平台ModelArts

ModelArts提供了REST（Representational State Transfer）风格API，支持您通过HTTPS请求调用，调用方法请参见如何调用API。同时ModelArts还提供多种编程语言的SDK供您使用，SDK的使用方法请参见ModelArts SDK参考。终端节点

 帮助中心 > AI开发平台ModelArts > API参考
依赖和委托 - AI开发平台ModelArts

modelarts:workspace:getQuota 查询工作空间配额。如果开通了工作空间功能，则需要配置此权限。 modelarts:tag:list 在训练作业中使用标签管理服务TMS。 IAM iam:credentials:listCredentials iam:agencies:listAgencies

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
使用AWQ量化 - AI开发平台ModelArts

AWQ(W4A16)量化方案能显著降低模型显存以及需要部署的卡数。降低小batch下的增量推理时延。支持AWQ量化的模型列表请参见支持的模型列表和权重文件。本章节介绍如何使用AWQ量化工具实现推理量化。量化方法：W4A16 per-group/per-channel，W8A16 per-channel Step1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
查询服务列表 - AI开发平台ModelArts

常，有的实例异常。正常的实例会产生费用，此时服务状态是concerning。 failed：失败，服务部署失败，失败原因可以查看事件和日志标签。 stopped：停止。 finished：只有批量服务会有这个状态，表示运行完成。 sort_by 否 String 指定排序字段，可

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何进行推理精度测试，请在Notebook的JupyterLab中另起一个Terminal，进行推理精度测试。 Step1 配置精度测试环境获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中，代码目录结构如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
推理精度测试 - AI开发平台ModelArts

推理精度测试本章节介绍如何进行推理精度测试，数据集是ceval_gen、mmlu_gen。前提条件确保容器可以访问公网。 Step1 配置精度测试环境获取精度测试代码。精度测试代码存放在代码包AscendCloud-LLM的llm_tools/llm_evaluation目录中，代码目录结构如下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）

总条数： 1241

上一页
1
...
36
37
38
...
63
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

管理团队和团队成员 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

自定义脚本代码示例 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

Notebook中快速使用MoXing - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

使用AWQ量化 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线