搜索_华为云

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

configs结构决定。部署在线服务Predictor需要线上服务端根据AI引擎创建容器，较耗时；本地Predictor部署较快，最长耗时10s，可用以测试模型，不建议进行模型的工业应用。当前版本支持部署本地服务Predictor的AI引擎为：“XGBoost”、“Scikit_Learn”

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

--test_count=3 (随机选择 3个数据作为测试集) user_id: 用户的唯一不重复的ID值，必选。 excel_addr: 待处理的excel文件的地址，必选。 dataset_name: 处理后的数据集名称，必选。 proportion: 测试集所占份数，范围[1,9]，可选。 test_count:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

待在线推理服务状态变为“运行中”时，便可进行推理预测。在在线推理服务列表页面，选择服务“状态”为“运行中”的服务。单击操作列的“推理测试”，在测试页面根据任务类型以及页面提示完成对应的测试。调用API 待推理服务的状态变为“运行中”时，可单击操作列的“调用”，复制对应的接口代码，在本地环境或云端的开发环境中进行接口。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
线下容器镜像构建及调试 - AI开发平台ModelArts

查看日志、错误等，并进行代码、环境变量的修正。预置脚本测试整体流程一般使用run.sh封装训练外的文件复制工作（数据、代码：OBS-->容器，输出结果：容器-->OBS），run.sh的构建方法参考run.sh脚本测试ModelArts训练整体流程。如果预置脚本调用结果不符

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
权限配置 - AI开发平台ModelArts
权限配置 - AI开发平台ModelArts

置、上传对象、获取对象、删除对象、获取对象ACL等对象基本操作权限。配置IAM权限配置ModelArts委托权限配置SWR组织权限测试用户权限父主题：基本配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置
使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入2. 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。 per-tensor+per-head静态量化场景

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
使用kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入2. 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。 per-tensor+per-head静态量化场景

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
Standard Notebook - AI开发平台ModelArts

在ModelArts的Notebook中，如何使用昇腾多卡进行调试？在ModelArts的Notebook中使用不同的资源规格训练时为什么训练速度差不多？在ModelArts的Notebook中使用MoXing时，如何进行增量训练？在ModelArts的Notebook中如何查看GPU使用情况？

帮助中心 > AI开发平台ModelArts > 常见问题
场景介绍及环境准备 - AI开发平台ModelArts

图像的质量。研究表明，具有较高GFLOPs的DiT模型在图像生成任务中表现更好，尤其是在ImageNet 512×512和256×256的测试中，DiT-XL/2模型实现了2.27的FID值。下文以Dit模型为例，介绍如何在昇腾设备上如何进行模型迁移，精度及性能调优。环境准备

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
kv-cache-int8量化 - AI开发平台ModelArts

--quantization-param-path kv_cache_scales.json #输入2. 抽取kv-cache量化系数生成的json文件路径; 如果只测试推理功能和性能，不需要此json文件，此时scale系数默认为1，但是可能会造成精度下降。 per-tensor+per-head静态量化场景

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
ModelArts最佳实践案例列表 - AI开发平台ModelArts

训练后的模型可用于推理部署，搭建大模型问答助手。主流开源大模型基于DevServer适配PyTorch NPU推理指导推理部署、推理性能测试、推理精度测试、推理模型量化介绍主流的开源大模型Llama系列、Qwen系列、Yi系列、Baichuan系列、ChatGLM系列等基于ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
在推理生产环境中部署推理服务 - AI开发平台ModelArts

预测”即可看到预测结果。图5 预测-openai 在线服务的更多内容介绍请参见文档查看服务详情。 Step5 推理性能测试推理性能测试操作请参见推理性能测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

预测”即可看到预测结果。图5 预测-openai 在线服务的更多内容介绍请参见文档查看服务详情。 Step5 推理性能测试推理性能测试操作请参见推理性能测试。父主题：主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
附录：大模型推理常见问题 - AI开发平台ModelArts

py第39行为SUPPORT_FP16 = True 问题8：使用benchmark-tools对GLM系列模型进行性能测试报错使用benchmark-tools对GLM系列模型进行性能测试报错TypeError: _pad() got an unexpected keyword argument

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
分布式训练功能介绍 - AI开发平台ModelArts

更高。 DistributedDataParallel进行多机多卡训练的优缺点通信更快：相比于DP，通信速度更快负载相对均衡：相比于DP，GPU负载相对更均衡运行速度快：因为通信时间更短，效率更高，能更快速地完成训练作业。相关章节创建单机多卡的分布式训练（DataPar

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Turbo 通过以下两种方式将下载到本地的模型文件上传至SFS Turbo中。方式一操作简单，但是数据传输速度比较慢，费时间。方式二操作相对方式一复杂一些，但是数据传输速度较快。方式一：将已下载的模型文件通过SSH直接上传至SFS Turbo中。具体步骤如下：进入到/mnt/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作

总条数： 337

上一页
1
...
9
10
11
...
17
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

权限配置 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线