搜索_华为云

AI Gallery（新版） - AI开发平台ModelArts

发布和管理AI Gallery中的AI应用使用AI Gallery微调大师训练模型使用AI Gallery在线推理服务部署模型 Gallery CLI配置工具指南计算规格说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery）
推理场景介绍 - AI开发平台ModelArts

Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.906）
使用kv-cache-int8量化 - AI开发平台ModelArts

但是可能会造成精度下降。 per-tensor+per-head静态量化场景如需使用该场景量化方法，请自行准备kv-cache量化系数，格式和per-tensor静态量化所需的2. 抽取kv-cache量化系数生成的json文件一致，只需把每一层的量化系数修改为列表，列表的长度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理模型量化
责任共担 - AI开发平台ModelArts
责任共担 - AI开发平台ModelArts

aaS和SaaS类各项云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮书》详细介绍华为云安全性的构建思

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
Standard专属资源池 - AI开发平台ModelArts

在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？ ModelArts训练专属资源池如何与SFS弹性文件系统配置对等链接？

帮助中心 > AI开发平台ModelArts > 常见问题
Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。检查是否安装docker。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
使用kv-cache-int8量化 - AI开发平台ModelArts

但是可能会造成精度下降。 per-tensor+per-head静态量化场景如需使用该场景量化方法，请自行准备kv-cache量化系数，格式和per-tensor静态量化所需的2. 抽取kv-cache量化系数生成的json文件一致，只需把每一层的量化系数修改为列表，列表的长度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

placeholder_format="cluster") ) 在控制台上如何使用MRS节点 Workflow发布后，在Workflow配置页，配置节点的数据输入，输出，启动脚本，集群ID等参数。父主题： Workflow高阶能力

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
SFT全参微调训练任务 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
kv-cache-int8量化 - AI开发平台ModelArts

但是可能会造成精度下降。 per-tensor+per-head静态量化场景如需使用该场景量化方法，请自行准备kv-cache量化系数，格式和per-tensor静态量化所需的2. 抽取kv-cache量化系数生成的json文件一致，只需把每一层的量化系数修改为列表，列表的长度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
创建训练作业 - AI开发平台ModelArts

url和engine_id无需填写。 parameter 否 Array<Object> 训练作业的运行参数，为“label-value”格式。取值可以为自定义的任何值，其中label为参数名称，value为参数值，该样例请参考请求示例；当为自定义镜像训练作业的时候，此参数为容器环境变量。详细请参见表8。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
投机推理使用说明 - AI开发平台ModelArts

5倍的时间代价，生成了3倍的token数量，性能提升了100%。投机推理参数设置在启动离线或在线推理服务时参考表1所示配置参数，使用投机推理功能。表1 投机推理相关参数服务启动方式配置项取值类型配置说明 offline speculative_model str 小模型权重地址，目前支持相对基

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

在SWR服务页面创建镜像组织。图2 创建镜像组织在SWR中单击右上角的“登录指令”，然后在跳出的登录指定窗口，单击复制临时登录指令。在创建的ECS中复制临时登录指令，即可完成登录。图3 复制登录指令修改并上传镜像。在ECS中输入上一步的登录指令后，使用下列示例命令： docker tag {image_url}

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
推理场景介绍 - AI开发平台ModelArts

Server上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
推理性能测试 - AI开发平台ModelArts

选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。 --num-scheduler-steps: 服务启动如果配置了--num-scheduler-steps和--multi-step-stream-outputs=false，则需配置此参数与服务启动时--num-scheduler-steps一致。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
LoRA微调训练 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b.sh和0_pl_lora_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

Turbo功能，则需要配置ModelArts和SFS Turbo间网络直通，以及配置ModelArts网络关联SFS Turbo。如果ModelArts网络关联SFS Turbo失败，则需要授权ModelArts云服务使用SFS Turbo，具体操作请参见配置ModelArts和SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
管理Standard专属资源池 - AI开发平台ModelArts

修复Standard专属资源池故障节点修改Standard专属资源池支持的作业类型迁移Standard专属资源池和网络至其他工作空间配置Standard专属资源池可访问公网使用TMS标签实现资源分组管理管理Standard专属资源池的游离节点释放Standard专属资源池和删除网络

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

H、sys.path；用户使用了已开启sudo权限的专属池，使用自定义镜像时，sudo工具未安装或安装错误；用户使用的cann、cuda环境有兼容性问题；用户的docker镜像配置错误、网络或防火墙限制、镜像构建问题（文件权限、依赖缺失或构建命令错误）等原因导致的。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
数据集版本发布失败 - AI开发平台ModelArts

OBS服务操作权限。请参考OBS权限管理，为当前IAM用户配置“作用范围”为“全局级服务”的“Tenant Administrator”策略，即拥有OBS服务所有操作权限。如果需要限制此IAM用户操作，仅为此用户配置OBS相关的最小化权限项，具体操作请参见创建ModelArts自定义策略。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据

总条数： 1769

上一页
1
...
64
65
66
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

AI Gallery（新版） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

责任共担 - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

在Workflow中使用大数据能力（DLI/MRS） - AI开发平台ModelArts

SFT全参微调训练任务 - AI开发平台ModelArts

kv-cache-int8量化 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

投机推理使用说明 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

管理Standard专属资源池 - AI开发平台ModelArts

Notebook自定义镜像故障基础排查 - AI开发平台ModelArts

数据集版本发布失败 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线