搜索_华为云

部署推理服务 - AI开发平台ModelArts

填写ascend_vllm文件夹绝对路径。高阶配置（可选）。词表切分。在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量： export USE_VOCAB_PARALLEL=1 #打开词表切分开关 unset USE_VOCAB_PARALLEL

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于LIte Server适配PyTorch NPU推理指导（6.3.905）
给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

此时，该用户组下的所有用户均有权限查看该用户组内成员创建的所有Notebook实例。如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定的子账号没有在用户组中，也可以通过“用户组管理”功能增加用户。子账号启动其他用户的SSH实例子账号可以看到所

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
Standard模型训练 - AI开发平台ModelArts

Standard模型训练在ModelArts训练得到的模型欠拟合怎么办？在ModelArts中训练好后的模型如何获取？在ModelArts上如何获得RANK_TABLE_FILE用于分布式训练？在ModelArts上训练模型如何配置输入输出数据？在ModelArts上如何提升训练效率并减少与OBS的交互？

帮助中心 > AI开发平台ModelArts > 常见问题
yaml配置文件参数配置说明 - AI开发平台ModelArts

训练、ZeRO内存优化等高级特性，以提高训练效率和性能 stage sft 表示训练类型。可选择值：[pt、sf、rm、ppo]，pt代表预训练，sft代表指令监督微调，rm代表奖励模型训练，ppo代表PPO训练。 finetuning_type full 用于指定微调的类型，可

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

model_baseline_performance表示调优前模型执行时间，单位为ms。 model_performance_improvement表示调优后模型执行时间减少百分比。 model_result_performance表示调优后模型执行时间。 repo_summary中的信息表示调优过程中使用到的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练作业日志中提示“No module named .*” - AI开发平台ModelArts

_64.whl tensorflow-1.8.0-cp36-cp36m-manylinux1_x86_64.whl 方式二：可以在启动文件添加如下代码安装依赖包： import os os.system('pip install xxx') 方式一在训练作业启动前即可完成相关依赖

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
使用前必读 - AI开发平台ModelArts

使用前必读在调用ModelArts API之前，请确保已经充分了解ModelArts相关概念，详细信息请参见产品介绍。 ModelArts提供了REST（Representational State Transfer）风格API，支持您通过HTTPS请求调用，调用方法请参见如何调用API。

帮助中心 > AI开发平台ModelArts > API参考
通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

为您自动填入虚拟私有云、子网和节点IP。创建内网域名：保持默认值。确认规格无误后，单击“立即购买”后提交任务，界面自动跳转至终端节点列表页面。创建DNS内网域名新创建的在线服务对接的是专享版APIG，需要使用ModelArts推理的独立公网域名，即infer-modelarts-<regionId>

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的访问通道
LLaVA模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Server资源和Ascend Snt9B。推理需要单机单卡。表1 环境要求名称版本 CANN cann_8.0.rc2 PyTorch pytorch_2.1.0 驱动 23.0.5 获取软件和镜像表2 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
创建训练作业 - AI开发平台ModelArts

objects 搜索算法配置。表66 reward_attrs 参数参数类型描述 name String 指标名称。 mode String 搜索方向。 max指定时表示指标值越大越好； min指定时表示指标值越小越好。 regex String 指标正则表达式。表67 search_params

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
预置框架启动文件的启动流程说明 - AI开发平台ModelArts

他方式来启动。MA_RUN_METHOD环境变量支持torchrun和msrun。当“MA_RUN_METHOD=torchrun”时，表示ModelArts Standard平台使用torchrun命令启动训练作业的“启动文件”。要求PyTorch版本大于等于1.11.0。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
准备镜像环境 - AI开发平台ModelArts

准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2.myhuaweicloud.com/a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备镜像环境 - AI开发平台ModelArts

准备训练模型适用的容器镜像，包括获取镜像地址，了解镜像中包含的各类固件版本，配置物理机环境操作。镜像地址本教程中用到的训练和推理的基础镜像地址和配套版本关系如下表所示，请提前了解。表1 基础容器镜像地址镜像用途镜像地址基础镜像 swr.cn-southwest-2.myhuaweicloud.com/a

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
分离部署推理服务 - AI开发平台ModelArts

n`模式表示生成rank_table文件，`merge`模式表示合并global rank_table文件。 --save-dir：保存生成的rank_table文件的根目录，默认为当前目录。 --api-server：仅在`gen`模式有效，可选输入，当存在该输入时，表示分离部

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

gen模式表示生成rank_table文件，merge模式表示合并global rank_table文件。 --save-dir：保存生成的rank_table文件的根目录，默认为当前目录。 --api-server：仅在`gen`模式有效，可选输入，当存在该输入时，表示分离部署

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

Server资源和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.911软件包中的AscendCloud-CV-6.3.911-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
ModelArts最佳实践案例列表 - AI开发平台ModelArts

介绍如何迁移到推理自定义引擎。第三方案例列表第三方案例来源为华为云开发者社区“云驻计划”。由于ModelArts产品的持续更新和迭代，第三方案例中的界面和步骤可能因时效性而与最新产品有所差异，仅供学习和参考。表6 第三方案例列表分类文章名称作者 Standard自动学习

 帮助中心 > AI开发平台ModelArts > 最佳实践
推理场景介绍 - AI开发平台ModelArts

说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
自定义镜像使用场景 - AI开发平台ModelArts

章节ModelArts统一镜像列表。各模块独有的镜像：仅适用单个模块（例如训练的预置镜像只能用于训练），此类镜像为ModelArts早期的镜像，后续会陆续下线。对应章节Notebook专属预置镜像列表、训练专属预置镜像列表、推理专属预置镜像列表。自定义镜像：用户参照ModelArts镜像规范制作的镜像。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard
Ascend-vLLM介绍 - AI开发平台ModelArts

硬件做亲和替换和优化。接口：离线SDK、在线OpenAI Server和社区完全一致，无缝迁移。 Ascend-vLLM支持的特性介绍表1 Ascend-vLLM支持的特性特性名称特性说明调度 Page-attention 分块管理kvcache，提升吞吐。 Continuous

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）

总条数： 1272

上一页
1
...
37
38
39
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

部署推理服务 - AI开发平台ModelArts

给子账号配置查看所有Notebook实例的权限 - AI开发平台ModelArts

Standard模型训练 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

训练作业日志中提示“No module named .*” - AI开发平台ModelArts

使用前必读 - AI开发平台ModelArts

通过VPC访问通道的方式访问在线服务 - AI开发平台ModelArts

LLaVA模型基于Lite Server适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

预置框架启动文件的启动流程说明 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

Paraformer基于Lite Server适配PyTorch NPU推理指导（6.3.911） - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

自定义镜像使用场景 - AI开发平台ModelArts

Ascend-vLLM介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线