搜索_华为云

单模型性能调优AOE - AI开发平台ModelArts

新建并进入AOE工作目录。 mkdir -p /home_host/work/aoe cd /home_host/work/aoe 在配置文件中启用AOE自动调优。配置unet.ini，开启aoe调优（aoe_mode + op_select_impl_mode）。 # unet.ini [ascend_context]

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

如果限时免费资源售罄，建议选择收费CPU资源进行部署。当选择收费CPU资源部署在线服务时会收取少量资源费用，具体费用以界面信息为准。参数配置完成后，单击“下一步”，确认规格参数后，单击“提交”启动在线服务的部署。进入“部署上线 > 在线服务”页面，等待服务状态变为“运行中”时，表示服务部署成功。单击操作列的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
创建网络资源 - AI开发平台ModelArts

创建网络资源功能介绍创建网络资源。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v1/{project_id}/networks 表1 路径参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询服务列表 - AI开发平台ModelArts

deploying：部署中，服务正在部署，调度资源部署等。 concerning：告警，后端实例异常，可能正在计费。例如多实例的情况下，有的实例正常，有的实例异常。正常的实例会产生费用，此时服务状态是concerning。 failed：失败，服务部署失败，失败原因可以查看事件和日志标签。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
审计与日志 - AI开发平台ModelArts

于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。用户开通云审计服务并创建和配置追踪任务后，CTS可记录ModelArts的管理事件和数据事件用于审计。 CTS的详细介绍和开通配置方法，请参见CTS快速入门。 CTS支持追踪的ModelArts管理事件和数据事件列表，

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Lite Server上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本文档适配昇腾云ModelArts 6.3.905版本，请参考表1获取配套版本的软件包，请严格遵照版本配套关系使用本文档。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、训练任务、性能查看。微调训练 SFT全参微调介绍如何进行SFT全参微调、超参配置、训练任务、性能查看。 LoRA微调训练介绍如何进行LoRA微调、超参配置、训练任务、性能查看。父主题：主流开源大模型基于Lite

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.906）
在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

KooSearch企业搜索服务：基于在MaaS开源大模型部署的模型API，搭建企业专属方案、LLM驱动的语义搜索、多模态搜索增强。盘古数字人大脑：基于在MaaS开源大模型部署的模型API，升级智能对话解决方案，含智能客服、数字人。 Dify：支持自部署的应用构建开源解决方案，用于Agent编排、自定义工作流。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

--inputShape="input_ids:1,77" 在配置文件中指定输入shape。配置文件中通过“[ascend_context]”配置项指定input_shape，格式与命令行一致，多个输入，需要使用“;”隔开。然后在命令行中通过--configFile指定对应的配置文件路径即可。 # text_encoder

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
管理AI Gallery中的AI应用 - AI开发平台ModelArts

查看环境变量的值：单击，可以查看当前环境变量的值。新增环境变量：单击“新增”，在编辑环境变量弹窗中配置“变量名称”和“变量值”，单击“确定”完成配置。修改环境变量：单击，在编辑环境变量弹窗中修改“变量名称”或“变量值”，单击“确定”完成配置。删除环境变量：单击，确认永久删除环境变量，单击“确定”完成删除。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
动态shape - AI开发平台ModelArts
动态shape - AI开发平台ModelArts

e的编译任务，从而能够在推理时支持多种shape的输入。动态batch 在模型转换阶段通过--configFile参数指定配置文件，并且在配置文件中配置input_shape及dynamic_dims动态参数。其中input_shape的-1表示动态shape所在的维度，dyn

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
使用ChatGLM3-6B或GLM-4-9B模型微调后，权重校验失败 - AI开发平台ModelArts

inconsistent with standard open source 原因分析 ChatGLM3-6B或GLM-4-9B调优转换后的模型文件中配置文件与原始文件有差异，导致权重校验失败。问题影响 ChatGLM3-6B或GLM-4-9B调优转换后的模型无法使用权重校验。处理方法

 帮助中心 > AI开发平台ModelArts > 常见问题 > Studio
创建训练任务 - AI开发平台ModelArts

创建训练任务针对专属池场景，应注意挂载的目录设置和调试时一致。登录ModelArts管理控制台，检查当前账号是否已完成访问授权的配置。如果未完成，请参考使用委托授权。针对之前使用访问密钥授权的用户，建议清空授权，然后使用委托进行授权。在左侧导航栏中选择“模型训练 > 训练作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
Standard资源管理 - AI开发平台ModelArts

Standard开发平台的训练作业、部署模型以及开发环境时，可以使用Standard专属资源池的计算资源。使用前，您需要先购买创建一个专属资源池。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等，均

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
更新管理 - AI开发平台ModelArts
更新管理 - AI开发平台ModelArts

更新管理 ModelArts在线服务更新对于已部署的推理服务，ModelArts支持通过更换模型的版本号，实现服务升级。推理服务有三种升级模式：全量升级、滚动升级（扩实例）和滚动升级（缩实例）。了解三种升级模式的流程，请参见图1。全量升级需要额外的双倍的资源，先全量创建新版本实例，然后再下线旧版本实例。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
LoRA微调训练 - AI开发平台ModelArts

最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。 Step2 配置环境变量单击“增加环境变量”，在增加的环境变量填写框中，按照表1表格中的配置进行填写。表1 需要填写的环境变量环境变量示例值参数说明 GPUS_PER_NODE 8 必

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

odelArts资源池。如果要使用训练作业挂载SFS Turbo功能，则需要配置ModelArts和SFS Turbo间网络直通，以及配置ModelArts网络关联SFS Turbo。具体操作请参见配置ModelArts和SFS Turbo间网络直通。图3 ModelArts网络关联SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 准备工作
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

odelArts资源池。如果要使用训练作业挂载SFS Turbo功能，则需要配置ModelArts和SFS Turbo间网络直通，以及配置ModelArts网络关联SFS Turbo。具体操作请参见配置ModelArts和SFS Turbo间网络直通。图3 ModelArts网络关联SFS

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 准备工作
Prefix Caching - AI开发平台ModelArts

Caching参数设置启动推理服务时，使用Prefix Cache特性需要配置的补充参数如表1所示，对应的代码样例如表2所示。表1 Prefix Cache特性参数服务启动方式配置项取值类型取值范围配置说明 offline enable_prefix_caching bool

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

在Notebook中，如何访问其他账号的OBS桶？。检查委托授权请前往权限管理，查看是否具有OBS访问授权。如果没有，请参考配置访问授权（全局配置）。检查OBS桶是否为非加密桶进入OBS管理控制台，单击桶名称进入概览页。确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶，可单击“默认加密”选项进行修改。

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题

总条数： 1865

上一页
1
...
78
79
80
...
94
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

单模型性能调优AOE - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像用于推理 - AI开发平台ModelArts

创建网络资源 - AI开发平台ModelArts

查询服务列表 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在MaaS应用实践中心查看应用解决方案 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

管理AI Gallery中的AI应用 - AI开发平台ModelArts

动态shape - AI开发平台ModelArts

使用ChatGLM3-6B或GLM-4-9B模型微调后，权重校验失败 - AI开发平台ModelArts

创建训练任务 - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

更新管理 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线