搜索_华为云

语言模型推理性能测试 - AI开发平台ModelArts

需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
语言模型推理性能测试 - AI开发平台ModelArts

需和服务启动时配置的--num-speculative-tokens一致。默认为-1。当该值大于等于0时，会基于该值计算投机推理的接受率指标。脚本运行完成后，测试结果保存在benchmark_parallel.csv中，示例如下图所示。图1 静态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
JupyterLab常用功能介绍 - AI开发平台ModelArts

图20 创建“dropdown”类型的表单图21 删除表单资源监控在使用过程中，如果想了解资源使用情况，可在右侧区域选择“Resource Monitor”，展示“CPU使用率”和“内存使用率”。图22 资源监控父主题：通过JupyterLab在线使用Notebook实例进行AI开发

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
查看诊断报告 - AI开发平台ModelArts

on）、内存（memory）和数据加载（dataloader）五个维度，根据训练作业卡数、训练实际性能问题有不同的呈现，并非所有训练任务都有上述五个维度的分析。图10 html报告总览-性能分析五维度 computation 计算维度通常包含如下几类问题：降频：对应html中的'AI

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
设置断点续训练 - AI开发平台ModelArts

训练输出设置断点续训练建议和训练容错检查（即自动重启）功能同时使用。在创建训练作业页面，开启“自动重启”开关。训练环境预检测失败、或者训练容器硬件检测故障、或者训练作业失败时会自动重新下发并运行训练作业。 PyTorch版reload ckpt PyTorch模型保存有两种方式。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
特权池信息数据显示均为0%如何解决？ - AI开发平台ModelArts

原因是集群没有安装ICAgent。新建特权池时默认会安装ICAgent，可能由于用户自行卸载ICAgent，导致资源池数据显示异常。处理方法登录“应用运维管理”控制台，在“配置管理 > Agent管理”中，选择未安装ICAgent的集群，并单击“安装ICAgent”。图1 安装ICAgent

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
IAM - AI开发平台ModelArts
IAM - AI开发平台ModelArts

弹性云服务器ECS ECS FullAccess 容器镜像服务SWR SWR Admin 弹性文件服务SFS SFS Turbo FullAccess 应用运维管理服务AOM AOM FullAccess 密钥管理服务KMS KMS CMKFullAccess AI开发平台ModelArts ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
迁移环境准备 - AI开发平台ModelArts

迁移环境准备迁移环境准备有以下两种方式：表1 方式说明序号名称说明方式一 ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。优点：可快速、低成本地搭建环境，使用标准化容器镜像，官方Notebook示例可直接运行。缺点：由于是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
创建团队标注任务 - AI开发平台ModelArts

或者也可以从“数据准备 >数据标注”页面进入，单击“创建标注作业”进入创建标注作业页面。在弹出的“创建标注作业”页面中，填写相关参数，然后单击“确定”，完成任务创建。 “名称”：设置此任务的名称。 “标注场景”：选择标注作业的任务类型。 “标签集”：展示当前数据集已有的标签及标签属性。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过团队标注方式标注数据
迁移过程使用工具概览 - AI开发平台ModelArts

规范化模块中的优化主要包括自动运算符inline、自动循环融合和公共子表达式优化等。自动调度：自动调度模块基于polyhedral技术，主要包括自动向量化、自动切分、thread/block映射、依赖分析和数据搬移等。后端优化：后端优化模块的优化主要包括TensorCo

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
成本管理 - AI开发平台ModelArts
成本管理 - AI开发平台ModelArts

成本管理成本构成 ModelArts提供AI工具链、AI算力，成本由AI算力的资源成本和运维成本构成。成本分配 ModelArts支持企业项目管理，可以由企业项目服务来管理同一账号下不同项目的成本。成本分析通过华为云费用账单来分析账号下的成本支出情况。成本优化长期使用

 帮助中心 > AI开发平台ModelArts > 计费说明
场景介绍及环境准备 - AI开发平台ModelArts

ModelArts Notebook 该环境为在线调试环境，主要面向演示、体验和快速原型调试场景。环境开通指导请参考Notebook环境创建。 ModelArts Lite DevServer 该环境为裸机开发环境，主要面向深度定制化开发场景。环境开通指导请参考DevServe

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优
数据集版本不合格 - AI开发平台ModelArts

数据集版本不合格出现此问题时，表示数据集版本发布成功，但是不满足自动学习训练作业要求，因此出现数据集版本不合格的错误提示。标注信息不满足训练要求针对不同类型的自动学习项目，训练作业对数据集的要求如下。图像分类：用于训练的图片，至少有2种以上的分类（即2种以上的标签），每种分类的图片数不少于5张。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
PD分离性能调优工具使用说明 - AI开发平台ModelArts

ascend_version 昇腾版本号，仅用于生成输出结果的文件名，可以自定义字符串，不影响运行 use_pd_separate 分离部署相关的SLO指标统计开关根据不同场景，需要调整以上参数，其中request_rate变化较大，刚开始测试时可以只设置单个值，且request_num设置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用 > 分离部署
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

RA、QLoRA，本文档主要支持全参数（Full）和LoRA。 LoRA(Low-Rank Adaptation)：这种策略主要针对如何在保持模型大部分参数固定的同时，通过引入少量可训练参数来调整模型以适应特定任务。全参训练（Full）：这种策略主要对整个模型进行微调。这意味

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

训练阶段下有不同的训练策略，分为全参数训练、部分参数训练、LoRA、QLoRA，本文档主要支持全参数（Full）和LoRA、LoRA+。 LoRA(Low-Rank Adaptation)：这种策略主要针对如何在保持模型大部分参数固定的同时，通过引入少量可训练参数来调整模型以适应特定任务。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911）
ModelArts训练专属资源池如何与SFS弹性文件系统配置对等链接？ - AI开发平台ModelArts

配置训练专属资源池与SFS弹性文件系统的对等链接，需要资源池打通VPC，使得资源池与SFS弹性文件系统所配置的VPC相同。配置完成后，在创建训练作业时，就可以看到SFS的配置选项。打通VPC步骤请参考打通VPC。父主题： Standard专属资源池

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard专属资源池
文档导读 - AI开发平台ModelArts
文档导读 - AI开发平台ModelArts

（可选）本地服务器安装ModelArts SDK 介绍如何在本地安装ModelArts SDK。（可选）Session鉴权 Session模块的主要作用是实现与公有云资源的鉴权，并初始化ModelArts SDK Client、OBS Client。 OBS管理概述 ModelArts

帮助中心 > AI开发平台ModelArts > SDK参考
ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

接经VPC对等连接发送到实例处理，访问速度更快。由于请求不经过推理平台，所以会丢失以下功能：认证鉴权流量按配置分发负载均衡告警、监控和统计图1 VPC直连的高速访问通道示意图约束限制调用API访问在线服务时，对预测请求体大小和预测时间有限制：请求体的大小不超过12MB，超过后请求会被拦截。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 603

上一页
1
...
18
19
20
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

JupyterLab常用功能介绍 - AI开发平台ModelArts

查看诊断报告 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

特权池信息数据显示均为0%如何解决？ - AI开发平台ModelArts

IAM - AI开发平台ModelArts

迁移环境准备 - AI开发平台ModelArts

创建团队标注任务 - AI开发平台ModelArts

迁移过程使用工具概览 - AI开发平台ModelArts

成本管理 - AI开发平台ModelArts

场景介绍及环境准备 - AI开发平台ModelArts

数据集版本不合格 - AI开发平台ModelArts

PD分离性能调优工具使用说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ModelArts训练专属资源池如何与SFS弹性文件系统配置对等链接？ - AI开发平台ModelArts

文档导读 - AI开发平台ModelArts

ModelArts Standard推理服务支持VPC直连的高速访问通道配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线