搜索_华为云

语言模型推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
Standard资源池功能介绍 - AI开发平台ModelArts

不同用户间的专属资源池物理隔离，公共资源池仅提供逻辑隔离，专属资源池的隔离性、安全性要高于公共资源池。专属资源池用户资源独享，在资源充足的情况下，作业是不会排队的；而公共资源池使用共享资源，在任何时候都有可能排队。专属资源池支持打通用户的网络，在该专属资源池中运行的作业可以访

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
查看训练作业日志 - AI开发平台ModelArts

中出现的问题提供详细信息。用户代码中的标准输出、标准错误信息会在训练日志中呈现。在ModelArts中训练作业遇到问题时，可首先查看日志，多数场景下的问题可以通过日志报错信息直接定位。训练日志包括普通训练日志和Ascend相关日志。普通日志说明：当使用Ascend之外的资源训

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建数据处理任务版本 - AI开发平台ModelArts

数据处理任务的工作目录。 workspace_id 否 String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。表3 ProcessorDataSource 参数是否必选参数类型描述 name 否 String 数据集的名称。 source

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
MaaS使用场景和使用流程 - AI开发平台ModelArts

成本。 MaaS提供灵活的模型开发能力，同时基于昇腾云的算力底座能力，提供了若干保障客户商业应用的关键能力。保障客户系统应用大模型的成本效率，按需收费，按需扩缩的灵活成本效益资源配置方案，有效避免了资源闲置与浪费，降低了进入AI领域的门槛。架构强调高可用性，多数据中心部署确保

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
按需计费 - AI开发平台ModelArts
按需计费 - AI开发平台ModelArts

成功”的“事件发生时间”，创建成功的时间点对应界面上的“事件发生时间”。对于公共资源池：计费的起点以实例创建成功的时间点为准，终点以实例停止或删除的时间为准。实例具体如下：因运行自动学习作业，而创建的对应的训练作业和在线服务。因运行Workflow工作流，而创建的对应的训练作业和在线服务。

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

running”状态代表启动成功。 kubectl get pod -A 进入容器，{pod_name}替换为您的pod名字（get pod中显示的名字），{namespace}替换为您的命名空间（默认为default）。 kubectl exec -it {pod_name} bash -n

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
查询处理任务详情 - AI开发平台ModelArts

objects 数据处理任务的输入通道列表，与data_source二选一。 is_current Boolean 当前任务是否是该版本的同类型任务中的最新任务。 name String 数据处理任务名称。 result Object 数据处理任务输出的结果，status为2时会出现该字段，用于特征分析任务。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

删除开发环境实例，删除的资源包括Notebook容器以及对应的所有存储资源。通过运行的实例保存成容器镜像运行的实例可以保存成容器镜像，保存的镜像中，安装的依赖包（pip包）不丢失，VSCode远程开发场景下，在Server端安装的插件不丢失。查询支持的有效规格列表查询支持的有效规格列表。

帮助中心 > AI开发平台ModelArts > API参考
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

物理专属池对应的资源池id。 pool_name 物理专属池对应的资源池name。 logical_pool_id 逻辑子池的id。 logical_pool_name 逻辑子池的name。 gpu_uuid 容器使用的GPU的UUID。 gpu_index 容器使用的GPU的索引。 gpu_type

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

NPU分布式训练场景描述 ranktable路由规划是一种用于分布式并行训练中的通信优化能力，在使用NPU的场景下，支持对节点之间的通信路径根据交换机实际topo做网络路由亲和规划，进而提升节点之间的通信速度。本案例介绍如何在ModelArts Lite场景下使用ranktable路由规划完成Pytorch

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

在在线推理服务列表页面，选择服务“状态”为“运行中”的服务。单击操作列的“推理测试”，在测试页面根据任务类型以及页面提示完成对应的测试。调用API 待推理服务的状态变为“运行中”时，可单击操作列的“调用”，复制对应的接口代码，在本地环境或云端的开发环境中进行接口。图1 调用接口当部署推理服务的“安全认证”选择

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

模型微调是深度学习中的一种重要技术，它是指在预训练好的模型基础上，通过调整部分参数，使其在特定任务上达到更好的性能。在实际应用中，预训练模型是在大规模通用数据集上训练得到的，而在特定任务上，这些模型的参数可能并不都是最合适的，因此需要进行微调。 AI Gallery的模型微调，简单易

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
使用MaaS调优模型 - AI开发平台ModelArts

模型进行调优，获得更合适的模型。场景描述从“我的模型”中选择一个模型进行调优，当模型完成调优作业后会产生一个新的模型，呈现在“我的模型”列表中。约束限制表1列举了支持模型调优的模型，不在表格里的模型不支持使用MaaS调优模型。表1 支持模型微调的模型模型名称全参微调

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
设置断点续训练 - AI开发平台ModelArts

卡死等）导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。 checkpoint的机制是：在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
依赖和委托 - AI开发平台ModelArts

用户自身用户组的授权策略的授权范围，如果配置不当就会出现用户越权的问题。为了控制委托授权的越权风险，ModelArts服务的权限管理功能要求只有租户管理员才能为用户配置委托，由管理员保证委托授权的安全性。委托授权的最小化管理员在配置委托授权时，应严格控制授权的范围。 Mod

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 权限控制方式
第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

tch等功能，能够提高GPU的使用率，改善推理服务的性能。当从第三方推理框架迁移到使用ModelArts推理的模型管理和服务管理时，需要对原生第三方推理框架镜像的构建方式做一定的改造，以使用ModelArts推理平台的模型版本管理能力和动态加载模型的部署能力。本案例将指导用户完

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 863

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语言模型推理性能测试 - AI开发平台ModelArts

Standard资源池功能介绍 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

创建数据处理任务版本 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

按需计费 - AI开发平台ModelArts

在Lite Cluster资源池上使用Snt9B完成分布式训练任务 - AI开发平台ModelArts

查询处理任务详情 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

设置断点续训练 - AI开发平台ModelArts

依赖和委托 - AI开发平台ModelArts

第三方推理框架迁移到ModelArts Standard推理自定义引擎 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线