搜索_华为云

推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
pip介绍及常用命令 - AI开发平台ModelArts

pip介绍及常用命令 pip常用命令如下： pip --help#获取帮助 pip install SomePackage==XXXX #指定版本安装 pip install SomePackage #最新版本安装 pip uninstall SomePackage #卸载软件版本

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
获取用户名和用户ID - AI开发平台ModelArts

获取用户名和用户ID 在调用接口的时候，部分请求中需要填入用户名（user name）和用户ID（user_id）。获取步骤如下：注册并登录管理控制台。鼠标移动至用户名，在下拉列表中单击“我的凭证”。在“API凭证”页面，查看“IAM用户名”和“IAM用户ID”。图1 获取用户名和ID

帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
自动学习/Workflow计费项 - AI开发平台ModelArts

专属资源池专属资源池的费用已在购买时支付，运行自动学习作业和Workflow工作流时不再收费。专属资源池的费用请参考专属资源池计费项。 - - 存储资源对象存储OBS 用于存储训练和推理的输入数据和输出结果数据。具体费用可参见对象存储价格详情。注意：存储到OBS中的数据需在OB

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
如何查看ModelArts消费详情？ - AI开发平台ModelArts

查询ModelArts的消费详情。本章节以查询“账单详情”为例指导您查看计费情况，如需了解更多的账单情况，请参见查看费用账单。查询方法：单击右上方的“费用中心 > 费用账单”进入费用中心详情页面，在左侧导航栏选择“账单管理 > 流水和明细账单”，在流水和明细账单页面，可切换“

帮助中心 > AI开发平台ModelArts > 常见问题 > 计费相关
与其他云服务的关系 - AI开发平台ModelArts

Notebook实例中的数据或代码文件存储在OBS中。训练模型训练作业使用的数据集存储在OBS中。训练作业的运行脚本存储在OBS中。训练作业输出的模型存储在指定的OBS中。训练作业的过程日志存储在指定的OBS中。 AI应用管理训练作业结束后，其生成的模型存储在OBS中，

帮助中心 > AI开发平台ModelArts > 产品介绍
InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.909软件包中的AscendCloud-AIGC-6.3.909-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
AIGC工具tailor使用指导 - AI开发平台ModelArts

查询onnx模型的输入信息。 # 查询onnx模型的输入信息 t.get_model_input_info() 图1 查询onnx模型的输入输出信息查询onnx模型的输出信息。 # 查询模型的输出信息 t.get_model_output_info() 图2 查询onnx模型的输出信息

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

Megatron-DeepSpeed是一个基于PyTorch的深度学习模型训练框架。它结合了两个强大的工具：Megatron-LM和DeepSpeed，可在具有分布式计算能力的系统上进行训练，并且充分利用了多个GPU和深度学习加速器的并行处理能力。可以高效地训练大规模的语言模型。 Megatron-LM是

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

ModelArts全球基础设施围绕华为云区域和可用区构建。华为云区域提供多个在物理上独立且隔离的可用区，这些可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比，可用区具有更高的可用性、容错性和可扩展性。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
如何查看ModelArts消费详情？ - AI开发平台ModelArts

查询ModelArts的消费详情。本章节以查询“账单详情”为例指导您查看计费情况，如需了解更多的账单情况，请参见查看费用账单。查询方法：单击右上方的“费用中心 > 费用账单”进入费用中心详情页面，在左侧导航栏选择“账单管理 > 流水和明细账单”，在流水和明细账单页面，可切换“

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费FAQ
使用DCGM监控Lite Server资源 - AI开发平台ModelArts

xx为Grafana的所在宿主机的IP地址图1 Prometheus 在HTTP的URL输入框中输入Prometheus的IP地址和端口号，单击Save&Test：图2 IP地址和端口号至此，指标监控方案安装完成。指标监控效果展示如下：图3 指标监控效果这里使用的是Grafan

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
ModelArts与其他服务的关系 - AI开发平台ModelArts

Notebook实例中的数据或代码文件存储在OBS中。训练模型训练作业使用的数据集存储在OBS中。训练作业的运行脚本存储在OBS中。训练作业输出的模型存储在指定的OBS中。训练作业的过程日志存储在指定的OBS中。 AI应用管理训练作业结束后，其生成的模型存储在OBS中，

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.910-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见模型软件包结构说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作
使用PyCharm手动连接Notebook - AI开发平台ModelArts

此时可以进入debug模式，代码运行暂停在该行，且可以查看变量的值。图9 Debug模式使用debug方式调试代码的前提是本地的代码和云端的代码是完全一致的，如果不一致可能会导致在本地打断点的行和实际运行时该行的代码并不一样，会出现意想不到的错误。因此在配置云上Python Interp

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

-l | grep nvidia 卸载nccl相关软件。由于nccl和cuda是配套关系，当cuda版本从12.0更换为11.7的时候，libnccl和libnccl-dev都需要更换为和cuda11.7匹配的版本。因此必须卸载掉原版本。 sudo apt-get autoremove

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.909-xxx.zip 说明：软件包名称中的xxx表示时间戳。包含了本教程中使用到的推理部署代码和推理评测代码、推理依赖的算子包。代码包具体说明请参见模型软件包结构说明。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
多模态模型推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-xxx.zip的llm_tools/llm_evaluation目录下。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试

总条数： 1513

上一页
1
...
12
13
14
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

pip介绍及常用命令 - AI开发平台ModelArts

获取用户名和用户ID - AI开发平台ModelArts

自动学习/Workflow计费项 - AI开发平台ModelArts

如何查看ModelArts消费详情？ - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.909） - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

故障恢复 - AI开发平台ModelArts

如何查看ModelArts消费详情？ - AI开发平台ModelArts

使用DCGM监控Lite Server资源 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

使用PyCharm手动连接Notebook - AI开发平台ModelArts

GPU A系列裸金属服务器如何更换NVIDIA和CUDA？ - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线