搜索_华为云

推理性能测试 - AI开发平台ModelArts

该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。性能bench

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

在某些推理场景中，模型输入的shape可能是不固定的，因此需要支持用户指定模型的动态shape，并能够在推理中接收多种shape的输入。在CPU上进行模型转换时无需考虑动态shape问题，因为CPU算子支持动态shape；而在昇腾场景上，算子需要指定具体的shape信息，并且在模型转换

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

图2 转换结果动态分档模型转换（可选）如果迁移的模型有多个shape档位的需求，可以通过如下方式对模型进行分档转换。动态分档是指将模型输入的某一维或者某几维设置为“动态”可变，但是需要提前设置可变维度的“档位”范围。即转换得到的模型能够在指定的动态轴上使用预设的几种sh

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

模型适配基于MindSpore Lite的模型转换动态shape 父主题： GPU推理业务迁移至昇腾的通用指导

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

户进行相应的权限配置，限制某些资源的管理，实现权限最小化。 AI应用管理使用从训练或者从OBS中选择创建AI应用，推荐用户使用动态加载的方式导入，动态加载实现了模型和镜像的解耦，便于进行模型资产的保护。用户需要及时更新AI应用的相关依赖包，解决开源或者第三方包的漏洞。AI应用相

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
AIGC工具tailor使用指导 - AI开发平台ModelArts

否 - tailor支持动态分档转换功能，需要指定配置文件路径，需要注意即便有配置文件，只要是动态模型就需要指定--input_shape参数。 --input_shape 指定模型转换的shape。 string 否 - 固定shape模型转换可以不填，动态模型转换必填。 --output_path

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

停止Notebook实例。动态挂载OBS 获取动态挂载OBS实例信息列表获取动态挂载OBS实例信息列表。动态挂载OBS 在运行态Notebook实例，动态挂载OBS。获取动态挂载OBS实例详情获取动态挂载OBS实例详情。动态卸载OBS 动态卸载OBS。标签管理添加资源标签

 帮助中心 > AI开发平台ModelArts > API参考
从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

在“选择训练作业”右侧下拉框中选择当前账号下已完成运行的训练作业。 “动态加载”：用于实现快速部署和快速更新模型。如果勾选动态加载，则模型文件和运行时依赖仅在实际部署时拉取。当单个模型文件大小超过5GB时，必须配置“动态加载”。 “AI引擎” 元模型使用的推理引擎，选择训练作业后会自动匹配。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
文件上传下载 - AI开发平台ModelArts

如何下载Notebook中的文件到本地？如何将开发环境Notebook A的数据复制到Notebook B中？在Notebook中上传文件失败，如何解决？动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

可以基于默认的参数跑完静态benchmark和动态benchmark ├── benchmark_parallel.py # 评测静态性能脚本 ├── benchmark_serving.py # 评测动态性能脚本 ├── benchmark_utils

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
保存Notebook实例 - AI开发平台ModelArts

不会被保存的目录：容器启动时动态连接到宿主机的挂载目录或数据卷，这些内容不会被保存在镜像中。可以通过df -h命令查看挂载的动态目录，非“/”路径下的不会保存。例如：持久化存储的部分“home/ma-user/work”目录的内容不会保存在最终产生的容器镜像中、动态挂载在“/data”下的目录不会被保存。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

不会被保存的目录：容器启动时动态连接到宿主机的挂载目录或数据卷，这些内容不会被保存在镜像中。可以通过df -h命令查看挂载的动态目录，非“/”路径下的不会保存。例如：持久化存储的部分“home/ma-user/work”目录的内容不会保存在最终产生的容器镜像中、动态挂载在“/data”下的目录不会被保存。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于创建Notebook
多模态模型推理性能测试 - AI开发平台ModelArts

benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本 ├── requirements

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本 ├── requirements

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

benchmark_serving.py # 评测动态性能脚本 ├── generate_dataset.py # 生成自定义数据集的脚本 ├── benchmark_utils.py # 工具函数集 ├── benchmark.py # 执行静态、动态性能评测脚本 ├── requirements

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
推理精度测试 - AI开发平台ModelArts

另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。在昇腾卡上执行时，需要在 opencompass/opencompass/runners/local.py 中添加如下代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
推理精度测试 - AI开发平台ModelArts

另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。在昇腾卡上执行时，需要在 opencompass/opencompass/runners/local.py 中添加如下代码

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
管理Lite Cluster资源池 - AI开发平台ModelArts

启用缓存清理功能。大页内存：开启表示配置使用透明大页功能。大页内存是一种内存管理机制，可以通过增大内存页的大小来提高系统性能。透明大页是动态分配大页内存的机制，可以简化大页内存的管理。开启大页内存也是一种应用调优手段，在大部分场景下可以提升应用性能，但是开启后也会引起soft

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
管理训练容器环境变量 - AI开发平台ModelArts

/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin” LD_LIBRARY_PATH 动态链接库路径，已包含常用的动态库路径。 “LD_LIBRARY_PATH=/usr/local/seccomponent/lib:/usr/local/c

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
资源选择推荐 - AI开发平台ModelArts

04，建议不小于2U8G，本地存储空间100G，带EIP全动态BGP，按流量10M带宽） × 多机多卡按需购买。（普通OBS桶）包月购买。（HPC型500G）免费。免费。包月购买。免费。包月购买。（建议不小于2U8G，本地存储空间100G，带EIP全动态BGP，按流量10M带宽） × 表2

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练

总条数： 168

上一页
1
2
3
4
5
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理性能测试 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

从训练作业中导入模型文件创建模型 - AI开发平台ModelArts

文件上传下载 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

保存Notebook实例 - AI开发平台ModelArts

在Notebook中通过镜像保存功能制作自定义镜像 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

管理Lite Cluster资源池 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

资源选择推荐 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线