搜索_华为云

多模态模型推理性能测试 - AI开发平台ModelArts

支持多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --height: 图片长度（分辨率相关参数）。 --width: 图片宽度（分辨率相关参数）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
多模态模型推理性能测试 - AI开发平台ModelArts

支持多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --height: 图片长度（分辨率相关参数）。 --width: 图片宽度（分辨率相关参数）。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 推理性能测试
查看日志和性能 - AI开发平台ModelArts

loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能训练结束之后，在保存路径下生成了如下几个文件： |──converted_hf2mg_weight_TP${TP}PP${PP} # 训练过程Megatron格式权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
推理性能测试 - AI开发平台ModelArts

带tokenizer.json的FastTokenizer。 --benchmark-csv：结果保存路径，如benchmark_serving.csv。脚本运行完后，测试结果保存在benchmark_serving.csv中，示例如下图所示。图4 动态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
发布Notebook - AI开发平台ModelArts

的主副标题。编辑完成之后单击“保存”，封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图4 修改封面图和二级标题编辑标签单击标签右侧的出现标签编辑框，在下拉框中勾选该资产对应的标签。单击编辑框右侧的对勾完成编辑。保存成功的标签信息会在资产搜索页成为过滤分类条件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

模型量化分为weight-only量化，weight-activation量化和kvcache量化。量化的一般步骤是：1、对浮点类型的权重镜像量化并保存量化完的权重；2、使用量化完的权重进行推理部署。什么是W4A16量化 W4A16量化方案能显著降低模型显存以及需要部署的卡数（约75%）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

modelarts:image:listGroup 在镜像管理中注册和查看镜像。按需配置。保存镜像 SWR SWR Admin SWR Admin为SWR最大权限，用于：开发环境运行的实例，保存成镜像。使用自定义镜像创建开发环境Notebook实例。按需配置。使用SSH功能 ECS

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
创建Notebook实例 - AI开发平台ModelArts

如果需要使用更高版本的MindSpore类型的Ascend架构镜像，可选择西南-贵阳一局点。自定义镜像：可以将基于公共镜像创建的实例保存下来，作为自定义镜像使用，请参考保存Notebook实例。也可以基于预置镜像或第三方镜像制作自定义镜像，请参考Notebook的自定义镜像制作方法。一个镜

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

import torchvision model = torchvision.models.resnet50(pretrained=True) # 保存模型为ONNX格式 torch.onnx.export(model, torch.randn(1, 3, 224, 224), "resnet50

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
人工标注文本数据 - AI开发平台ModelArts

个标注对象可添加多个标签。以此类推，不断选中标注对象，并为其添加标签。图4 文本分类标注当所有的标注对象都已完成标注，单击页面下方“保存当前页”，完成“未标注”列表的文本标注。添加标签（文本分类）在“未标注”页签添加：单击页面中标签集右侧的加号，然后在弹出的“新增标签”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
附录：训练常见问题 - AI开发平台ModelArts

6.0框架推理失败：错误截图：报错原因：训练时transformers版本要求为4.45.0，训练完成后保存的tokenizer.json文件中的“merges”时保存的是拆开的列表不是字符串，导致推理异常解决措施，以下两种方法任选其一：更新transformes和tokenizers版本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
语言模型推理性能测试 - AI开发平台ModelArts

支持多个，如 128 2048 128 2048，数量需和--prompt-tokens的数量对应。 --benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --num-scheduler-steps: 需和服务启动时配置的num-scheduler-steps一致。默认为1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 推理性能测试
Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

1。 --checkpoint_dir ：此目录用于保存模型。 -checkpoint_path ：（可选）可基于此目录的lipsync_expert模型继续进行训练，如果重新训练则不需要此参数。默认每10000 step保存一次模型。训练Wav2Lip模型。训练Wav2L

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

求签名的SDK。创建Java类，进行预测请求。由于在APIG的Java SDK中，“request.setBody()”只支持String类型，所以只支持输入为文本格式的预测请求。此处以json格式为例介绍读取本地预测文件并进行base64编码的请求体： // Package

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
推理精度测试 - AI开发平台ModelArts

ss下面data目录。 model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 benchmark_type：作为一个保存log结果中的一个变量名，默认选eval。参考命令： vllm_path=vllm host=0.0.0.0 service_port=8080

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
推理性能测试 - AI开发平台ModelArts

带tokenizer.json的FastTokenizer。 --benchmark-csv：结果保存路径，如benchmark_serving.csv。脚本运行完后，测试结果保存在benchmark_serving.csv中，示例如下图所示。图4 动态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

de_dir打包上传到obs_path中。准备训练输出，与单机训练作业调试4相同。查看训练支持的AI框架，与单机训练作业调试5相同。保存当前Notebook为新镜像，与单机训练作业调试9相同。 Estimator初始化。 from modelarts.estimatorV2

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

制吗？在数据管理功能中，针对“物体检测”或“图像分类”的数据集，在数据集中上传更多的图片时，是有限制的。要求单张图片大小不超过8MB，且只支持JPG、JPEG、PNG和BMP四种格式的图片。请注意，针对自动学习功能中的添加图片，其图片大小限制不同，要求上传的图片大小不超过5MB。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

onnx 图21 代码下载成功容器环境保存镜像。配置好环境后可以进行业务代码的开发调试。通常为了避免机器重启后环境丢失，建议将已经配好的环境保存成新的镜像，命令如下： # 查看需要保存为镜像的容器ID docker ps # 保存镜像 docker commit 容器ID

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
advisor调优总体步骤 - AI开发平台ModelArts

step14-step16的profiling数据会保存在同一个json文件中。由于设置了repeat=2，则会再次重复一次采集过程，那么实际会二次采集step21-step23这三个连续step的profiling数据并保存至一个新的json文件中。图1 torch_npu.profiler

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导

总条数： 742

上一页
1
...
14
15
16
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

多模态模型推理性能测试 - AI开发平台ModelArts

多模态模型推理性能测试 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

发布Notebook - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

给子账号配置开发环境基本使用权限 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

人工标注文本数据 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

在ModelArts数据集中添加图片对图片大小有限制吗？ - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

advisor调优总体步骤 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线