搜索_华为云

准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

针对昇腾云平台适配的功能补丁包 |──scripts/ # 训练需要的启动脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──Megatron-LM/ #

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
推理服务精度评测 - AI开发平台ModelArts

代码目录结构如下。 mme_eval ├──metric.py #MME精度测试脚本 ├──MME.sh #运行MME脚本启动MME精度测试脚本。 export MODEL_PATH=/data/nfs/model/InternVL2-8B/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912）
多模态 - AI开发平台ModelArts
多模态 - AI开发平台ModelArts

多模态推理请求通过online_serving.py方式发送请求（单图单轮对话）由于多模态推理涉及图片的编解码，所以采用脚本方式调用服务API。脚本中需要配置的参数如表1 脚本参数说明所示。 import base64 import requests import argparse import

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

ief:node:list 通过IEF部署边缘服务。按需配置。操作步骤本案例场景为在开发环境中构建并调试推理镜像，在Notebook中制作自定义镜像，然后将调试完成的镜像导入ModelArts的模型管理中，并部署上线。使用主用户账号登录管理控制台，单击右上角用户名，在下拉框

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
部署推理服务 - AI开发平台ModelArts

-h Step4 制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6.3.907-xxx.zip和算子包AscendCloud-OPP-6.3.907-xxx.zip，并执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

crictl image # nerdctl 工具查看 nerdctl --namespace k8s.io image list Step3 制作推理镜像获取模型软件包，并上传到机器SFS Turbo的目录下（可自定义路径），获取地址参考表1。解压AscendCloud压缩包及该

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909） > 准备工作
msprobe精度比对 - AI开发平台ModelArts

同一模型，进行迭代（模型、框架版本升级或设备硬件升级）时存在的精度下降问题，对比相同模型在迭代前后版本的API计算数值，进行问题定位。首先通过在PyTorch训练脚本中插入dump接口，跟踪计算图中算子的前向传播与反向传播时的输入与输出，然后再使用子命令compare进行比对生成比对表格。当前比对结果支

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
动态挂载OBS并行文件系统 - AI开发平台ModelArts

动态挂载API接口已发布至华北-北京四和华东-上海一站点。请参考JupyterLab主页介绍、在JupyterLab中新建ipynb文件，新建一个ipynb文件然后执行脚本。挂载脚本代码示例如下。更多API参数介绍请参考动态挂载OBS。 import os from json import JSONEncoder

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
Standard推理部署 - AI开发平台ModelArts

ModelArts线上训练得到的模型是否支持离线部署在本地？ ModelArts在线服务预测请求体大小限制是多少？ ModelArts部署在线服务时，如何避免自定义预测脚本python依赖包出现冲突？ ModelArts在线服务预测时，如何提高预测速度？在ModelArts中调整模型后，部署新版本模型能否保持原API接口不变？

帮助中心 > AI开发平台ModelArts > 常见问题
AIGC工具tailor使用指导 - AI开发平台ModelArts

在打开AOE功能时会生成。 benchmark run_benchmark.sh 是运行benchmark的脚本，可本地直接运行。 run_benchmark_accuracy.sh 是 benchmark运行精度的脚本，可本地直接运行。 performance.txt 是 benchmark性能测试结果。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
训练性能测试 - AI开发平台ModelArts

训练性能测试流程图训练性能测试流程图如下图所示：图1 训练性能测试流程执行性能比较脚本完成benchmark启动任务。进入test-benchmark目录执行命令。 ascendfactory-cli performance <cfgs_yaml_file> --baseline

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练benchmark工具
管理标注作业 - AI开发平台ModelArts

在标注任务复制的弹窗中，填写作业描述，作业名称task-xxxx-copy-xxxx，其中xxxx为系统生成的随机码，用来区分新作业与被复制作业。也可以修改新生成的作业名称。单击“确定”。复制完成后，在标注作业列表页即可查询新的标注任务，复制标注作业信息包含标注任务的样本、标签、团队标注信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

|──scripts/ # 训练需要的启动脚本 |——src/ # 启动命令行封装脚本，在install.sh里面自动构建 |──Megatron-LM/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 准备工作
ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

代码自动迁移工具，通过简单import命令可将PyTorch训练脚本从GPU平台迁移至NPU平台运行。包含在torch_npu包中。自动迁移工具使用指导训练业务代码适配昇腾PyTorch代码适配 PyTorch Analyse 迁移分析工具，可以使用工具扫描用户的训练脚本，识别出源码中不支持的torch API和cuda

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理
在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

y日志文件中，并通过可视化界面MindInsight进行展示。前提条件使用MindSpore引擎编写训练脚本时，为了保证训练结果中输出Summary文件，您需要在脚本中添加收集Summary相关代码。将数据记录到Summary日志文件中的具体方式请参考收集Summary数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

数据准备完成后，启动训练的脚本，查看训练是否能够正常拉起。一般来说，启动脚本为： cd /cache/code/ python start_train.py 如果训练流程不符合预期，可以在容器实例中查看日志、错误等，并进行代码、环境变量的修正。预置脚本测试整体流程一般使用run

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

A系列裸金属服务器，单台服务器GPU间是走NVLINK，可以通过相关命令查询GPU拓扑模式： nvidia-smi topo -m 图1 查询GPU拓扑模式操作步骤使用以下脚本测得GPU服务器内NVLINK带宽性能。 import torch import numpy as np device = torch.device("cuda")

帮助中心 > AI开发平台ModelArts > 常见问题 > Lite Server
执行训练任务 - AI开发平台ModelArts

如需其他配置参数，可参考表1按照实际需求修改。步骤三启动训练脚本修改完yaml配置文件后，启动训练脚本。模型不同最少NPU卡数不同，NPU卡数建议值可参考表1。修改启动脚本demo.sh 进入代码目录{work_dir}/llm_train/LLaMAFactory下修改启动脚本，其中{work_dir}为容器挂载路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
执行训练任务 - AI开发平台ModelArts

如需其他配置参数，可参考表1按照实际需求修改。步骤三启动训练脚本修改完yaml配置文件后，启动训练脚本。模型不同最少NPU卡数不同，NPU卡数建议值可参考表1。修改启动脚本demo.sh 进入代码目录{work_dir}/llm_train/LLaMAFactory下修改启动脚本，其中{work_dir}为容器挂载路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
分离部署推理服务 - AI开发平台ModelArts

df -h 步骤四制作推理镜像解压AscendCloud压缩包及该目录下的推理代码AscendCloud-LLM-6.3.910-xxx.zip和算子包AscendCloud-OPP-6.3.910-xxx.zip，并执行build_image.sh脚本制作推理镜像。安装过程需要连接互联网git

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务

总条数： 758

上一页
1
...
27
28
29
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备镜像 - AI开发平台ModelArts

推理服务精度评测 - AI开发平台ModelArts

多模态 - AI开发平台ModelArts

给子账号配置部署上线基本使用权限 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

msprobe精度比对 - AI开发平台ModelArts

动态挂载OBS并行文件系统 - AI开发平台ModelArts

Standard推理部署 - AI开发平台ModelArts

AIGC工具tailor使用指导 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

管理标注作业 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

ModelArts昇腾迁移调优工具总览 - AI开发平台ModelArts

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

在ModelArts Standard上运行GPU单机多卡训练作业 - AI开发平台ModelArts

GPU A系列裸金属服务器节点内如何进行NVLINK带宽性能测试方法？ - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线