搜索_华为云

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

ASCEND_RT_VISIBLE_DEVICES=0,1 通过命令npu-smi info查询NPU卡为容器中的第几张卡。例如下图查询出两张卡，如果希望使用第一和第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图2 查询结果配置环境变量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
准备资源 - AI开发平台ModelArts
准备资源 - AI开发平台ModelArts

在训练中，程序会自动执行对数据集预处理、权重转换、执行训练等操作，具体可通过训练启动脚本说明和参数配置、训练的数据集预处理说明、训练的权重转换说明了解其中的操作。训练完成后在SFS Turbo中保存训练的模型结果。（多机情况下，只有在rank_0节点进行数据预处理，权重转换等工作，所以原始数据集和

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

录方法如下：客户端生成公私钥。执行如下命令，在本地客户端生成公私钥（一路回车默认即可）。 ssh-keygen 上面这个命令会在用户目录.ssh文件夹下创建“id_rsa.pub”（公钥）和“id_rsa”（私钥），可通过如下命令查看： cd ~/.ssh 上传公钥到服务器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

SSH登录机器后，检查NPU卡状态。运行如下命令，返回NPU设备信息。 npu-smi info # 在每个实例节点上运行此命令可以看到NPU卡状态 npu-smi info -l | grep Total # 在每个实例节点上运行此命令可以看到总卡数如出现

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
SFT全参微调训练 - AI开发平台ModelArts

作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

可纠正ECC错误（单比特ECC错误），不影响业务。观测方式：nvidia-smi -a中查询到Volatile Correctable记录。 L2: 不可纠正ECC错误（多比特ECC错误），当次业务受损，重启进程可恢复。观测方式：nvidia-smi -a中查询到Volatile Uncorrectable记录。 L3:

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

mkdir -p tokenizers/Llama2-70B 多机情况下，只有在rank_0节点进行数据预处理，转换权重等工作，所以原始数据集和原始权重，包括保存结果路径，都应该在共享目录下。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

mkdir -p tokenizers/Llama2-70B 多机情况下，只有在rank_0节点进行数据预处理，转换权重等工作，所以原始数据集和原始权重，包括保存结果路径，都应该在共享目录下。父主题：准备工作

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
推理性能测试 - AI开发平台ModelArts

--benchmark-csv：结果保存文件，如benchmark_parallel.csv。 --served-model-name：选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完成后，测试结果保存在benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
在Notebook上安装配置Grafana - AI开发平台ModelArts

前提条件已创建CPU或GPU类型的Notebook实例，并处于运行中。打开Terminal。操作步骤在Terminal中依次执行以下命令，下载并安装Grafana。 mkdir -p /home/ma-user/work/grf cd /home/ma-user/work/grf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
启动推理服务 - AI开发平台ModelArts

OpenAI服务的API接口启动在线推理服务方式。推理请求测试使用命令测试推理服务是否正常启动。服务启动命令中的参数设置请参见启动在线推理服务。通过OpenAI服务API接口启动服务使用以下推理测试命令。${docker_ip}替换为实际宿主机的IP地址。如果启动服务未添加

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
推理精度测试 - AI开发平台ModelArts

batch_size：输入的batch_size大小，不影响精度，只影响得到结果速度，默认使用auto，代表自动选择batch大小。 output_path：结果保存路径。使用lm-eval，比如加载非量化或者awq量化，llama3.2-1b模型的权重，参考命令： lm_eval --model vllm

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

填写为“0,1”，以此类推。 export ASCEND_RT_VISIBLE_DEVICES=0,1 NPU卡编号可以通过命令npu-smi info查询。配置环境变量。 export DEFER_DECODE=1 # 是否使用推理与Token解码并行；默认值为1表示开启并

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
SFT全参微调训练 - AI开发平台ModelArts

ut/llama2-13b/saved_models/。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
LoRA微调训练 - AI开发平台ModelArts

ut/llama2-13b/saved_models/。最后，提交训练作业，训练完成后，请参考查看日志和性能章节查看SFT微调的日志和性能。了解更多ModelArts训练功能，可查看模型开发简介。父主题：主流开源大模型基于Standard适配PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
训练管理 - AI开发平台ModelArts
训练管理 - AI开发平台ModelArts

训练管理创建算法查询算法列表查询算法详情更新算法删除算法获取支持的超参搜索算法创建训练实验创建训练作业查询训练作业详情更新训练作业描述删除训练作业终止训练作业查询训练作业指定任务的日志（预览）查询训练作业指定任务的日志（OBS链接）查询训练作业指定任务的运行指标

 帮助中心 > AI开发平台ModelArts > API参考
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

ource-path为“/v3/auth/tokens”。 query-string 查询参数，可选，查询参数前面需要带一个“？”，形式为“参数名=参数取值”，例如“limit=10”，表示查询不超过10条数据。例如您需要获取“华北-北京一”区域的Token，则需使用“华北-北京一”区域的Endpoint（iam

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
推理精度测试 - AI开发平台ModelArts

Step2 查看精度测试结果默认情况下，评测结果会按照result/{service_name}/{eval_dataset}-{timestamp} 的目录结果保存到对应的测试工程。执行多少次，则会在{service_name}下生成多少次结果。单独的评测结果如下： {ev

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）

总条数： 870

上一页
1
...
19
20
21
...
44
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

准备资源 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

FlUX.1基于Lite Server适配PyTorch NPU推理指导（6.3.912） - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

训练管理 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线