搜索_华为云

在推理生产环境中部署推理服务 - AI开发平台ModelArts

输入预测代码“{"prompt": "你好", "temperature":0, "max_tokens":20}”，单击“预测”既可看到预测结果。图8 预测-vllm 如果以openai接口启动服务，设置请求路径：“/v1/completions”，输入预测代码“{"prompt":

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

https://huggingface.co/runwayml/stable-diffusion-v1-5 -b onnx 图21 代码下载成功容器环境保存镜像。配置好环境后可以进行业务代码的开发调试。通常为了避免机器重启后环境丢失，建议将已经配好的环境保存成新的镜像，命令如下： # 查看需要保存为镜像的容器ID

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
查询服务对象列表 - AI开发平台ModelArts

查询服务对象列表获取当前用户服务对象列表。示例代码在ModelArts notebook平台，Session鉴权无需输入鉴权参数。其它平台的Session鉴权请参见Session鉴权。场景1：查询当前用户所有服务对象 1 2 3 4 5 6 from modelarts.session

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
推理性能测试 - AI开发平台ModelArts

评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-3rdLLM-x.x.x.zip的llm_evaluation目录下。代码目录如下: benchmark_tools ├── benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
LoRA微调训练 - AI开发平台ModelArts

以Qwen-14B为例，单机SFT微调启动命令如下。在/home/ma-user/ws/xxx-Ascend/llm_train/AscendSpeed/代码目录下执行。 MODEL_TYPE=14B RUN_TYPE=lora DATASET_PATH=/home/ma-user/ws/pr

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
精度对齐 - AI开发平台ModelArts
精度对齐 - AI开发平台ModelArts

___getitem___6_forward_input。图6 api_stack_dump.pkl 根据stack信息查找到对应源码的代码行，发现对应函数上添加了@torch.jit.script装饰器，经过调试发现，GPU也执行了这个函数，但是没有dump算子执行信息，而且

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
预训练任务 - AI开发平台ModelArts

2-70B建议为8机64卡训练。多机启动以Llama2-70B为例，多台机器执行训练启动命令如下。多机启动需要在每个节点上执行。进入代码目录/home/ma-user/ws/xxx-Ascend/llm_train/AscendSpeed下执行启动脚本。xxx-Ascend请根据实际目录替换。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
自定义镜像规范 - AI开发平台ModelArts

必选文件，训练参数文件，定义了模型训练的必要参数，例如训练方式、超参信息。该参数会显示在微调工作流的“作业设置”页面的算法配置和超参数设置里面。代码示例请参见train_params.json示例。 “dataset_readme.md” 必选文件，数据集要求说明，定义了模型训练时对数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
Lite Cluster资源配置流程 - AI开发平台ModelArts

job的方式，直接启动容器进行测试。训练测试用例使用NLP的bert模型，详细代码和指导可参考Bert。拉取镜像。本测试镜像为bert_pretrain_mindspore:v1，已经把测试数据和代码打进镜像中。 docker pull swr.cn-southwest-2.myhuaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
SFT全参微调任务 - AI开发平台ModelArts

请根据表1修改超参值后，再启动训练脚本。Llama2-70B建议为8机64卡训练。多机启动以Llama2-70B为例，多台机器执行训练启动命令如下。进入代码目录/home/ma-user/ws/xxx-Ascend/llm_train/AscendSpeed下执行启动脚本。 #第一台节点 MASTER_ADDR=xx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调训练
在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

图6 推理模型model目录示意图（需要用户自己准备模型文件）推理脚本customize_service.py的具体写法要求可以参考模型推理代码编写说明。本案例中提供的customize_service.py文件具体内容如下： import logging import threading

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
推理前的权重合并转换 - AI开发平台ModelArts

ggingface_qwen、save_huggingface_llama等）。 megatron-path：megatron模型路径，在代码xxx-Ascend/llm_train/AscendSpeed/ModelLink目录下 load-dir：${LOAD_DIR} 训练完成后保存的权重路径

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

3.904版本发布支持的软件包和能力说明如下，软件包获取路径：Support-E网站。发布包软件包特性说明配套说明备注昇腾云模型代码三方大模型，包名：AscendCloud-3rdLLM PyTorch框架下支持如下模型训练： llama2-7b llama2-13b

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
安装Gallery CLI配置工具 - AI开发平台ModelArts

自定义加密函数，认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件中密文存放，使用时解密，确保安全。 sdk_decrypt_implementation_func 自定义解密函数，认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
LoRA微调训练 - AI开发平台ModelArts

请根据表1修改超参值后，再启动训练脚本。Llama2-70B建议为8机64卡训练。多机启动以Llama2-70B为例，多台机器执行训练启动命令如下。进入代码目录/home/ma-user/ws/xxx-Ascend/llm_train/AscendSpeed下执行启动脚本。 #第一台节点 MASTER_ADDR=xx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904）
在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

前提条件使用MindSpore引擎编写训练脚本时，为了保证训练结果中输出Summary文件，您需要在脚本中添加收集Summary相关代码。将数据记录到Summary日志文件中的具体方式请参考收集Summary数据。注意事项在开发环境跑训练任务，在开发环境使用MindI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
创建处理任务 - AI开发平台ModelArts

增加数据量。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/processor-tasks 表1 路径参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_evaluation目录下。代码目录如下: benchmark_tools ├── benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
查询处理任务列表 - AI开发平台ModelArts

增加数据量。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/processor-tasks 表1 路径参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
推理性能测试 - AI开发平台ModelArts

能评估推理框架在实际业务中能支持的并发数。性能benchmark验证使用到的脚本存放在代码包AscendCloud-LLM-x.x.x.zip的llm_evaluation目录下。代码目录如下: benchmark_tools ├── benchmark_parallel

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）

总条数： 1081

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在推理生产环境中部署推理服务 - AI开发平台ModelArts

NPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

查询服务对象列表 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

精度对齐 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

SFT全参微调任务 - AI开发平台ModelArts

在Notebook中通过Dockerfile从0制作自定义镜像用于推理 - AI开发平台ModelArts

推理前的权重合并转换 - AI开发平台ModelArts

昇腾云服务6.3.904版本说明 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

在JupyterLab中使用MindInsight可视化作业 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询处理任务列表 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线