搜索_华为云

语言模型推理性能测试 - AI开发平台ModelArts

--backend：服务类型，如tgi，vllm，mindspore、openai。 --host ${docker_ip}：服务部署的IP地址，${docker_ip}替换为宿主机实际的IP地址。 --port：推理服务端口。 --dataset：数据集路径。 --dataset-type：支持三种

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务性能评测
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

job_name：可选参数，训练任务名，便于区分和记忆。本地分布式训练任务开始后，SDK会依次帮助用户完成以下流程：将训练脚本打包成zip文件，上传到3中指定的obs_path中。如果训练数据保存在Notebook中，则将其打包成zip文件并上传到指定的obs_path中。创建一个附属Notebook，

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬件，为用户提供推理部署方案，帮助用户使能大模型业务。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。约束限制本方案目前仅适用于部分企业客户。本文档适配昇腾云ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
推理精度测试 - AI开发平台ModelArts

eval。AscendCloud-3rdLLM-6.3.905-xxx.zip代码包已包含数据集。精度测试使用的是openai接口，部署服务的时候请使用openai-api启动，暂不支持vllm-api接口。获取精度测试代码。精度测试代码存放在代码包AscendCloud-3

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
执行LoRA微调训练任务 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。步骤三启动训练脚本修改超参值后，再启动训练脚本。Llama2-70b建议为4机32卡训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
执行LoRA微调训练任务 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。步骤三启动训练脚本修改超参值后，再启动训练脚本。Llama2-70b建议为4机32卡训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

购买弹性云服务器ECS，详情请见购买ECS。镜像可选择Ubuntu最新版本。虚拟私有云选择提前创建好的VPC。申请弹性公网IP EIP，详情请见申请弹性公网IP。将弹性公网IP绑定到ECS，详情请见将弹性公网IP绑定至实例。登录ECS，执行如下命令进行Docker安装。如已安装，请直接进入下一步。 curl

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

环境，ModelArts提供了一个PyCharm插件工具PyCharm ToolKit，协助用户完成SSH远程连接Notebook、代码上传、提交训练作业、将训练日志获取到本地展示等，用户只需要专注于本地的代码开发即可。本章节介绍如何使用PyCharm ToolKit插件创建训练作业并调试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 创建调试训练作业
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

docker-runc.aarch64 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward 如果net.ipv4.ip_forward配置项的值不为1，执行以下命令配置IP转发。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|──scripts/ # 各模型训练需要的启动脚本，训练脚本以分类的方式集中在scripts文件夹中。 # 自动生成数据目录结构 |── processed_for_input #目录结构会自动生成，无需用户创建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
训练中的权重转换说明 - AI开发平台ModelArts

json等tokenizer文件或者其他json文件。若缺少则需要直接复制至权重转换后的文件夹中，否则不能直接用于推理。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练中的权重转换说明 - AI开发平台ModelArts

json等tokenizer文件或者其他json文件。若缺少则需要直接复制至权重转换后的文件夹中，否则不能直接用于推理。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

3b/saved_models/pretrain_hf/目录下查看转换后的权重文件。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可在Notebook直接编辑scripts/llama2/2_convert_mg_hf.sh脚本，自定义环境变量的值，并在N

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
DevServer管理 - AI开发平台ModelArts

DevServer管理查询用户所有DevServer实例列表创建DevServer 查询DevServer实例详情删除DevServer实例实时同步用户所有DevServer实例状态启动DevServer实例停止DevServer实例

 帮助中心 > AI开发平台ModelArts > API参考
创建ModelArts委托 - AI开发平台ModelArts

创建ModelArts委托功能介绍创建包含OBS、SWR、IEF等依赖服务的ModelArts委托。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/agency

帮助中心 > AI开发平台ModelArts > API参考 > 授权管理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

解压代码包后自动生成的代码目录，无需用户创建 |── AscendSpeed # 代码目录 |──ascendcloud_patch/ # 针对昇腾云平台适配的功能代码包 |──scripts/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作
执行SFT全参微调训练任务 - AI开发平台ModelArts

第一台节点 sh scripts/llama2/0_pl_sft_70b.sh xx.xx.xx.xx 4 0 # 第二台节点 sh scripts/llama2/0_pl_sft_70b.sh xx.xx.xx.xx 4 1 # 第三台节点 sh scripts/llama2/0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行SFT全参微调训练任务 - AI开发平台ModelArts

#第一台节点 sh scripts/llama2/0_pl_sft_70b.sh xx.xx.xx.xx 4 0 # 第二台节点 sh scripts/llama2/0_pl_sft_70b.sh xx.xx.xx.xx 4 1 # 第三台节点 sh scripts/llama2/0_pl_sft_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.910）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├──install.sh #安装opencompass脚本 ├──vllm_api.py #启动vllm api服务器 ├──vllm.py #构造vllm评测配置脚本名字相关文档

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911） > 准备工作
训练中的权重转换说明 - AI开发平台ModelArts

2-13b/saved_models/pretrain_hf/ 目录下查看转换后的权重文件。用户自定义执行权重转换参数修改说明同样以 llama2 为例，用户可直接编辑 scripts/llama2/2_convert_mg_hf.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明

总条数： 2247

上一页
1
...
48
49
50
...
113
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

语言模型推理性能测试 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

使用PyCharm ToolKit创建并调试训练作业 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

DevServer管理 - AI开发平台ModelArts

创建ModelArts委托 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

训练中的权重转换说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线