搜索_华为云

准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Version中下载文件。文件会直接下载用户本地，需要再上传至SFS Turbo中。方法二：huggingface-cli：huggingface-cli是Hugging Face官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Version中下载文件。文件会直接下载用户本地，需要再上传至SFS Turbo中。方法二：huggingface-cli：huggingface-cli是Hugging Face官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
创建工作流定时调度 - AI开发平台ModelArts

/schedules 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。请求参数表2 请求Body参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
分布式训练功能介绍 - AI开发平台ModelArts

约束限制总览页面打开的CodeLab不支持此项功能，但是如果用户在AI Hub中打开了可用的案例，会自动跳转到CodeLab中，此时是可以使用这项功能的。如果切换了Notebook的规格，那么只能在Notebook进行单机调测，不能进行分布式调测，也不能提交远程训练作业。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
部署推理服务 - AI开发平台ModelArts

否有对应运行的进程如出现错误，可能是机器上的NPU设备没有正常安装，或者NPU镜像被其他容器挂载。请先正常安装固件和驱动，或释放被挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。启动后容器默认端口是8080。配置需要使用的NPU卡为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.907）
发布本地AI应用到AI Gallery - AI开发平台ModelArts

AI应用英文名称是自定义一个易于分辨的AI应用英文名称。只能以数字、大小字母、下划线组成，且字符长度在3到90之间。中文名称是自定义一个易于分辨的AI应用中文名称。字符长度在1到30之间。许可证否选择AI应用遵循的许可证。计算规格选择是按需选择计算规格。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
SFT全参微调数据处理 - AI开发平台ModelArts

handler-name：生成数据集的用途，这里是生成的指令数据集，用于微调。 - append-eod:参数用于控制是否在每个输入序列的末尾添加一个特殊的标记。这个标记表示输入序列的结束,可以帮助模型更好地理解和处理长序列 - workers 需要使用的卡数 - seq-length：是一个用于计算序列长度

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
上传远端文件至JupyterLab - AI开发平台ModelArts

输入有效的远端文件URL后，系统会自动识别上传文件名称，单击“上传”，开始上传文件。图3 输入有效的远端文件URL 图4 远端文件上传成功异常处理远端文件上传失败。可能是网络原因。请先在浏览器中输入该远端文件的URL地址，测试该文件是否能下载。图5 远端文件上传失败父主题：上传文件至JupyterLab

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
SFT微调数据处理 - AI开发平台ModelArts

tokenizer-name-or-path：tokenizer的存放路径。 - handler-name：生成数据集的用途，这里是生成的指令数据集，用于微调。 - seq-length：是一个用于计算序列长度的函数。它接收一个序列作为输入，并返回序列的长度，需和训练时参数保持一致。 - workers：数据处理线程数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > SFT微调训练
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
推理精度测试 - AI开发平台ModelArts

-w {output_path} --debug 参数说明如下： --datasets：评测的数据集及评测方法，其中 mmlu 是数据集，ppl 是评测方法。 --hf-type：HuggingFace模型权重类型(base,chat), 默认为chat, 依据实际的模型选择。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
免费资产和商用资产 - AI开发平台ModelArts

法、模型、镜像。商用资产由华为云云商店提供卖家发布和买家购买相关功能，AI Gallery仅提供列表展示。购买商业售卖的AI资产，本质上是购买算法、模型等AI资产的使用配额，在配额定义的约束下，有限地使用算法、模型等。卖家发布AI类资产操作请参考发布AI资产类商品操作指导。买家购买相关功能请参考商品购买。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Version中下载文件。文件会直接下载用户本地，需要再上传至SFS Turbo中。方法二：huggingface-cli：huggingface-cli是Hugging Face官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
Prefix Caching - AI开发平台ModelArts

Prefix Caching 什么是Prefix Caching 在LLM推理应用中，经常会面临具有长system prompt的场景以及多轮对话的场景。长system prompt的场景，system prompt在不同的请求中但是相同的，KV Cache的计算也是相同的；多轮

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901） > 推理关键特性使用
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

Version中下载文件。文件会直接下载用户本地，需要再上传至SFS Turbo中。方法二：huggingface-cli：huggingface-cli是Hugging Face官方提供的命令行工具，自带完善的下载功能。具体步骤可参考：HF-Mirror中的使用教程。完成依赖安装和环境变量配置后，以Llama2-70B为例：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901） > 准备工作
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理时，要执行的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
yaml配置文件参数配置说明 - AI开发平台ModelArts

alpaca_en_demo 指定用于训练的数据集，数据集都放置在此处为identity，alpaca_en_demo表示使用了两个数据集，一个是 identity，一个是alpaca_en_demo。如选用定义数据请参考准备数据（可选） template qwen 必须修改。用于指定模板。如果设

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

可以提前的完成POC评估，例如框架、算子支持度，以及可能的一些性能指标。 - 如果是AIGC场景的业务例如Stable Diffusion，请在上表的基础上，再提供以下信息：表2 AIGC场景业务迁移评估表收集项说明实际情况（请填写）使用场景例如：业务是文生图，图生图等。业务是否需要频繁更新模型，或者需要动态加载Lora。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
推理精度测试 - AI开发平台ModelArts

-w {output_path} --debug 参数说明如下： --datasets：评测的数据集及评测方法，其中 mmlu 是数据集，ppl 是评测方法。 --hf-type：HuggingFace模型权重类型(base,chat), 默认为chat, 依据实际的模型选择。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
语言模型推理性能测试 - AI开发平台ModelArts

zip并解压，无需重复执行。进入benchmark_tools目录下，运行静态benchmark验证。 cd benchmark_tools 语言模型脚本相对路径是tools/llm_evaluation/benchmark_tools/benchmark_parallel.py，具体操作命令如下，可以根据参数说明修改参数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试

总条数： 1539

上一页
1
...
57
58
59
...
77
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备权重 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

创建工作流定时调度 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

上传远端文件至JupyterLab - AI开发平台ModelArts

SFT微调数据处理 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

免费资产和商用资产 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

Prefix Caching - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线