搜索_华为云

准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── Qwen2-72B # 输出权重及日志路径，用户可根据实际自行规划，无需手动创建，此路径对应表1表格中output_dir参数值 |── saved_dir_for_output_lf # 训练输出保存权重，目录结构会自动生成，无需用户创建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

|── Qwen2-72B # 输出权重及日志路径，用户可根据实际自行规划，无需手动创建，此路径对应表1表格中output_dir参数值 |── saved_dir_for_output_lf # 训练输出保存权重，目录结构会自动生成，无需用户创建

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
创建Notebook实例 - AI开发平台ModelArts

此参数的参数值。 id 否 String EFS专属存储盘ID，只有当category为EFS，同时ownership为DEDICATED时必填。参数值获取方式如下：登录弹性文件服务控制台，在文件系统列表中，单击文件系统名称进入详情页。其中，“ID”即为此参数的参数值。表5 CustomHooks

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练的数据集预处理说明 - AI开发平台ModelArts

为例，用户可直接编辑 scripts/llama2/1_preprocess_data.sh 脚本，自定义环境变量的值，并运行该脚本。其中环境变量详细介绍如下：表1 数据预处理中的环境变量环境变量示例参数说明 RUN_TYPE pretrain、sft、lora 数据预处理区分：预训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
Eagle投机小模型训练 - AI开发平台ModelArts

--code_type str 预训练json文件编码，默认utf-8。步骤三：sharegpt格式数据生成为训练data数据集设置环境变量。 export EAGLE_TARIN_MODE=1 如果使用开源数据集，推荐使用原论文代码仓数据集，下载地址：https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 投机推理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

culative-model ${container_draft_model_path}同时使用。可在run_vllm.sh增加如下环境变量开启高阶配置： export DEFER_DECODE=1 # 是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

建新镜像步骤ECS中构建新镜像（二选一）中镜像的代码目录CODE_DIR。修改代码如图1。图1 修改区分训练作业中2个代码目录使用环境变量SAVE_PATH重新覆盖权重文件保存路径，作为最终的权重保存路径。修改代码如图2。图2 修改权重保存路径多机训练场景下，需要将COD

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
推理精度测试 - AI开发平台ModelArts

model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 benchmark_type：作为一个保存log结果中的一个变量名，默认选eval。参考命令： vllm_path=vllm host=0.0.0.0 service_port=8080 max_out_len=16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909）
推理精度测试 - AI开发平台ModelArts

model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 benchmark_type：作为一个保存log结果中的一个变量名，默认选eval。参考命令： vllm_path=vllm host=0.0.0.0 service_port=8080 max_out_len=16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
推理精度测试 - AI开发平台ModelArts

model_name：评测模型名称，不需要与启动服务时的模型参数保持一致。 benchmark_type：作为一个保存log结果中的一个变量名，默认选eval。参考命令： vllm_path=vllm host=0.0.0.0 service_port=8080 max_out_len=16

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
管理员和开发者权限分离 - AI开发平台ModelArts

”，“权限配置”选择“普通用户”。管理员不做权限控制，此处默认使用普通用户委托即可。勾选“我已经详细阅读并同意《 ModelArts服务声明》”，单击“创建”。测试管理员用户权限。使用管理员用户登录ModelArts管理控制台。在登录页面，请使用“IAM用户登录”方式进行登录。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
配置节点参数控制分支执行 - AI开发平台ModelArts

策略，并且都使用参数进行控制。当参数值配置不同时，model_step的执行可以分为以下几种情况（model_step没有配置跳过策略，因此会遵循默认规则）： job_step_a_is_skip参数值 job_step_b_is_skip参数值 model_step是否执行 True

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
线下容器镜像构建及调试 - AI开发平台ModelArts

list是否包含所需的包，查看容器直接调用的python是否是自己所需要的那个（如果容器镜像装了多个python，需要设置python路径的环境变量）。测试训练启动脚本。优先使用手工进行数据复制的工作并验证一般在镜像里不包含训练所用的数据和代码，所以在启动镜像以后需要手工把需要的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？参考下载OBS文件到Notebook中的指导，将OBS中的数据下载至Notebook本地处理。参考pandas用户指南处理pandas数据。父主题： Standard Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook
pipeline代码适配 - AI开发平台ModelArts

ne初始化的时候直接初始化模型。您可以参照如下样例，通过修改use_ascend修改该模型是否使用mindir运行，也可以编写代码通过环境变量指定。 # pipeline_onnx_stable_diffusion_img2img_mslite.py class OnnxSta

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
非分离部署推理服务 - AI开发平台ModelArts

ix-caching特性则不配置该环境变量。若要开启图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA # 开启PTA模式，若不使用图模式，请关闭该环境变量 export PTA_TORCHAIR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

ix-caching特性则不配置该环境变量。若要开启图模式，请配置以下5个环境变量，并且启动服务时不要添加enforce-eager参数。 export INFER_MODE=PTA # 开启PTA模式，若不使用图模式，请关闭该环境变量 export PTA_TORCHAIR

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

第二张卡，则“export ASCEND_RT_VISIBLE_DEVICES=0,1”，注意编号不是填4、5。图2 查询结果配置环境变量。 export DEFER_DECODE=1 # 是否使用推理与Token解码并行；默认值为1表示开启并行，取值为0表示关闭并行。开启该

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
Lite Cluster使用流程 - AI开发平台ModelArts

裸金属服务器（Bare Metal Server）是一款兼具虚拟机弹性和物理机性能的计算类服务，为您和您的企业提供专属的云上物理服务器，为核心数据库、关键应用系统、高性能计算、大数据等业务提供卓越的计算性能以及数据安全。 ECS 弹性云服务器（Elastic Cloud Server）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
附录：大模型推理常见问题 - AI开发平台ModelArts

inv_freq.npu() 问题6：使用Qwen2-7B、Qwen2-72B模型有精度问题，重复输出感叹号检查步骤六中4. 配置环境变量章节中，高精度模式的环境变量是否开启。问题7：使用autoAWQ进行qwen-7b模型量化时报错使用autoAWQ进行qwen-7b模型量化时报错：TypeError:

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）

总条数： 611

上一页
1
...
20
21
22
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备代码 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

Eagle投机小模型训练 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

配置节点参数控制分支执行 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

在ModelArts的Notebook中如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

pipeline代码适配 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

附录：大模型推理常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线