搜索_华为云

使用PyCharm手动连接Notebook - AI开发平台ModelArts

名字，单击OK。配置完成后，单击Test Connection测试连通性。选择Yes，显示Successfully connected表示网络可以连通，单击OK。在最下方再单击OK保存配置。图2 配置SSH Step2 获取开发环境预置虚拟环境路径单击“Tools > Start

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过PyCharm远程使用Notebook实例
什么是ModelArts - AI开发平台ModelArts

ore等主流开源的AI开发框架，也支持开发者使用自研的算法框架，匹配您的使用习惯。产品形态 ModelArts提供多种产品形态，如下表所示。表1 ModelArts产品形态介绍产品形态产品定位使用场景 ModelArts Standard 面向AI开发者的一站式开发平台，

帮助中心 > AI开发平台ModelArts > 产品介绍
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

conversations：包含一系列对话对象，每个对象都由发言者(from)和发言内容(value)组成。 from：表示对话的角色，可以是"human"（人类）或"gpt"（机器），表示是谁说的这句话。 value：具体的对话内容。 system：系统提示词，用来为整个对话设定场景或提供指导原则。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
非分离部署推理服务 - AI开发平台ModelArts

--enable-lora表示开启lora挂载。 --lora-modules后面添加挂载的lora列表，要求lora地址权重是huggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。 --max-lora-rank表示挂载lo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
训练启动脚本说明和参数配置 - AI开发平台ModelArts

TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 4 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示contex

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 CP 1 表示context并行，默认为1。应用于训练长序列文本的模型。若训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明
部署推理服务 - AI开发平台ModelArts

--enable-lora表示开启lora挂载。 --lora-modules后面添加挂载的lora列表，要求lora地址权重是huggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。 --max-lora-rank表示挂载lo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
部署推理服务 - AI开发平台ModelArts

--enable-lora表示开启lora挂载。 --lora-modules后面添加挂载的lora列表，要求lora地址权重是huggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。 --max-lora-rank表示挂载lo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
Lite Cluster资源配置流程 - AI开发平台ModelArts

集群的配置使用需要用户具备一定的知识背景，包括但不限于Kubernetes基础知识、网络知识、存储和镜像知识。配置流程图1 Lite Cluster资源配置流程图表1 Cluster资源配置流程配置顺序配置任务场景说明 1 配置Lite Cluster网络购买资源池后，需要弹性公网IP并进行网络

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
非分离部署推理服务 - AI开发平台ModelArts

export USE_VOCAB_PARALLEL=1 # 是否使用词表并行；默认值为1表示开启并行，取值为0表示关闭并行。对于词表较小的模型（如llama2系模型），关闭并行可以减少推理时延，对于词表较大的模型（如qwen系模型），开启并行可以减少显存占用，以提升推理吞吐量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
查看批量服务的事件 - AI开发平台ModelArts

页面进行查看。方便用户更清楚的了解服务部署和运行过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：表1 事件事件类型事件信息（“XXX”表示占位符，以实际返回信息为准）解决方案正常开始部署服务。 Start to deploy service. - 异常

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

如果验证自定义镜像功能成功，结果如下图所示。图3 校验接口上传自定义镜像至SWR服务。完成自定义镜像上传后，您可以在“容器镜像服务>我的镜像>自有镜像”列表中看到已上传镜像。将自定义镜像创建为模型参考从容器镜像中选择元模型导入元模型，您需要特别关注以下参数：元模型来源：选择“从容器镜像中选择”

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
推理性能测试 - AI开发平台ModelArts

支持random、sharegpt、human-eval三种输入。random表示构造随机token的数据集进行测试；sharegpt表示使用sharegpt数据集进行测试；human-eval数据集表示使用human-eval数据集进行测试。注意：当输入为sharegpt或hu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 CP 1 表示context并行，默认为1。应用于训练长序列文本的模型。若训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

conversations：包含一系列对话对象，每个对象都由发言者(from)和发言内容(value)组成。 from：表示对话的角色，可以是"human"（人类）或"gpt"（机器），表示是谁说的这句话。 value：具体的对话内容。 system：系统提示词，用来为整个对话设定场景或提供指导原则。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
推理性能测试 - AI开发平台ModelArts

支持random、sharegpt、human-eval三种输入。random表示构造随机token的数据集进行测试；sharegpt表示使用sharegpt数据集进行测试；human-eval数据集表示使用human-eval数据集进行测试。注意：当输入为sharegpt或hu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.911）
Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

源和Ascend Snt9B。获取软件和镜像表1 获取软件和镜像分类名称获取路径插件代码包 AscendCloud-6.3.911软件包中的AscendCloud-CV-6.3.911-xxx.zip 文件名中的xxx表示具体的时间戳，以包名发布的实际时间为准。获取

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 内容审核模型训练推理
推理场景介绍 - AI开发平台ModelArts

Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表1所示。表1 支持的模型列表和权重获取地址序号模型名称是否支持fp16/bf16推理是否支持W4A16量化

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.909）
非分离部署推理服务 - AI开发平台ModelArts

--enable-lora表示开启lora挂载。 --lora-modules后面添加挂载的lora列表，要求lora地址权重是huggingface格式，当前支持QKV-proj、O-proj、gate_up_proj、down_proj模块的挂载。 --max-lora-rank表示挂载lo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
训练启动脚本说明和参数配置 - AI开发平台ModelArts

TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 4 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示contex

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考

总条数： 722

上一页
1
...
32
33
34
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用PyCharm手动连接Notebook - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

部署推理服务 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

从0-1制作自定义镜像并创建模型 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线