搜索_华为云

准备数据（可选） - AI开发平台ModelArts

集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info.json文件中添加数据集描述；具体示例如下。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_train/LLaMAFacto

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
管理Lite Cluster节点 - AI开发平台ModelArts

置同时被重置节点的最大个数。驱动版本可以在下拉框中指定重置节点的驱动版本。图1 重置节点单击“操作记录”可查看当前资源池重置节点的操作记录。重置中节点状态为“重置中”，重置成功后，节点状态变为“可用”）。重置节点操作不会收取费用。重置节点将影响相关业务的运行，重置时本地

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
非分离部署推理服务 - AI开发平台ModelArts

--device=/dev/davinci7：挂载NPU设备，示例中挂载了8张卡davinci0~davinci7。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_wor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
非分离部署推理服务 - AI开发平台ModelArts

--device=/dev/davinci7：挂载NPU设备，示例中挂载了8张卡davinci0~davinci7。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_wor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
CogVideoX1.5 5b 和 CogVideoX 5b模型基于Lite Server全量8卡序列并行推理指导（6.5.901） - AI开发平台ModelArts

${work_dir}:${container_work_dir}：代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。work_dir为宿主机中工作目录，目录下可存放项目所需代码、数据等文件。container_work_dir为要挂载到的容器中的目录。为方便两个地址可以相同。容器不能挂载到/

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生视频模型训练推理
在线服务预测报错MR.0105 - AI开发平台ModelArts

从上图报错日志判断，预测失败是模型推理代码编写有问题。解决方法根据日志报错提示，append方法中缺少必填参数，修改模型推理代码文件“customize_service.py”中的代码，给append方法中传入合理的参数。如需了解更多模型推理代码编写说明，请参考模型推理代码编写说明。父主题：

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

模式直接接入到云上环境中完成迁移开发与调测，最终生成适配昇腾的推理应用。当前支持以下两种迁移环境搭建方式： ModelArts Standard：在Notebook中，使用预置镜像进行。 ModelArts Lite DevServer：在裸金属服务器中，自助配置好存储、安装固件、驱动、配置网络等。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
基本配置 - AI开发平台ModelArts
基本配置 - AI开发平台ModelArts

基本配置权限配置创建网络专属资源池VPC打通 ECS服务器挂载SFS Turbo存储在ECS中创建ma-user和ma-group obsutil安装和配置（可选）工作空间配置父主题：专属资源池训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练
推理性能测试 - AI开发平台ModelArts

csv。 --served-model-name：选择性添加，选择性添加，在接口中使用的模型名；如果没有配置，则默认为tokenizer。脚本运行完后，测试结果保存在benchmark_serving.csv中，示例如下图所示。图2 动态benchmark测试结果（示意图）

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908）
管理Standard专属资源池的游离节点 - AI开发平台ModelArts

并支持对多个节点进行批量操作。添加/编辑/删除资源标签资源标签用于方便管理资源的计费账单。勾选节点名称，选择节点列表上方的“添加/编辑资源标签”或“删除资源标签”，操作单个节点或批量操作节点资源标签。查找搜索节点在节点管理页面的搜索栏中，支持通过节点名称、IP地址、资源标签等关键字搜索节点。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
管理Lite Cluster资源池的游离节点 - AI开发平台ModelArts

并支持对多个节点进行批量操作。添加/编辑/删除资源标签资源标签用于方便管理资源的计费账单。勾选节点名称，选择节点列表上方的“添加/编辑资源标签”或“删除资源标签”，操作单个节点或批量操作节点资源标签。查找搜索节点在节点管理页面的搜索栏中，支持通过节点名称、IP地址、资源标签等关键字搜索节点。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
创建ModelArts人工标注作业 - AI开发平台ModelArts

音频类型标注作业的详细参数参数名称说明数据集名称选择支持当前标注类型的数据集。添加标签集（声音分类） “声音分类”类型的标注作业可以添加标签集。设置标签名称：在标签名称文本框中，长度为1～1024字符。添加标签：单击“添加标签”可增加多个标签。标签管理（语音分割） “语音分割”类型的标注作业，支持标签管理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

实例规格选择实例规格，规格中描述了服务器类型、型号等信息。 xxx 流量限制（QPS）设置待部署模型的流量限制QPS。 3 实例数设置服务器个数。 1 更多选项内容审核选择是否打开内容审核，默认启用。开关打开（默认打开），内容审核可以阻止模型推理中的输入输出中出现不合规的内容，但可能会对接口性能产生较大影响。

帮助中心 > AI开发平台ModelArts > 快速入门
人工标注视频数据 - AI开发平台ModelArts

在上方区域选择标注框，默认为矩形框。使用鼠标在视频画面中框出目标，然后在弹出的添加标签文本框中，直接输入新的标签名，在文本框前面选中标签颜色，单击“添加”完成1个物体的标注。如果已存在标签，从下拉列表中选择已有的标签，然后单击“添加”完成标注。逐步此画面中所有物体所在位置，一帧对应的画面可添加多个标签。支持的标

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过人工标注方式标注数据
在Windows上安装配置Grafana - AI开发平台ModelArts

本章节适用于在Windows操作系统的PC中安装配置Grafana。操作步骤下载Grafana安装包。进入下载链接，单击Download the installer，等待下载成功即可。安装Grafana。双击安装包，按照指示流程安装完成即可。在Windows的“服务”中，找到Grafana

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
语言模型推理性能测试 - AI开发平台ModelArts

rving.csv中，示例如下图所示。图2 动态benchmark测试结果（示意图）投机推理benchmark验证本章节介绍如何进行投机推理benchmark验证。已经上传投机推理benchmark验证脚本到推理容器中。如果在步骤四制作推理镜像步骤中已经上传过AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 推理性能测试
启动推理服务 - AI开发平台ModelArts

的文本中各个词语的出现频率进行奖惩。取值范围[-2.0，2.0]。 length_penalty 否 1.0 Float length_penalty表示在beam search过程中，对于较长的序列，模型会给予较大的惩罚。如果要使用length_penalty，必须添加如下三

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理服务部署
使用MaaS部署模型服务 - AI开发平台ModelArts

“主题名”：事件通知的主题名称。单击“创建主题”，前往消息通知服务中创建主题。 “事件”：选择要订阅的事件类型。例如“运行中”、“已终止”、“运行失败”等。说明：需要为消息通知服务中创建的主题添加订阅，当订阅状态为“已确认”后，方可收到事件通知。订阅主题的详细操作请参见添加订阅。使用消息通知服务会产生相关服务费用，详细信息请参见计费说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
非分离部署推理服务 - AI开发平台ModelArts

--device=/dev/davinci7：挂载NPU设备，示例中挂载了8张卡davinci0~davinci7。 -v ${dir}:${container_work_dir} 代表需要在容器中挂载宿主机的目录。宿主机和容器使用不同的大文件系统，dir为宿主机中文件目录，${container_wor

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
Profiling数据采集 - AI开发平台ModelArts

Profiling数据采集在train.py的main()函数Step迭代处添加配置，添加位置如下图所示：此处需要注意的是prof.step()需要加到dataloder迭代循环的内部以保证采集单个Step迭代的Profiling数据。更多信息，请参见Ascend PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 性能调优

总条数： 1513

上一页
1
...
14
15
16
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

准备数据（可选） - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

CogVideoX1.5 5b 和 CogVideoX 5b模型基于Lite Server全量8卡序列并行推理指导（6.5.901） - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

基本配置 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

管理Standard专属资源池的游离节点 - AI开发平台ModelArts

管理Lite Cluster资源池的游离节点 - AI开发平台ModelArts

创建ModelArts人工标注作业 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

人工标注视频数据 - AI开发平台ModelArts

在Windows上安装配置Grafana - AI开发平台ModelArts

语言模型推理性能测试 - AI开发平台ModelArts

启动推理服务 - AI开发平台ModelArts

使用MaaS部署模型服务 - AI开发平台ModelArts

非分离部署推理服务 - AI开发平台ModelArts

Profiling数据采集 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线