搜索_华为云

LoRA微调训练 - AI开发平台ModelArts

S/MBS的值能够被NPU/(TP×PP×CP)的值进行整除。 Step4 其他配置选择用户自己的专属资源池，以及规格与节点数。防止训练过程中出现内存溢出的情况，用户可参考表1进行配置。图2 选择资源池规格作业日志选择OBS中的路径，训练作业的日志信息则保存该路径下。最后

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
准备镜像环境 - AI开发平台ModelArts

也可以映射至容器中，作为容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。为方便访问两个地址可以相同。 ${pvc_name} 为在CCE集群关联SFS Turbo步骤中创建的PVC名称。在设置容器中需要的CPU与内存大小时，可通过运行以下命令查看申请的节点机器中具体的CPU与内存信息。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
创建生产训练作业 - AI开发平台ModelArts

模型训练是一个不断迭代和优化模型权重的过程。ModelArts的训练模块支持创建训练作业、查看训练情况以及管理训练版本。通过模型训练试验模型结构、数据和超参的各种组合，便于找到最佳的模型结构和权重。创建生产环境的训练作业有2种方式：通过ModelArts Standard控制台的方式创建生产环境的训练作业，详细操作请参考本章节以下内容。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
模型包结构介绍 - AI开发平台ModelArts

创建模型时，如果是从OBS中导入元模型，则需要符合一定的模型包规范。模型包规范适用于单模型场景，如果是多模型场景（例如含有多个模型文件）推荐使用自定义镜像方式。 ModelArts推理平台不支持的AI引擎，推荐使用自定义镜像方式。请参考创建模型的自定义镜像规范和从0-1制作自定义镜像并创建模型，制作自定义镜像。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
部署物体检测服务 - AI开发平台ModelArts

时后”、“自定义”。如果选择“自定义”的模式，可在右侧输入框中输入1~24范围内的任意整数。如果您购买了套餐包，计算节点规格可选择您的套餐包，同时在“配置费用”页签还可查看您的套餐包余量以及超出部分的计费方式，请您务必关注，避免造成不必要的资源浪费。完成资源配置后，单击“继续

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现物体检测
部署声音分类服务 - AI开发平台ModelArts

时后”、“自定义”。如果选择“自定义”的模式，可在右侧输入框中输入1~24范围内的任意整数。如果您购买了套餐包，计算节点规格可选择您的套餐包，同时在“配置费用”页签还可查看您的套餐包余量以及超出部分的计费方式，请您务必关注，避免造成不必要的资源浪费。完成资源配置后，单击“继续

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类
数据准备使用流程 - AI开发平台ModelArts

提供多种数据接入方式，支持用户从OBS，MRS，DLI以及DWS等服务导入用户的数据。提供18+数据增强算子，帮助用户扩增数据，增加训练用的数据量。帮助用户提高数据的质量。提供图像、文本、音频、视频等多种格式数据的预览，帮助用户识别数据质量。提供对数据进行多维筛选的能力，用户可以根据样本属性、标注信息等进行样本筛选。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
部署图像分类服务 - AI开发平台ModelArts

时后”、“自定义”。如果选择“自定义”的模式，可在右侧输入框中输入1~24范围内的任意整数。如果您购买了套餐包，计算节点规格可选择您的套餐包，同时在“配置费用”页签还可查看您的套餐包余量以及超出部分的计费方式，请您务必关注，避免造成不必要的资源浪费。完成资源配置后，单击“继续

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

返回此错误信息。如果您使用的是自定义镜像导入的模型，请增大自定义镜像中所使用的web server的keep-alive的参数值，尽量避免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
下线公告 - AI开发平台ModelArts
下线公告 - AI开发平台ModelArts

下线公告【下线公告】华为云ModelArts自动学习下线公告【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告【下线公告】华为云ModelArts服务旧版数据集下线公告【下线公告】华为云ModelArts服务模型转换下线公告【下线公告】华为云ModelArts

帮助中心 > AI开发平台ModelArts > 服务公告
准备镜像环境 - AI开发平台ModelArts

也可以映射至容器中，作为容器中挂载宿主机的目录。宿主机和容器使用不同的文件系统。为方便访问两个地址可以相同。 ${pvc_name} 为在CCE集群关联SFS Turbo步骤中创建的PVC名称。在设置容器中需要的CPU与内存大小时，可通过运行以下命令查看申请的节点机器中具体的CPU与内存信息。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作
通过APP认证的方式访问在线服务 - AI开发平台ModelArts

情请参见在线服务授权管理。开启支持APP认证功能后，将支持APP认证的服务授权给应用，用户可以使用创建的“AppKey/AppSecret”或“AppCode”调用服务的支持APP认证的接口。 APP认证的服务授权给应用后，需要1-2分钟生效。在线服务授权管理如果您需要使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业 > 访问在线服务支持的认证方式
指令监督微调训练任务 - AI开发平台ModelArts

指定每个设备的训练批次大小 gradient_accumulation_steps 8 指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可根据自己要求适配 num_train_epochs 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。可根据自己要求适配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

service_predict.py # 发送请求的服务。支持vllm的openai，atb的tgi模板 ├── ... ├──benchmark_tools #性能评测 ├── benchmark.py # 可以基于默认的参数跑完静态benchmark和动态benchmark

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
准备权重 - AI开发平台ModelArts
准备权重 - AI开发平台ModelArts

准备权重获取对应模型的权重文件，获取链接参考表1。权重文件下载有如下几种方式，但不仅限于以下方式：方法一：网页下载：通过单击表格中权重文件获取地址的访问链接，即可在模型主页的Files and Version中下载文件。方法二：huggingface-cli：huggingface-cli是

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
订阅免费算法 - AI开发平台ModelArts

算法”，进入“我的算法”页面。选择“我的订阅”页签，进入个人订阅的算法列表。在算法列表选择需要使用的算法，单击“应用控制台”列的“ModelArts”。在弹出的“选择云服务区域”页面选择ModelArts所在的云服务区域，单击“确定”跳转至ModelArts控制台的“算法管理 >

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
推理场景介绍 - AI开发平台ModelArts

6。适配的CANN版本是cann_8.0.rc3。资源规格要求本文档中的模型运行环境是ModelArts Lite的Lite k8s Cluster。推荐使用“西南-贵阳一”Region上的资源和Ascend Snt9B。支持的模型列表和权重文件本方案支持vLLM的v0.6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910）
查询APP的API认证信息 - AI开发平台ModelArts

查询APP的API认证信息功能介绍查询APP的API认证信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/serv

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
W4A16量化 - AI开发平台ModelArts
W4A16量化 - AI开发平台ModelArts

n量化和kvcache量化。量化的一般步骤是：1、对浮点类型的权重镜像量化并保存量化完的权重；2、使用量化完的权重进行推理部署。什么是W4A16量化 W4A16量化方案能显著降低模型显存以及需要部署的卡数（约75%）。大幅降低小batch下的增量推理时延。约束限制支持AWQ

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化

总条数： 1205

上一页
1
...
51
52
53
...
61
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LoRA微调训练 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

创建生产训练作业 - AI开发平台ModelArts

模型包结构介绍 - AI开发平台ModelArts

部署物体检测服务 - AI开发平台ModelArts

部署声音分类服务 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

部署图像分类服务 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

下线公告 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

通过APP认证的方式访问在线服务 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

准备权重 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询APP的API认证信息 - AI开发平台ModelArts

W4A16量化 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线