搜索_华为云

模型包结构介绍 - AI开发平台ModelArts

模型包里面必须包含“model”文件夹，“model”文件夹下面放置模型文件，模型配置文件，模型推理代码文件。模型文件：在不同模型包结构中模型文件的要求不同，具体请参见模型包结构示例。模型配置文件：模型配置文件必须存在，文件名固定为“config.json”，有且只有一个，模型配置文件编写请参见模型配置文件编写说明。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
切换Lite Server服务器操作系统 - AI开发平台ModelArts

切换Lite Server服务器操作系统场景描述 Lite Server为一台弹性裸金属服务器，您可以使用BMS服务提供的切换操作系统功能，对Lite Server资源操作系统进行切换。本文介绍以下三种切换操作系统的方式：在BMS控制台切换操作系统使用BMS Go SDK的方式切换操作系统

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
状态码 - AI开发平台ModelArts
状态码 - AI开发平台ModelArts

Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证，与401类似，但请求者应当使用代理进行授权。 408 Request Time-out 服务器等候请求时发生超时。客户端

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
推理场景介绍 - AI开发平台ModelArts

6.3版本。支持FP16和BF16数据类型推理。适配的CANN版本是cann_8.0.rc3。 DevServer驱动版本要求23.0.6。资源规格要求本文档中的模型运行环境是ModelArts Lite的DevServer。推荐使用“西南-贵阳一”Region上的资源和Ascend

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
终止训练作业 - AI开发平台ModelArts

SchedulePolicy 参数参数类型描述 required_affinity RequiredAffinity object 训练作业亲和要求 priority Integer 训练作业优先级 preemptible Boolean 是否可以被抢占(tag:hcs) 表55 RequiredAffinity

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

SchedulePolicy 参数参数类型描述 required_affinity RequiredAffinity object 训练作业亲和要求 priority Integer 训练作业优先级 preemptible Boolean 是否可以被抢占(tag:hcs) 表54 RequiredAffinity

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
附录：训练常见问题 - AI开发平台ModelArts

修改后的barrier_timeout参数问题5：训练完成使用vllm0.6.0框架推理失败：错误截图：报错原因：训练时transformers版本要求为4.45.0，训练完成后保存的tokenizer.json文件中的“merges”时保存的是拆开的列表不是字符串，导致推理异常解决措施，以下两种方法任选其一：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912）
Lite Server使用流程 - AI开发平台ModelArts

Lite Server使用流程 ModelArts Lite Server提供多样化的xPU裸金属服务器，赋予用户以root账号自主安装和部署AI框架、应用程序等第三方软件的能力，为用户打造专属的云上物理服务器环境。用户只需轻松选择服务器的规格、镜像、网络配置及密钥等基本信息，即

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server使用前必读
在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

高准确性：利用模型强大的语义理解能力，系统能够准确识别新闻内容的主题和关键词，实现高准确率的自动分类。快速响应：系统能够实时处理新闻内容，快速完成分类，满足新闻时效性的要求。可扩展性：随着模型的不断训练和优化，系统能够适应不断变化的新闻内容和分类需求。降低人力成本：减少人工分类的工作量，降低人力成本，提高工作效率。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理
准备镜像环境 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。修改目录权限，上传代码和数据到宿主机时使用的是root用户，如用ma-user用户训练，此处需要执行如下命令统一文件权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作
准备镜像环境 - AI开发平台ModelArts

为docker镜像的ID，在宿主机上可通过docker images查询得到。 --shm-size：表示共享内存，用于多进程间通信。由于需要转换较大内存的模型文件，因此大小要求200g及以上。修改目录权限，上传代码和数据到宿主机时使用的是root用户，如用ma-user用户训练，此处需要执行如下命令统一文件权限。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
模型训练使用流程 - AI开发平台ModelArts

模型训练有多种训练框架来源，具体可以参考准备模型训练镜像。 ModelArts Standard平台提供了模型训练常用的预置框架，可以直接使用。当预置框架不满足训练要求时，支持用户构建自定义镜像用于训练。准备训练数据训练数据除了训练数据集，也可以是预测模型。在创建训练作业前，需要先准备好训练数据。当

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc3。 Server驱动版本要求23.0.6 PyTorch版本：2.1.0 确保容器可以访问公网。文档更新内容 6.3.908版本相对于6.3.907版本新增如下内容：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.RC3。 Server驱动版本要求23.0.6 PyTorch版本：2.2.0 Python版本：3.10 确保容器可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908）
费用账单 - AI开发平台ModelArts
费用账单 - AI开发平台ModelArts

费用账单您可以在“费用中心 > 账单管理”查看资源的费用账单，以了解该资源在某个时间段的使用量和计费信息。账单上报周期包年/包月计费模式的资源完成支付后，会实时上报一条账单到计费系统进行结算。按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据

 帮助中心 > AI开发平台ModelArts > 计费说明
查看训练作业资源占用情况 - AI开发平台ModelArts

查看训练作业资源占用情况约束限制训练作业的资源占用情况系统会自动保存30天，过期会被清除。如何查看训练作业资源使用详情在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

华为自研Ascend Snt9B硬件，完成Qwen-VL Finetune训练。资源规格要求推荐使用“西南-贵阳一”Region上的DevServer资源和Ascend Snt9B。表1 环境要求名称版本 CANN cann_8.0.rc3 驱动 24.1.rc1 PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理
发布本地AI应用到AI Gallery - AI开发平台ModelArts

启动AI应用上传AI应用的运行文件“app.py”。在AI应用详情页，选择“应用文件”页签，单击“添加文件”，进入上传文件页面。运行文件的开发要求请参见准备AI应用运行文件app.py。上传单个超过5GB的文件时，请使用Gallery CLI工具。CLI工具的获取和使用请参见Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档中的模型运行环境是ModelArts Lite Server。镜像适配的Cann版本是cann_8.0.rc3。 Lite Server驱动版本要求23.0.6 PyTorch版本：2.1.0 确保容器可以访问公网。文档更新内容 6.3.909版本相对于6.3.908版本新增如下内容：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

自定义脚本内容 ... # run.sh调用app.py启动服务器，app.py请参考https示例 python app.py 除了按上述要求设置启动命令，您也可以在镜像中自定义启动命令，在创建模型时填写与您镜像中相同的启动命令。提供的服务可使用HTTPS/HTTP协议和监听的

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署

总条数： 735

上一页
1
...
16
17
18
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型包结构介绍 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

状态码 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

Lite Server使用流程 - AI开发平台ModelArts

在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

准备镜像环境 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

费用账单 - AI开发平台ModelArts

查看训练作业资源占用情况 - AI开发平台ModelArts

Qwen-VL基于Lite Server适配PyTorch NPU的Finetune训练指导(6.3.912) - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线