搜索_华为云

训练作业容错检查 - AI开发平台ModelArts

item（日志关键字）执行条件检测成功要求域名检测 dns 无 volcano容器的域名都解析成功（/etc/volcano下的“.host”文件中的域名解析成功）磁盘空间-容器根目录 disk-size root 无大于32GB 磁盘空间-/dev/shm目录 disk-size

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

已升级到最新版本。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

确保集群可以访问公网。训练支持的模型列表本方案支持以下模型的训练，如表1所示。表1 支持的模型列表序号支持模型支持模型参数量权重文件获取地址 1 llama2 llama2-7b https://huggingface.co/meta-llama/Llama-2-7b-chat-hf

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
订阅免费模型 - AI开发平台ModelArts

在使用过程中如果消耗了硬件资源进行部署，管理控制台将根据实际使用情况收取硬件资源的费用。前提条件注册并登录华为云，且创建好OBS桶用于存储数据和模型。如果是订阅使用HiLens技能，则需要获取相关服务权限，详细操作请参见准备工作（华为HiLens）。订阅免费模型登录“AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
推理场景介绍 - AI开发平台ModelArts

说明：如果上述软件获取路径打开后未显示相应的软件信息，说明您没有下载权限，请联系您所在企业的华为方技术支持下载获取。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM版本支持的模型列表有差异，具体如表3所示。表3 支持的模型列表和权重获取地址序号模型名称

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）
昇腾能力应用地图 - AI开发平台ModelArts

NPU训练指导主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导 Llama3 Llama3-8b Llama3-70b 预训练、SFT全参微调、LoRA微调 ModelLink

帮助中心 > AI开发平台ModelArts > 最佳实践
昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

LLM开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） LLM开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）支持如下模型适配PyTorch-NPU的推理。 llama-7B llama-13b

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。准备代码准备AscendCloud-3rdLLM-6.3.905-xxx.zip和AscendCloud-OPP-6.3.905-xxx

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
创建IAM用户并授权使用MaaS - AI开发平台ModelArts

FullAccess 可选 ModelArts FullAccess权限和ModelArts CommonOperations权限建议二选一。 OBS对象存储服务授予子用户使用OBS服务的权限。ModelArts的数据管理、开发环境、训练作业、模型推理部署均需要通过OBS进行数据中转。 OBS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
查询处理任务详情 - AI开发平台ModelArts

t-3026-X6c3N3eztX7cr3Arvqu/annotation/V002/V002.manifest", "file_path" : "s3://lch-test-obs/classify/output/dataset-3026-X6c3N3eztX7

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

LLM开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） LLM开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）支持如下模型适配PyTorch-NPU的推理。 llama-7B llama-13b

帮助中心 > AI开发平台ModelArts > 服务公告 > 产品发布说明
推理业务迁移评估表 - AI开发平台ModelArts

推理业务迁移评估表通用的推理业务及LLM推理可提供下表进行业务迁移评估：收集项说明实际情况（请填写）项目名称项目名称，例如：XXX项目。 - 使用场景例如：使用YOLOv5算法对工地的视频流裁帧后进行安全帽检测。使用BertBase算法对用户在app上购买商品后的评论进行理解。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
查看在线服务的事件 - AI开发平台ModelArts

update service, rollback failed. 请联系技术支持。正常 [model 0.0.1] OBS桶，OBS并行文件系统，SFS Turbo挂载成功。 [%s] %s volume successfully. - 服务部署和运行过程中，关键事件支持手动/自动刷新。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
查询团队标注任务统计信息 - AI开发平台ModelArts

确认请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 data_path String 数据集数据存储路径。 data_spliting_enable Boolean 根据样本标注统计，判断数据集是否可以进行训练/验证集切分。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查看批量服务的事件 - AI开发平台ModelArts

update service, rollback failed. 请联系技术支持。正常 [model 0.0.1] OBS桶，OBS并行文件系统，SFS Turbo挂载成功。 [%s] %s volume successfully. - 服务部署和运行过程中，关键事件支持手动/自动刷新。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
查询数据集的统计信息 - AI开发平台ModelArts

确认请求参数无响应参数状态码： 200 表3 响应Body参数参数参数类型描述 data_path String 数据集数据存储路径。 data_spliting_enable Boolean 根据样本标注统计，判断数据集是否可以进行训练/验证集切分。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

ECC错误。通过nvidia-smi -a查询到存在Pending Page Blacklist为Yes的记录，或多比特Register File大于0。对于Ampere架构的GPU，存在以下场景：存在不可纠正的SRAM错误。存在Remapping Failure记录。 dmsg中存在Xid

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

WebSocket客户端和服务端双向传输数据 WebSocket连接的建立打开Postman（需选择8.5 以上版本，以10.12.0为例）工具，单击左上角，选择“File>New”，弹出新建对话框，选择“WebSocket Request”（当前为beta版本）功能：图3 选择WebSocket Request功能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
创建资源池 - AI开发平台ModelArts

资源规格，比如：modelarts.vm.gpu.tnt004。 count 是 Integer 资源规格的保障资源量。 maxCount 否 Integer 资源规格的弹性资源量。物理池中该值和count必须一致。 extendParams 否 extendParams object 自定义配置参数。表9 extendParams

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

迁移评估推理迁移包括模型迁移、业务迁移、精度性能调优等环节，是否能满足最终的迁移效果需要进行系统的评估。如果您仅需要了解迁移过程，可以先按照本文档的指导进行操作并熟悉迁移流程。如果您有实际的项目需要迁移，建议填写下方的推理业务迁移评估表，并将该调研表提供给华为云技术支持人员进行迁移评估，以确保迁移项目能顺利实施。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导

总条数： 1718

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练作业容错检查 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

订阅免费模型 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

昇腾云服务6.3.907版本说明 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建IAM用户并授权使用MaaS - AI开发平台ModelArts

查询处理任务详情 - AI开发平台ModelArts

昇腾云服务6.3.908版本说明 - AI开发平台ModelArts

推理业务迁移评估表 - AI开发平台ModelArts

查看在线服务的事件 - AI开发平台ModelArts

查询团队标注任务统计信息 - AI开发平台ModelArts

查看批量服务的事件 - AI开发平台ModelArts

查询数据集的统计信息 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

ModelArts Standard的WebSocket在线服务全流程开发 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线