搜索_华为云

NPU日志收集上传 - AI开发平台ModelArts

件，文件名一般为：credentials.csv。如下图所示，文件包含了租户名（User Name），AK（Access Key Id），SK（Secret Access Key）。图1 credential.csv文件内容 AK/SK生成步骤：登录管理控制台。单击右上角

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍不同AI模型训练所需要的数据量和算力不同，在训练时选择合适的存储及训练方案可提升模型训练效率与资源性价比。ModelArts Standard支持单机单卡、单机多卡和多机多卡的训练场景，满足不同AI模型训练的要求。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
使用python3.6-torch1.4版本镜像环境安装MMCV报错 - AI开发平台ModelArts

使用python3.6-torch1.4版本镜像环境安装MMCV报错问题现象日志报错中存在AssertionError: MMCV==1.2.5 is used but incompatible. Please install mmcv>=1.3.1, <=1.5.0。原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
训练作业运行失败排查指导 - AI开发平台ModelArts

训练作业运行失败排查指导问题现象训练作业的“状态”出现“运行失败”的现象。原因分析及处理方法查看训练作业的“日志”，出现报错“MoxFileNotExistsException(resp, 'file or directory or bucket not found.')”。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
预置算法运行故障 - AI开发平台ModelArts

预置算法运行故障日志提示“label_map.pbtxt cannot be found” 日志提示“root: XXX valid number is 0” 日志提示“ValueError: label_map not match” 日志提示“Please set the train_url

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业
如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？查询cuda版本： cat /usr/local/cuda/version.txt 查询cudnn版本： cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2 父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
AI Gallery使用流程 - AI开发平台ModelArts

AI Gallery使用流程 AI Gallery提供了模型、数据集、AI应用等AI数字资产的共享，为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体，提供安全、开放的共享及交易环节，加速AI资产的开发与落地，保障AI开发生态链上各参与方高效地实现各自的商业价值。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
查询服务日志 - AI开发平台ModelArts

UTC'的毫秒数。 result String 更新结果，取值为：SUCCESS/FAIL/RUNNING。 config Config结构数组更新后的服务配置，当infer_type为real-time时，会返回此值。 success_num Number 操作成功的节点数，当infer_type为edge时，会返回此值。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
删除AI应用 - AI开发平台ModelArts

头中X-Subject-Token的值）。响应参数状态码： 200 表4 响应Body参数参数参数类型描述 delete_success_list Array of strings 删除成功的模型id列表。 delete_failed_list Array of Del

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

场景介绍方案概览本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908）
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
创建模型 - AI开发平台ModelArts
创建模型 - AI开发平台ModelArts

创建模型创建模型不同方式的场景介绍从训练作业中导入模型文件创建模型从OBS中导入模型文件创建模型从容器镜像中导入模型文件创建模型从AI Gallery订阅模型父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
获取训练作业支持的AI预置框架 - AI开发平台ModelArts

获取训练作业支持的AI预置框架功能介绍获取训练作业支持的AI预置框架。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” 问题现象预测流量不大但频繁出现以下报错 Backend service internal error. Backend service read timed out Send the request from gateway to the

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

saved_entry=EulerOS (4.18.0-147.5.1.6.h998.eulerosv2r9.x86_64) 2.0 (SP9x86_64) boot_success=0 [root@Server-ddff ~]# 发现默认系统内核已经变为h998，reboot后就会生效。此时若重启那么内核版本就被升级了。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？新版训练和旧版训练的差异主要体现在以下3点: 新旧版创建训练作业方式差异新旧版训练代码适配的差异新旧版训练预置引擎差异新旧版创建训练作业方式差异旧版训练支持使用“算法管理”（包含已保存的算法和订阅的算法）、“常用框架”、“自定义”（即自定义镜像）方式创建训练作业。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
作业状态参考 - AI开发平台ModelArts

作业状态参考作业状态如表1所示。表1 作业状态状态值作业状态说明 0 JOBSTAT_UNKNOWN，作业状态未知。 1 JOBSTAT_INIT，作业初始化状态。 2 JOBSTAT_IMAGE_CREATING，作业镜像正在创建。 3 JOBSTAT_IMAGE_FAILED，作业镜像创建失败。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版）
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

准备代码本教程中用到的模型软件包如下表所示，请提前准备好。软件配套版本本方案支持的软件配套版本和依赖包获取地址如表1所示。表1 软件配套版本和获取地址软件名称说明下载地址 AscendCloud-6.3.907-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907） > 准备工作

总条数： 944

上一页
1
...
35
36
37
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

NPU日志收集上传 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练作业的场景介绍 - AI开发平台ModelArts

使用python3.6-torch1.4版本镜像环境安装MMCV报错 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

预置算法运行故障 - AI开发平台ModelArts

如何查询自定义镜像的cuda和cudnn版本？ - AI开发平台ModelArts

AI Gallery使用流程 - AI开发平台ModelArts

查询服务日志 - AI开发平台ModelArts

删除AI应用 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

创建模型 - AI开发平台ModelArts

获取训练作业支持的AI预置框架 - AI开发平台ModelArts

服务启动后，状态断断续续处于“告警中” - AI开发平台ModelArts

GPU裸金属服务器使用EulerOS内核误升级如何解决 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

作业状态参考 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线