搜索_华为云

更新训练作业描述 - AI开发平台ModelArts

参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 job_id 是 Long 训练作业的ID。请求消息请求消息如表2所示。表2 请求参数参数是否必选参数类型说明 job_desc

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
上传OBS文件到JupyterLab - AI开发平台ModelArts

如何查看OBS桶与ModelArts是否在同一区域。没有该OBS桶的访问权限。请确认操作Notebook的账号有权限读取OBS桶中的数据。具体操作请参见检查您的账号是否有该OBS桶的访问权限。 OBS文件被删除。请确认待上传的OBS文件是否存在。异常场景2 图6 文件上传失败

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
模型适配 - AI开发平台ModelArts
模型适配 - AI开发平台ModelArts

=====" 转换结果如下，其中safety_checker模型转换成功，但中间有ERROR日志，该ERROR属于常量折叠失败，不影响结果。图2 转换结果动态分档模型转换（可选）如果迁移的模型有多个shape档位的需求，可以通过如下方式对模型进行分档转换。动态分档是指将模

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 应用迁移
ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

见什么是区域、可用区？资源类型：ModelArts支持查询的资源类型如表1所示。资源标签：不填写标签时，表示查询所有资源，无论此资源是否有配置标签。选择相应标签查询资源，用户可以通过多个标签组合查询资源使用情况。表1 ModelArts的资源类型资源类型说明 ModelArts-Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

什么是区域、可用区？。资源类型：ModelArts支持查询的资源类型如表1所示。资源标签：不填写标签时，表示查询所有资源，无论此资源是否有配置标签。选择相应标签查询资源，用户可以通过多个标签组合查询资源使用情况。表1 ModelArts的资源类型资源类型说明 ModelArts-Notebook

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
功能咨询 - AI开发平台ModelArts
功能咨询 - AI开发平台ModelArts

ModelArts支持将模型部署为哪些类型的服务？在线服务和批量服务有什么区别？在线服务和边缘服务有什么区别？为什么选择不了Ascend Snt3资源？线上训练得到的模型是否支持离线部署在本地？服务预测请求体大小限制是多少？在线服务部署是否支持包周期？部署服务如何选择计算节点规格？部署GPU服务支持的Cuda版本是多少？

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 部署上线
部署的在线服务状态为告警 - AI开发平台ModelArts

如果您使用API接口进行预测，请检查是否预测请求过多。大量的预测请求会导致部署的在线服务进入告警状态。业务内存不正常。请检查推理代码是否存在内存溢出或者内存泄漏的问题。模型运行异常。请检查您的模型是否能正常运行。例如模型依赖的资源是否故障，需要排查推理日志。实例pod数量异常

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
注册API并授权给APP - AI开发平台ModelArts

表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务编号，可通过查询服务列表获取。请求参数表2 请求Header参数参数是否必选参数类型描述

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
什么是ModelArts - AI开发平台ModelArts

提供了简洁易用的管理控制台，包含自动学习、数据管理、开发环境、模型训练、模型管理、部署上线等端到端的AI开发工具链，实现AI全流程生命周期管理。面向有AI开发平台诉求的用户。 ModelArts用户指南（Standard） ModelArts Studio 大模型即服务平台（后续简称为MaaS服务）

帮助中心 > AI开发平台ModelArts > 产品介绍
分离部署推理服务 - AI开发平台ModelArts

挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
使用Msprobe工具分析偏差 - AI开发平台ModelArts

使用Msprobe工具分析偏差观察上一章Loss趋势，在首个Step有较小偏差，所以对第一个Step进行比对分析。此处使用Msprobe的整网Dump和比对分析功能。首先安装社区Msprobe工具，命令如下： pip install mindstudio-probe 使能工具

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型Pytorch迁移与精度性能调优 > 精度对齐
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4503。原因分析及处理方法服务预测报错ModelArts.4503有多种场景，常见场景如下：通信出错请求报错：{"error_code":"ModelArts.4503","error_msg":"Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
创建训练作业 - AI开发平台ModelArts

obs 参数说明如表1所示。表1 参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求消息请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 job_name 是 String

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
创建APP - AI开发平台ModelArts
创建APP - AI开发平台ModelArts

/v1/{project_id}/app-auth/apps 表1 路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Header参数参数是否必选参数类型描述 Content-Type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
训练迁移快速入门案例 - AI开发平台ModelArts

PU对应的接口，请参考昇腾手工迁移文档进行操作。常见问题如何检测当前的torch_npu是否正确安装？您可以使用如下的python命令在对应的运行环境中初步校验torch_npu是否正常安装。 python3 -c "import torch;import torch_npu;print(torch_npu

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
分离部署推理服务 - AI开发平台ModelArts

挂载的NPU。驱动版本要求是23.0.6。如果不符合要求请参考安装固件和驱动章节升级驱动。检查docker是否安装。 docker -v #检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker-engine.aarch64

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.911） > 部署推理服务
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 常见错误原因和解决方法
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 常见错误原因和解决方法
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907） > 常见错误原因和解决方法

总条数： 1154

上一页
1
...
20
21
22
...
58
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

更新训练作业描述 - AI开发平台ModelArts

上传OBS文件到JupyterLab - AI开发平台ModelArts

模型适配 - AI开发平台ModelArts

ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

功能咨询 - AI开发平台ModelArts

部署的在线服务状态为告警 - AI开发平台ModelArts

注册API并授权给APP - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

创建APP - AI开发平台ModelArts

训练迁移快速入门案例 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线