搜索_华为云

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

服务部署失败后，进入服务详情界面，查看服务部署日志，明确服务部署失败原因（用户代码输出需要使用标准输入输出函数，否则输出的内容不会呈现到前端页面日志）。根据日志中提示的报错信息找到对应的代码进行定位。如果模型启动失败根本没有日志，则考虑使用推理模型调试功能，具体参见：在开发环境中构建并调试推理镜像。父主题：模型管理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
开发环境管理 - AI开发平台ModelArts

查询运行中的Notebook可用时长 Notebook时长续约启动Notebook实例停止Notebook实例获取动态挂载OBS实例信息列表动态挂载OBS 获取动态挂载OBS实例详情动态卸载OBS 添加资源标签删除资源标签查询Notebook资源类型下的标签查询支持的镜像列表

 帮助中心 > AI开发平台ModelArts > API参考
PD分离部署使用说明 - AI开发平台ModelArts

group_id="0")代表Scheduler实例的ip信息，只能有一个实例。第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 分离部署
使用自动分组智能标注作业 - AI开发平台ModelArts

在数据集详情页的“全部”页签中，单击“自动分组 > 启动任务”。只能在“全部”页签下启动自动分组任务或查看任务历史。在弹出的“自动分组”对话框中，填写参数信息，然后单击“确定”。 “分组数”：填写2~200之间的整数，指将图片分为多少组。 “结果处理方式”：“更新属性到当前样本中”，或者“保存到对象存储服务（OBS）”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

conda search numpy #查找名为numpy的package的所有信息 conda search numpy=1.12.0 --info #查看版本为1.12.0的numpy的信息 conda install numpy pandas #安装numpy和pan

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard镜像相关
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建预训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
使用MaaS调优模型 - AI开发平台ModelArts

公共资源池供所有租户共享使用。专属资源池需单独创建，不与其他租户共享。规格选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。更多选项永久保存日志选择是否打开“永久保存日志”开关。开

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用Msprobe工具分析偏差 - AI开发平台ModelArts

进行数据Dump。task指定为statistics表示使用统计量模式，该模式下针对整网训练API输入输出保存最大值、最小值、均值等统计量信息比对，落盘数据量较小。GPU和NPU环境依次进行数据Dump，正常执行结束标识如下图回显Exception: msprobe: exit after

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > Dit模型PyTorch迁移与精度性能调优 > 精度对齐
SFT全参微调训练 - AI开发平台ModelArts

kenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建SFT全参微调训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
LoRA微调训练 - AI开发平台ModelArts

parallel size)流水线模型并行策略，具体详细参数配置如表2所示。 Step2 创建LoRA微调训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及上传的镜像。训练脚本中会自动执行训练前的权重转换操作和数据处理操作。图1 选择镜像训练作业启动命令中输入：

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查看ModelArts模型事件 - AI开发平台ModelArts

查看。方便用户更清楚的了解创建模型过程，遇到任务异常时，更加准确的排查定位问题。可查看的事件点包括：事件类型事件信息（“XXX”表示占位符，以实际返回信息为准）解决方案正常开始导入模型。 Start model import. - 异常构建镜像失败。 Failed to

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
获取Workflow工作流列表 - AI开发平台ModelArts

Query参数参数是否必选参数类型描述 name 否 String 工作流名称。 description 否 String 工作流描述信息。 status 否 String 工作流状态。 labels 否 String 工作流标签。 template_id 否 String 工作流模板ID。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
分离部署推理服务 - AI开发平台ModelArts

group_id="0")代表Scheduler实例的ip信息，只能有一个实例。第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.908） > 部署推理服务
分离部署推理服务 - AI开发平台ModelArts

group_id="0")代表Scheduler实例的ip信息，只能有一个实例。第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.909） > 部署推理服务
MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

environ['PS_RESEND'] = '1' 其中，“os.environ['PS_VERBOSE'] = '2'”为打印所有的通信信息。“os.environ['PS_RESEND'] = '1'”为在“PS_RESEND_TIMEOUT”毫秒后没有收到ACK消息，Van实例会重发消息。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
发布本地AI应用到AI Gallery - AI开发平台ModelArts

运行时长控制，单击“确定”。在“所在区”选择计算规格所在的区域。默认显示全部区域的计算规格。选择计算规格不可用的资源会置灰。右侧“配置信息”区域会显示计算规格的详细数据，AI Gallery会基于资产和资源情况分析该任务是否支持设置“商品数量”，用户可以基于业务需要选择任务所需的资源卡数。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

模型列表页面。单击左上角的“创建模型”，进入“创建模型”页面。在“创建模型”页面，填写相关参数。填写模型基本信息，详细参数说明请参见表1。表1 模型基本信息参数说明参数名称说明名称模型名称。支持1～64位可见字符（含中文），名称可以包含字母、中文、数字、中划线、下划线。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

可以在5的回显信息中获取。图4 成功执行动态路由的回显只有任务节点大于等于3的训练任务才能成功执行动态路由。如果执行失败可以参考故障排除：ranktable路由优化执行失败处理。故障排除：ranktable路由优化执行失败故障现象容器日志有error信息。可能原因

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
分离部署推理服务 - AI开发平台ModelArts

group_id="0")代表Scheduler实例的ip信息，只能有一个实例。第二个元素(group_id="1")代表全量实例信息，长度即为全量实例个数。其中需要配置每个全量实例的ip信息以及使用的device信息。rank_id为逻辑卡号，必然从0开始计算，device_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910） > 部署推理服务
管理和查看数据处理任务 - AI开发平台ModelArts

本管理页面。您可以在该页面进行数据处理任务的“修改”与“删除”。图1 数据处理版本管理页面您可以在版本管理页面，通过切换页签查看“配置信息”、“日志”和“结果展示”。图2 日志页面图3 结果展示页面父主题：处理ModelArts数据集中的数据

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据

总条数： 1101

上一页
1
...
33
34
35
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建模型成功后，部署服务报错，如何排查代码问题 - AI开发平台ModelArts

开发环境管理 - AI开发平台ModelArts

PD分离部署使用说明 - AI开发平台ModelArts

使用自动分组智能标注作业 - AI开发平台ModelArts

如何在ModelArts的Notebook中配置Conda源？ - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

使用Msprobe工具分析偏差 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

查看ModelArts模型事件 - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

MXNet创建kvstore时程序被阻塞，无报错 - AI开发平台ModelArts

发布本地AI应用到AI Gallery - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

在Lite Cluster资源池上使用ranktable路由规划完成Pytorch NPU分布式训练 - AI开发平台ModelArts

分离部署推理服务 - AI开发平台ModelArts

管理和查看数据处理任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线