搜索_华为云

更新训练作业描述 - AI开发平台ModelArts

training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。请求参数表2 请求Body参数参数是否必选参数类型描述 description 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。响应参数无请求示例

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
管理员和开发者权限分离 - AI开发平台ModelArts

rts专属资源池的完全控制权限，以及Notebook所有实例的访问和操作权限。普通开发者使用开发环境，只需关注对自己Notebook实例的操作权限，包括对自己实例的创建、启动、停止、删除等权限以及周边依赖服务的权限。普通开发者不需要ModelArts专属资源池的操作权限，也不需要查看其他用户的Notebook实例。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
训练作业性能降低 - AI开发平台ModelArts

训练作业性能降低问题现象使用ModelArts平台训练算法训练耗时增加。原因分析可能存在如下原因：平台上的代码经过修改优化、训练参数有过变更。训练的GPU硬件工作出现异常。处理方法请您对作业代码进行排查分析，确认是否对训练代码和参数进行过修改。检查资源分配情况（

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业性能问题
获取超参敏感度分析结果 - AI开发平台ModelArts

Array<Array<String>> 超参搜索某个trial结果的每条数据列表。请求示例如下查询training_job_id为04f679b17380d32a2f32c00335c4b5ba作业的超参敏感度分析结果。 GET https://endpoint/v2/{project_id}/tr

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
断点续训练 - AI开发平台ModelArts

断点续训练是指因为某些原因导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
断点续训练 - AI开发平台ModelArts

t接续训练。当需要从训练中断的位置接续训练，只需要加载checkpoint，并用checkpoint信息初始化训练状态即可。用户需要在代码里加上reload ckpt的代码，使能读取前一次训练保存的预训练模型。断点续训练操作过程 GLM3-6B的断点续训脚本glm3_base

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > GLM3-6B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

3567：用户只能访问自己账号下的obs目录，ModelArts在读取其他用户obs下的数据时，需要用户委托权限，没有创建委托，就没有权限使用其他用户obs中的数据。登录ModelArts控制台，管理控制台，在左侧导航栏中选择“权限管理”，单击“查看权限”，检查是否配置了obs的委托权限。图1

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
断点续训练 - AI开发平台ModelArts

断点续训练是指因为某些原因导致训练作业还未完成就被中断，下一次训练可以在上一次的训练基础上继续进行。这种方式对于需要长时间训练的模型而言比较友好。断点续训练是通过checkpoint机制实现。checkpoint机制是在模型训练的过程中，不断地保存训练结果（包括但不限于EPOCH、模型权重、优

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
Notebook中安装依赖包报错ERROR: HTTP error 404 while getting xxx - AI开发平台ModelArts

在Notebook中安装依赖包时报错，报错截图如下：原因分析 pypi源没有这个包或源不可用。解决方案使用别的源下载。 pip install -i 源地址包名父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
部署服务 - AI开发平台ModelArts
部署服务 - AI开发平台ModelArts

必须大于0，不配置默认值为1。当小于1时，代表滚动升级时增加的实例数的百分比；当大于1时，代表滚动升级时最大扩容的实例数。 max_unavailable 否 Float 必须大于0，不配置默认值为0。当小于1时，代表滚动升级时允许缩容的实例数的百分比；当大于1时，代表滚动升级时允许缩容的实例数。 terminat

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
订阅免费算法 - AI开发平台ModelArts

算法”，进入算法页面，该页面展示了所有共享的算法。搜索业务所需的算法，请参见查找资产。单击目标算法进入详情页面。在详情页面您可以查看算法的“描述”、“交付、”“限制”、“版本”、“关联资产”和“评论”等信息。为方便您的使用，在订阅算法时，建议您查看算法详情页“版本”页签中关于算法对应版本的“使用约束”，准备对应的数据和资源规格后进行使用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 订阅使用
注册伙伴 - AI开发平台ModelArts
注册伙伴 - AI开发平台ModelArts

根据界面提示，填写注册成为合作伙伴需要提供的信息。单击“提交”，AI Gallery的运营人员将会审核您的申请，后续您可以在“我的Gallery > 合作伙伴”里查看审核进展以及审核结果。图1 查看审核进度父主题：合作伙伴

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 合作伙伴
授权API至APP - AI开发平台ModelArts

授权API至APP 功能介绍将指定的API授权给APP。API的认证方式必须为APP认证，APP的创建用户必须是API所属服务的创建者，且请求用户对API所属服务必须有更新权限。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

用户可实现在租户账号下管理个人的作业与资源。下线旧版自动学习对现有用户的使用是否有影响？用户将无法再使用旧版自动学习的功能，且因旧版自动学习文件均存储于ModelArts统一管理账号下，用户无法找回旧版自动学习的作业记录。旧版自动学习如何升级到新版自动学习？请参考新版自动学习指导文档来体验新版自动学习。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
使用CTS审计ModelArts服务 - AI开发平台ModelArts

使用CTS审计ModelArts服务 ModelArts支持云审计的关键操作查看ModelArts相关审计日志

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard）
自定义模型规范 - AI开发平台ModelArts

Gallery除了支持托管文本生成和文本问答任务类型的模型，还支持托管其他任务类型的模型，其他任务类型的模型被称为自定义模型。但是托管的自定义模型要满足规范才支持使用AI Gallery工具链服务（微调大师、在线推理服务）。自定义模型的使用流程托管模型到AI Gallery。模型基础设置里的“任务类型”选择除“文本问答”和“文本生成”之外的类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
模型训练使用流程 - AI开发平台ModelArts

训练高可靠性查看训练结果和日志查看训练作业详情训练作业运行中或运行结束后，可以在训练作业详情页面查看训练作业的参数设置，训练作业事件等。查看训练作业日志训练日志用于记录训练作业运行过程和异常信息，可以通过查看训练作业日志定位作业运行中出行的问题。表2 训练作业的创建方式介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
Standard Workflow - AI开发平台ModelArts

Workflow是开发者基于实际业务场景开发用于部署模型或应用的流水线工具，核心是将完整的机器学习任务拆分为多步骤工作流，每个步骤都是一个可管理的组件，可以单独开发、优化、配置和自动化。Workflow有助于标准化机器学习模型生成流程，使团队能够大规模执行AI任务，并提高模型生成的效率。 ModelArts W

帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
Cann软件与Ascend驱动版本不匹配 - AI开发平台ModelArts

原因分析当昇腾规格的训练作业在ModelArts训练平台上运行时，会自动对Cann软件与Ascend驱动的版本匹配情况进行检查。如果平台发现版本不匹配，则会立即训练失败，避免后续无意义的运行时长。解决方案专属资源池的Ascend驱动版本需与训练基础镜像中的Cann软件版本版本匹配。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > Ascend相关问题
释放Standard专属资源池和删除网络 - AI开发平台ModelArts

可切换“训练作业”、“推理服务”、“开发环境”页签查看资源池上创建的训练作业、部署的推理服务、创建的Notebook实例。图1 删除资源池释放游离节点如果您的资源中存在游离节点（即没有被纳管到资源池中的节点），您可在“专属资源池 > 弹性集群 >节点”下查看此类节点的相关信息。图2 节点页签

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池

总条数： 1729

上一页
1
...
67
68
69
...
87
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

更新训练作业描述 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

训练作业性能降低 - AI开发平台ModelArts

获取超参敏感度分析结果 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

批量服务输入/输出obs目录不存在或者权限不足 - AI开发平台ModelArts

断点续训练 - AI开发平台ModelArts

Notebook中安装依赖包报错ERROR: HTTP error 404 while getting xxx - AI开发平台ModelArts

部署服务 - AI开发平台ModelArts

订阅免费算法 - AI开发平台ModelArts

注册伙伴 - AI开发平台ModelArts

授权API至APP - AI开发平台ModelArts

【下线公告】华为云ModelArts旧版自动学习下线公告 - AI开发平台ModelArts

使用CTS审计ModelArts服务 - AI开发平台ModelArts

自定义模型规范 - AI开发平台ModelArts

模型训练使用流程 - AI开发平台ModelArts

Standard Workflow - AI开发平台ModelArts

Cann软件与Ascend驱动版本不匹配 - AI开发平台ModelArts

释放Standard专属资源池和删除网络 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线