搜索_华为云

推理精度测试 - AI开发平台ModelArts

上使用transformers进行推理，因为没有框架的优化，执行时间最长。另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。在昇腾卡上执行时，需要在 opencompass/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.910）
配置ModelArts委托权限 - AI开发平台ModelArts

rts服务声明》”，然后单击“创建”。图1 配置委托访问授权完成配置后，在ModelArts控制台的权限管理列表，可查看到此账号的委托配置信息。图2 查看委托配置信息父主题：权限配置

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 基本配置 > 权限配置
日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

标注的数据是不符合规格的（如目标检测算法要求标注为矩形框，但是提供数据标注为非矩形框）。处理方法请您检查数据是否已标注，或检查数据标注是否符合算法要求。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
查看训练作业标签 - AI开发平台ModelArts

查看训练作业标签通过给训练作业添加标签，可以标识云资源，便于快速搜索训练作业。在ModelArts管理控制台的左侧导航栏中选择“模型训练 > 训练作业”。在训练作业列表中，单击作业名称进入训练作业详情页面。在训练作业详情页面，单击“标签”页签查看标签信息。支持添加、修改

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

model_baseline_performance表示调优前模型执行时间，单位为ms。 model_performance_improvement表示调优后模型执行时间减少百分比。 model_result_performance表示调优后模型执行时间。 repo_summary中的信息表示调优过程

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
查询Workflow工作流 - AI开发平台ModelArts

查询Workflow工作流功能介绍通过ID查询Workflow工作流详情。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{pro

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
在线服务预测报错MR.0105 - AI开发平台ModelArts

部署为在线服务，服务处于运行中状态，预测时报错：{ "erno": "MR.0105", "msg": "Recognition failed","words_result": {}}。图1 预测报错原因分析请在“在线服务”详情页面的日志页签中查看对应的报错日志，分析报错原因。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
查询Notebook实例列表 - AI开发平台ModelArts

取值为准。表8 Lease 参数参数类型描述 create_at Long 实例创建的时间，UTC毫秒。 duration Long 实例运行时长，以创建时间为起点计算，即“创建时间+duration > 当前时刻”时，系统会自动停止实例。 enable Boolean 是否启用自动停止功能。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
日志提示“ValueError: label - AI开发平台ModelArts

发生。例如，训练集中的标签共有4个，验证集中的标签只有3个。处理方法请您保持数据中训练集和验证集的标签数量一致。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
推理精度测试 - AI开发平台ModelArts

上使用transformers进行推理，因为没有框架的优化，执行时间最长。另一方面，由于是使用transformers推理，结果也是最稳定的。对单卡运行的模型比较友好，算力利用率比较高。对多卡运行的推理，缺少负载均衡，利用率低。在昇腾卡上执行时，需要在 opencompass/

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.911）
查询所有Notebook实例列表 - AI开发平台ModelArts

取值为准。表8 Lease 参数参数类型描述 create_at Long 实例创建的时间，UTC毫秒。 duration Long 实例运行时长，以创建时间为起点计算，即“创建时间+duration > 当前时刻”时，系统会自动停止实例。 enable Boolean 是否启用自动停止功能。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
查询Workflow待办事项 - AI开发平台ModelArts

total Integer 条目个数。表4 WorkflowTodo 参数参数类型描述 time String 时间。 duration Integer 运行时长。 workflow_id String Workflow工作流ID。 workflow_name String

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
分布式训练功能介绍 - AI开发平台ModelArts

DistributedDataParallel进行多机多卡训练的优缺点通信更快：相比于DP，通信速度更快负载相对均衡：相比于DP，GPU负载相对更均衡运行速度快：因为通信时间更短，效率更高，能更快速地完成训练作业。相关章节创建单机多卡的分布式训练（DataParallel）：介绍单机多卡数据并行分布式训练原理和代码改造点。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

X。具体操作请参见修改虚拟私有云网段。如果满足条件，则继续下一步。查看SFS Turbo的VPC网段的安全组是否被限制了。在所选专属资源池中新建一个未挂载的SFS Turbo的训练作业，当训练作业处于“运行中”时，通过Cloud Shell功能登录训练作业worker-0实例，使用curl

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 专属资源池创建训练作业
如何关闭Mox的warmup - AI开发平台ModelArts

进行训练。原因分析 Tensorflow分布式有多种执行模式，mox会通过4次执行50 step记录执行时间，选择执行时间最少的模型。处理方法创建训练作业时，在“运行参数”中增加参数“variable_update=parameter_server”来关闭Mox的warmup。

帮助中心 > AI开发平台ModelArts > 故障排除 > MoXing
如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？问题现象 Notebook中，运行训练代码出现如下错误。 cudaCheckError() failed : no kernel image is available for execution on the device

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 代码运行故障
查询训练作业详情 - AI开发平台ModelArts

Integer 本次运行开始时间的unix时间戳，单位为秒(s)。 end_at Integer 本次运行结束时间的unix时间戳，单位为秒(s)。 start_type String 本地运行的启动方式： init_or_rescheduled：代表本次启动为被调度后的首次运行，包括初次启动及调度恢复后的运行。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

署，工作流发布至运行态后，部分运行的开关默认关闭，节点全部运行。用户可在权限管理页面打开开关，选择指定的场景进行运行。部分运行能力支持同一个节点被定义在不同的运行场景中，但是需要用户自行保证节点之间数据依赖的正确性。另外，部分运行能力仅支持在运行态进行配置运行，不支持在开发态进行调试。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > Workflow高阶能力
日志提示“Please set the train_url to an empty obs directory” - AI开发平台ModelArts

径不是空目录，会出现该报错。处理方法对于不支持断点训练的模型，请您将模型的输出路径train_url设置为空目录。父主题：预置算法运行故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 预置算法运行故障
修改模型服务QPS - AI开发平台ModelArts

配置可能导致用户等待时间延长，影响满意度。因此，能够灵活调整模型的QPS对于保障服务性能、优化用户体验、维持业务流畅及控制成本至关重要。 ModelArts Studio大模型即服务平台支持手动修改模型服务的实例流量限制QPS，该操作不会影响部署服务的正常运行。约束限制仅当模

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务

总条数： 1776

上一页
1
...
8
9
10
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

推理精度测试 - AI开发平台ModelArts

配置ModelArts委托权限 - AI开发平台ModelArts

日志提示“root: XXX valid number is 0” - AI开发平台ModelArts

查看训练作业标签 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

查询Workflow工作流 - AI开发平台ModelArts

在线服务预测报错MR.0105 - AI开发平台ModelArts

查询Notebook实例列表 - AI开发平台ModelArts

日志提示“ValueError: label - AI开发平台ModelArts

推理精度测试 - AI开发平台ModelArts

查询所有Notebook实例列表 - AI开发平台ModelArts

查询Workflow待办事项 - AI开发平台ModelArts

分布式训练功能介绍 - AI开发平台ModelArts

创建训练作业时出现“实例挂卷失败”的事件 - AI开发平台ModelArts

如何关闭Mox的warmup - AI开发平台ModelArts

如何解决训练过程中出现的cudaCheckError错误？ - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

在Workflow中指定仅运行部分节点 - AI开发平台ModelArts

日志提示“Please set the train_url to an empty obs directory” - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线