搜索_华为云

释放Lite Server资源 - AI开发平台ModelArts

Server资源仅在创建失败或错误状态下，才可以删除，其它状态下仅支持退订。退订“包年/包月”的Lite Server资源您可通过以下方式进行退订：方式一：在ModelArts界面退订（单个实例资源退订）方式二：在费用中心退订（单个/批量实例资源退订）在ModelArts界面退订登录ModelArts管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
发布Workflow到ModelArts - AI开发平台ModelArts

description="每训练n个epoch做一次验证")), wf.AlgorithmParameters(name="save_model_secs", value=wf.Placeholder(name="save_model_secs", placeholder_type=wf

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

submit命令提交ModelArts训练作业。 ma-cli ma-job submit命令需要指定一个位置参数YAML_FILE表示作业的配置文件路径，如果不指定该参数，则表示配置文件为空。配置文件是一个YAML格式的文件，里面的参数就是命令的option参数。此外，如果用户在命令行中同时

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

从指标源下拉列表选择“Prometheus_AOM_Default”实例。图1 选择指标源通过“全量指标”或“按普罗语句添加”方式选择一个或多个关注的指标。图2 添加指标关于更多指标浏览方法请参考华为云帮助中心“应用运维管理 AOM> 用户指南（2.0）> 指标浏览”。容器级别的指标介绍

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
在ModelArts Standard上运行GPU训练任务的场景介绍 - AI开发平台ModelArts

SFS Turbo的存储加速实践。表1 不同场景所需服务及购买推荐场景 OBS SFS SWR DEW ModelArts VPC ECS EVS 单机单卡按需购买（并行文件系统） × 免费免费包月购买免费 × 按需购买单机多卡 × 包月购买（HPC型500G）免费

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练任务
增量模型训练 - AI开发平台ModelArts

Learning）是机器学习领域中的一种训练方法，它允许人工智能（AI）模型在已经学习了一定知识的基础上，增加新的训练数据到当前训练流程中，扩展当前模型的知识和能力，而不需要从头开始。增量训练不需要一次性存储所有的训练数据，缓解了存储资源有限的问题；另一方面，增量训练节约了重新训练中需要消耗大量算力、时间以及经济成本。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

关键资源（GPU、NPU、CPU、Memory等）的使用情况并上报到AOM，用户可直接在AOM上查看默认配置好的基础指标，也支持用户自定义一些指标项上报到AOM查看。此外，还支持在ModelArts Lite Cluster上安装Prometheus开源监控工具，方便用户使用Prometheus工具在Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

打开Terminal，用命令行进行操作。方法一：执行cd checkpoints命令打开checkpoints文件夹。方法二：新建一个文件夹，移动checkpoints文件夹的数据到新建的文件夹下。执行mkdir xxx命令，新建一个文件夹，例如“xxx”（不要用checkpoints关键字命名）

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 其他故障
如何获取访问密钥？ - AI开发平台ModelArts

“credentials.csv”的文件，即可查看访问密钥（Access Key Id和Secret Access Key）。父主题：一般性问题

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
查询Notebook支持的有效规格列表 - AI开发平台ModelArts

是否必选参数类型描述 category 否 String 规格处理器类型。 CPU GPU ASCEND limit 否 Integer 每一页的数量，默认不限制。 offset 否 Integer 分页记录的起始位置偏移量，默认值0。 type 否 String 集群类型。枚举值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
训练过程中无法找到so文件 - AI开发平台ModelArts

cuda版本不一致。处理方法编译环境的cuda版本与训练环境不一致，训练作业运行就会报错。例如：使用cuda版本为10的开发环境tf-1.13中编译生成的so包，在cuda版本为9.0训练环境中tf-1.12训练会报该错。编译环境和训练环境的cuda版本不一致时，可参考如下处理方法：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
模型训练存储加速 - AI开发平台ModelArts

模型训练存储加速针对AI训练场景中大模型Checkpoint保存和加载带来的I/O挑战，华为云提供了基于对象存储服务OBS+高性能弹性文件服务SFS Turbo的AI云存储解决方案，如下图所示。 SFS Turbo HPC型支持和OBS数据联动，您可以通过SFS Turbo H

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
用户AK-SK认证模式 - AI开发平台ModelArts

用户AK-SK认证模式本模式支持OBS管理、训练管理、模型管理、服务管理模块的鉴权。示例代码 1 2 from modelarts.session import Session session = Session(access_key='***',secret_key='***'

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
（可选）Session鉴权 - AI开发平台ModelArts

session = Session() 本地PC使用ModelArts SDK时，需要进行Session鉴权。鉴权方式可参考如下认证方式，选择其中一种方式进行认证即可。用户名密码认证模式：支持OBS管理、数据管理、训练管理、模型管理、服务管理的鉴权。用户AK-SK认证模式：支持O

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？问题现象原因分析当前本地网络原因，导致远程自动安装VS Code Server时间过长。解决方法

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > VS Code连接开发环境失败常见问题
如何在代码中打印GPU使用信息 - AI开发平台ModelArts

memory:3.1%} |") 执行nvidia_smi + wapper + prettytable命令。用户可以将GPU信息显示操作看作一个装饰器，在模型训练过程中就可以实时的显示GPU状态信息。 def gputil_decorator(func): def wrapper(*args

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 更多功能咨询
连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？问题现象原因分析当前本地网络原因，导致远程自动安装VS Code Server时间过长。解决方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
ModelArts最佳实践案例列表 - AI开发平台ModelArts

镜像对应功能场景说明基于ModelArts Standard一键完成商超商品识别模型部署 - 在线服务物体检测此案例以“商超商品识别”模型为例，完成从AI Gallery订阅模型，到ModelArts一键部署为在线服务的免费体验过程。第三方推理框架迁移到ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

上执行，这种情况可以通过输出日志来进行判断。自助性能调优三板斧基于上一步完成的性能测试，为了最大化模型推理性能，首先确保当前使用的CANN版本是最新版本（最新版本请见此处），每个迭代的CANN版本都有一定的性能收益。在此基础上，可以进行三板斧自助工具式性能调优。这些调优过程由

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
更新MaaS模型服务的模型权重 - AI开发平台ModelArts

开启权重文件校验。参考部署模型服务，用新建的模型部署模型服务。 “模型设置”选择上一步新建的模型。 “资源设置”和待升级的模型服务保持一致。其他参数自定义。参考调用MaaS部署的模型服务，用上一步部署的模型服务验证推理效果。如果推理结果正确，则使用该模型权重完成执行步骤2：滚动升级模型权重。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务

总条数： 1021

上一页
1
...
39
40
41
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

释放Lite Server资源 - AI开发平台ModelArts

发布Workflow到ModelArts - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

在ModelArts Standard上运行GPU训练任务的场景介绍 - AI开发平台ModelArts

增量模型训练 - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

Notebook中无法打开“checkpoints”文件夹 - AI开发平台ModelArts

如何获取访问密钥？ - AI开发平台ModelArts

查询Notebook支持的有效规格列表 - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

模型训练存储加速 - AI开发平台ModelArts

用户AK-SK认证模式 - AI开发平台ModelArts

（可选）Session鉴权 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

如何在代码中打印GPU使用信息 - AI开发平台ModelArts

连接远端开发环境时，一直处于"Setting up SSH Host xxx: Downloading VS Code Server locally"超过10分钟以上，如何解决？ - AI开发平台ModelArts

ModelArts最佳实践案例列表 - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

更新MaaS模型服务的模型权重 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线