搜索_华为云

分布式模型训练 - AI开发平台ModelArts

分布式模型训练分布式训练功能介绍创建单机多卡的分布式训练（DataParallel）创建多机多卡的分布式训练（DistributedDataParallel）示例：创建DDP分布式训练（PyTorch+GPU）示例：创建DDP分布式训练（PyTorch+NPU）父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
管理模型训练作业 - AI开发平台ModelArts

管理模型训练作业查看训练作业详情查看训练作业资源占用情况查看模型评估结果查看训练作业事件查看训练作业日志修改训练作业优先级使用Cloud Shell调试生产训练作业重建、停止或删除训练作业管理训练容器环境变量查看训练作业标签父主题：使用ModelArts Standard训练模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
Lite Server使用前必读 - AI开发平台ModelArts

Lite Server使用前必读 Lite Server使用流程 Lite Server高危操作一览表 Lite Server算力资源和镜像版本配套关系

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server）
在Windows上安装配置Grafana - AI开发平台ModelArts

其开启，如果已经开启，则直接进入4。登录Grafana。 Grafana默认在本地的3000端口启动，打开链接http://localhost:3000，出现Grafana的登录界面。首次登录用户名和密码为admin，登录成功后请根据提示修改密码。父主题：安装配置Grafana

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.906）
查询用户镜像组列表 - AI开发平台ModelArts

数据。 pages Integer 总的页数。 size Integer 每一页的数量。 total Long 总的记录数量。表4 ImageGroup 参数参数类型描述 name String 镜像名称。 create_at Long 镜像创建的时间，UTC毫秒。 namespace

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

ToolKit，协助用户完成代码上传、提交训练作业、将训练日志获取到本地展示等，用户只需要专注于本地的代码开发即可。使用PyCharm ToolKit连接Notebook 本地IDE（VS Code）当用户创建完成支持SSH的Notebook实例后，使用VS Code的开发者可以通过以下三种方式连接到开发环境中：VS

帮助中心 > AI开发平台ModelArts > 功能总览
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

patch 操作对服务进行更新查询服务监控信息查询服务列表部署服务查询支持的服务部署规格查询服务详情更新服务配置删除服务查询专属资源池列表查询服务事件日志启动停止边缘节点服务实例查询服务更新日志添加资源标签删除资源标签查询推理服务标签

 帮助中心 > AI开发平台ModelArts > API参考
推理性能测试 - AI开发平台ModelArts

静态性能测试：评估在固定输入、固定输出和固定并发下，模型的吞吐与首token延迟。该方式实现简单，能比较清楚的看出模型的性能和输入输出长度、以及并发的关系。动态性能测试：评估在请求并发在一定范围内波动，且输入输出长度也在一定范围内变化时，模型的延迟和吞吐。该场景能模拟实际业务下动态的发送不同长度请求，能评估推理框架在实际业务中能支持的并发数。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.905）
通过patch操作对服务进行更新 - AI开发平台ModelArts

String 操作路径，符合标准的Json PATCH格式，代表以服务详情的Json返回体为基准，想要执行替换的值的目标路径（Json PATH）。当前支持且仅支持对模型相关所有参数的替换更新，因此前缀固定为“/config/”。例如，当期望更新第一个模型中的实例数量，则路径为“/con

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

指令微调数据：如上述提供的 alpaca_gpt4_data.json 数据集，数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

指令微调数据：如上述提供的 alpaca_gpt4_data.json 数据集，数据集包含有以下字段： instruction：描述模型应执行的任务。指令中的每一条都是唯一的。 input：任务的可选上下文或输入。instruction 对应的内容会与 input 对应的内容拼接后作为指令，即指令为

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 准备工作
OOM导致训练作业失败 - AI开发平台ModelArts

hide_layer、cell_nums等。释放一些不需要的tensor，使用过的，如下： del tmp_tensor torch.cuda.empty_cache() 必现的问题，使用本地Pycharm远程连接Notebook调试超参。如果还存在问题，可能需要提工单进行定位，甚至需要隔离节点修复。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
创建失败的专属资源池删除后，控制台为什么还能看到？ - AI开发平台ModelArts

创建失败的专属资源池删除后，控制台为什么还能看到？在控制台页面操作删除专属资源池后，后端服务需要进行资源实例释放。在资源实例释放过程中，用户依然可以查询到资源池。如果需要创建专属资源池，建议等待5min后再创建，且不要使用已创建过的专属资源池名称来命名新建的专属资源池。如果做UI自动化测试，建议用例用随机串替代。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard资源池
日志提示"write line error" - AI开发平台ModelArts

排查数据集大小，checkpoint保存文件大小，是否占满了磁盘空间。必现的问题，使用本地Pycharm远程连接Notebook调试。建议与总结在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
导入数据到ModelArts数据集 - AI开发平台ModelArts

导入数据到ModelArts数据集数据导入方式介绍从OBS导入数据到ModelArts数据集从DWS导入数据到ModelArts数据集从DLI导入数据到ModelArts数据集从MRS导入数据到ModelArts数据集从本地上传数据到ModelArts数据集父主题：

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
管理AI应用 - AI开发平台ModelArts

管理AI应用查看AI应用详情查看AI应用事件管理AI应用版本发布AI应用父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
创建AI应用 - AI开发平台ModelArts

创建AI应用创建AI应用不同方式的场景介绍从训练作业中导入AI应用文件创建模型从OBS中导入AI应用文件创建模型从容器镜像中导入AI应用文件创建模型从AI Gallery订阅模型父主题：使用ModelArts Standard部署模型并推理预测

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测
删除开发环境实例 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。 instance_id 是 String 实例ID。请求消息无请求参数。响应消息响应参数如表2所示。表2 响应参数参数参数类型说明 instance_id String 实例ID。请求示例如下以删除

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
下线公告 - AI开发平台ModelArts
下线公告 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务模型转换下线公告【下线公告】华为云ModelArts旧版自动学习下线公告【下线公告】华为云ModelArts自动学习模块的文本分类功能下线公告【下线公告】华为云ModelArts服务旧版数据集下线公告【下线公告】华为云ModelArts MindStudio/ML

帮助中心 > AI开发平台ModelArts > 服务公告

总条数： 2006

上一页
1
...
56
57
58
...
101
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分布式模型训练 - AI开发平台ModelArts

管理模型训练作业 - AI开发平台ModelArts

Lite Server使用前必读 - AI开发平台ModelArts

在Windows上安装配置Grafana - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查询用户镜像组列表 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

通过patch操作对服务进行更新 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

OOM导致训练作业失败 - AI开发平台ModelArts

创建失败的专属资源池删除后，控制台为什么还能看到？ - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

导入数据到ModelArts数据集 - AI开发平台ModelArts

管理AI应用 - AI开发平台ModelArts

创建AI应用 - AI开发平台ModelArts

删除开发环境实例 - AI开发平台ModelArts

下线公告 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线