搜索_华为云

查看日志和性能 - AI开发平台ModelArts

time per iteration)*1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
查看日志和性能 - AI开发平台ModelArts

time per iteration)×1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907）
查看日志和性能 - AI开发平台ModelArts

time per iteration)*1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
查询专属资源池列表 - AI开发平台ModelArts

描述 total_count Integer 不分页的情况下符合查询条件的总集群数量。 count Integer 当前查询结果的集群数量，不设置offset、limit查询参数时，count与total相同。 clusters Array of Cluster objects 查询到的集群列表。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
迁移评估 - AI开发平台ModelArts
迁移评估 - AI开发平台ModelArts

（https://github.com/AUTOMATIC1111/stable-diffusion-webui）。如果是基于其他开源，需要附带开源代码仓地址。 - 具体使用库例如：使用了哪个pipeline （例如lpw_stable_diffusion.py）。使用了哪个huggingface的模型

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
基于MindSpore Lite的模型转换 - AI开发平台ModelArts

Lite提供的模型convertor工具可以支持主流的模型格式到MindIR的格式转换，用户需要导出对应的模型文件，推荐导出为ONNX格式。如何导出ONNX模型 PyTorch转ONNX，操作指导请见此处。 PyTorch导出ONNX模型样例如下： import torch import

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导 > 模型适配
创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

sampler, 基于当前的epoch为其设置随机数，避免加载到重复数据 ### tr_sampler.set_epoch(epoch) ### 分布式改造，DDP sampler, 基于当前的epoch为其设置随机数，避免加载到重复数据 ###

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器、NPU节点数及其他配置。具体优化工具使用说明可参考如何选择最佳性能的zero-stage和-offloads。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
自动学习训练作业失败 - AI开发平台ModelArts

数据源”，将OBS中的数据重新同步至ModelArts中。检查OBS的访问权限如果OBS桶的访问权限设置无法满足训练要求时，将会出现训练失败。请排查如下几个OBS的权限设置。当前账号具备OBS桶的读写权限（桶ACLs）进入OBS管理控制台，选择当前自动学习项目使用的OBS桶，单击桶名称进入概览页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 模型训练
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

免由服务端发起关闭连接。如您使用的Gunicorn来作为web server，可以通过Gunicorn命令的--keep-alive参数来设置该值。其他方式导入的模型，服务内部已做处理。协议错误请求报错：{"error_code":"ModelArts.4503", "error_msg":"Failed

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
审计与日志 - AI开发平台ModelArts

出于分析或审计等目的，用户可以开启ModelArts的日志记录功能。在您开启了云审计服务后，系统会记录ModelArts的相关操作，且控制台保存最近7天的操作记录。本节介绍如何在云审计服务管理控制台查看最近7天的操作记录。对接云审计服务的配置方法请参见查看审计日志章节。父主题：安全

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
升级Standard专属资源池驱动 - AI开发平台ModelArts

“按实例数量”两种滚动方式。按节点比例：每批次驱动升级的实例数量为“节点比例*资源池实例总数”。按实例数量：每批次驱动升级的实例数量为设置的实例数量。对于不同的升级方式，滚动升级选择节点的策略会不同：如果升级方式为安全升级，则根据滚动实例数量选择无业务的节点，隔离节点并滚动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

对于首次使用ModelArts新用户，请直接新增委托即可。一般用户新增普通用户权限即可满足使用要求。如果有精细化权限管理的需求，可以自定义权限按需设置。如果未获得委托授权，当打开“访问授权”页面时，ModelArts会提醒您当前用户未配置授权，需联系此IAM用户的管理员账号进行委托授权。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
查看日志和性能 - AI开发平台ModelArts

time per iteration)×1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。图2 查看日志和性能

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912）
上传本地文件至JupyterLab - AI开发平台ModelArts

图8 打开OBS File Browser 方式三：单击“使用默认路径”完成。图9 使用默认路径上传文件图10 设置本地文件OBS中转路径完成OBS中转路径设置后，开始上传文件。图11 上传文件解压缩文件包将文件以压缩包形式上传至Notebook JupyterLab后，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发 > 上传文件至JupyterLab
上传算法至SFS - AI开发平台ModelArts

准备obsutil_linux_amd64.tar.gz的分享链接单击此处下载obsutil_linux_amd64.tar.gz，将其上传至OBS桶中，设置为公共读。单击属性，单击复制链接。链接样例如下： https://${bucketname_name}.obs.cn-north-4.myhuaweicloud

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
查看日志和性能 - AI开发平台ModelArts

time per iteration)*1000，其global batch size（GBS）、seq_len（SEQ_LEN）为训练时设置的参数，具体参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912）
托管数据集到AI Gallery - AI开发平台ModelArts

支持管理托管的资产文件，例如在线预览、下载、删除文件。只支持预览大小不超过10MB、格式为文本类或图片类的文件。支持编辑资产介绍。每个资产介绍可分为基础设置和使用描述。基础设置部分包含了该资产所有重要的结构化元数据信息。选择填入的信息将会变成该模型资产的标签，并且自动同步在模型描述部分，保存到“README

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
查看训练作业详情 - AI开发平台ModelArts

容器运行时的用户ID。 “本地代码目录” 训练代码在训练容器中的存放路径。 “工作目录” 训练启动文件在训练容器中的路径。 “实例数” 本次训练作业设置的实例数。 “专属资源池” 专属资源池信息，仅当训练作业使用专属资源池时可见。 “实例规格” 本次训练作业使用的训练规格。 “输入-输入路径”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
创建APP - AI开发平台ModelArts
创建APP - AI开发平台ModelArts

表2 请求Header参数参数是否必选参数类型描述 Content-Type 否 String 消息体的类型。设置为text/plain，返回临时预览链接。设置为application/octet-stream，返回临时下载链接。 X-Auth-Token 是 String 用户token

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理

总条数： 1492

上一页
1
...
63
64
65
...
75
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查询专属资源池列表 - AI开发平台ModelArts

迁移评估 - AI开发平台ModelArts

基于MindSpore Lite的模型转换 - AI开发平台ModelArts

创建多机多卡的分布式训练（DistributedDataParallel） - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

自动学习训练作业失败 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

审计与日志 - AI开发平台ModelArts

升级Standard专属资源池驱动 - AI开发平台ModelArts

个人用户快速配置ModelArts访问权限 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

上传本地文件至JupyterLab - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

托管数据集到AI Gallery - AI开发平台ModelArts

查看训练作业详情 - AI开发平台ModelArts

创建APP - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线