搜索_华为云

执行预训练任务 - AI开发平台ModelArts

sh scripts/llama2/0_pl_pretrain_13b.sh 注意：如果单机运行需要指定使用NPU卡的数量，可提前定义变量 NPUS_PER_NODE 。例如使用单机四卡训练Llama2-7B命令： MASTER_ADDR=localhost NNODES=1 NODE_RANK=0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909）
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

参数类型。 - continuous：指定时表示这个超参是连续类型的。连续类型的超参在算法使用于训练作业时，控制台显示为输入框。 - discrete：指定时表示这个超参是离散类型的。离散类型的超参在算法使用于训练作业时，控制台显示为下拉选择框架。 lower_bound 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
启动智能任务 - AI开发平台ModelArts

Boolean 是否通过图片色彩来聚类。 inf_cluster_id 否 String 专属集群ID，默认为空，不使用专属集群；使用专属集群部署服务时需确保集群状态正常；配置此参数后，则使用集群的网络配置，vpc_id参数不生效。 inf_config_list 否 Array of InfConfig

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
删除APP - AI开发平台ModelArts
删除APP - AI开发平台ModelArts

描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选参数类型描述 Content-Type 否 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
数据管理计费项 - AI开发平台ModelArts

存储到OBS中的数据需在OBS控制台进行手动删除。如果未删除，则会按照OBS的计费规则进行持续计费。按需计费包年/包月创建桶不收取费用，按实际使用的存储容量和时长收费计费示例以下案例中出现的费用价格仅供参考，实际价格请参见各服务价格详情。示例：存储费用假设用户于2023年4月

 帮助中心 > AI开发平台ModelArts > 计费说明 > 计费项
断点续训和故障快恢说明 - AI开发平台ModelArts

存路径${output_dir}/saved_checkpoints（加载故障快恢路径）必须为空，否则此参数无效断点续训失效。如果就是使用最新的训练权重进行断点续训（暂停+启动场景），那么可以同时指定train_auto_resume =1和 ${user_converted

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
断点续训和故障快恢说明 - AI开发平台ModelArts

存路径${output_dir}/saved_checkpoints（加载故障快恢路径）必须为空，否则此参数无效断点续训失效。如果就是使用最新的训练权重进行断点续训（暂停+启动场景），那么可以同时指定train_auto_resume =1和 ${user_converted

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明参考
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909）
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912）
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910）
在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

“数据集输出位置”，指在ModelArts完成数据标注后，执行数据集发布操作后，在此指定路径下，按数据集版本，生成相关目录。包含ModelArts中使用的Manifest文件（包含数据及标注信息）。详细文件说明可参见数据集发布后，相关文件的目录结构说明。查看步骤在ModelArts管理控制台，进入“数据管理>数据集”。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
配置Lite Cluster网络 - AI开发平台ModelArts

配置Lite Cluster网络本章节介绍如何申请弹性公网IP并绑定到弹性云服务器。通过本文档，您可以实现弹性云服务器访问公网的目的。使用华为云账号登录CCE管理控制台。找到购买Cluster资源时选择的CCE集群，单击名称进入CCE集群详情页面，单击“节点管理”页签，在“

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
查看日志和性能 - AI开发平台ModelArts

参数查看表1。 loss收敛情况：日志里存在lm loss参数，lm loss参数随着训练迭代周期持续性减小，并逐渐趋于稳定平缓。也可以使用可视化工具TrainingLogParser查看loss收敛情况，如图2所示。单节点训练：训练过程中的loss直接打印在窗口上。多节点

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911）
查询标注团队详情 - AI开发平台ModelArts

workforce_name String 标注团队名称。 workspace_id String 工作空间ID。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求示例查询标注团队详情 GET https://{endpoint}/v2/{project_id}/w

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
管理Workflow StepExecution - AI开发平台ModelArts

数据约束条件。 value 否 Map<String,Object> 数据的值。 used_steps 否 Array of strings 使用了这条数据的工作流节点。 delay 否 Boolean 延时参数标记。表4 Constraint 参数是否必选参数类型描述 attribute

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

参数类型。 - continuous：指定时表示这个超参是连续类型的。连续类型的超参在算法使用于训练作业时，控制台显示为输入框。 - discrete：指定时表示这个超参是离散类型的。离散类型的超参在算法使用于训练作业时，控制台显示为下拉选择框架。 lower_bound 否 String

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
总览Workflow工作流 - AI开发平台ModelArts

描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 search_type 否 String 过滤方式。可选值如下： equal表示精确匹配。 contain表示模糊匹配。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
查询APP是否存在 - AI开发平台ModelArts

描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
advisor分析报告html文件详解 - AI开发平台ModelArts

计算维度，检测动态shape，动态shape会触发频繁的算子编译。 computation - operator bound 计算维度，算子计算性能分析，例如算子是否充分使用AICORE核数。 schedule - synchronize stream 下发维度，异常同步流分析，过多同步流会打断CPU侧任务异步下发。

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于advisor的昇腾训练性能自助调优指导
断点续训和故障快恢说明 - AI开发平台ModelArts

存路径${output_dir}/saved_checkpoints（加载故障快恢路径）必须为空，否则此参数无效断点续训失效。如果就是使用最新的训练权重进行断点续训（暂停+启动场景），那么可以同时指定train_auto_resume =1和 ${user_converted

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明

总条数： 2126

上一页
1
...
97
98
99
...
107
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

执行预训练任务 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

启动智能任务 - AI开发平台ModelArts

删除APP - AI开发平台ModelArts

数据管理计费项 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

在ModelArts中数据标注完成后，标注结果存储在哪里？ - AI开发平台ModelArts

配置Lite Cluster网络 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

查询标注团队详情 - AI开发平台ModelArts

管理Workflow StepExecution - AI开发平台ModelArts

创建算法 - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

查询APP是否存在 - AI开发平台ModelArts

advisor分析报告html文件详解 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线