搜索_华为云

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

Shell登录容器镜像中调试。在Cloud Shell中调试多节点训练作业时，需要在Cloud Shell中切换work0、work1来实现对不同节点下发启动命令，否则任务会处于等待其他节点的状态。如何防止Cloud Shell的Session断开如果需要长时间运行某一个任务，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

面向熟悉代码编写和调测，熟悉常见AI引擎的开发者，ModelArts不仅提供了在线代码开发环境，还提供了从模型训练、模型管理到模型部署上线的端到端开发流程（即AI全流程开发），帮助您高效、快速的构建一个可用模型。准备工作配置ModelArts访问授权创建OBS桶开发环境创建Notebook

帮助中心 > AI开发平台ModelArts > 成长地图
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本案例需要创建一个Notebook，以便能够通过它访问SFS Turbo服务。随后，通过Notebook将OBS中的数据上传至SFS Turbo，并对存储在SFS Turbo中的数据执行编辑操作。预训练预训练介绍如何进行预训练，包括训练数据处理、超参配置、创建训练任务及性能查看。微调训练

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911）
在推理生产环境中部署推理服务 - AI开发平台ModelArts

配置后重启推理服务生效。 Matmul_all_reduce融合算子使用Matmul_all_reduce融合算子能提升全量推理性能，该算子对驱动和固件版本要求较高，默认不开启。如需开启，配置以下环境变量。 export USE_MM_ALL_REDUCE_OP=1 关闭Matmu

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
查看ModelArts模型详情 - AI开发平台ModelArts

模型精度显示该模型的模型召回率、精准率、准确率和F1值。参数配置可以查看模型的apis定义详情，以及模型的入参和出参。运行时依赖查看模型对环境的依赖。当构建任务失败后可以编辑运行时依赖，保存修改后将触发镜像重新构建。事件展示模型创建过程中的关键操作进展。事件保存周期为3个月，3个月后自动清理数据。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
配置多分支节点数据 - AI开发平台ModelArts

"], else_then_steps=["training_job_2"], ) # 构建一个OutputStorage对象，对训练输出目录做统一管理 storage = wf.data.OutputStorage(name="storage_name", title="title_info"

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
批量更新样本标签 - AI开发平台ModelArts

样本标签列表，为空表示删除样本的所有标签。 metadata 否 SampleMetadata object 样本metadata属性键值对。 sample_id 否 String 样本ID。 sample_type 否 Integer 样本类型。可选值如下： 0：图像 1：文本

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

PPO强化训练方案。 DPO(Direct Preference Optimization)：直接偏好优化方法，通过直接优化语言模型来实现对大模型输出的精确把控，不用进行强化学习，也可以准确判断和学习到使用者的偏好，最后，DPO算法还可以与其他优化算法相结合，进一步提高深度学习模型的性能。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909）
msprobe精度分析工具使用指导 - AI开发平台ModelArts

因此，在精度问题定位过程中，确定性计算不是目的，而是手段。很多场景下需要在确定性计算使能的情况下，进行下一步的精度问题分析定位。Cuda对部分算子实现了确定性计算，但仍有部分算子无法固定。通常需要依赖确定性计算的场景是长稳问题，因为长稳问题需要通过多次长跑来分析Loss情况，这

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
查询服务更新日志 - AI开发平台ModelArts

custom_spec CustomSpec object 自定义资源规格配置。 envs Map<String,String> 运行模型需要的环境变量键值对。 cluster_id String 专属资源池ID。 instance_count Integer 模型部署的实例数，当infer_type为real-time时会返回此值。

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
批量更新团队标注样本的标签 - AI开发平台ModelArts

样本标签列表，为空表示删除样本的所有标签。 metadata 否 SampleMetadata object 样本metadata属性键值对。 sample_id 否 String 样本ID。 sample_type 否 Integer 样本类型。可选值如下： 0：图像 1：文本

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

生成器是基于encoder-decoder的网络结构，分别利用2个encoder（speech encoder和identity encoder）去对输入的语音和视频人脸进行编码，并将二者的编码结果进行拼接，送入到face decoder中进行解码得到输出的视频帧。判别器Visual Quality

帮助中心 > AI开发平台ModelArts > 最佳实践 > 数字人模型训练推理
在Lite Cluster资源池上使用Ascend FaultDiag工具完成日志诊断 - AI开发平台ModelArts

节点日志清洗指定单节点日志路径为输入，指定该节点日志清洗存储路径为输出（输出路径需要为空），使用ascend-fd parse命令逐一对单个节点的日志进行清洗。 ascend-fd parse -i ${path_to_worker_logs} -o ${path_to_parse_output}

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
查询数据集导出任务的状态 - AI开发平台ModelArts

OR：或操作 AND：与操作 property Map<String,Array<String>> 标签属性，是Object格式，存放任意的键值对；key是属性名称，value是取值列表，如value为null表示不根据值搜索，否则搜索的值满足列表中任意一个即可。 type Integer

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
构造请求 - AI开发平台ModelArts
构造请求 - AI开发平台ModelArts

否，使用AK/SK认证时必选。 code.test.com or code.test.com:443 API同时支持使用AK/SK认证，AK/SK认证是使用SDK对请求进行签名，签名过程会自动往请求中添加Authorization（签名认证信息）和X-Sdk-Date（请求发送的时间）请求头。AK/SK认证的详细说明请参见API签名指南。

帮助中心 > AI开发平台ModelArts > API参考 > 如何调用API
yaml配置文件参数配置说明 - AI开发平台ModelArts

o代表PPO训练。 finetuning_type full 用于指定微调的类型，可选择值【full、lora】如果设置为"full"，则对整个模型进行微调。这意味着在微调过程中，除了输出层外，模型的所有参数都将被调整以适应新的任务。 dataset identity,alpaca_en_demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
更新算法 - AI开发平台ModelArts
更新算法 - AI开发平台ModelArts

算法uuid，创建算法时无需填写。 name 是 String 算法名称。限制为1-64位只含数字、字母、下划线和中划线的名称。 description 否 String 对算法的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 workspace_id 否 String 指定算法所处的工作空间，默认值为“0”。“0”

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
创建训练作业版本 - AI开发平台ModelArts

Long 训练作业的ID。请求消息请求参数如表2所示。表2 请求参数参数是否必选参数类型说明 job_desc 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 config 是 Object 创建训练作业需要的参数。详情参见表3。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

用于实现快速部署和快速更新模型。如果勾选“动态加载”，则模型文件和运行时依赖仅在实际部署时拉取。单个模型文件大小超过5GB，需要配置“动态加载”。 “运行时依赖” 罗列选中模型对环境的依赖。例如依赖“tensorflow”，安装方式为“pip”，其版本必须为1.8.0及以上版本。 “模型说明” 为了帮助其他模型开发者

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型

总条数： 633

上一页
1
...
27
28
29
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Cloud Shell调试生产训练作业 - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

msprobe精度分析工具使用指导 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

Wav2Lip训练基于Lite Server适配PyTorch NPU训练指导（6.3.907） - AI开发平台ModelArts

在Lite Cluster资源池上使用Ascend FaultDiag工具完成日志诊断 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

构造请求 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

更新算法 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线