搜索_华为云

训练的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir :

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

在创建训练作业前，推荐您先使用ModelArts开发环境调试训练代码，避免代码迁移过程中的错误。直接使用线上notebook环境调试请参考使用JupyterLab开发模型。配置本地IDE（Pycharm或者VSCode）联接云上环境调试请参考使用本地IDE开发模型。父主题： GPU相关问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
启动/停止/删除实例 - AI开发平台ModelArts

“/home/ma-user/work”目录以及动态挂载在“/data”下的目录下的数据会保存，其余目录下内容会被清理。例如：用户在开发环境中的其他目录下安装的外部依赖包等，在Notebook停止后会被清理。您可以通过保存镜像的方式保留开发环境设置，具体操作请参考保存Notebook实例。 No

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
获取自动化搜索作业yaml模板的内容 - AI开发平台ModelArts

String yaml文件内容。请求示例如下查询algorithm_type为hpo且algorithm_name为Bayes的yaml配置文件内容。 GET https://endpoint/v2/{project_id}/training-jobs/autosearch/y

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询推理VPC访问通道信息的API - AI开发平台ModelArts

查询推理VPC访问通道信息的API 功能介绍该接口用于查询推理VPC访问通道。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_i

帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
训练过程中无法找到so文件 - AI开发平台ModelArts

训练过程中无法找到so文件问题现象 ModelArts训练作业运行时，日志中遇到如下报错，导致训练失败： libcudart.so.9.0 cannot open shared object file no such file or directory 原因分析编译生成s

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
计算规格说明 - AI开发平台ModelArts

计算规格说明 AI Gallery提供了多种计算规格供用户按需选用。只要用户的账号费用充足，就可以持续使用资源，详细计费说明请参见计费说明。计费说明 AI Gallery的计费规则如表1所示。表1 计费说明规则说明话单上报规则仅当AI Gallery工具链服务创建成功

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

新版训练中使用“自定义算法”创建训练作业（启动方式选择“自定义”）。新旧版训练代码适配的差异旧版训练中，用户需要在输入输出数据上做如下配置： #解析命令行参数 import argparse parser = argparse.ArgumentParser(description='MindSpore

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
训练的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir :

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.910） > 训练脚本说明
训练权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir :

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

--tensor-model-parallel-size：${TP}张量并行数，需要与训练脚本中的TP值配置一样。 --pipeline-model-parallel-size：${PP}流水线并行数，需要与训练脚本中的PP值配置一样。 --load-dir：加载转换模型权重路径。 --save-dir :

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明
创建资源池 - AI开发平台ModelArts

Integer 资源规格的弹性资源量。物理池中该值和count必须一致。 extendParams 否 extendParams object 自定义配置参数。表9 extendParams 参数是否必选参数类型描述 dockerBaseSize 否 String 指定资源池节点的容器引擎空间大小。

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
查询API - AI开发平台ModelArts
查询API - AI开发平台ModelArts

查询API 功能介绍查询指定API详情。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/app-auth/{service_id}/apis/{api_id}

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询APP的API认证信息 - AI开发平台ModelArts

查询APP的API认证信息功能介绍查询APP的API认证信息。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/serv

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
创建Workflow数据集标注节点 - AI开发平台ModelArts

outputs 数据集标注节点的输出列表是 LabelingOutput或者LabelingOutput的列表 properties 数据集标注相关的配置信息是 LabelTaskProperties title title信息，主要用于前端的名称展示否 str description 数据集标注节点的描述信息

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
执行SFT全参微调训练任务 - AI开发平台ModelArts

明和训练的数据集预处理说明。步骤二修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
执行SFT全参微调训练任务 - AI开发平台ModelArts

训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的SFT微调为例，执行脚本为0_pl_sft_70b.sh 和 0_pl_sft_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
创建在线服务包 - AI开发平台ModelArts

创建在线服务包功能介绍计费工作流购买资源。接口约束无调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/workfl

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

algorithm_names Array of strings 该算法类型下所有算法的名称。请求示例查询自动化搜索作业支持的yaml配置模板的信息 GET https://endpoint/v2/{project_id}/training-jobs/autosearch/yaml-templates

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理

总条数： 1621

上一页
1
...
74
75
76
...
82
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的权重转换说明 - AI开发平台ModelArts

日志提示"No CUDA-capable device is detected" - AI开发平台ModelArts

日志提示“RuntimeError: Cannot re-initialize CUDA in forked subprocess” - AI开发平台ModelArts

启动/停止/删除实例 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的内容 - AI开发平台ModelArts

查询推理VPC访问通道信息的API - AI开发平台ModelArts

训练过程中无法找到so文件 - AI开发平台ModelArts

计算规格说明 - AI开发平台ModelArts

旧版训练迁移至新版训练需要注意哪些问题？ - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

训练权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

查询API - AI开发平台ModelArts

查询APP的API认证信息 - AI开发平台ModelArts

创建Workflow数据集标注节点 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

创建在线服务包 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线