搜索_华为云

Yaml配置文件参数配置说明 - AI开发平台ModelArts

or false】，默认false do_train true 指示脚本执行训练步骤，用来控制是否进行模型训练的。如果设置为true，则会进行模型训练；如果设置为false，则不会进行模型训练。 cutoff_len 4096 文本处理时的最大长度，此处为4096，用户可根据自己要求适配。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
训练启动脚本说明和参数配置 - AI开发平台ModelArts

（此参数目前仅适用于Llama3系列模型长序列训练） LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改。指定的输入数据集中数据的总数量。更换数据集时，需要修改。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明
Lite Cluster资源配置流程 - AI开发平台ModelArts

务器页面。图8 节点管理单击“远程登录”，在弹出的窗口中，单击“CloudShell登录”。图9 远程登录在CloudShell中设置密码等参数后，单击“连接”即可登录节点，CloudShell介绍可参见远程登录Linux弹性云服务器（CloudShell方式）。配置kubectl工具。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
查询APP是否存在 - AI开发平台ModelArts

描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例 GET https://{endpoint}/v1/{project_id}/app-auth/apps/{app_name}/exists&workspace_id=0

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
查询数据处理的算法类别 - AI开发平台ModelArts

label_zh String 算法类别名称。 template_id String 算法类别的ID。请求示例查询数据处理算法类别的列表 GET https://{endpoint}/v2/{project_id}/processor-tasks/items 响应示例状态码： 200 OK

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询Notebook资源类型下的标签 - AI开发平台ModelArts

参数类型描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例 https://{endpoint}/v1/{project_id}/notebooks/tags 响应示例状态码：200 查询项目下Notebook实例类型下的标签，正常返回。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
总览Workflow工作流 - AI开发平台ModelArts

total Integer 总数。 stat Map<String,Integer> 状态。请求示例请求Workflow统计信息 GET https://{endpoint}/v2/{project_id}/workflows/overview 响应示例状态码：200 OK {

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
准备数据（可选） - AI开发平台ModelArts

ta.json.json）按照下面的数据存放目录要求放置。样例数据集alpaca_gpt4_data.json.json的下载链接：https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpacaGPT4/alpaca_gpt4_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
训练的数据集预处理说明 - AI开发平台ModelArts

--seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出间隔的参数，表示输出日志的频率。在训练大规模模型时，可以通过设置这个参数来控制日志的输出。输出数据预处理结果路径：训练完成后，以

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

python -c "import torch;print(torch.__version__)" 通过pytorch官网可查兼容版本：https://pytorch.org/get-started/previous-versions/ 如果环境中装了多版本的cuda，可以排查LD

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 自定义镜像故障
查询标注团队成员详情 - AI开发平台ModelArts

worker_id String 标注成员ID。 workforce_id String 所属标注团队ID。请求示例查询标注团队成员详情 GET https://{endpoint}/v2/{project_id}/workforces/{workforce_id}/workers/{worker_id}

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

UNMOUNTING：卸载中 UNMOUNT_FAILED：卸载失败 UNMOUNTED：卸载完成 uri String OBS对象路径。请求示例 GET https://{endpoint}/v1/{project_id}/notebooks/{instance_id}/storage 响应示例状态码：200

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

algorithm_names Array of strings 该算法类型下所有算法的名称。请求示例查询自动化搜索作业支持的yaml配置模板的信息 GET https://endpoint/v2/{project_id}/training-jobs/autosearch/yaml-templates 响应示例

 帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
资源池统计 - AI开发平台ModelArts

error_code String ModelArts错误码。 error_msg String 具体错误信息。请求示例查询资源池监控信息。 GET https://{endpoint}/v2/{project_id}/pools { } 响应示例状态码：200 OK。 { "statistics"

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
更新消息订阅Subscription - AI开发平台ModelArts

entity String 订阅的主体。 events Array of strings 订阅的事件。请求示例更新订阅信息 PUT https://{endpoint}/v2/{project_id}/workflows/{workflow_id}/subscription/f

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
准备数据（可选） - AI开发平台ModelArts

pt4_data.json）按照下面的数据存放目录要求放置。指令微调样例数据集alpaca_gpt4_data.json的下载链接：https://huggingface.co/datasets/QingyiSi/Alpaca-CoT/blob/main/alpacaGPT4/alpaca_gpt4_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
性能调优 - AI开发平台ModelArts
性能调优 - AI开发平台ModelArts

行模型的性能。 AKG的配置也是在模型转换阶段进行配置（即执行converter_lite命令时），通过指定对应的配置文件akg.cfg，设置对应的akg优化级别，并且在模型转换时参考样例进行对应的配置。 # akg.cfg [graph_kernel_param] opt_level=2

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU推理业务迁移至昇腾的通用指导
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 LR 2.5e-5 学习率设置。 MIN_LR 2.5e-6 最小学习率设置。 SEQ_LEN 4096 要处理的最大序列长度。 MAX_PE 8192 设置模型能够处理的最大序列长度。 SN 1200 必须修改

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
手动续费 - AI开发平台ModelArts
手动续费 - AI开发平台ModelArts

如果您持有多台到期日不同的专属资源池，可以将到期日统一设置到一个日期，便于日常管理和续费。图2展示了用户将两个不同时间到期的资源，同时续费一个月，并设置“统一到期日”后的效果对比。图2 统一到期日更多关于统一到期日的规则请参见如何设置统一到期日。父主题：续费

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费

总条数： 1168

上一页
1
...
36
37
38
...
59
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Yaml配置文件参数配置说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

查询APP是否存在 - AI开发平台ModelArts

查询数据处理的算法类别 - AI开发平台ModelArts

查询Notebook资源类型下的标签 - AI开发平台ModelArts

总览Workflow工作流 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

用户使用torch报错Unexpected error from cudaGetDeviceCount - AI开发平台ModelArts

查询标注团队成员详情 - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

获取自动化搜索作业yaml模板的信息 - AI开发平台ModelArts

资源池统计 - AI开发平台ModelArts

更新消息订阅Subscription - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

性能调优 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

手动续费 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线