搜索_华为云

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

镜像里面“/var/lib/cloud/instances”残留了制作镜像机器（后面称模板机）的实例ID信息，如果制作镜像不清理“/var/lib/cloud/*”就会导致用该镜像再重装模板机时，cloud-init根据残留目录（含实例ID）判断已经执行过一次，进而不会再执行user-data里面的脚本。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
指令监督微调训练任务 - AI开发平台ModelArts

Face权重时存放目录绝对或相对路径。请根据实际规划修改。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用Qwen模板进行训练，模板选择可参照表1中的template列 output_dir /home/ma-user/ws/Qwen2-72B/sft-4096

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列 max_samples 50000 用于指定训练过程中使用的最大样本数量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
yaml配置文件参数配置说明 - AI开发平台ModelArts

identity，一个是alpaca_en_demo。如选用定义数据请参考准备数据（可选） template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练,模板选择可参照表1中的template列 max_samples 1000 用于指定训练过程中使用的最大样本数量。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
Standard自动学习 - AI开发平台ModelArts

根据最终部署环境和开发者需求的推理速度，自动调优并生成满足要求的模型 ModelArts自动学习，为资深级用户提供模板化开发能力提供“自动学习白盒化”能力，开放模型参数、自动生成模型，实现模板化开发，提高开发效率采用自动深度学习技术，通过迁移学习（只通过少量数据生成高质量的模型），多维度下

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
执行训练任务 - AI开发平台ModelArts

复制tune_yaml样例模板内容覆盖demo.yaml文件内容。 DPO偏好训练，复制dpo_yaml样例模板内容覆盖demo.yaml文件内容。 PPO强化训练，先进行RM奖励训练任务后，复制ppo_yaml样例模板内容覆盖demo.yaml内容。 RM奖励训练，复制rm_yaml样例模板内容覆盖demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910）
执行训练任务 - AI开发平台ModelArts

复制tune_yaml样例模板内容覆盖demo.yaml文件内容。 DPO偏好训练，复制dpo_yaml样例模板内容覆盖demo.yaml文件内容。 PPO强化训练，先进行RM奖励训练任务后，复制ppo_yaml样例模板内容覆盖demo.yaml内容。 RM奖励训练，复制rm_yaml样例模板内容覆盖demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列 max_samples 50000 用于指定训练过程中使用的最大样本数量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
ModelArts Standard资源监控概述 - AI开发平台ModelArts

所有监控指标。方式三：通过Grafana查看所有监控指标当AOM的监控模板不能满足用户诉求时，用户可以使用Grafana可视化工具来查看与分析监控指标。Grafana支持灵活而又复杂多样的监控视图和模板，为用户提供基于网页仪表面板的可视化监控效果，使用户更加直观地查看到实时资源使用情况。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
Yaml配置文件参数配置说明 - AI开发平台ModelArts

json配置文件所属的绝对路径；如使用自定义数据集，yaml配置文件需添加此参数。 template qwen 必须修改。用于指定模板。如果设置为"qwen"，则使用QWEN模板进行训练，模板选择可参照表1中的template列 max_samples 50000 用于指定训练过程中使用的最大样本数量

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

├── model.py # 发送请求的模块，在这里修改请求响应。目前支持vllm.openai，atb的tgi模板 ├── ... ├── eval_test.py # 启动脚本，建立线程池发送请求，并汇总结果

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905） > 准备工作
数据集如何切分 - AI开发平台ModelArts

“验证集比例”等于1。 “训练集比例”即用于训练模型的样本数据比例；“验证集比例”即用于验证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
资源管理 - AI开发平台ModelArts
资源管理 - AI开发平台ModelArts

资源管理查询OS的配置参数查询插件模板查询节点列表批量删除节点批量重启节点查询事件列表创建网络资源查询网络资源列表查询网络资源删除网络资源更新网络资源查询资源实时利用率创建资源池查询资源池列表，可通过标签、资源池状态筛选查询资源池列表查询资源池删除资源池

 帮助中心 > AI开发平台ModelArts > API参考
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

提前终止自动化搜索作业的某个trial 提前终止自动化搜索作业的某个trial。获取自动化搜索作业yaml模板的信息获取自动化搜索作业yaml模板的信息。获取自动化搜索作业yaml模板的内容获取自动化搜索作业yaml模板的内容。表8 训练作业标签管理接口 API 说明创建训练作业标签创建训练作

 帮助中心 > AI开发平台ModelArts > API参考
创建数据处理任务版本 - AI开发平台ModelArts

数据来源列表，与data_source二选一。 name 是 String 数据处理任务名称。 template 否 TemplateParam object 数据处理模板，如算法ID和参数等。 version_id 否 String 数据集版本ID。 work_path 否 WorkPath object 数据处理任务的工作目录。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

支持发布至市场将产生的模型发布至AI Gallery，共享给其他用户。支持创建新版本创建新版本，仅支持从ModelArts训练作业、OBS、模型模板、或自定义镜像中选择元模型。无法从原自动学习项目中，创建新版本。支持删除模型或其模型版本父主题：使用窍门

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用窍门
如何将某些图片划分到验证集或者训练集？ - AI开发平台ModelArts

“验证集比例”等于1。 “训练集比例”即用于训练模型的样本数据比例；“验证集比例”即用于验证模型的样本数据比例。“训练验证比例”会影响训练模板的性能。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
查询处理任务详情 - AI开发平台ModelArts

3：失败 4：停止 task_id String 数据处理任务ID。 template TemplateParam object 数据处理模板，如算法ID和参数等。 version_count Integer 数据处理任务的版本数量。 version_id String 数据处理任务对应的数据集版本ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询数据处理任务的版本详情 - AI开发平台ModelArts

数据处理任务ID。 task_version_id String 数据处理任务的版本ID。 template TemplateParam object 算法模板，如算法ID和参数等。 unmodified_sample_count Integer 处理后无修改的图片数量。 update_time Long

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Notebook Cache盘告警上报 - AI开发平台ModelArts

行动规则即为告警触发时，AOM以怎样的方式来告知用户。启用告警行动规则后，系统根据关联SMN主题与消息模板来发送告警通知。更多详情请参考AOM用户指南。根据界面提示填写行动规则名称，选择行动规则类型，选择上一步创建的主题，选择消息模板，然后单击“确定”。图6 新建告警行动规则在之前打开的“创建告警规则”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例

总条数： 542

上一页
1
2
3
4
5
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

华为云CCE集群纳管GPU裸金属服务器由于CloudInit导致纳管失败的解决方案 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

yaml配置文件参数配置说明 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

执行训练任务 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

ModelArts Standard资源监控概述 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

数据集如何切分 - AI开发平台ModelArts

资源管理 - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

创建数据处理任务版本 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

如何将某些图片划分到验证集或者训练集？ - AI开发平台ModelArts

查询处理任务详情 - AI开发平台ModelArts

查询数据处理任务的版本详情 - AI开发平台ModelArts

Notebook Cache盘告警上报 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线