搜索_华为云

Lite Server - AI开发平台ModelArts
Lite Server - AI开发平台ModelArts

04内核自动升级？哪里可以了解Atlas800训练服务器硬件相关内容使用GPU A系列裸金属服务器有哪些注意事项？ GPU A系列裸金属服务器如何更换NVIDIA和CUDA？

帮助中心 > AI开发平台ModelArts > 常见问题
指令监督微调训练任务 - AI开发平台ModelArts

yaml配置文件在代码目录下的{work_dir}/llm_train/LLaMAFactory/demo.yaml。修改详细步骤如下所示：选择指令微调类型 sft，复制sft_yaml样例模板内容覆盖demo.yaml文件内容。 lora，复制lora_yaml样例模板内容覆盖demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907）
创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

如果模型状态为“构建失败”，可以在模型详情页面，查看“事件”页签中的“查看构建日志”。构建日志中有对应的构建镜像失败的详细原因，根据构建失败的原因进行排查处理。图1 查看构建日志常见问题模型文件目录下不能出现dockerfile文件； “查看构建日志”中显示“Not only a Dockerfile

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 模型管理
API概览 - AI开发平台ModelArts
API概览 - AI开发平台ModelArts

终止训练作业，只可终止创建中、等待中、运行中的作业。查询训练作业指定任务的日志（预览）查询训练作业指定任务的日志（预览）。查询训练作业指定任务的日志（OBS链接）查询训练作业指定任务的日志（OBS链接），可全量查看或直接下载。查询训练作业指定任务的运行指标查询训练作业指定任务的运行指标。查询训练作业列表

 帮助中心 > AI开发平台ModelArts > API参考
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

本教程中用到的模型软件包如下表所示，请提前准备好。获取模型软件包本方案支持的模型对应的软件和依赖包获取地址如表1所示。表1 模型对应的软件包和依赖包获取地址代码包名称代码说明下载地址 AscendCloud-6.3.908-xxx.zip 说明：软件包名称中的xxx表示时间戳。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作
执行LoRA微调训练任务 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。步骤二修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910）
执行LoRA微调训练任务 - AI开发平台ModelArts

训练脚本中会自动执行训练前的权重转换操作和数据处理操作。如果想详细了解脚本执行训练权重转换操作和数据集预处理操作说明请分别参见训练中的权重转换说明和训练的数据集预处理说明。 Step2 修改训练超参配置以Llama2-70b和Llama2-13b的LoRA微调为例，执行脚本为0_pl_lora_70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908）
执行微调训练任务 - AI开发平台ModelArts

Yaml配置文件在代码目录下的{work_dir}/llm_train/LLaMAFactory/demo.yaml。修改详细步骤如下所示。选择训练策略类型。 sft，复制sft_yaml样例模板内容覆盖demo.yaml文件内容。 lora，复制lora_yaml样例模板内容覆盖demo

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
预训练任务 - AI开发平台ModelArts

启动后，可通过以下命令获取所有已创建的pod信息。若pod已全部启动，则状态为：Running。 kubectl get pod -A -o wide 若查看启动作业日志信息，可通过以下命令打印正在启动的日志信息。其中${pod_name}为上述pod信息中的NAME，例如vcjob-main-0。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909）
在Notebook上安装配置Grafana - AI开发平台ModelArts

在Notebook上安装配置Grafana 适用场景本章节适用于在ModelArts Standard的Notebook中安装配置Grafana。前提条件已创建CPU或GPU类型的Notebook实例，并处于运行中。打开Terminal。操作步骤在Terminal中依次执行以下命令，下载并安装Grafana。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标 > 安装配置Grafana
支持哪些型号的Ascend芯片？ - AI开发平台ModelArts

支持哪些型号的Ascend芯片？目前支持Ascend Snt3和Snt9、Snt9、Snt9B、Snt9C。Ascend应用案例请参见Ascend应用样例。模型训练：ModelArts中支持使用Snt9、Snt9B训练模型。模型推理：在ModelArts中将模型部署上线为在

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

json文件中的status字段的值在训练脚本启动时，并不一定为completed状态。因此需要训练脚本等待status字段的值等于completed之后，再去读取文件的剩余内容。通过训练脚本，可以使用模板一格式的jobstart_hccl.json文件，在等待status字段的值等于

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
开发Workflow的核心概念介绍 - AI开发平台ModelArts

outputs 节点的输出列表否 AbstractOutput或者list[AbstractOutput] properties 节点的属性信息否 dict policy 节点的执行策略，主要包含节点调度运行的时间间隔、节点执行的超时时间、以及节点执行是否跳过的相关配置否 StepPolicy

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
服务管理 - AI开发平台ModelArts
服务管理 - AI开发平台ModelArts

patch 操作对服务进行更新查询服务监控信息查询服务列表部署服务查询支持的服务部署规格查询服务详情更新服务配置删除服务查询专属资源池列表查询服务事件日志启动停止边缘节点服务实例查询服务更新日志添加资源标签删除资源标签查询推理服务标签

 帮助中心 > AI开发平台ModelArts > API参考
获取用户绑定APP的api列表 - AI开发平台ModelArts

获取用户绑定APP的api列表功能介绍获取用户绑定app的API列表。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
开发用于预置框架训练的代码 - AI开发平台ModelArts

业启动后会下载至后台，可能会有下载失败的风险。建议训练代码目录大小小于或等于50MB。代码目录路径中的启动文件代码目录路径中的启动文件作为训练启动的入口，当前只支持python格式。预置框架启动文件的启动流程说明请参见预置框架启动文件的启动流程说明。训练输入路径参数训练数

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

练作业支持的引擎类型和版本。调用创建算法接口创建一个算法，记录算法id。调用创建训练作业接口使用刚创建的算法返回的uuid创建一个训练作业，记录训练作业id。调用查询训练作业详情接口使用刚创建的训练作业返回的id查询训练作业状态。调用查询训练作业指定任务的日志（OBS链接

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
ModelArts - AI开发平台ModelArts
ModelArts - AI开发平台ModelArts

更多训练作业 ModelArts中的作业为什么一直处于等待中？ ModelArts训练好后的模型如何获取？如何查看训练作业的资源占用情况？更多 Lite Server 哪里可以了解Atlas800训练服务器硬件相关内容 GPU A系列裸金属服务器如何更换NVIDIA和CUDA？

帮助中心 > AI开发平台ModelArts > 成长地图
SD WEBUI套件适配PyTorch NPU的推理指导（6.3.907） - AI开发平台ModelArts

SD WEBUI套件适配PyTorch NPU的推理指导（6.3.907） SD WebUI推理方案概览在DevServer上部署SD WebUI推理服务在Standard上部署SD WebUI推理服务 SD WebUI推理性能测试父主题： AIGC模型训练推理

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
预训练任务 - AI开发平台ModelArts

执行训练启动命令后，等待模型载入，当出现“training”关键字时，表示开始训练。训练过程中，训练日志会在最后的Rank节点打印。图1 等待模型载入最后，请参考查看日志和性能章节查看预训练的日志和性能。父主题：主流开源大模型基于DevServer适配ModelLink PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）

总条数： 1385

上一页
1
...
22
23
24
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Lite Server - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

创建模型失败，如何定位和处理问题？ - AI开发平台ModelArts

API概览 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

在Notebook上安装配置Grafana - AI开发平台ModelArts

支持哪些型号的Ascend芯片？ - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

服务管理 - AI开发平台ModelArts

获取用户绑定APP的api列表 - AI开发平台ModelArts

开发用于预置框架训练的代码 - AI开发平台ModelArts

以PyTorch框架创建训练作业（新版训练） - AI开发平台ModelArts

ModelArts - AI开发平台ModelArts

SD WEBUI套件适配PyTorch NPU的推理指导（6.3.907） - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线