搜索_华为云

创建算法 - AI开发平台ModelArts
创建算法 - AI开发平台ModelArts

在“我的算法”列表，单击算法名称进入详情页，可以查看算法详细信息。选择“基本信息”页签可以查看算法信息。 “基本信息”页签，单击“编辑”，支持修改除名称和ID之外的算法信息。修改完成，单击“保存”即可完成修改。选择“训练列表”页签可以查看使用该算法的训练作业信息，例如训练作业名称、状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型
指令监督微调训练任务 - AI开发平台ModelArts

3指使用0-3卡执行训练任务训练成功标志 “***** train metrics *****”关键字打印训练完成后，请参考查看日志和性能章节查看指令微调的日志和性能。 1、如训练过程中遇到“NPU out of memory”“Permission denied” 问题可参考

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907）
管理员和开发者权限分离 - AI开发平台ModelArts

权限，包括对自己实例的创建、启动、停止、删除等权限以及周边依赖服务的权限。普通开发者不需要ModelArts专属资源池的操作权限，也不需要查看其他用户的Notebook实例。图1 账号关系示意图配置管理员权限管理员账号需要拥有ModelArts专属资源池的完全控制权限，以及

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
NPU日志收集上传 - AI开发平台ModelArts

执行脚本收集日志。在节点上执行该脚本，可以看到有如下输出，代表日志收集完成并成功上传至OBS。图3 日志收集完成查看在脚本的同级目录下，可以看到收集到的日志压缩包。图4 查看结果父主题： Lite Server资源管理

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

#检查docker是否安装如尚未安装，运行以下命令安装docker。 yum install -y docker 配置IP转发，用于容器内的网络访问。执行以下命令查看net.ipv4.ip_forward配置项的值，如果为1，可跳过此步骤。 sysctl -p | grep net.ipv4.ip_forward

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
动态挂载OBS并行文件系统 - AI开发平台ModelArts

统。选择存放OBS并行文件系统下的文件夹，单击“确定”。图1 动态挂载OBS并行文件系统挂载成功后，可以在Notebook实例详情页查看到挂载结果。图2 挂载成功方式2：API模式动态挂载API接口已发布至华北-北京四和华东-上海一站点。请参考JupyterLab主页

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 管理Notebook实例
ECS中构建新镜像（可选） - AI开发平台ModelArts

${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
获取样本搜索条件 - AI开发平台ModelArts

LabelAttribute 参数参数类型描述 default_value String 标签属性默认值。 id String 标签属性ID。可通过调用标签列表查询。 name String 标签属性名称。不能超过64个字符，不能包含字符!<>=&"'。 type String 标签属性类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
执行训练任务（推荐） - AI开发平台ModelArts

/llm_train/saved_dir_for_output/llama2-13b/saved_models/。最后，请参考查看日志和性能章节查看预训练的日志和性能。步骤五删除config.yaml创建出的所有工作负载Pod 若要删除config.yaml创建出的所有工作负载Pod，需要先找到config

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
创建Workflow训练作业节点 - AI开发平台ModelArts

Session() 公共池查询 # 公共资源池规格列表查询 spec_list = TrainingJob(session).get_train_instance_types(session) # 返回的类型为list,可按需打印查看 print(spec_list) 专属池查询 # 运行中的专属资源池列表查询

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
ECS中构建新镜像 - AI开发平台ModelArts

${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
批量修改标签 - AI开发平台ModelArts

是否必选参数类型描述 default_value 否 String 标签属性默认值。 id 否 String 标签属性ID。可通过调用标签列表查询。 name 否 String 标签属性名称。不能超过64个字符，不能包含字符!<>=&"'。 type 否 String 标签属性类型。可选值如下：

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

/pretrain_gpt2.sh & 图3 开始预训练实时查看训练日志，监控程序。 tail -f nohup.out 如果显示如下信息，表示模型训练完成。图4 模型训练完成在训练过程中观察单GPU卡的利用率，如下：图5 GPU利用率查看生成的模型checkpoint。本示例生成的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
执行SFT全参微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 NPUS_PER_NODE=4 sh scripts/llama2/0_pl_sft_7b.sh 最后，请参考查看日志和性能章节查看SFT微调的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）
创建APP - AI开发平台ModelArts
创建APP - AI开发平台ModelArts

app名称。 app_remark 否 String app备注。 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。响应参数状态码：200 表4 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
删除AppCode - AI开发平台ModelArts
删除AppCode - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数是否必选参数类型描述 workspace_id 否 String 工作空间ID。获取方法请参见查询工作空间列表。未创建工作空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。请求参数表3 请求Header参数参数是否必选

 帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
ECS中构建新镜像 - AI开发平台ModelArts

${dockerfile_image_name}：在step5中，使用Dockerfile创建的新镜像名称。 <镜像仓库地址>：可在SWR控制台上查询，容器镜像服务中登录指令末尾的域名即为镜像仓库地址。 <组织名称>：前面步骤中自己创建的组织名称。示例：ma-group <镜像名称>:<

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
执行SFT全参微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 NPUS_PER_NODE=4 sh scripts/llama2/0_pl_sft_7b.sh 最后，请参考查看日志和性能章节查看SFT微调的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.908）
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 NPUS_PER_NODE=4 sh scripts/llama2/0_pl_lora_7b.sh 最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.909）
执行LoRA微调训练任务 - AI开发平台ModelArts

NODE_RANK=0 NPUS_PER_NODE=4 sh scripts/llama2/0_pl_lora_7b.sh 最后，请参考查看日志和性能章节查看LoRA微调的日志和性能。父主题：主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911）

总条数： 1447

上一页
1
...
66
67
68
...
73
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建算法 - AI开发平台ModelArts

指令监督微调训练任务 - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

NPU日志收集上传 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

动态挂载OBS并行文件系统 - AI开发平台ModelArts

ECS中构建新镜像（可选） - AI开发平台ModelArts

获取样本搜索条件 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

创建Workflow训练作业节点 - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

批量修改标签 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

创建APP - AI开发平台ModelArts

删除AppCode - AI开发平台ModelArts

ECS中构建新镜像 - AI开发平台ModelArts

执行SFT全参微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

执行LoRA微调训练任务 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线