搜索_华为云

ModelArts最佳实践案例列表 - AI开发平台ModelArts

Standard权限配置样例对应功能场景说明 ModelArts Standard权限管理 IAM权限配置、权限管理为子账号配置权限当一个华为云账号下需创建多个IAM子账号时，可参考此样例，为IAM子账号赋予使用ModelArts所需的权限。避免IAM子账号因权限问题导致使用时出现异常。 ModelArts

帮助中心 > AI开发平台ModelArts > 最佳实践
重试/停止/运行Workflow节点 - AI开发平台ModelArts

序执行部分运行节点。部分运行Workflow节点，首先在新开发Workflow时，需要预先定义好部分运行场景。具体流程如下：通过SDK创建工作流时，预先定义好部分运行场景，具体可参考在Workflow中指定仅运行部分节点。在配置工作流时，打开“部分运行”开关，选择需要执行的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
ModelArts训练时使用os.system('cd xxx')无法进入文件夹怎么办？ - AI开发平台ModelArts

ModelArts训练时使用os.system('cd xxx')无法进入文件夹怎么办？当在训练作业的启动脚本中使用os.system('cd xxx')无法进入相应的文件夹时，建议使用如下方法： import os os.chdir('/home/work/user-job-dir/xxx')

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

容器使用的GPU的型号。 account_name 训练、推理或开发环境任务创建者的账号名。 user_name 训练、推理或开发环境任务创建者的用户名。 task_creation_time 训练、推理或开发环境任务的创建时间。 task_name 训练、推理或开发环境任务的名称。 task_spec_code

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控
查询数据集导入任务列表 - AI开发平台ModelArts

ImportTaskStatusResp 参数参数类型描述 annotated_sample_count Long 已标注样本数量。 create_time Long 任务创建时间。 data_source DataSource object 数据来源。 dataset_id String 数据集ID。 elapsed_time

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
查询模型runtime - AI开发平台ModelArts

String 用户token。响应参数状态码：200 表4 响应Body参数参数参数类型描述 count Integer 不分页的情况下符合查询条件的总数量。 total_count Integer 当前查询结果的数量，不设置offset、limit查询参数时，count与total相同。

帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
SDK简介 - AI开发平台ModelArts
SDK简介 - AI开发平台ModelArts

SDK已经集成在ModelArts开发环境Notebook中，可以直接使用，无需进行Session鉴权。登录ModelArts控制台，在“开发空间 > Notebook”中创建Notebook实例，在Terminal或ipynb文件中直接调用ModelArts SDK的接口。在Notebook中调用SDK，可直接

 帮助中心 > AI开发平台ModelArts > SDK参考
预训练数据处理 - AI开发平台ModelArts

alpaca_text_document.bin alpaca_text_document.idx Alpaca数据处理具体操作 Alpaca数据处理具体操作步骤如下：创建数据处理后的输出目录/home/ma-user/ws/processed_for_ma_input/BaiChuan2-13B/data/pretrain/。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
训练作业运行失败排查指导 - AI开发平台ModelArts

原因：训练作业使用的镜像CUDA版本只支持sm_37、sm_50、sm_60和sm_70的加速卡，不支持sm_80。处理建议：使用自定义镜像创建训练作业，并安装高版本的cuda以及对应的PyTorch版本。查看训练作业的“日志”，出现报错“ERROR:root:label_map

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
msprobe梯度监控 - AI开发平台ModelArts

中的问题。使用步骤如下：通过pip安装msprobe工具。 # shell pip install mindstudio-probe 创建配置文件config.json。 { "task": "grad_probe", "dump_path": "./dump_path"

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > msprobe工具使用指导
VS Code连接开发环境时报错Missing GLIBC，Missing required dependencies - AI开发平台ModelArts

27.so Error: Missing required dependencies. Please refer to our FAQ https://aka.ms/vscode-remote/faq/old-linux for additional information. 原因分析

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

qwen-vl.patch # 使用git apply修改模型相关代码代码上传至OBS 代码包解压后，在OBS中创建mllm_train目录，并将train/<commit_id>上传至该目录中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 准备工作
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

OM配置短信、邮件等通知方式。以下步骤基于AOM2.0配置。登录AOM控制台。在左侧导航栏选择“告警管理 > 告警规则”，单击“创建”，创建告警规则。设置告警规则（以NPU掉卡为例）。规则类型：选择“指标告警规则”。配置方式：选择“PromQL”。设置告警规则详情。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
准备代码 - AI开发平台ModelArts
准备代码 - AI开发平台ModelArts

qwen-vl.patch # 使用git apply修改模型相关代码代码上传至OBS 代码包解压后，在OBS中创建mllm_train目录，并将train/<commit_id>上传至该目录中。结合准备数据、准备权重、准备代码，将数据集、原始权重、代

 帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
执行训练任务（推荐） - AI开发平台ModelArts

yaml启动作业启动作业命令如下。首先会根据config.yaml创建pod，继而在pod容器内自动启动训练作业。 kubectl apply -f config.yaml 启动后，可通过以下命令获取所有已创建的pod信息。若pod已全部启动，则状态为：Running。 kubectl

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练任务
支持的模型列表 - AI开发平台ModelArts

√ √ https://huggingface.co/meta-llama/Llama-2-13b-chat-hf 6 llama2-70b √ √ √ √ √ https://huggingface.co/meta-llama/Llama-2-70b-hf https://huggingface

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.5.901）
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

xxx 步骤一：准备工作完成准备工作内容，生成ascendfactory-cli工具。创建test-benchmark目录，该目录存放训练生成的权重文件及训练日志。 # 任意目录创建 mkdir test-benchmark 修改config目录下yaml文件中model_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.912） > 执行训练任务
ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

xxx 步骤一：准备工作完成准备工作内容，生成ascendfactory-cli工具。创建test-benchmark目录，该目录存放训练生成的权重文件及训练日志。 # 任意目录创建 mkdir test-benchmark 修改config目录下yaml文件中model_

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.5.901） > 执行训练任务
预训练数据处理 - AI开发平台ModelArts

b/alpaca_text_document，不加文件类型后缀。 Alpaca数据处理操作步骤 Alpaca数据处理具体操作步骤如下：创建数据处理后的输出目录/home/ma-user/ws/processed_for_ma_input/Qwen-14B/data/pretrain/。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 预训练
预训练数据处理 - AI开发平台ModelArts

B/alpaca_text_document，不加文件类型后缀。 Alpaca数据处理操作步骤 Alpaca数据处理具体操作步骤如下：创建数据处理后的输出目录/home/ma-user/ws/processed_for_ma_input/Llama2-70B/data/pretrain/。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于Lite Server适配PyTorch NPU训练指导（6.3.904） > 预训练

总条数： 1765

上一页
1
...
78
79
80
...
89
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ModelArts最佳实践案例列表 - AI开发平台ModelArts

重试/停止/运行Workflow节点 - AI开发平台ModelArts

ModelArts训练时使用os.system('cd xxx')无法进入文件夹怎么办？ - AI开发平台ModelArts

在AOM控制台查看ModelArts所有监控指标 - AI开发平台ModelArts

查询数据集导入任务列表 - AI开发平台ModelArts

查询模型runtime - AI开发平台ModelArts

SDK简介 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

训练作业运行失败排查指导 - AI开发平台ModelArts

msprobe梯度监控 - AI开发平台ModelArts

VS Code连接开发环境时报错Missing GLIBC，Missing required dependencies - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

准备代码 - AI开发平台ModelArts

执行训练任务（推荐） - AI开发平台ModelArts

支持的模型列表 - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

ascendfactory-cli方式启动（推荐） - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线