搜索_华为云

工作负载Pod异常 - AI开发平台ModelArts

kubectl describe pod ${pod_name} volcano资源调度失败当volcano的资源出现争抢时，会出现下图中的问题。解决方法：通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 常见错误原因和解决方法
SFT全参微调训练 - AI开发平台ModelArts

已上传训练代码、训练权重文件和数据集到OBS中，具体参考代码上传至OBS。 Step1 创建训练任务创建训练作业，并自定义名称、描述等信息。选择自定义算法，启动方式自定义，以及选择上传的镜像。图1 创建训练作业训练作业启动命令中输入： cd /home/ma-user/work/Qwen-VL;

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912）
用户名密码认证模式 - AI开发平台ModelArts

用户名密码认证模式本模式支持OBS管理、训练管理、模型管理、服务管理的鉴权。示例代码账号与用户的概念介绍，请参见IAM基本概念。获取您的账号、用户名等信息，请参见获取用户名、用户ID、项目名称、项目ID。使用账号认证 “username”填写您的账号名。 1 2 from

帮助中心 > AI开发平台ModelArts > SDK参考 > Session鉴权
创建训练作业 - AI开发平台ModelArts

ssion鉴权请参见Session鉴权。 ModelArts SDK不支持通过在AI Gallery中订阅的算法创建训练作业。示例一：提交常用框架训练作业 Estimator中同时指定framework_type和framework_version，会提交一个常用框架训练作业。

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
单模型性能调优AOE - AI开发平台ModelArts

进行操作，以达到较好的优化效果（第一次执行生成AOE的知识库，在第二次使用时可以复用）。在该场景中，AOE对text_encoder等模型提升效果不大，性能主要瓶颈点在unet模型中，主要对unet模型做调优，整体的操作步骤如下：转换前先清理缓存，避免转换时的影响。 # shell

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

训练效果的指标介绍指标名称指标说明 NPU/GPU利用率在训练过程中，机器的NPU/GPU占用情况（横坐标时间，纵坐标占用率）。显存利用率在训练过程中，机器的显存占用情况（横坐标时间，纵坐标占用率）。吞吐在训练过程中，每卡处理tokens数量（tokens/s/p）。每种框架计

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
工作负载Pod异常 - AI开发平台ModelArts

kubectl describe pod ${pod_name} volcano资源调度失败当volcano的资源出现争抢时，会出现下图中的问题。解决方法：通过打印所有Pod的信息，并找到命名有scheduler字段的Pod。 kubectl get pod -A -o wide

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.909） > 常见错误原因和解决方法
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

产品优势 ModelArts服务具有以下产品优势。稳定安全的算力底座，极快至简的模型训练支持万节点计算集群管理。大规模分布式训练能力，加速大模型研发。提供高性价比国产算力。多年软硬件经验沉淀，AI场景极致优化。加速套件，训练、推理、数据访问多维度加速。一站式端到端生产工具链，一致性开发体验

 帮助中心 > AI开发平台ModelArts > 产品介绍
训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

辑 1_preprocess_data.sh 、2_convert_mg_hf.sh中的具体python指令，并在Notebook环境中运行执行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。如果用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
模型的自定义镜像制作流程 - AI开发平台ModelArts

具体案例参考在Notebook中通过镜像保存功能制作自定义镜像用于推理。图1 模型的自定义镜像制作场景一场景二：预置镜像既不满足软件环境要求，同时需要放入模型包，在Notebook中通过Dockerfile制作。具体案例参考在Notebook中通过Dockerfile从0制作自定义镜像用于推理。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于推理
W8A8量化 - AI开发平台ModelArts
W8A8量化 - AI开发平台ModelArts

量化。 Deepseek-v2系列模型的W8A8量化需要使用llm-compressor工具。 SmoothQuant量化模型本章节介绍如何使用SmoothQuant量化工具实现推理量化。 SmoothQuant量化工具使用到的脚本存放在代码包AscendCloud-LLM-x

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用 > 量化
在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

在开发环境中，其环境规格取决于开发环境资源规格；例如在一个modelarts.vm.cpu.2u的Notebook中，部署本地Predictor，其运行环境就是cpu.2u。部署在线服务Predictor，即将存储在OBS中的模型文件部署到线上服务管理模块提供的容器中运行，其环

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
创建处理任务 - AI开发平台ModelArts

大类任务。可通过指定请求体中的复合参数“template”的“id”字段来创建某类任务。 “特征分析”是指基于图片或目标框对图片的各项特征，如模糊度、亮度进行分析，并绘制可视化曲线，帮助处理数据集。 “数据处理”是指从大量的、杂乱无章的、难以理解的数据中抽取或者生成对某些特定的人

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Yaml配置文件参数配置说明 - AI开发平台ModelArts

文件将保存在这个目录下 logging_steps 2 用于指定模型训练过程中，多少步输出一次日志。日志包括了训练进度、学习率、损失值等信息。建议设置 save_steps 5000 指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务 plot_loss

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

1_preprocess_data.sh 、2_convert_mg_hf.sh 中的具体python指令运行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。若用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以 llama2-70b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

辑 1_preprocess_data.sh 、2_convert_mg_hf.sh中的具体python指令，并在Notebook环境中运行执行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。如果用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明
查询数据集导出任务的状态 - AI开发平台ModelArts

查询数据集导出任务的状态功能介绍查询数据集导出任务的状态。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI GET /v2/{project_id}/datase

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
创建数据集 - AI开发平台ModelArts

创建数据集功能介绍创建数据集。调试您可以在API Explorer中调试该接口，支持自动认证鉴权。API Explorer可以自动生成SDK代码示例，并提供SDK代码示例调试功能。 URI POST /v2/{project_id}/datasets 表1 路径参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

训练创建新的作业。旧版训练管理是否停止新购？是的，旧版训练管理将于2023年6月30日 00:00(北京时间)正式退市。旧版训练管理如何升级到新版训练？请参考新版训练指导文档（模型训练）来体验新版训练。旧版训练迁移至新版训练需要注意哪些问题？新版训练和旧版训练的差异主要体现在以下3点。

帮助中心 > AI开发平台ModelArts > 服务公告 > 下线公告
训练启动脚本说明和参数配置 - AI开发平台ModelArts

1_preprocess_data.sh 、2_convert_mg_hf.sh 中的具体python指令运行。本代码中有许多环境变量的设置，在下面的指导步骤中，会展开进行详细的解释。如果用户希望自定义参数进行训练，可直接编辑对应模型的训练脚本，可编辑参数以及详细介绍如下。以下参数

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配ModelLink PyTorch NPU训练指导（6.3.911） > 训练脚本说明参考

总条数： 1328

上一页
1
...
60
61
62
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

工作负载Pod异常 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

用户名密码认证模式 - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

使用AI Gallery微调大师训练模型 - AI开发平台ModelArts

工作负载Pod异常 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

训练启动脚本说明和参数配置【旧】 - AI开发平台ModelArts

模型的自定义镜像制作流程 - AI开发平台ModelArts

W8A8量化 - AI开发平台ModelArts

在开发环境中部署本地服务进行调试 - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

查询数据集导出任务的状态 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

【下线公告】华为云ModelArts服务旧版训练管理下线公告 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线