搜索_华为云

训练的数据集预处理说明 - AI开发平台ModelArts

微调包含SFT和LoRA微调。数据集预处理脚本参数说明如下： --input：原始数据集的存放路径。 --output-prefix：处理后的数据集保存路径+数据集名称（例如：alpaca_gpt4_data） --tokenizer-type：tokenizer的类型，可选项有['Be

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练作业卡死检测 - AI开发平台ModelArts

配置通知及时提醒用户作业卡死。检测规则卡死检测主要是通过监控作业进程的状态和资源利用率来判定作业是否卡死。会启动一个进程来周期性地监控上述两个指标的变化情况。进程状态：只要训练作业中存在进程IO有变化，进入下一个检测周期。如果在多个检测周期内，作业所有进程IO都没有变化，则进入资源利用率检测阶段。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
重置AppCode - AI开发平台ModelArts
重置AppCode - AI开发平台ModelArts

APP密钥。 app_type String APP类型。枚举值如下： APIC：该APP注册在roma connect网关上 APIG：该APP注册在共享API网关上 DEDICATE_APIG：该APP注册在专享API网关上 bounded_api_count Integer APP绑定API数量。

帮助中心 > AI开发平台ModelArts > API参考 > APP认证管理
Standard资源管理 - AI开发平台ModelArts

以访问打通网络中的存储和资源。例如，在创建训练作业时选择打通了网络的专属资源池，训练作业创建成功后，支持在训练时访问SFS中的数据。专属资源池支持自定义物理节点运行环境相关的能力，例如GPU/Ascend驱动的自助升级，而公共资源池暂不支持。专属资源池有什么能力？新版专属资

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍 > Standard功能介绍
训练的数据集预处理说明 - AI开发平台ModelArts

微调包含SFT和LoRA微调。数据集预处理脚本参数说明如下： --input：原始数据集的存放路径。 --output-prefix：处理后的数据集保存路径+数据集名称（例如：alpaca_gpt4_data） --tokenizer-type：tokenizer的类型，可选项有['Be

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
获取智能任务的信息 - AI开发平台ModelArts

-20-21-19”。难例原因ID可选值如下： 0：未识别出任何目标物体。 1：置信度偏低。 2：基于训练数据集的聚类结果和预测结果不一致。 3：预测结果和训练集同类别数据差异较大。 4：连续多张相似图片的预测结果不一致。 5：图像的分辨率与训练数据集的特征分布存在较大偏移。 6

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
Lite Cluster资源开通 - AI开发平台ModelArts

容器引擎：容器引擎是Kubernetes最重要的组件之一，负责管理镜像和容器的生命周期。Kubelet通过Container Runtime Interface (CRI) 与容器引擎交互，以管理镜像和容器。此处支持选择Docker和Containerd。Containerd和Docker的详细差异对比请见容器引擎。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster）
创建训练作业版本 - AI开发平台ModelArts

e_url和engine_id无需填写。 boot_file_url 是 String 训练作业的代码启动文件，需要在代码目录下。如：“/usr/app/boot.py”。应与app_url一同出现，若填入model_id则app_url/boot_file_url和engine_id无需填写。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
Standard自动学习 - AI开发平台ModelArts

Standard自动学习 ModelArts自动学习与ModelArts PRO的区别是什么？在ModelArts中图像分类和物体检测具体是什么？在ModelArts自动学习中模型训练图片异常怎么办？在ModelArts自动学习中，如何进行增量训练？创建自动学习项目时，如何快速创建OBS桶及文件夹？

帮助中心 > AI开发平台ModelArts > 常见问题
Standard专属资源池 - AI开发平台ModelArts

ModelArts支持使用ECS创建专属资源池吗？在ModelArts中1个节点的专属资源池，能否部署多个服务？在ModelArts中公共资源池和专属资源池的区别是什么？ ModelArts中的作业为什么一直处于等待中？ ModelArts控制台为什么能看到创建失败被删除的专属资源池？

帮助中心 > AI开发平台ModelArts > 常见问题
查询训练作业参数列表 - AI开发平台ModelArts

String 可选值有以下两种。 “asc”为递增排序。 “desc”为递减排序，默认为“desc”。 search_content 否 String 指定要查询的文字信息，例如参数名称。默认为空。 config_type 否 String 指定要查询的配置类型，可选值有以下两种 “custom”为查询用户自定义配置。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
ModelArts CLI命令功能介绍 - AI开发平台ModelArts

configure ma-cli鉴权命令，支持用户名密码、AK/SK image ModelArts镜像构建、镜像注册、查询已注册镜像信息等 obs-copy 本地和OBS文件/文件夹间的相互复制 ma-job ModelArts训练作业管理，包含作业提交、资源查询等 dli-job

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
修改工作空间 - AI开发平台ModelArts

_id同时使用。 auth_type 否 String 授权类型。可选值有PUBLIC、PRIVATE、INTERNAL。默认值为PUBLIC。 PUBLIC：租户内部公开访问。 PRIVATE：仅创建者和主账号可访问。 INTERNAL：创建者、主账号、指定IAM子账号可访问，需要与grants参数配合使用。

帮助中心 > AI开发平台ModelArts > API参考 > 工作空间管理
发布免费算法 - AI开发平台ModelArts

等，让资产更吸引人。修改封面图和二级标题在发布的资产详情页面，单击右侧的“编辑”，选择上传新的封面图，为资产编辑独特的主副标题。编辑完成之后单击“保存”。封面图和二级标题内容自动同步，您可以直接在资产详情页查看修改结果。图1 修改封面图和二级标题编辑标签单击标签右侧的

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

returned Connection refused, retrying”。原因分析 NCCL是一个提供GPU间通信原语的库，实现集合通信和点对点发送/接收原语。当训练作业出现NCCL的报错时，可以通过调整NCCL的环境变量尝试解决问题。处理步骤进入状态“运行失败”的训练作业

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 训练作业运行失败
免费体验MaaS预置服务 - AI开发平台ModelArts

选择“预置服务”页签。领取免费调用额度。在预置服务列表，选择所需的服务，单击操作列的“领取”。当领取置灰时，表示该服务的免费额度已领取。有以下两种方式免费体验预置服务。在“模型体验”页面进行推理。在预置服务列表，选择所需的服务，单击操作列的“体验”，跳转到“模型体验”页面，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

触发条件和下面的因素有关：文件名越长，文件数量的上限越小。 blocksize越小，文件数量的上限越小。 blocksize系统默认为4096B，总共有三种大小：1024B、2048B、4096B。创建文件越快，越容易触发（机制大概是：有一个缓存，这块大小和上面的1和2有关，

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

使用平台推荐的权重文件，可提高模型的训练、压缩、部署和调优等服务的使用效率。权重文件指的是模型的参数集合。使用推荐权重参数配置完成后，单击“创建”，创建自定义模型。在模型列表，单击模型名称可以进入详情页查看模型详细信息和任务。当模型“状态”变成“创建成功”时，表示模型创建完成。

帮助中心 > AI开发平台ModelArts > 快速入门
精度问题概述 - AI开发平台ModelArts

数值计算结果通常会有差异，比如GPU和CPU之间，GPU各版本之间，数值计算结果都有一定差异，在特定的容限范围内，不会影响模型的最终收敛。所以，计算的数值差异是很常规的现象，并非错误。为了更好地了解这种计算差异，并且能够正确区分正常计算差异和引起模型精度问题的异常差异，本指南提

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移精度调优
使用CES监控Lite Server资源 - AI开发平台ModelArts

nvidia-smi命令异常请检查GPU驱动是否正常 GPU卡驱动不可用 GPU 重要 nvidia-fabricmanager版本和GPU驱动版本不一致请检查GPU驱动版本和nvidia-fabricmanager版本 nvidia-fabricmanager 无法正常工作，影响 GPU 的使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源

总条数： 823

上一页
1
...
32
33
34
...
42
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练的数据集预处理说明 - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

重置AppCode - AI开发平台ModelArts

Standard资源管理 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

获取智能任务的信息 - AI开发平台ModelArts

Lite Cluster资源开通 - AI开发平台ModelArts

创建训练作业版本 - AI开发平台ModelArts

Standard自动学习 - AI开发平台ModelArts

Standard专属资源池 - AI开发平台ModelArts

查询训练作业参数列表 - AI开发平台ModelArts

ModelArts CLI命令功能介绍 - AI开发平台ModelArts

修改工作空间 - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

训练作业运行失败，出现NCCL报错 - AI开发平台ModelArts

免费体验MaaS预置服务 - AI开发平台ModelArts

常见的磁盘空间不足的问题和解决办法 - AI开发平台ModelArts

使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 - AI开发平台ModelArts

精度问题概述 - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线