搜索_华为云

新建Workflow工作流 - AI开发平台ModelArts

String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 name 是 String Workflow工作流名称，1到64位只包含中英文、数字、空格、下划线（_）和中划线（-），并且以中英文开头。 description

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。提示：本文档适用于仅使用OBS对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

本文档利用训练框架PyTorch_npu+华为自研Ascend Snt9B硬件，为用户提供了常见主流开源大模型在ModelArts Standard上的预训练和全量微调方案。本方案目前仅适用于部分企业客户，完成本方案的部署，需要先联系您所在企业的华为方技术支持。适配的CANN版本是cann_8.0

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907）
准备数据（可选） - AI开发平台ModelArts

此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据（可选） - AI开发平台ModelArts

此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 准备工作
获取Workflow工作流列表 - AI开发平台ModelArts

训练数据的名称。填写1-64位，仅包含英文、数字、下划线（_）和中划线（-），并且以英文开头的名称。 type String 数据来源的类型，可选值为dataset、obs、swr、model、label_task、service、image。 value Map<String,Object>

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

推理部署使用的服务框架是vLLM。vLLM支持v0.6.0版本。仅支持FP16和BF16数据类型推理。本案例仅支持在专属资源池上运行。专属资源池驱动版本要求23.0.6。适配的CANN版本是cann_8.0.rc3。支持的模型列表和权重文件本方案支持vLLM的v0.6.0版本。不同vLLM

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
准备数据（可选） - AI开发平台ModelArts

此小节为自定义数据集执行过程，如非自定义数据集此小节忽略。本教程使用到的是LLamaFactory代码包自带数据集。您也可以自行准备数据集，目前支持alpaca格式和sharegpt格式的微调数据集；使用自定义数据集时，请更新代码目录下data/dataset_info.json文件；请务必在dataset_info

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 准备工作
管理Lite Cluster资源池的游离节点 - AI开发平台ModelArts

资源标签、删除资源标签、搜索等操作。续费/开通自动续费/修改自动续费对于包年/包月的节点，在“节点管理”页签中提供了续费、开通自动续费和修改自动续费功能，并支持对多个节点进行批量操作。添加/编辑/删除资源标签资源标签用于方便管理资源的计费账单。勾选节点名称，选择节点列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
管理Standard专属资源池的游离节点 - AI开发平台ModelArts

资源标签、删除资源标签、搜索等操作。续费/开通自动续费/修改自动续费对于包年/包月的节点，在“节点管理”页签中提供了续费、开通自动续费和修改自动续费功能，并支持对多个节点进行批量操作。添加/编辑/删除资源标签资源标签用于方便管理资源的计费账单。勾选节点名称，选择节点列表

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
昇腾能力应用地图 - AI开发平台ModelArts

昇腾能力应用地图 ModelArts支持如下开源模型基于Ascend卡进行训练和推理。主流三方大模型 ModelArts针对以下主流的LLM大模型进行了基于昇腾NPU的适配工作，可以直接使用适配过的模型进行推理训练。表1 LLM模型训练能力支持模型支持模型参数量应用场景

 帮助中心 > AI开发平台ModelArts > 最佳实践
修改Workflow工作流 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 workflow_id 是 String 工作流的ID。请求参数表2 请求Body参数参数是否必选参数类型描述 name 否 String 工作流名称。填写1-64位，仅包含英文、数字、下划线（_）和中划线（-），并且以英文开头的名称。

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
设置无条件自动重启 - AI开发平台ModelArts

导致训练周期长，而无条件自动重启可以避免这类问题。无条件自动重启是指当训练作业失败时，不管什么原因系统都会自动重启训练作业，提高训练成功率和提升作业的稳定性。为了避免无效重启浪费算力资源，系统最多只支持连续无条件重启3次。为了避免丢失训练进度、浪费算力，开启此功能前请确认代码已

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
自动续费 - AI开发平台ModelArts
自动续费 - AI开发平台ModelArts

自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致ModelArts中专属资源池不能使用。自动续费的规则如下所述：以专属资源池的到期日计算第一次自动续费日期和计费周期。专属资源池自动续费周期以您选择的续费时长为准。例如，您选择了3个月，专属资源池即在每次到期前自动续费3个月。在专属资源池到期前

 帮助中心 > AI开发平台ModelArts > 计费说明 > 续费
查询Workflow工作流 - AI开发平台ModelArts

训练数据的名称。填写1-64位，仅包含英文、数字、下划线（_）和中划线（-），并且以英文开头的名称。 type String 数据来源的类型，可选值为dataset、obs、swr、model、label_task、service、image。 value Map<String,Object>

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
管理训练容器环境变量 - AI开发平台ModelArts

“S3_VERIFY_SSL=0” S3_USE_HTTPS 访问OBS是否使用HTTPS。 “S3_USE_HTTPS=1” 表5 PIP源和API网关地址环境变量变量名说明示例 MA_PIP_HOST PIP源域名。 “MA_PIP_HOST=repo.myhuaweicloud

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
单模型性能调优AOE - AI开发平台ModelArts

单模型性能调优AOE 使用AOE工具可以在模型转换阶段对于模型运行和后端编译过程进行执行调优，注意AOE只适合静态shape的模型调优。在AOE调优时，容易受当前缓存的一些影响，建议分两次进行操作，以达到较好的优化效果（第一次执行生成AOE的知识库，在第二次使用时可以复用）。在该

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导 > 性能调优
使用CES监控Lite Server资源 - AI开发平台ModelArts

nvidia-smi命令异常请检查GPU驱动是否正常 GPU卡驱动不可用重要 nvidia-fabricmanager版本和GPU驱动版本不一致请检查GPU驱动版本和nvidia-fabricmanager版本 nvidia-fabricmanager 无法正常工作，影响 GPU 的使用

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理 > 监控Lite Server资源
Cluster资源池节点故障如何定位 - AI开发平台ModelArts

通过nvidia-smi -a查询到Retired Pages中，Single Bit和Double Bit之和大于64。发起维修流程。 NT_GPU_CARD_LOSE GPU 掉卡 GPU卡丢失。节点规格的GPU卡数和以下任意值不相等： lspci可见GPU卡数。 nvidia-smi可见卡数。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Cluster
训练声音分类模型 - AI开发平台ModelArts

区分能力。 accuracy：准确率所有样本中，模型正确预测的样本比率，反映模型对样本整体的识别能力。 f1：F1值 F1值是模型精确率和召回率的加权调和平均，用于评价模型的好坏，当F1较高时说明模型效果较好。同一个自动学习项目可以训练多次，每次训练会注册一个新的模型版本。如第一次训练版本号为“0

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现声音分类

总条数： 1116

上一页
1
...
47
48
49
...
56
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

新建Workflow工作流 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

获取Workflow工作流列表 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

管理Lite Cluster资源池的游离节点 - AI开发平台ModelArts

管理Standard专属资源池的游离节点 - AI开发平台ModelArts

昇腾能力应用地图 - AI开发平台ModelArts

修改Workflow工作流 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

自动续费 - AI开发平台ModelArts

查询Workflow工作流 - AI开发平台ModelArts

管理训练容器环境变量 - AI开发平台ModelArts

单模型性能调优AOE - AI开发平台ModelArts

使用CES监控Lite Server资源 - AI开发平台ModelArts

Cluster资源池节点故障如何定位 - AI开发平台ModelArts

训练声音分类模型 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线