搜索_华为云

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境场景描述本文旨在指导如何在GPU裸金属服务器上，安装NVIDIA、CUDA驱动等环境配置。由于不同GPU预置镜像中预安装的软件不同，您通过Lite Server算力资源和镜像版本配套关系章节查看已安装的软件。下面为常见的软件

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli upload”可以往AI Gallery仓库上传资产。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
重建、停止或删除训练作业 - AI开发平台ModelArts

重建、停止或删除训练作业另存为算法当您需要修改训练作业的算法时，可以在训练作业详情页面右上角，单击“另存为算法”。在“创建算法”页面中，会自动填充上一次训练作业的算法参数配置，您可以根据业务需求在原来算法配置基础上进行修改。订阅算法不支持另存为算法。重建训练作业当对创

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍场景介绍本文介绍如何将客户已有的PyTorch训练业务迁移到昇腾设备上运行并获得较好的模型训练效果。华为云ModelArts针对该场景提供了系统化的迁移指导，包括迁移原理、迁移流程以及迁移后的精度调试及性能调优方法介绍。此外，ModelArts提

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
环境准备 - AI开发平台ModelArts
环境准备 - AI开发平台ModelArts

环境准备开通裸金属服务器资源（详情请参见裸金属服务器资源），并在裸金属服务器上搭建迁移环境（详情请参见裸金属服务器环境配置指导）。启动华为云预置镜像环境。本示例使用贵阳一的镜像环境。 # shell docker run --privileged --name chatglm-test

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
查找Workflow工作流 - AI开发平台ModelArts

查找Workflow工作流查找Workflow 在Workflow列表页，您可以通过搜索框，根据工作流的属性类型快速搜索过滤到相应的工作流，可节省您的时间。登录ModelArts管理控制台，在左侧导航栏选择“开发空间>Workflow”，进入Workflow总览页面。在工作

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 管理Workflow
各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换在训练开始前，因模型权重文件可能与训练框架不匹配或有优化，因此需要针对模型的tokenizer文件进行修改或替换，不同模型的tokenizer文件修改内容如下。 falcon-11B模型在训练开始前，针对falcon-11B模型中的tokenizer文件

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
管理和查看数据处理任务 - AI开发平台ModelArts

管理和查看数据处理任务删除数据处理任务当已有的数据处理任务不再使用时，您可以删除数据处理任务。请注意，数据处理任务删除后不可恢复，请谨慎操作。处于“完成”、“失败”、“已停止”、“运行失败”、“部署中”状态的训练作业，您可以单击操作列的“删除”，删除对应的数据处理任务。查看数据处理任务详情

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
Lite Cluster使用流程 - AI开发平台ModelArts

Lite Cluster使用流程 ModelArts Lite Cluster面向k8s资源型用户，提供托管式k8s集群，并预装主流AI开发插件以及自研的加速插件，以云原生方式直接向用户提供AI Native的资源、任务等能力，用户可以直接操作资源池中的节点和k8s集群。本文旨在帮助您了解Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster使用前必读
配置Grafana数据源 - AI开发平台ModelArts

配置Grafana数据源在Grafana配置数据源后，即可通过Grafana查看ModelArts的监控数据。前提条件已安装Grafana。配置Grafana数据源获取Grafana数据源配置代码。进入AOM管理控制台。图1 AOM管理控制台在左侧导航栏中选择“Prometheus监控

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源监控 > 使用Grafana查看AOM中的监控指标
LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） LLaVA是一种新颖的端到端训练的大型多模态模型，它结合了视觉编码器和Vicuna，用于通用的视觉和语言理解，实现了令人印象深刻的聊天能力，在科学问答（Science QA）上达到了新的高度。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Lite Cluster资源配置流程 - AI开发平台ModelArts

Lite Cluster资源配置流程本章节介绍Lite Cluster环境配置详细流程，适用于加速卡环境配置。前提条件已完成集群资源购买和开通，具体请参见Lite Cluster资源开通。集群的配置使用需要用户具备一定的知识背景，包括但不限于Kubernetes基础知识、网络知识、存储和镜像知识。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
服务启动失败 - AI开发平台ModelArts

服务启动失败问题现象当服务事件中出现如下事件时，表示容器启动失败。图1 服务启动失败原因分析服务启动失败的原因比较多样，可能有如下几种情况： AI应用本身问题，无法启动镜像中配置的端口错误健康检查配置有问题模型推理代码customize_service.py编写有问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
ModelArts数据管理支持哪些格式？ - AI开发平台ModelArts

ModelArts数据管理支持哪些格式？不同类型的数据集支持不同的功能。数据集类型标注类型创建数据集导入数据导出数据发布数据集修改数据集管理版本自动分组数据特征文件型图像分类支持支持支持支持支持支持支持支持物体检测支持支持支持支持

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
管理Lite Cluster资源池的游离节点 - AI开发平台ModelArts

管理Lite Cluster资源池的游离节点如果资源中存在游离节点，即没有被纳管到资源池中的节点，可在“AI专属资源池 > 弹性集群Cluster >节点”下查看此类节点的相关信息。系统支持对游离节点进行续费、退订、开通/修改自动续费、添加/编辑资源标签、删除资源标签、搜索等操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
管理Standard专属资源池的游离节点 - AI开发平台ModelArts

管理Standard专属资源池的游离节点如果资源中存在游离节点，即没有被纳管到资源池中的节点，可在“AI专属资源池 > 弹性集群Cluster >节点”下查看此类节点的相关信息。系统支持对游离节点进行续费、退订、开通/修改自动续费、添加/编辑资源标签、删除资源标签、搜索等操作。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件在服务器（ModelArts Lite云服务器或者是本地Windows/Linux等服务器）上登录Gallery CLI配置工具后，通过命令“gallery-cli download”可以从AI Gallery仓库下载资源。命令说明登录Gallery

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
Finetune训练 - AI开发平台ModelArts

Finetune训练本章节介绍SDXL&SD 1.5模型的Finetune训练过程。Finetune是指在已经训练好的模型基础上，使用新的数据集进行微调（fine-tuning）以优化模型性能。启动SD1.5 Finetune训练服务使用ma-user用户执行如下命令运行训练脚本。

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）

总条数： 902

上一页
1
...
33
34
35
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

使用Gallery CLI配置工具上传文件 - AI开发平台ModelArts

重建、停止或删除训练作业 - AI开发平台ModelArts

训练业务迁移到昇腾设备场景介绍 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

环境准备 - AI开发平台ModelArts

查找Workflow工作流 - AI开发平台ModelArts

各个模型训练前文件替换 - AI开发平台ModelArts

管理和查看数据处理任务 - AI开发平台ModelArts

Lite Cluster使用流程 - AI开发平台ModelArts

配置Grafana数据源 - AI开发平台ModelArts

LLaVA模型基于DevServer适配PyTorch NPU推理指导（6.3.906） - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

服务启动失败 - AI开发平台ModelArts

ModelArts数据管理支持哪些格式？ - AI开发平台ModelArts

管理Lite Cluster资源池的游离节点 - AI开发平台ModelArts

管理Standard专属资源池的游离节点 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线