搜索_华为云

故障恢复 - AI开发平台ModelArts
故障恢复 - AI开发平台ModelArts

可用区通过延迟低、吞吐量高且冗余性高的网络连接在一起。利用可用区，您可以设计和操作在可用区之间无中断地自动实现故障转移的应用程序和数据库。与传统的单个或多个数据中心基础设施相比，可用区具有更高的可用性、容错性和可扩展性。 ModelArts通过对DB的数据进行备份，保证在原数据被破坏或损坏的情况下可以恢复业务。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

服务推荐使用免费资源。但是数据集存储在OBS桶中会收取少量费用，具体计费请参见OBS价格详情页，案例使用完成后请及时清除资源和数据。准备工作注册华为账号并开通华为云、实名认证注册华为账号并开通华为云进行实名认证配置委托访问授权 ModelArts使用过程中涉及到OBS、

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

notebook目录code_dir打包上传到obs_path中。准备训练输出，与单机训练作业调试4相同。查看训练支持的AI框架，与单机训练作业调试5相同。保存当前Notebook为新镜像，与单机训练作业调试9相同。 Estimator初始化。 from modelarts

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业 > 训练作业调测
训练的数据集预处理说明 - AI开发平台ModelArts

--tokenizer-name-or-path：tokenizer的存放路径，与HF权重存放在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.910） > 训练脚本说明参考
训练的数据集预处理说明 - AI开发平台ModelArts

--tokenizer-name-or-path：tokenizer的存放路径，与HF权重存放在一个文件夹下。 --seq-length：要处理的最大seq length。 --workers：设置数据处理使用执行卡数量 / 启动的工作进程数。 --log-interval：是一个用于设置日志输出

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
部署在线服务 - AI开发平台ModelArts

} } }] } mapping_rule 否 Map 输入参数与csv数据的映射关系，仅当mapping_type为csv时需要填写。映射规则与模型配置文件config.json中输入参数的定义方式相似，只需要在每一个基本类型（string/n

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

安装nvidia-fabricmanager Ant系列GPU支持NvLink & NvSwitch，若您使用多GPU卡的机型，需额外安装与驱动版本对应的nvidia-fabricmanager服务使GPU卡间能够互联，否则可能无法正常使用GPU实例。 nvidia-fabricmanager必须和nvidia

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置 > 配置Lite Server软件环境
管理Lite Cluster节点 - AI开发平台ModelArts

长，对于非本地盘类故障，本地盘数据可以保留。 - 重部署：通过更换为新服务器实现修复，修复耗时较短，本地盘数据会丢失。修复期间实例将无法工作，请确保相关实例业务已离线。如果云服务器上的业务不可停止，请勿修复，并联系技术支持进行处理。若选择了重部署修复方式，实例会立即关机并迁移

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

5-32b模型暂不支持单卡启动，glm4-9b模型仅支持单卡启动。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

--image-name String 否查询指定镜像名称的镜像详情。 -wi / --workspace-id String 否查询指定工作空间下的镜像信息。 -pn / --page-num Int 否镜像页索引，默认是第1页。 -ps / --page-size Int 否

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.907）
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

各模型支持的卡数请参见附录：基于vLLM不同模型推理支持最小卡数和最大序列说明章节。操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行，需要购买ModelArts专属资源池。准备权重准备对应模型的权重文件。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

由于案例中需要下载商用版CANN，因此本案例仅面向有下载权限的渠道用户，非渠道用户建议参考其他自定义镜像制作教程。 Mindspore版本与CANN版本，CANN版本与Ascend驱动/固件版本均有严格的匹配关系，版本不匹配会导致训练失败。前提条件已注册华为账号并开通华为云，且在使用Mod

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU推理指导（6.3.908）
查询训练作业列表 - AI开发平台ModelArts

应的“asc”，升序排序。 group_by String 查询作业要搜索的分组条件。 workspace_id String 作业所处的工作空间，默认值为“0”。 ai_project String 作业所属的AI项目，默认值为"default-ai-project"。 items

帮助中心 > AI开发平台ModelArts > SDK参考 > 训练管理 > 训练作业
与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务产品文档》。与对象存储服务的关系 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 产品介绍
ModelArts与其他服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系示意图与统一身份认证服务的关系 ModelArts使用统一身份认证服务（Identity and Access Management，简称IAM）实现认证功能。IAM的更多信息请参见《统一身份认证服务用户指南》。与对象存储服务的关系 ModelArts使用对象存储服务（Object

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
创建ModelArts数据增强任务 - AI开发平台ModelArts

创建ModelArts数据增强任务前提条件数据已准备完成：已经创建数据集或者已经将数据上传至OBS。确保您使用的OBS与ModelArts在同一区域。创建数据处理任务登录ModelArts管理控制台，在左侧的导航栏中选择“数据准备>数据处理”，进入“数据处理”页面。在

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 处理ModelArts数据集中的数据
ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

g --uid String 否自定义镜像运行的UID，默认值1000。 --working-dir String 否运行算法时所在的工作目录。 --local-code-dir String 否算法的代码目录下载到训练容器内的本地路径。 --user-command String

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
推理场景介绍 - AI开发平台ModelArts

推理场景介绍方案概览本方案介绍了在ModelArts的Lite DevServer上使用昇腾计算资源开展常见开源大模型Llama、Qwen、ChatGLM、Yi、Baichuan等推理部署的详细过程。本方案利用适配昇腾平台的大模型推理服务框架vLLM和华为自研昇腾Snt9B硬

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909）

总条数： 856

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

故障恢复 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

使用SDK调测多机分布式训练作业 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

训练的数据集预处理说明 - AI开发平台ModelArts

部署在线服务 - AI开发平台ModelArts

GPU服务器上配置Lite Server资源软件环境 - AI开发平台ModelArts

管理Lite Cluster节点 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MindSpore+Ascend） - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

与其他云服务的关系 - AI开发平台ModelArts

ModelArts与其他服务的关系 - AI开发平台ModelArts

创建ModelArts数据增强任务 - AI开发平台ModelArts

ma-cli ma-job训练作业支持的命令 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线