搜索_华为云

修改服务 - AI开发平台ModelArts
修改服务 - AI开发平台ModelArts

按要求进行升级前准备，做好验证，即可实现业务不中断的无损升级。表1 支持无损滚动升级的场景创建AI应用的元模型来源服务使用的是公共资源池服务使用的是专属资源池从训练中选择元模型不支持不支持从容器镜像中选择元模型不支持支持，创建AI应用的自定义镜像需要满足创建AI应用的自定义镜像规范。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 部署AI应用（部署上线）
部署为批量服务 - AI开发平台ModelArts

参数不同。当AI应用输入为JSON文件时，则需要根据配置文件生成映射文件；如果AI应用输入为文件时，则不需要。批量服务只支持使用公共资源池，暂不支持使用专属资源池。操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“模型部署 > 批量服务”，默认进入“批量服务”列表。

帮助中心 > AI开发平台ModelArts > 推理部署（历史文档待下线） > 部署AI应用（部署上线） > 部署AI应用（批量服务）
为什么在ModelArts数据标注平台标注数据提示标注保存失败？ - AI开发平台ModelArts

可能是用户本地网络的原因，网速不稳定或者网络配置有问题，均可能导致保存失败。解决方案 1. 切换为稳定的网络后重试。 2. 初始化网络配置，使用管理员权限启动CMD，输入netsh winsock reset指令，完成后重启电脑，再登录数据标注平台重试。父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
查询训练作业版本列表 - AI开发平台ModelArts

dataset_version String 训练作业的数据集版本ID。 type String 数据集类型。 “obs”：表示使用OBS的数据。 “dataset”：表示使用数据集的数据。 data_url String OBS的桶路径。表7 model_metric_list属性列表参数

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
SFT全参微调数据处理 - AI开发平台ModelArts

parquet 如果在准备数据章节已下载数据集，此处无需重复操作。 SFT全参微调和LoRA微调训练使用的是同一个数据集，数据处理一次即可，训练时可以共用。数据预处理说明使用数据预处理脚本preprocess_data.py脚本重新生成.bin和.idx格式的SFT全参微调数据。preprocess_data

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > SFT全参微调
变更计费模式概述 - AI开发平台ModelArts

将专属资源池的计费模式从按需计费转为包年/包月，可以让您享受一定程度的价格优惠。将专属资源池的计费模式从包年/包月转为按需计费，可以更加灵活地使用ModelArts计算资源。说明：包年/包月计费模式到期后，按需计费模式才会生效。按需转包年/包月包年/包月转按需父主题：变更计费模式

 帮助中心 > AI开发平台ModelArts > 计费说明 > 变更计费模式
查询服务更新日志 - AI开发平台ModelArts

服务ID。表2 Query参数参数是否必选参数类型描述 update_time 否 Number 待过滤的更新时间，查询在线服务更新日志可使用，可准确过滤出某次更新任务；默认不过滤。请求参数表3 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

单击“创建训练作业”，进入创建训练作业页面，填写作业信息，创建方式参考表1，其他参数填写请参考创建训练作业。表1 创建训练作业的创建方式（使用自定义镜像）参数名称说明创建方式必选，选择“自定义算法”。启动方式必选，选择“自定义”。镜像必填，单击右边的“选择”，从容器镜像中选择上一步上传到SWR的镜像。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

he”，实际下载的数据会翻倍。例如只下载了2.5TB的数据，程序就显示空间不够而失败，因为/cache只有4TB的可用空间。处理方法在使用Tensorflow多节点作业下载数据时，正确的下载逻辑如下： import argparse parser = argparse.ArgumentParser()

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
删除资源池 - AI开发平台ModelArts

空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 os.modelarts/name String 用户指定的pool名称。 os.modelarts/resource.id String 资源池的主资源id，通常提供给cbc使用。 os.modelarts/tenant

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
预训练数据处理 - AI开发平台ModelArts

bin和alpaca_text_document.idx文件。自定义数据如果是用户自己准备的数据集，可以使用Ascendspeed代码仓中的转换工具将json格式数据集转换为训练中使用的.idx + .bin格式。 #示例： #1.将准备好的json格式数据集存放于/home/ma-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Baichuan2-13B模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

add_argument('--init_method', default='tcp://xxx',help="init-method") 通过使用解析方式args, unparsed = parser.parse_known_args()代替args = parser.parse_args()解决该问题。代码示例如下：

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
开启训练故障自动重启功能 - AI开发平台ModelArts

自动从训练中断的位置接续训练，加载中断生成的checkpoint，中间不需要改动任何参数（支持预训练、LoRA微调、SFT微调）。如果要使用自动重启功能，资源规格必须选择八卡规格。当前功能还处于试验阶段，只有llama3-8B/70B适配。父主题：主流开源大模型基于Standard适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906）
线下容器镜像构建及调试 - AI开发平台ModelArts

可以直接把SFS的目录直接挂载到调试节点的"/mnt/sfs_turbo"目录，或者保证对应目录的内容和SFS盘匹配。调试时建议使用接近的方式，即：启动容器实例时使用"-v"参数来指定挂载某个宿主机目录到容器环境。 docker run -ti -d -v /mnt/sfs_turbo:/sfs

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 单机单卡
删除服务 - AI开发平台ModelArts
删除服务 - AI开发平台ModelArts

用户项目ID。获取方法请参见获取项目ID和名称。 service_id 是 String 服务ID，如需批量删除多个服务，则将多个service_id使用英文半角逗号拼接。请求参数表2 请求Header参数参数是否必选参数类型描述 X-Auth-Token 是 String 用户

 帮助中心 > AI开发平台ModelArts > API参考 > 服务管理
ModelArts环境挂载目录说明 - AI开发平台ModelArts

rnetes.io/serviceaccount 是 / 训练任务表2 训练任务挂载点介绍挂载点是否只读备注 /xxx 否专属池使用SFS盘挂载的目录，路径由客户自己指定。 /home/ma-user/modelarts 否空文件夹，建议用户主要用这个目录。 /cache

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
预训练数据处理 - AI开发平台ModelArts

bin和alpaca_text_document.idx文件。图1 处理后的数据自定义数据如果是用户自己准备的数据集，可以使用Ascendspeed代码仓中的转换工具将json格式数据集转换为训练中使用的.idx + .bin格式。 #示例： #1.将准备好的json格式数据集存放于/home/ma-

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > LLama2系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
预训练数据处理 - AI开发平台ModelArts

bin和alpaca_text_document.idx文件。图1 处理后的数据自定义数据如果是用户自己准备的数据集，可以使用Ascendspeed代码仓中的转换工具将json格式数据集转换为训练中使用的.idx + .bin格式。 #示例 #1.将准备好的json格式数据集存放于/home/ma-u

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > Qwen系列模型基于DevServer适配PyTorch NPU训练指导（6.3.904） > 预训练
迁移适配 - AI开发平台ModelArts
迁移适配 - AI开发平台ModelArts

4量化默认为FP16精度。${HOME} 目录需要根据读者实际数据集及模型路径匹配，适配的数据集是ADGEN数据集，如果需要读者也可以使用自定义的数据集训练，具体请参考使用自己数据集。另外通过指定local_rank为-1为单卡模式，多卡模式下无需指定，会默认启动DistributedDataParallel（DDP）

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于LLM模型的GPU训练业务迁移至昇腾指导
创建资源池 - AI开发平台ModelArts

空间时默认值为“0”，存在创建并使用的工作空间，以实际取值为准。 os.modelarts/name String 用户指定的pool名称。 os.modelarts/resource.id String 资源池的主资源id，通常提供给cbc使用。 os.modelarts/tenant

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理

总条数： 1852

上一页
1
...
83
84
85
...
93
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修改服务 - AI开发平台ModelArts

部署为批量服务 - AI开发平台ModelArts

为什么在ModelArts数据标注平台标注数据提示标注保存失败？ - AI开发平台ModelArts

查询训练作业版本列表 - AI开发平台ModelArts

SFT全参微调数据处理 - AI开发平台ModelArts

变更计费模式概述 - AI开发平台ModelArts

查询服务更新日志 - AI开发平台ModelArts

已有镜像迁移至ModelArts用于训练模型 - AI开发平台ModelArts

Tensorflow多节点作业下载数据到/cache显示No space left - AI开发平台ModelArts

删除资源池 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

ModelArts训练作业无法解析参数，日志报错 - AI开发平台ModelArts

开启训练故障自动重启功能 - AI开发平台ModelArts

线下容器镜像构建及调试 - AI开发平台ModelArts

删除服务 - AI开发平台ModelArts

ModelArts环境挂载目录说明 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

预训练数据处理 - AI开发平台ModelArts

迁移适配 - AI开发平台ModelArts

创建资源池 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线