搜索_华为云

预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
LoRA微调训练 - AI开发平台ModelArts

当环境问题导致训练作业异常时，系统将自动修复异常或隔离节点，并重启训练作业，提高训练成功率。为了避免丢失训练进度、浪费算力。此功能已适配断点续训练。图2 开启故障重启断点续训练是通过checkpoint机制实现。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.909）
使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

AI引擎的值是系统自动写入的，无需设置。图5 设置元模型来源在AI应用列表页面，当AI应用状态变为“正常”时，表示AI应用创建成功。单击AI应用操作列的“部署”，弹出“版本列表”，单击操作列“部署>在线服务”，将AI应用部署为在线服务。

帮助中心 > AI开发平台ModelArts > 快速入门
配置多分支节点数据 - AI开发平台ModelArts

"item_version_id", # 算法订阅版本ID，也可直接填写版本号 parameters=[] ), # 训练使用的算法对象，示例中使用AIGallery订阅的算法；部分算法超参的值如果无需修改，则在parameters字段中可以不填写，系统自动填充相关超参值

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
部署图像分类服务 - AI开发平台ModelArts

建议使用专属资源池，或者联系系统管理员创建公共资源池。计算节点个数：默认为1，输入值必须是1-5之间的整数。是否自动停止：启用该参数并设置时间后，服务将在指定时间后自动停止。如果不启用此参数，在线服务将一直运行，同时一直收费，自动停止功能可以帮您避免产生不必要的费用。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
训练作业状态显示“审核作业初始化” - AI开发平台ModelArts

训练作业状态显示“审核作业初始化” 问题现象当创建训练作业的“算法来源”选择“自定义”镜像创建训练作业时，训练作业状态显示审核作业初始化。原因分析自定义镜像首次运行时，需要先审核镜像，通过审核之后才可创建作业，即当前状态为审核作业初始化。父主题：业务代码问题

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
准备预测分析数据 - AI开发平台ModelArts

如果您的原始表格中已包含表头，需要开启“导入是否包含表头”开关，系统会导入文件的第一行（表头）作为列名，无需再手动修改Schema信息。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现预测分析
AI Gallery简介 - AI开发平台ModelArts

AI Gallery简介 AI Gallery算法、镜像、模型、Workflow等AI数字资产的共享，为高校科研机构、AI应用开发商、解决方案集成商、企业级/个人开发者等群体，提供安全、开放的共享及交易环节，加速AI资产的开发与落地，保障AI开发生态链上各参与方高效地实现各自的商业价值

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版）
使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误问题现象使用预置算法创建训练作业，训练失败，日志中出现如下报错。 KeyError: 'bndbox' 原因分析用于训练的数据集中，使用了“非矩形框”标注。而预置使用算法不支持“非矩形框”标注的数据集。处理方法此问题有两种解决方法

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” 问题现象代码在Notebook的keras镜像中可以正常运行，在训练模块使用tensorflow.keras训练报错时，出现如下报错：AttributeError

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 业务代码问题
如何在训练中加载部分训练好的参数？ - AI开发平台ModelArts

如何在训练中加载部分训练好的参数？在训练作业时，需要从预训练的模型中加载部分参数，初始化当前模型。请您通过如下方式加载：通过如下代码，您可以查看所有的参数。 from moxing.tensorflow.utils.hyper_param_flags import mox_flags

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 编写训练代码
JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？问题现象 JupyterLab中保存文件时报错如下：原因分析浏览器安装了第三方插件proxy进行了拦截，导致无法进行保存。在Notebook中的运行文件超过指定大小就会提示此报错。 jupyter页面打开时间太长。网络环境原因

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 代码运行常见错误
在推理生产环境中部署推理服务 - AI开发平台ModelArts

系统运行架构选择“ARM”。图2 设置AI应用单击“立即创建”开始AI应用创建，待应用状态显示“正常”即完成AI应用创建。若权重文件大于60G，创建AI应用会报错，提示模型大于60G，请提工单扩容。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
昇腾迁移融合算子API替换样例 - AI开发平台ModelArts

_norm(x.float()).type_as(x) return output * self.weight input_data = torch.randn(128, 256).cuda() torch_rms_norm = TorchRMSNorm((128

帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > GPU训练业务迁移至昇腾的通用指导 > PyTorch迁移性能调优 > 自动诊断工具MA-Advisor使用指导
查询训练作业参数详情 - AI开发平台ModelArts

表6 nfs属性列表参数参数类型说明 id String SFS Turbo 文件系统 ID。 src_path String SFS Turbo 文件系统地址。 dest_path String 训练作业的本地路径。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
动态挂载OBS - AI开发平台ModelArts

动态挂载OBS 功能介绍在运行中的Notebook实例，支持将“OBS并行文件系统”挂载到实例中指定的文件目录，挂载后可以在容器中以文件系统操作方式完成OBS并行文件系统对象的读写。接口约束暂无约束调试您可以在API Explorer中调试该接口，支持自动认证鉴权。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建Workflow模型注册节点 - AI开发平台ModelArts

该字段不需要填，系统也能自动识别出model目录下的推理代码。否 str dependencies 推理代码及模型需安装的包，默认为空。从配置文件读取。否 str model_metrics 模型精度信息，从配置文件读取。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
训练图像分类模型 - AI开发平台ModelArts

如果关闭或退出此页面，系统仍然在执行训练操作。在“图像分类”节点中，待训练状态由“运行中”变为“运行成功”，即完成了模型的自动训练。训练完成后，您可以单击“图像分类”节点上方的按钮，查看相关指标信息，如“准确率”、“评估结果”等。评估结果参数说明请参见表1。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用自动学习实现图像分类
GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

return torch._C._cuda_getDeviceCount() > 0 原因分析 nvidia-modprobe是一个Linux工具，用于在系统中加载NVIDIA驱动程序及其相关的内核模块。

帮助中心 > AI开发平台ModelArts > 故障排除 > Lite Server
使用ModelArts Standard专属资源池进行单机单卡训练 - AI开发平台ModelArts

上传数据和算法到OBS 已经在OBS上创建好并行文件系统，请参见创建并行文件系统。已经安装和配置obsutil，请参见安装和配置OBS命令行工具。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard专属资源池训练模型

总条数： 1324

上一页
1
...
9
10
11
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

使用ModelArts Standard自定义算法实现手写数字识别 - AI开发平台ModelArts

配置多分支节点数据 - AI开发平台ModelArts

部署图像分类服务 - AI开发平台ModelArts

训练作业状态显示“审核作业初始化” - AI开发平台ModelArts

准备预测分析数据 - AI开发平台ModelArts

AI Gallery简介 - AI开发平台ModelArts

使用预置算法训练时，训练失败，报“bndbox”错误 - AI开发平台ModelArts

日志提示“AttributeError: 'NoneType' object has no attribute 'dtype'” - AI开发平台ModelArts

如何在训练中加载部分训练好的参数？ - AI开发平台ModelArts

JupyterLab中文件保存失败，如何解决？ - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

昇腾迁移融合算子API替换样例 - AI开发平台ModelArts

查询训练作业参数详情 - AI开发平台ModelArts

动态挂载OBS - AI开发平台ModelArts

创建Workflow模型注册节点 - AI开发平台ModelArts

训练图像分类模型 - AI开发平台ModelArts

GP Vnt1裸金属服务器用PyTorch报错CUDA initialization:CUDA unknown error - AI开发平台ModelArts

使用ModelArts Standard专属资源池进行单机单卡训练 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线