搜索_华为云

构建条件节点控制分支执行 - AI开发平台ModelArts

# 该节点仅作为示例使用，其他字段需自行补充 job_step_1 = wf.steps.JobStep( name="job_step_1", depend_steps=condition_step ) # 该节点仅作为示例使用，其他字段需自行补充 model_step_1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 构建Workflow多分支运行场景
预训练任务 - AI开发平台ModelArts

0_pl_pretrain_70b.sh 和 0_pl_pretrain_13b.sh 。修改模型训练脚本中的超参配置，必须修改的参数如表1所示。其他超参均有默认值，可以参考表1按照实际需求修改。表1 必须修改的训练超参配置参数示例值参数说明 ORIGINAL_TRAIN_DATA_PATH

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906）
欠拟合的解决方法有哪些？ - AI开发平台ModelArts

调整参数和超参数。神经网络中：学习率、学习衰减率、隐藏层数、隐藏层的单元数、Adam优化算法中的β1和β2参数、batch_size数值等。其他算法中：随机森林的树数量，k-means中的cluster数，正则化参数λ等。增加训练数据作用不大。欠拟合一般是因为模型的学习能力不足，一味地增加数据，训练效果并不明显。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard训练作业 > 功能咨询
使用llm-compressor工具量化 - AI开发平台ModelArts

512 执行权重量化： python deepseek_moe_w8a8_int8.py 1、执行权重量化过程中，请保证使用的GPU卡上没有其他进程，否则可能出现OOM； 2、若量化Deepseek-v2-236b模型，大致需要10+小时。使用量化模型使用量化模型需要在NPU的机器上运行。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910） > 推理模型量化
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

准备镜像主机 Step4 制作自定义镜像 Step5 上传镜像至SWR服务 Step6 在ModelArts上创建训练作业前提条件已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。 Step1 创建OBS桶和文件夹在OBS服务中创建桶和

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

准备镜像主机 Step4 制作自定义镜像 Step5 上传镜像至SWR服务 Step6 在ModelArts上创建训练作业前提条件已注册华为账号并开通华为云，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。 Step1 创建OBS桶和文件夹在OBS服务中创建桶和

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
开发第一条Workflow - AI开发平台ModelArts

Gallery>资产集市>算法，搜索自动学习算法-图像分类。单击算法右侧的“订阅”。在弹出的窗口中，勾选“我已阅读并同意《数据安全与隐私风险承担条款》和《华为云AI Gallery服务协议》”后，单击“继续订阅”。订阅完成后，单击“前往控制台”，选择云服务区域为“华北-北京四”，单击“确定”后

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

#启动文件 |---otherfileDirectory #其他依赖文件所在的目录 |---otherfile.py #其他依赖文件在启动文件中，建议用户参考以下方式获取依赖文件所在路径，即示例中的otherfile_path。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
查询网络资源列表 - AI开发平台ModelArts

0.0/12~24 192.168.0.0/16~24。 connection NetworkConnection object 当前网络与其他云服务的连通信息。表10 NetworkConnection 参数参数类型描述 peerConnectionList Array of

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
MaaS使用场景和使用流程 - AI开发平台ModelArts

使用MaaS压缩模型 4 模型部署 ModelArts Studio大模型即服务平台支持将自定义模型部署到计算资源上，便于在“模型体验”或其他业务环境中可以调用该模型。使用MaaS部署模型服务 5 模型体验在ModelArts Studio大模型即服务平台完成模型部署后，可以

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
什么是ModelArts - AI开发平台ModelArts

数据到AI应用的全流程开发过程。包含数据处理、模型训练、AI应用管理、AI应用部署等操作，并且提供AI Gallery功能，能够在市场内与其他开发者分享模型。 ModelArts支持图像分类、物体检测、视频分析、语音识别、产品推荐、异常检测等多种AI应用场景。图1 ModelArts架构

 帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
管理员和开发者权限分离 - AI开发平台ModelArts

包括对自己实例的创建、启动、停止、删除等权限以及周边依赖服务的权限。普通开发者不需要ModelArts专属资源池的操作权限，也不需要查看其他用户的Notebook实例。图1 账号关系示意图配置管理员权限管理员账号需要拥有ModelArts专属资源池的完全控制权限，以及No

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

Deepspeed-ZeRO-3 cutoff_len=8192 Deepspeed-ZeRO-3 以上为建议值，上述参数值仅供参考，如需配置其他加速框架或ZeRO (Zero Redundancy Optimizer)优化器用户可自行选用配置。父主题：训练脚本说明

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 训练脚本说明
设置无条件自动重启 - AI开发平台ModelArts

到训练异常，就无条件重启训练作业。如果未勾选“无条件自动重启”只是打开了“自动重启”开关，则表示仅环境问题导致训练作业异常时才会自动重启，其他问题导致训练作业异常时会直接返回“运行失败”。图1 开启无条件重启 API接口设置通过API接口创建训练作业时，在“metadata”

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
删除网络资源 - AI开发平台ModelArts

0.0/12~24 192.168.0.0/16~24。 connection NetworkConnection object 当前网络与其他云服务的连通信息。表7 NetworkConnection 参数参数类型描述 peerConnectionList Array of

帮助中心 > AI开发平台ModelArts > API参考 > 资源管理
创建Notebook实例 - AI开发平台ModelArts

k会使用/home/ma-user/work目录作为用户的工作空间持久化存储。存放在work目录的内容，在实例停止、重新启动后依然保留，其他目录下的内容不会保留，使用开发环境时建议将需要持久化的数据放在/home/ma-user/work目录。更多Notebook实例的目录挂

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试
无法导入模块 - AI开发平台ModelArts

dirname(__file__) sys.path.append(current_path) # 在sys.path.append执行完毕之后再导入其他模块 from module_dir import module_file 训练作业导入模块时日志出现“ImportError: No module

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
更新服务配置 - AI开发平台ModelArts

2u/modelarts.vm.gpu.p4(需申请)/modelarts.vm.ai1.a310(需申请)，需申请权限才能使用的规格请在华为云创建工单，由ModelArts运维工程师添加权限。 instance_count 是 Integer 模型部署的实例数，当前限制最大实例

 帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
切换Lite Server服务器操作系统 - AI开发平台ModelArts

当前裸金属服务器状态为停止状态。目标操作系统必须是该Region下的IMS公共镜像或者私有共享镜像。在BMS控制台切换操作系统获取操作系统镜像。由华为云官方提供给客户操作系统镜像，在IMS镜像服务的共享镜像处进行接收即可，参考如下图操作。图1 共享镜像切换操作系统。对Lite Se

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

据集上进行了训练，直接运行一个预训练好的GPT-2模型:给定一个预定好的起始单词或者句子，可以让它自行地随机生成后续的文本。环境准备在华为云ModelArts Server预购相关超强算力的GPU裸金属服务器，并选择AIGC场景通用的镜像，完成使用Megatron-DeepS

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用

总条数： 1048

上一页
1
...
41
42
43
...
53
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

构建条件节点控制分支执行 - AI开发平台ModelArts

预训练任务 - AI开发平台ModelArts

欠拟合的解决方法有哪些？ - AI开发平台ModelArts

使用llm-compressor工具量化 - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

开发第一条Workflow - AI开发平台ModelArts

训练作业日志中提示“No such file or directory” - AI开发平台ModelArts

查询网络资源列表 - AI开发平台ModelArts

MaaS使用场景和使用流程 - AI开发平台ModelArts

什么是ModelArts - AI开发平台ModelArts

管理员和开发者权限分离 - AI开发平台ModelArts

各个模型深度学习训练加速框架的选择 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

删除网络资源 - AI开发平台ModelArts

创建Notebook实例 - AI开发平台ModelArts

无法导入模块 - AI开发平台ModelArts

更新服务配置 - AI开发平台ModelArts

切换Lite Server服务器操作系统 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线