搜索_华为云

发布镜像到AI Gallery - AI开发平台ModelArts

勾选启用：当用户要使用该镜像时需要提交申请，只有镜像所有者同意申请后，才能使用镜像。不勾选不启用（默认值）：所有可见资产的用户都可以直接使用镜像。发布后，资产会处于“审核中”，审核中的资产仅资产所有者可见。审核完成后，资产会变成“已发布”状态，并在镜像列表可见。父主题：发布和管理AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery镜像
从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

协议和端口号与自定义镜像中提供的协议和端口号保持一致。镜像复制：选填，选择是否将容器镜像中的模型镜像复制到ModelArts中。健康检查：选填，用于指定模型的健康检查。仅当自定义镜像中配置了健康检查接口，才能配置“健康检查”，否则会导致AI应用创建失败。 apis定义：选填，

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
数据准备使用流程 - AI开发平台ModelArts

数据标注能力。图1 ModelArts数据准备全流程 ModelArts数据管理为用户准备高质量的AI数据提供了以下主要能力：解决用户获取数据的问题。用户可在AI Gallery上一键下载需要的数据资源到ModelArts数据管理。提供多种数据接入方式，支持用户从OBS，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理
查看日志和性能 - AI开发平台ModelArts

查看日志和性能单击作业详情页面，则可查看训练过程中的详细信息。图1 查看训练作业在作业详情页的日志页签，查看最后一个节点的日志，其包含“elapsed time per iteration (ms)”数据，可换算为tokens/s/p的性能数据。吞吐量（tokens/s/p）：global

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

Gallery下载并使用数据集是限时免费的，但数据集存储在OBS，从OBS中读取数据需要根据OBS的计费原则收费。确认无误后，单击确定。页面自动跳转到“我的数据>我的下载”页面，请耐心等待，预计5分钟左右。下载完成后，您可以单击目标位置跳转至OBS桶中查看是否存在已下载的数据。步骤2：订阅算法在AI

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
Yaml配置文件参数配置说明 - AI开发平台ModelArts

文件将保存在这个目录下 logging_steps 2 用于指定模型训练过程中，多少步输出一次日志。日志包括了训练进度、学习率、损失值等信息。建议设置 save_steps 5000 指定模型训练过程中，每多少步保存一次模型。保存的模型可以用于后续的训练或推理任务 plot_loss

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
发布模型到AI Gallery - AI开发平台ModelArts

勾选启用：当用户要使用该模型时需要提交申请，只有模型所有者同意申请后，才能使用或复制模型。不勾选不启用（默认值）：所有可见资产的用户都可以直接使用模型。发布后，资产会处于“审核中”，审核中的资产仅资产所有者可见。审核完成后，资产会变成“已发布”状态，并在模型列表可见。父主题：发布和管理AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
附录：微调训练常见问题 - AI开发平台ModelArts

expandable_segments:True 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deep

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 问题现象在线服务部署完成且服务已经处于“运行中”的状态后，向运行的服务发起推理请求，报错ModelArts.4503。原因分析及处理方法服务预测报错ModelArts.4503有多种场景，常见场景如下：通信出错请求报错：{"

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

ModelArts使用过程中涉及到OBS、SWR、IEF等服务交互，首次使用ModelArts需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录ModelArts管理控制台，在左侧导航栏单击“权限管理”，进入“权限管理”页面，单击“添加授权”。在弹出的“添加授权”页面中，授权对象

 帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

ModelArts使用过程中涉及到OBS、SWR、IEF等服务交互，首次使用ModelArts需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录ModelArts管理控制台，在左侧导航栏单击“权限管理”，进入“权限管理”页面，单击“添加授权”。在弹出的“添加授权”页面中，授权对象

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard自动学习
什么是Workflow - AI开发平台ModelArts

漂移的问题。新的数据和新的特征在已有的模型上表现会越来越差。在MLOps中，实验迭代的产物将会是一条固化下来的流水线，这条流水线将会包含数据工程、模型算法、训练配置等。用户将会使用这条流水线在持续产生的数据中持续迭代训练，确保这条流水线生产出来的模型的AI应用始终维持在一个较好的状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
Finetune训练 - AI开发平台ModelArts

练脚本。 sh diffusers_sdxl_finetune_train.sh 训练执行脚本中配置了保存checkpoint的频率，每500steps保存一次，如果磁盘空间较小，这个值可以改大到5000，避免磁盘空间写满，导致训练失败终止。 checkpoint保存频率的修改命令如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理 > SD1.5&SDXL Diffusers框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
创建Standard专属资源池 - AI开发平台ModelArts

当资源池创建成功后，资源池的状态会变成“运行中”，当“节点个数”中的“可用”和“总数”值大于0时，资源池才能下发任务。图7 查看资源池可以将鼠标放在“创建中”字样上，查看当前创建过程详情。如果单击查看详情，可跳转到“操作记录”中。图8 创建中状态可以在资源池列表右上角“操作记录”中查看资源池的任务记录。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
发布数据集到AI Gallery - AI开发平台ModelArts

勾选启用：当用户要使用该数据集时需要提交申请，只有数据集所有者同意申请后，才能使用数据集。不勾选不启用（默认值）：所有可见资产的用户都可以直接使用数据集。发布后，资产会处于“审核中”，审核中的资产仅资产所有者可见。审核完成后，资产会变成“已发布”状态，并在数据集列表可见。父主题：发布和管理AI

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery数据集
使用kv-cache-int8量化 - AI开发平台ModelArts

权重。量化后的权重包括原始权重和kvcache的scale系数。抽取kv-cache量化系数。该步骤的目的是将步骤1中生成的scale系数提取到单独文件中，供推理时使用。使用的抽取脚本由vllm社区提供： python3 examples/fp8/extract_scales

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.909） > 推理模型量化
执行微调训练任务 - AI开发平台ModelArts

gradient_accumulation_steps 8 可修改。指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可根据自己要求适配。取值可参考表1中梯度累积值列。 num_train_epochs 5 表示训练轮次，根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。可根据自己要求适配

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.908）
使用TMS标签实现资源分组管理 - AI开发平台ModelArts

在ModelArts的训练作业中添加标签。可以在创建训练作业页面添加标签，也可以在已经创建完成的训练作业详情页面的“标签”页签中添加标签。在ModelArts的在线服务中添加标签。可以在创建在线服务页面添加标签，也可以在已经创建完成的在线服务详情页面的“标签”页签中添加标签。图1 添加标签

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

在ModelArts的训练作业中添加标签。可以在创建训练作业页面添加标签，也可以在已经创建完成的训练作业详情页面的“标签”页签中添加标签。在ModelArts的在线服务中添加标签。可以在创建在线服务页面添加标签，也可以在已经创建完成的在线服务详情页面的“标签”页签中添加标签。在ModelArts的专属资源池中添加标签。

帮助中心 > AI开发平台ModelArts > 常见问题 > 一般性问题
附录：训练常见问题 - AI开发平台ModelArts

expandable_segments:True 将yaml文件中的per_device_train_batch_size调小，重新训练如未解决则执行下一步。替换深度学习训练加速的工具或增加zero等级，可参考模型NPU卡数、梯度累积值取值表，如原使用Accelerator可替换为Deep

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.909）

总条数： 1039

上一页
1
...
47
48
49
...
52
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

发布镜像到AI Gallery - AI开发平台ModelArts

从0-1制作自定义镜像并创建AI应用 - AI开发平台ModelArts

数据准备使用流程 - AI开发平台ModelArts

查看日志和性能 - AI开发平台ModelArts

使用AI Gallery的订阅算法实现花卉识别 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

发布模型到AI Gallery - AI开发平台ModelArts

附录：微调训练常见问题 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

使用ModelArts Standard自动学习实现垃圾分类 - AI开发平台ModelArts

什么是Workflow - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

发布数据集到AI Gallery - AI开发平台ModelArts

使用kv-cache-int8量化 - AI开发平台ModelArts

执行微调训练任务 - AI开发平台ModelArts

使用TMS标签实现资源分组管理 - AI开发平台ModelArts

ModelArts如何通过标签实现资源分组管理 - AI开发平台ModelArts

附录：训练常见问题 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线