搜索_华为云

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1 docker tag swr.cn-southwest-2.myhuaweicloud.com/os-public-repo/bert_pretrain_mindspore:v1

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源使用
在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

Standard使用run.sh脚本实现OBS和训练容器间的数据传输自定义容器在ModelArts上训练和本地训练的区别如下图：图1 本地与ModelArts上训练对比 ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard模型训练 > 基于ModelArts Standard运行GPU训练作业
使用MaaS调优模型 - AI开发平台ModelArts

取值范围：1~100000 学习率/learning_rate 设置每个迭代步数（iteration）模型参数/权重更新的速率。学习率设置得过高会导致模型难以收敛，过低则会导致模型收敛速度过慢。取值范围：0~0.1 默认值：0.00002 建议微调场景的学习率设置在10-5这个量级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
创建Workflow数据集节点 - AI开发平台ModelArts

否 bool work_path_type 数据集输出路径类型，当前仅支持OBS，默认为0。否 int import_config 标签导入的相关配置，默认为None，当基于已标注的数据创建数据集时，可指定该字段导入相关标注信息。否 ImportConfig 表5 Importconfig

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 创建Workflow节点
run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程自定义容器在ModelArts上训练和本地训练的区别如下图：图1 本地与ModelArts上训练对比 ModelArts上进行训练比本地训练多了一步OBS和容器环境的数据迁移工作。增加了和OBS交互工作的整个训练流程如下：

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.910) - AI开发平台ModelArts

finetune_full_multi.sh 参数说 NODE_NUM：机器数量。 NODE_RANK：机器rank num，主机为0，其余递增。 MASTER_ADDR：主机IP地址。 GPUS: 每台机器npu卡数 PER_DEVICE_BATCH_SIZE：每张卡batch

帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Lite Cluster资源配置流程 - AI开发平台ModelArts

装在和集群在相同vpc下的某一台机器上。单击连接信息下kubectl后的“配置”按钮，根据界面提示使用kubectl工具。图11 通过内网使用kubectl工具通过公网使用kubectl工具，可以将kubectl安装在任一台可以访问公网的机器。首先需要绑定公网地址，单击公网地址后的“绑定”按钮。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源配置
使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

指标名称指标说明 CPU使用率在推理服务启动过程中，机器的CPU占用情况。内存使用率在推理服务启动过程中，机器的内存占用情况。显卡使用率在推理服务启动过程中，机器的NPU/GPU占用情况。显存使用率在推理服务启动过程中，机器的显存占用情况。父主题： AI Gallery（新版）

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版）
Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

镜像配套关系获取基础镜像。步骤一：检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
查询算法列表 - AI开发平台ModelArts

算法可用性。 state String 算法状态。 tags Array of Map<String,String> objects 算法标签。 attr_list Array of strings 算法属性列表。 version_num Integer 算法版本数量，默认为0。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

配套关系获取基础镜像。 Step1 检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

指标维度：填写过滤该指标的标签，请参考表4的Label名字栏。样例如下：图3 示例图片单击确定，即可出现指标信息。图4 示例图片自定义监控指标上报到AOM 用户有一些自定义的指标数据需要保存到AOM，ModelArts提供了命令方式将用户的自定义指标上报保存到AOM。约束与限制 Mod

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理 > 监控Lite Cluster资源
从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

上传镜像至容器镜像服务镜像仓库。使用docker tag命令给上传镜像打标签。 #region和domain信息请替换为实际值，组织名称deep-learning也请替换为自定义的值。 sudo docker tag pytorch:2.1.0-cann7.0.0 swr.{region-id}

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
使用基础镜像 - AI开发平台ModelArts

/scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install.sh则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

/scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而 install.sh 则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
查询Workflow Execution - AI开发平台ModelArts

执行的时长。 events Array of strings 执行的事件。 labels Array of strings 为执行记录设置的标签。 data_requirements Array of DataRequirement objects 节点steps使用到的数据。 parameters

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
创建训练作业镜像保存任务 - AI开发平台ModelArts

字、中划线、下划线和点。 namespace 否 String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 tag 否 String 镜像tag，长度限制64个字符，支持大小写字母、数字、中划线、下划线和点。 description 否 String 该镜像所对应的描述信息，长度限制512个字符。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910) - AI开发平台ModelArts

PyTorch 2.1.0 步骤一检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

PyTorch 2.1.0 步骤一：检查环境请参考DevServer资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。购买DevServer资源时如果无可选资源规格，需要联系华为云技术支持申请开通。当容器需要提供服务

 帮助中心 > AI开发平台ModelArts > 最佳实践 > AIGC模型训练推理
使用基础镜像 - AI开发平台ModelArts

/scripts/install.sh; sh ./scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install.sh则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 准备工作 > 准备镜像

总条数： 713

上一页
1
...
27
28
29
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Lite Cluster资源池上使用Snt9B完成推理任务 - AI开发平台ModelArts

在ModelArts Standard使用run.sh脚本实现OBS和训练容器间的数据传输 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

创建Workflow数据集节点 - AI开发平台ModelArts

run.sh脚本测试ModelArts训练整体流程 - AI开发平台ModelArts

InternVL2基于DevServer适配PyTorch NPU训练指导（6.3.910) - AI开发平台ModelArts

Lite Cluster资源配置流程 - AI开发平台ModelArts

使用AI Gallery在线推理服务部署模型 - AI开发平台ModelArts

Hunyuan-DiT基于DevServer部署适配PyTorch NPU推理指导（6.3.909） - AI开发平台ModelArts

查询算法列表 - AI开发平台ModelArts

SD3 Diffusers框架基于DevServer适配PyTorch NPU推理指导（6.3.907） - AI开发平台ModelArts

使用AOM查看Lite Cluster监控指标 - AI开发平台ModelArts

从0制作自定义镜像用于创建训练作业（Pytorch+Ascend） - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

创建训练作业镜像保存任务 - AI开发平台ModelArts

LLaMA-VID基于DevServer适配PyTorch NPU推理指导（6.3.910) - AI开发平台ModelArts

Paraformer基于DevServer适配PyTorch NPU推理指导（6.3.911) - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线