搜索_华为云

预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

集。 MBS 4 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
LoRA微调训练 - AI开发平台ModelArts

集。 MBS 4 表示流水线并行中一个micro batch所处理的样本量。在流水线并行中，为了减少气泡时间，会将一个step的数据切分成多个micro batch。该值与TP和PP以及模型大小相关，可根据实际情况进行调整。 GBS 512 表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.908）
常见问题 - AI开发平台ModelArts
常见问题 - AI开发平台ModelArts

Stable Diffusion WebUI如何适配？ WebUI一般可以分为前端和后端实现两部分，后端的实现模式种类多样，并且依赖了多个的第三方库，当前在WebUI适配时，并没有特别好的方式。在对后端实现比较理解的情况下，建议针对具体的功能进行Diffusers模块的适配与

 帮助中心 > AI开发平台ModelArts > 最佳实践 > GPU业务迁移至昇腾训练推理 > 基于AIGC模型的GPU推理业务迁移至昇腾指导
ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

9-cp37-cp37m-manylinux1_x86_64.whl" } ] } ] 模型配置文件的“dependencies”支持多个“dependency”结构数组以list形式填入。示例如下： "dependencies": [ { "installer":

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

中需要有三个列名称：conversation_id, Human, assistant conversation_id: 指定的对话id, 如果相同, 转换后就放在同一conversation_id的不同turn_X下。如果为空，则放在新的conversation_id下。 Human: 数据集中每条数据的输入。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

中需要有三个列名称：conversation_id, Human, assistant conversation_id: 指定的对话id, 如果相同, 转换后就放在同一conversation_id的不同turn_X下。如果为空，则放在新的conversation_id下。 Human: 数据集中每条数据的输入。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
创建开发环境实例 - AI开发平台ModelArts

链接仓库协议。当前支持：ssh，https。 url String 链接仓库地址。 credential Object 证书信息，请参见表30。表30 credential字段数据结构说明参数参数类型说明 ssh_private_key String ssh私有证书。 access_token

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 开发环境（旧版）
查看训练作业日志 - AI开发平台ModelArts

513254-worker-0.log 单机训练作业只会生成一个日志文件，单机作业的task id默认为worker-0。分布式场景下有多个节点日志文件并存，通过task id区分不同节点，例如：worker-0，worker-1等。训练进程日志、“pip-requirement

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 管理模型训练作业
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

中需要有三个列名称：conversation_id, Human, assistant conversation_id: 指定的对话id, 如果相同, 转换后就放在同一conversation_id的不同turn_X下。如果为空，则放在新的conversation_id下。 Human: 数据集中每条数据的输入。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
查询数据集导入任务的详情 - AI开发平台ModelArts

表格数据集，HDFS路径。例如/datasets/demo。 ip String 用户GaussDB(DWS)集群的IP地址。 port String 用户GaussDB(DWS)集群的端口。 queue_name String 表格数据集，DLI队列名。 subnet_id String MRS集群的子网ID。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
模型配置文件编写说明 - AI开发平台ModelArts

说明： “dependencies”参数支持多个“dependency”结构数组，以list格式填入，默认安装包存在先后依赖关系（即写在前面的先安装，写在后面的后安装），且支持线下wheel包安装（wheel包必须与模型文件放在同一目录）。示例请参考导入模型时安装包依赖配置文件如何书写？

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
批量更新团队标注样本的标签 - AI开发平台ModelArts

坐标，第一个点y坐标一定小于第二个点的y坐标)。 polygon [[0,100],[50,95],[10,60],[500,400]] 多个点组成，按顺序连接成一个多边形。 circle [[100,100],[50]] 一个圆心点和半径组成。 line [[0,100],[50

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
约束与限制 - AI开发平台ModelArts

ModelArts不支持从加密的OBS桶中读取数据，创建OBS桶时，请勿开启桶加密。 ModelArts不支持跨区域访问OBS桶，请确保使用的OBS与ModelArts在同一区域。

帮助中心 > AI开发平台ModelArts > 产品介绍
VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

报错“ssh: connect to host xxx.pem port xxxxx: Connection refused”如何解决？报错"ssh: connect to host ModelArts-xxx port xxx: Connection timed out"如何解决？

帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境
自定义镜像规范 - AI开发平台ModelArts

py”。仅支持shell脚本和python脚本。如果是SWR容器内的地址，则填写绝对路径；如果是AI Gallery仓库内的地址，则填写相对路径。 Infer_port 选填，推理服务提供的端口，缺省值为8080。只支持部署HTTP服务。自定义镜像可以通过是否上传自定义推理参数文件“gallery_inference/inference_params

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
批量更新样本标签 - AI开发平台ModelArts

坐标，第一个点y坐标一定小于第二个点的y坐标)。 polygon [[0,100],[50,95],[10,60],[500,400]] 多个点组成，按顺序连接成一个多边形。 circle [[100,100],[50]] 一个圆心点和半径组成。 line [[0,100],[50

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
上传算法至SFS - AI开发平台ModelArts

distributed.launch --nproc_per_node=1 --master_addr localhost --master_port=$MASTER_PORT main.py --data-path $IMAGE_DATA_PATH --cfg ./configs/swin/swi

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > 调试与训练 > 多机多卡
推理场景介绍 - AI开发平台ModelArts

资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据。具体操作请参见禁止容器获取宿主机元数据。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Server适配PyTorch NPU推理指导（6.3.910）
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

NGPUS_PER_NODE="$MA_NUM_GPUS" # self-define, it can be changed to >=10000 port MASTER_PORT="38888" # replace ${MA_JOB_DIR}/code/torch_ddp.py to the actutal

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

使用 nerdctl 工具进行镜像拉取。 nerdctl --namespace k8s.io pull {image_url} 注意：集群有多个节点，要确保每个节点都拥有镜像。镜像获取完成后可通过如下其中一个命令进行查看： # ctr 工具查看 ctr -n k8s.io image

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU推理指导（6.3.910） > 准备工作

总条数： 745

上一页
1
...
24
25
26
...
38
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

预训练 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

常见问题 - AI开发平台ModelArts

ModelArts导入模型时，如何编写模型配置文件中的安装包依赖参数？ - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

创建开发环境实例 - AI开发平台ModelArts

查看训练作业日志 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

查询数据集导入任务的详情 - AI开发平台ModelArts

模型配置文件编写说明 - AI开发平台ModelArts

批量更新团队标注样本的标签 - AI开发平台ModelArts

约束与限制 - AI开发平台ModelArts

VS Code连接开发环境失败故障处理 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

批量更新样本标签 - AI开发平台ModelArts

上传算法至SFS - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线