搜索_华为云

使用基础镜像 - AI开发平台ModelArts

/scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install.sh则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

/scripts_modellink/llama2/0_pl_pretrain_13b.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install.sh则会在容器内安装依赖以及下载完整的代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.912） > 准备工作 > 准备镜像
删除镜像 - AI开发平台ModelArts
删除镜像 - AI开发平台ModelArts

namespace String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 origin String 指定镜像来源，可选项，默认自定义构建镜像为CUSTOMIZE。枚举值如下： CUSTOMIZE：用户自定义构建镜像。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

操作步骤登录ModelArts管理控制台，在左侧导航栏中选择“AI专属资源池 > 弹性集群Cluster”，进入“Standard资源池”页面。在资源池列表中，选择某个资源池右侧操作列的“ > 设置作业类型”。在“设置作业类型”弹窗中，选择需要设置的作业类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理 > 管理Standard专属资源池
日志提示"write line error" - AI开发平台ModelArts

云上训练磁盘空间一般指如下两个目录的磁盘空间： “/”根目录，是docker中配置项“base size”，默认是10G，云上统一改为50G。 “/cache”目录满了，一般是3.5T存储空间满了，具体规格的空间大小可参见训练环境中不同规格资源“/cache”目录的大小。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 硬盘限制故障
使用基础镜像 - AI开发平台ModelArts

/scripts/llama2/0_pl_pretrain_13b.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而install.sh则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
产品优势 - AI开发平台ModelArts
产品优势 - AI开发平台ModelArts

零改造迁移提供业界通用的k8s接口使用资源，业务跨云迁移无压力。 SSH直达节点和容器，一致体验。

帮助中心 > AI开发平台ModelArts > 产品介绍
配置Lite Server存储 - AI开发平台ModelArts

访问方式在BMS中通过网络协议挂载使用，支持NFS和CIFS的网络协议。需要指定网络地址进行访问，也可以将网络地址映射为本地目录后进行访问。可以通过互联网或专线访问。需要指定桶地址进行访问，使用的是HTTP和HTTPS等传输协议。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源配置
在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

其他算法中：随机森林的树数量，k-means中的cluster数，正则化参数λ等。增加训练数据作用不大。欠拟合一般是因为模型的学习能力不足，一味地增加数据，训练效果并不明显。降低正则化约束。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
Finetune训练 - AI开发平台ModelArts

main_training_function: main mixed_precision: fp16 num_machines: 1 num_processes: 8 rdzv_backend: static same_network: true tpu_env: [] tpu_use_cluster

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Koyha框架基于DevServer适配PyTorch NPU训练指导（6.3.908）
infiniband驱动的安装 - AI开发平台ModelArts

USER root # copy MLNX_OFED_LINUX-4.3-1.0.1.0-ubuntu16.04-x86_64.tgz to docker image RUN tar xzvf MLNX_OFED_LINUX-4.3-1.0.1.0-ubuntu16.04-x86

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例 > 专属资源池训练 > FAQ
ModelArts计费模式概述 - AI开发平台ModelArts

适用计费项计算资源计算资源、云硬盘适用资源池专属资源池公共资源池、专属资源池适用功能模块 Standard自动学习、Workflow、Notebook、模型训练、模型部署 Lite Cluster Lite Server Standard自动学习、Workflow、Notebook

帮助中心 > AI开发平台ModelArts > 计费说明 > 计费模式
创建导入任务 - AI开发平台ModelArts

表5 SourceInfo 参数是否必选参数类型描述 cluster_id 否 String MRS集群ID。可登录MRS控制台查看。 cluster_mode 否 String MRS集群运行模式。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100 -p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
自定义引擎创建模型规范 - AI开发平台ModelArts

在模型包文件夹的同级目录下验证如下命令拉起服务： docker run --user 1000:100 -p 8080:8080 -v model:/home/mind/model custom_engine:v1 该指令无法完全模拟线上，主要是由于-v挂载进去的目录是root

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考
GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

docker pull nvcr.io/nvidia/pytorch:21.10-py3 启动容器。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源使用
ModelArts中常用概念 - AI开发平台ModelArts

ModelArts Lite Server和ModelArts Lite Cluster使用的都是专属资源池。

帮助中心 > AI开发平台ModelArts > 产品介绍 > AI开发基础知识
注册自定义镜像 - AI开发平台ModelArts

namespace String 镜像所属组织，可以在SWR控制台“组织管理”创建和查看。 origin String 指定镜像来源，可选项，默认自定义构建镜像为CUSTOMIZE。枚举值如下： CUSTOMIZE：用户自定义构建镜像。

帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
创建Standard专属资源池 - AI开发平台ModelArts

自定义：需要自定义K8S容器网段和K8S服务网段。 K8S容器网段：集群下容器使用的网段，决定了集群下容器的数量上限。创建后不可修改。 K8S服务网段：同一集群下容器互相访问时使用的Service资源的网段。决定了Service资源的上限。创建后不可修改。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > ModelArts Standard资源管理
变更计费模式 - AI开发平台ModelArts

在ModelArts列表页，选择“资源管理 > AI专属资源池 > 弹性集群Cluster ”，在Standard资源池列表中选中目标专属资源池。在资源池详情页的右上角选择“更多 > 转包周期”。在弹出的“转包周期”页面，确认无误后单击“确定”。

帮助中心 > AI开发平台ModelArts > 计费说明

总条数： 825

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

删除镜像 - AI开发平台ModelArts

修改Standard专属资源池支持的作业类型 - AI开发平台ModelArts

日志提示"write line error" - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

产品优势 - AI开发平台ModelArts

配置Lite Server存储 - AI开发平台ModelArts

在ModelArts训练得到的模型欠拟合怎么办？ - AI开发平台ModelArts

Finetune训练 - AI开发平台ModelArts

infiniband驱动的安装 - AI开发平台ModelArts

ModelArts计费模式概述 - AI开发平台ModelArts

创建导入任务 - AI开发平台ModelArts

使用自定义引擎在ModelArts Standard创建模型 - AI开发平台ModelArts

自定义引擎创建模型规范 - AI开发平台ModelArts

GPT-2基于Server适配PyTorch GPU的训练推理指导 - AI开发平台ModelArts

ModelArts中常用概念 - AI开发平台ModelArts

注册自定义镜像 - AI开发平台ModelArts

创建Standard专属资源池 - AI开发平台ModelArts

变更计费模式 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线