搜索_华为云

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

ubuntu-18.04 cuda-11.1 python-3.7.13 openmpi-3.0.0 操作流程使用自定义镜像创建训练作业时，需要您熟悉docker软件的使用，并具备一定的开发经验。详细步骤如下所示：前提条件 Step1 创建OBS桶和文件夹 Step2 准备脚本文件并上传至OBS中

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 制作自定义镜像用于ModelArts Standard > 制作自定义镜像用于训练模型
示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

ubuntu-18.04 cuda-11.1 python-3.7.13 openmpi-3.0.0 操作流程使用自定义镜像创建训练作业时，需要您熟悉docker软件的使用，并具备一定的开发经验。详细步骤如下所示：前提条件 Step1 创建OBS桶和文件夹 Step2 准备脚本文件并上传至OBS中

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

参数说明参数名参数类型是否必选参数说明 -swr / --swr-path String 是需要调试的镜像的SWR路径。 -r / --region String 是需要调试的镜像所在的区域。 -s / --service String 否调试镜像的服务类型，NOTE

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > ModelArts CLI命令参考
安装Gallery CLI配置工具 - AI开发平台ModelArts

配置文件中，账号密码认证和AK/SK认证二选一即可。如果使用账号密码认证，则需要填写配置项“iam_domain”、“iam_user”和“iam_password”；如果使用AK/SK认证，则需要填写配置项“iam_ak”、“iam_sk”和加密配置。华为账号只能使用AK/

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

确保容器可以访问公网。本案例仅支持在专属资源池上运行。 Step1 创建专属资源池本文档中的模型运行环境是ModelArts Standard，用户需要购买专属资源池，具体步骤请参考创建资源池。资源规格要求：硬盘空间：至少200GB。昇腾资源规格：Ascend: 8*ascend-snt9b表示昇腾8卡规格。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作
在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

在“服务列表”中选择“管理与监管 > 云监控服务”，进入“云监控服务”管理控制台。在左侧导航栏，选择“云服务监控 > ModelArts”。选择需要添加告警规则的在线服务名称，单击操作列的“创建告警规则”。在“创建告警规则”界面，根据界面提示设置ModelArts在线服务和模型负载的告警规则。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
删除AI应用 - AI开发平台ModelArts

/v1/{project_id}/models/{model_id} 表1 路径参数参数是否必选参数类型描述 model_id 是 String 需要删除的AI应用ID。 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。表2 Query参数参数

 帮助中心 > AI开发平台ModelArts > API参考 > AI应用管理
在模型广场查看模型 - AI开发平台ModelArts

Studio大模型即服务平台已预置非量化模型与AWQ-W4A16量化模型的模型模板。非量化模型可以支持调优、压缩、部署等操作。量化模型仅支持部署操作。当需要获取SmoothQuant-W8A8量化模型时，则可以通过对非量化模型进行模型压缩获取。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
预训练 - AI开发平台ModelArts
预训练 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建预训练任务创建训练作业，并自定义名称、描述等

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
SFT全参微调训练 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建SFT全参微调训练任务创建训练作业，并自定义

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
查询服务日志 - AI开发平台ModelArts

String 资源规格。 instance_count Integer 模型部署的实例数。 envs Map<String, String> 运行模型需要的环境变量键值对。表4 result结构参数参数类型描述 node_id String 待查询的边缘节点ID，仅当infer_type为edge时存在。

帮助中心 > AI开发平台ModelArts > SDK参考 > 服务管理
欠费说明 - AI开发平台ModelArts
欠费说明 - AI开发平台ModelArts

存储都将被释放，数据无法恢复。图1 按需计费资源生命周期华为云根据客户等级定义了不同客户的宽限期和保留期时长。避免和处理欠费欠费后需要及时充值，详细操作请参见账户充值。如果确认不再使用ModelArts服务，需在ModelArts管理控制台总览页确认会收费的实例已全部停

 帮助中心 > AI开发平台ModelArts > 计费说明
VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

/home/ma-user/.vscode-server/bin/$commitId 关闭VS Code，重新从Notebook实例列表页面打开VS Code（注意：需要关闭本地vscode，否则可能会报多个安装进程正在运行中）。父主题： VS Code连接开发环境失败故障处理

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > VS Code连接开发环境失败故障处理
LoRA微调训练 - AI开发平台ModelArts

必须修改。加载tokenizer与Hugging Face权重时，对应的存放地址。请根据实际规划修改。对于ChatGLMv3-6B和Qwen系列模型，还需要手动修改tokenizer文件，具体请参见训练tokenizer文件说明。 Step2 创建LoRA微调训练任务创建训练作业，并自定义名

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
Standard Notebook - AI开发平台ModelArts

何获取本机外网IP？ ModelArts的Notebook有代理吗？如何关闭？在ModelArts的Notebook中内置引擎不满足使用需要时，如何自定义引擎IPython Kernel？在ModelArts的Notebook中如何将git clone的py文件变为ipynb文件？

帮助中心 > AI开发平台ModelArts > 常见问题
在JupyterLab中创建定时任务 - AI开发平台ModelArts

ebook的python变量。 Schedule：任务执行策略，可以立即运行；也可以设置定时策略运行，支持cron表达式。 cron表达式需要使用linux系统下支持的格式，其他的cron表达式会报错。表达式可能会包含问号，要兼容linux的cron表达式，需将“?”替换为“*”。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
开发用于自定义镜像训练的代码 - AI开发平台ModelArts

env”启动训练。由于训练作业运行时不是shell环境，因此无法直接使用“conda activate”命令激活指定的 “conda env”，需要使用其他方式以达成使用指定“conda env”来启动训练的效果。假设您的自定义镜像中的“conda”安装于“/home/ma-user/anaconda3”目录“conda

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 准备模型训练代码
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作
准备数据 - AI开发平台ModelArts
准备数据 - AI开发平台ModelArts

MB。自定义数据预训练数据：用户也可以自行准备预训练数据。数据要求如下：使用标准的.json格式的数据，通过设置--json-key来指定需要参与训练的列。请注意huggingface中的数据集具有如下this格式。可以使用–json-key标志更改数据集文本字段的名称，默认为t

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配ModelLink PyTorch NPU训练指导（6.3.910） > 准备工作

总条数： 1424

上一页
1
...
59
60
61
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从0制作自定义镜像用于创建训练作业（MPI+CPU/GPU） - AI开发平台ModelArts

示例：从 0 到 1 制作自定义镜像并用于训练（MPI+CPU/GPU） - AI开发平台ModelArts

ma-cli image镜像构建支持的命令 - AI开发平台ModelArts

安装Gallery CLI配置工具 - AI开发平台ModelArts

SDXL基于Standard适配PyTorch NPU的LoRA训练指导（6.3.908） - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

在云监控平台查看在线服务性能指标 - AI开发平台ModelArts

删除AI应用 - AI开发平台ModelArts

在模型广场查看模型 - AI开发平台ModelArts

预训练 - AI开发平台ModelArts

SFT全参微调训练 - AI开发平台ModelArts

查询服务日志 - AI开发平台ModelArts

欠费说明 - AI开发平台ModelArts

VS Code连接远端Notebook时报错“XHR failed” - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

Standard Notebook - AI开发平台ModelArts

在JupyterLab中创建定时任务 - AI开发平台ModelArts

开发用于自定义镜像训练的代码 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

准备数据 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线