搜索_华为云

SFT全参微调训练 - AI开发平台ModelArts

SFT全参微调训练前提条件已上传训练代码、训练权重文件和数据集到SFS Turbo中，具体参考代码上传至OBS和使用Notebook将OBS数据导入SFS Turbo。 Step1 在Notebook中修改训练超参配置以llama2-13b SFT微调为例，执行脚本 0_pl_sft_13b

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
创建智能标注作业 - AI开发平台ModelArts

度更高。计算节点规格即智能标注任务使用的资源规格。说明：智能标注创建时免费，但OBS存储会按需收费，请参考计费详情。为保证您的资源不浪费，标注作业与后续任务完成后，请及时清理您的OBS桶。计算节点个数默认为1，表示单机模式。目前仅支持此参数值。表2 预标注参数说明

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 数据准备与处理 > 标注ModelArts数据集中的数据 > 通过智能标注方式标注数据
创建DevServer - AI开发平台ModelArts

允许通过SSH协议访问Notebook的公网IP地址白名单列表，默认都可以访问。当配置指定IP后，则仅允许IP所在的客户端实现对Notebook的访问。 dev_service String 支持的服务，枚举值如下： NOTEBOOK：可以通过https协议访问Notebook

帮助中心 > AI开发平台ModelArts > API参考 > DevServer管理
在推理生产环境中部署推理服务 - AI开发平台ModelArts

准备模型文件和权重文件在OBS桶中，创建文件夹，准备模型权重文件、推理启动脚本run_vllm.sh及SSL证书。此处以chatglm3-6b为例。模型权重文件获取地址请参见表1。若需要部署量化模型，请参考推理模型量化在Notebook中进行权重转换，并将转换后的权重上传至OBS中。权重

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
配置ModelArts委托授权 - AI开发平台ModelArts

rts完成AI开发的所有必要功能权限，如数据的访问、训练任务的创建和管理等。一般用户选择此项即可。如何获取访问密钥AK/SK？如果在其他功能（例如访问模型服务等）中使用到访问密钥AK/SK认证，获取AK/SK方式请参考如何获取访问密钥章节。如何删除已有委托列表下面的委托名称？

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 配置MaaS访问授权
推理场景介绍 - AI开发平台ModelArts

er资源开通，购买DevServer资源，并确保机器已开通，密码已获取，能通过SSH登录，不同机器之间网络互通。当容器需要提供服务给多个用户，或者多个用户共享使用该容器时，应限制容器访问Openstack的管理地址（169.254.169.254），以防止容器获取宿主机的元数据

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配PyTorch NPU推理指导（6.3.904）
LLM大语言模型训练推理 - AI开发平台ModelArts

PyTorch NPU训练指导（6.5.901）主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.5.901）主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.5.901）

帮助中心 > AI开发平台ModelArts > 最佳实践
Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

处要勾选ModelArts FullAccess，请谨慎配置。配置OBS使用权限。搜索OBS，勾选“OBS Administrator”。ModelArts训练作业中需要依赖OBS作为数据中转站，需要配置OBS的使用权限。配置SWR使用权限。搜索SWR，勾选“SWR Full

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践 > 配置ModelArts基本使用权限
数据集版本不合格 - AI开发平台ModelArts

数据集版本不合格出现此问题时，表示数据集版本发布成功，但是不满足自动学习训练作业要求，因此出现数据集版本不合格的错误提示。标注信息不满足训练要求针对不同类型的自动学习项目，训练作业对数据集的要求如下。图像分类：用于训练的图片，至少有2种以上的分类（即2种以上的标签），每种分类的图片数不少于5张。

帮助中心 > AI开发平台ModelArts > 故障排除 > 自动学习 > 准备数据
训练场景和方案介绍 - AI开发平台ModelArts

824153350-cebb080 cann_8.0.rc3 pytorch_2.1.0 驱动23.0.6 从SWR拉取不同软件版本对应的基础镜像地址不同，请严格按照软件版本和镜像配套关系获取基础镜像。父主题： SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD1.5&SDXL Diffusers框架基于Lite Server适配PyTorch NPU训练指导（6.3.908）
使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

列的“打开”，访问JupyterLab。图2 打开Notebook实例进入JupyterLab页面后，自动打开Launcher页面，如下图所示。您可以使用开源支持的所有功能，详细操作指导可参见JupyterLab官网文档。图3 JupyterLab主页不同AI引擎的Not

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Notebook进行AI开发调试 > 通过JupyterLab在线使用Notebook实例进行AI开发
运行第一条Workflow - AI开发平台ModelArts

本发布生成的Manifest文件等。单击图标选择OBS桶下的空目录，且此目录不能与输入位置一致，也不能为输入位置的子目录。数据集输入位置：用来存放源数据集信息，例如本案例中从AI Gallery下载的数据集。单击图标选择您的OBS桶下的任意一处目录，但不能与输出位置为同一目录。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行 install.sh文件，来安装依赖以及下载完整代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.911） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，如果直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行 install.sh文件，来安装依赖以及下载完整代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配ModelLink PyTorch NPU训练指导（6.3.909） > 准备工作 > 准备镜像
使用基础镜像 - AI开发平台ModelArts

使用基础镜像通过ECS获取和上传基础镜像将镜像上传至SWR服务后，可创建训练作业，在“选择镜像”中选择SWR中基础镜像。由于基础镜像内需要安装固定版本依赖包，若直接使用基础镜像进行训练，每次创建训练作业时，训练作业的图1中都需要执行 install.sh 文件，来安装依赖以及下载完整代码。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 准备工作 > 准备镜像
训练tokenizer文件说明 - AI开发平台ModelArts

训练tokenizer文件说明在训练开始前，有些模型需要对模型的tokenizer文件，或者模型的配置文件进行修改，具体的修改如下： Qwen-VL 修改文件modeling_qwen.py： # 将36 37 两行注释部分 36 SUPPORT_BF16 = SUPPORT_CUDA

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.912） > 训练脚本说明
断点续训和故障快恢说明 - AI开发平台ModelArts

训练中一定间隔（${save-interval}）保存的模型（包括模型参数、优化器状态、训练迭代次数等）继续训练恢复，而不需要从头开始。不同点断点续训：可指定加载训练过程中生成的Megatron格式权重(${user_converted_ckpt_path}) 故障快恢：默认

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.3.912） > 训练脚本说明
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

置信度得分。步骤1：准备工作已注册华为账号并开通华为云，进行了实名认证，且在使用ModelArts前检查账号状态，账号不能处于欠费或冻结状态。注册华为账号并开通华为云进行实名认证配置委托访问授权 ModelArts使用过程中涉及到OBS、SWR、IEF等服务交互，首次使

 帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
调用MaaS部署的模型服务 - AI开发平台ModelArts

1-9e7c-2b4de06******/v1" api_key = "<your_apiKey>" # 把<your_apiKey>替换成已获取的API Key。 client = OpenAI(api_key=api_key, base_url=base_url)

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
网卡名称错误 - AI开发平台ModelArts

网卡名称错误当训练开始时提示网卡名称错误。或者通信超时。可以使用ifconfig命令检查网卡名称配置是否正确。比如，ifconfig看到当前机器IP对应的网卡名称为enp67s0f5，则可以设置环境变量指定该值。图1 网卡名称错误 export GLOO_SOCKET_IFNAME=enp67s0f5

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配ModelLink PyTorch NPU训练指导（6.5.901） > 常见错误原因和解决方法

总条数： 2380

上一页
1
...
54
55
56
...
119
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

SFT全参微调训练 - AI开发平台ModelArts

创建智能标注作业 - AI开发平台ModelArts

创建DevServer - AI开发平台ModelArts

在推理生产环境中部署推理服务 - AI开发平台ModelArts

配置ModelArts委托授权 - AI开发平台ModelArts

推理场景介绍 - AI开发平台ModelArts

LLM大语言模型训练推理 - AI开发平台ModelArts

Step2 为用户配置云服务使用权限 - AI开发平台ModelArts

数据集版本不合格 - AI开发平台ModelArts

训练场景和方案介绍 - AI开发平台ModelArts

使用JupyterLab在线开发和调试代码 - AI开发平台ModelArts

运行第一条Workflow - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

使用基础镜像 - AI开发平台ModelArts

训练tokenizer文件说明 - AI开发平台ModelArts

断点续训和故障快恢说明 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

调用MaaS部署的模型服务 - AI开发平台ModelArts

网卡名称错误 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线