搜索_华为云

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.909） > 训练脚本说明
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练脚本说明
自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

later”，同时在“日志”页签中，无任何信息。图1 部署在线服务异常解决方法出现此问题现象，通常是因为您部署的模型过大导致的。解决方法如下：精简模型，重新导入模型和部署上线。购买专属资源池，在部署上线为在线服务时，使用专属资源池进行部署。父主题：服务部署

 帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务部署
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型模型参数量训练类型序列长度cutoff_len 梯度累积值优化工具(Deepspeed)

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表不同模型推荐的训练参数和计算规格要求如表1所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表1 NPU卡数、加速框架、梯度配置取值表模型 Template 模型参数量训练策略类型序列长度cutoff_len 梯度累积值

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练脚本说明
将数据预热到SFS Turbo - AI开发平台ModelArts

Turbo高性能文件存储中，数据预热功能的具体操作请参考创建SFS Turbo 和 OBS 之间的联动任务。在ECS服务器挂载SFS Turbo已经将SFS Turbo挂载到了/mnt/sfs_turbo目录，这里参考obsutil文档，直接使用obsutil命令将OBS桶中的所有数据拷贝到该目录即可。

帮助中心 > AI开发平台ModelArts > 最佳实践 > MLLM多模态模型训练推理 > Qwen-VL基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.912） > 准备工作
获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

参数类型描述 instance_id 是 String Notebook实例ID，可通过调用查询Notebook实例列表接口获取。 project_id 是 String 用户项目ID，获取方法请参见获取项目ID和名称。请求参数无响应参数状态码：200 表2 响应Body参数

 帮助中心 > AI开发平台ModelArts > API参考 > 开发环境管理
如何切分ModelArts数据集？ - AI开发平台ModelArts

如何切分ModelArts数据集？在发布数据集时，仅“图像分类”、“物体检测”、“文本分类”和“声音分类”类型数据集支持进行数据切分功能。一般默认不启用该功能。启用后，需设置对应的训练验证比例。输入“训练集比例”，数值只能是0~1区间内的数。设置好“训练集比例”后，“验证集比例”自动填充。“训练集比例”加“验证集比例”等于1。

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据准备
不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

在统一身份认证服务页面的左侧导航选择“用户组”，在用户组页面查找待授权的用户组名称，在右侧的操作列单击“授权”，勾选步骤2创建的自定义策略，单击“下一步”，选择授权范围方案，单击“确定”。如果没有用户组，也可以创建一个新的用户组，并通过“用户组管理”功能添加用户，并配置授权。如果指定的子用户没有在用户组中，也可以通过“用户组管理”功能增加用户。

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard权限管理 > 典型场景配置实践
创建数据集 - AI开发平台ModelArts

sample_label_separator 否 String 文本和标签之间的分割符。分隔符仅支持一个字符，必须为大小写字母，数字或@#￥%^&*_=|?/':.;,中的某一个字符，分割符需要转义。 label_separator 否 String 标签和标签之间的分割符。分隔符仅支持一个字符，必须为大小写字母，数字或@#￥%^&*_=|

帮助中心 > AI开发平台ModelArts > SDK参考 > 数据管理 > 数据集管理
Yaml配置文件参数配置说明 - AI开发平台ModelArts

用于指定预处理数据的工作线程数。随着线程数的增加，预处理的速度也会提高，但也会增加内存的使用。 per_device_train_batch_size 1 指定每个设备的训练批次大小。 gradient_accumulation_steps 8 必须修改，指定梯度累积的步数，这可以增加批次大小而不增加内存消耗。可参考表1

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.908） > 训练脚本说明
释放Lite Server资源 - AI开发平台ModelArts

图5 搜索实例ID 根据界面提示，确认需要退订的资源，并选择退订原因。确认退订信息无误后，勾选“我已确认……”和“资源退订后……”提示信息。单击“退订”，再次根据界面信息确认要退订的资源。再次单击“退订”，完成包年/包月资源的退订操作。在费用中心批量退订实例资源登录ModelArts管理控制台。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

获取“repo_id”和待下载的文件名。获取“repo_id” 在AI Gallery页面的资产详情页，单击复制完整的资产名称，如图1所示，获取到的信息即为“repo_id”。例如，复制出的信息为“ur5468675/test_cli_model1”，则该资产的“repo_id”为

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > Gallery CLI配置工具指南
Notebook中安装依赖包报错ERROR: HTTP error 404 while getting xxx - AI开发平台ModelArts

问题现象在Notebook中安装依赖包时报错，报错截图如下：原因分析 pypi源没有这个包或源不可用。解决方案使用别的源下载。 pip install -i 源地址包名父主题：环境配置故障

 帮助中心 > AI开发平台ModelArts > 故障排除 > 开发环境 > 环境配置故障
创建训练作业 - AI开发平台ModelArts

、下划线和中划线的名称。 job_desc 否 String 对训练作业的描述，默认为“NULL”，字符串的长度限制为[0, 256]。 config 是 Object 创建训练作业需要的参数。详情请参见表3。 workspace_id 否 String 指定作业所处的工作空间，默认值为“0”。

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业
在MaaS体验模型服务 - AI开发平台ModelArts

在MaaS体验模型服务在ModelArts Studio大模型即服务平台，运行中的模型服务可以在“模型体验”页面在线体验模型服务的推理效果。前提条件在“模型部署”的服务列表存在“运行中”的模型服务。操作步骤登录ModelArts管理控制台，在左侧导航栏中，选择“ModelArts Studio”进入ModelArts

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
使用MaaS压缩模型 - AI开发平台ModelArts

-W8A8和AWQ-W4A16两种压缩策略。表1 压缩策略的适用场景压缩策略场景 SmoothQuant-W8A8 长序列的场景大并发量的场景 AWQ-W4A16 小并发量的低时延场景更少推理卡数部署的场景约束限制表2列举了支持模型压缩的模型，不在表格里的模型不支持使用MaaS压缩模型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
查看批量服务详情 - AI开发平台ModelArts

服务ID 批量服务的ID。状态批量服务当前状态。任务ID 批量服务的任务ID。实例规格批量服务的节点规格。实例数批量服务的节点个数。任务开始时间本次批量服务的任务开始时间。环境变量批量服务创建时填写的环境变量。任务结束时间本次批量服务的任务结束时间。描述

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理批量推理作业
在ModelArts训练作业中如何判断文件夹是否复制完毕？ - AI开发平台ModelArts

在ModelArts训练作业中如何判断文件夹是否复制完毕？您可以在训练作业启动文件的脚本中，通过如下方式获取复制和被复制文件夹大小，根据结果判断是否复制完毕： import moxing as mox mox.file.get_size('obs://bucket_name/obs_file'

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard模型训练
准备数据（可选） - AI开发平台ModelArts

o.json文件中添加数据集描述。关于数据集文件的格式及配置，请参考data/README_zh.md的内容。可以使用HuggingFace/ModelScope上的数据集或加载本地数据集。上传自定义数据到指定目录将下载的原始数据存放在{work_dir}/llm_trai

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配LlamaFactory PyTorch NPU训练指导（6.3.907） > 准备工作

总条数： 2466

上一页
1
...
87
88
89
...
124
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

自定义镜像模型部署为在线服务时出现异常 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

模型NPU卡数、梯度累积值取值表 - AI开发平台ModelArts

将数据预热到SFS Turbo - AI开发平台ModelArts

获取动态挂载OBS实例信息列表 - AI开发平台ModelArts

如何切分ModelArts数据集？ - AI开发平台ModelArts

不允许子账号使用公共资源池创建作业 - AI开发平台ModelArts

创建数据集 - AI开发平台ModelArts

Yaml配置文件参数配置说明 - AI开发平台ModelArts

释放Lite Server资源 - AI开发平台ModelArts

使用Gallery CLI配置工具下载文件 - AI开发平台ModelArts

Notebook中安装依赖包报错ERROR: HTTP error 404 while getting xxx - AI开发平台ModelArts

创建训练作业 - AI开发平台ModelArts

在MaaS体验模型服务 - AI开发平台ModelArts

使用MaaS压缩模型 - AI开发平台ModelArts

查看批量服务详情 - AI开发平台ModelArts

在ModelArts训练作业中如何判断文件夹是否复制完毕？ - AI开发平台ModelArts

准备数据（可选） - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线