搜索_华为云

训练精度测试 - AI开发平台ModelArts

ccuracy_cfgs.yaml相对或绝对路径 <model_name>：训练模型名，如qwen2.5-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora、full：4096-full】训练完成后，test-benchmark目录下会生成训

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
AI Gallery功能介绍 - AI开发平台ModelArts

Gallery为零基础开发者，提供无代码开发工具，快速推理、部署模型；为具备基础代码能力的开发者，AI Gallery将复杂的模型、数据及算法策略深度融合，构建了一个高效协同的模型体验环境，让开发者仅需几行代码即可调用任何模型，大幅度降低了模型开发门槛。充足澎湃算力，最佳实践算力推荐方案，提升实践效率和成本

 帮助中心 > AI开发平台ModelArts > 产品介绍 > 功能介绍
JupyterLab默认工作路径是什么？ - AI开发平台ModelArts

JupyterLab默认工作路径是什么？带OBS存储的Notebook实例 JupyterLab文件默认存储路径，为创建Notebook时指定的OBS路径。在文件列表的所有文件读写操作都是基于所选择的OBS路径下的内容操作的，跟当前实例空间没有关系。如果用户需要将内容同步到实

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
ModelArts中提示OBS相关错误 - AI开发平台ModelArts

确保此OBS桶的加密功能关闭。如果此OBS桶为加密桶，可单击“默认加密”选项进行修改。创建OBS桶时，桶的存储类别请勿选择“归档存储”和“深度归档存储”，归档存储的OBS桶会导致模型训练失败。图1 查看OBS桶是否加密检查OBS文件是否为加密文件进入OBS管理控制台，单击桶名称进入概览页。

帮助中心 > AI开发平台ModelArts > 故障排除 > 通用问题
准备镜像 - AI开发平台ModelArts
准备镜像 - AI开发平台ModelArts

sh ./scripts/obs_pipeline.sh 创建训练作业后，会在节点机器中使用基础镜像创建docker容器，并在容器内进行分布式训练。而 install.sh 则会在容器内安装依赖以及下载完整的代码。当训练作业结束后，对应的容器也会同步销毁。图4 训练作业启动命令

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 准备工作
使用MaaS调优模型 - AI开发平台ModelArts

规格选择规格，规格中描述了服务器类型、型号等信息，仅显示模型支持的资源。计算节点个数当计算节点个数大于1，将启动多节点分布式训练。详细信息，请参见分布式训练功能介绍。更多选项永久保存日志选择是否打开“永久保存日志”开关。开关关闭（默认关闭）：表示不永久保存日志，则任务

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio）
如何对OBS的文件重命名？ - AI开发平台ModelArts

rename('obs://bucket_name/obs_file.txt', 'obs://bucket_name/obs_file_2.txt') 父主题：数据存储

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储
使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

约束与限制需要申请单个模型大小配额和添加使用节点本地存储缓存的白名单。需要使用自定义引擎Custom，配置动态加载。需要使用专属资源池部署服务。专属资源池磁盘空间需大于1T。操作事项申请扩大模型的大小配额和使用节点本地存储缓存白名单上传模型数据并校验上传对象的一致性创建专属资源池

 帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
查询Workflow Execution - AI开发平台ModelArts

objects 节点steps使用到的参数。 policies WorkflowDagPolicies object 执行记录使用到的执行策略。表3 StepExecution 参数参数类型描述 step_name String 节点的名称，在一个DAG中唯一，1到64位只

 帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
开发Workflow的核心概念介绍 - AI开发平台ModelArts

是 str steps 工作流包含的节点列表是 list[Step] storages 统一存储对象列表否 Storage或者list[Storage] policy 工作流的配置策略，主要用于部分运行场景否 Policy Step Step是组成Workflow的最小单元，

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考
LoRA微调训练 - AI开发平台ModelArts

由于模型中LoRA微调训练存在已知的精度问题，因此不支持TP(tensor model parallel size)张量模型并行策略，推荐使用PP(pipeline model parallel size)流水线模型并行策略，具体详细参数配置如表2所示。 Step3 启动训练脚本修改超参值后，再启动训练脚本。Llama2-70b建议为4机32卡训练。

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.907）
自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？模型统一管理针对自动学习项目，当模型训练完成后，其生成的模型，将自动进入“模型管理”页面，如下图所示。模型名称由系统自动命名，前缀与自动学习项目的名称一致，方便辨识。自动学习生成的模型，不支持下载使用。图1 自动学习生成的模型

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用自动学习实现零代码AI开发 > 使用窍门
训练作业卡死检测 - AI开发平台ModelArts

日志中还未出现NCCL DEBUG信息时已卡死。解决方案1 检查代码，检查是否有参数中未传入“master_ip”和“rank”参数等问题。问题现象2 分布式训练的日志中，发现有的节点含有GDR信息，而有的节点无GDR信息，导致卡死的原因可能为GDR。 # 节点A日志 modelarts-job

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性
训练性能测试 - AI开发平台ModelArts

formance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora、full：4096-full、lora-8k：8192-lora、full-8k：8192-full】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.910） > 训练benchmark工具
如何将Keras的.h5格式模型导入到ModelArts中 - AI开发平台ModelArts

如何将Keras的.h5格式模型导入到ModelArts中 ModelArts不支持直接导入“.h5”格式的模型。您可以先将Keras的“.h5”格式转换为TensorFlow的格式，然后再导入ModelArts中。从Keras转TensorFlow操作指导请参见其官网指导。父主题：

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard推理部署 > 模型管理 > 导入模型
训练性能测试 - AI开发平台ModelArts

formance_cfgs.yaml相对或绝对路径。 <model_name>：训练模型名，如qwen2-7b <run_type>：训练策略类型及数据序列长度：【lora：4096-lora、full：4096-full、lora-8k：8192-lora、full-8k：8192-full】

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配LlamaFactory PyTorch NPU训练指导（6.3.911） > 训练benchmark工具
修改Workflow工作流 - AI开发平台ModelArts

描述 name 否 String 工作流存储的名称。填写1-64位，只包含英文、数字、下划线（_）和中划线（-），并且以英文开头的名称。 type 否 String 工作流存储的类型，当前只支持obs。 path 否 String 统一存储的根路径，当前只支持OBS路径。表7 WorkflowStep

帮助中心 > AI开发平台ModelArts > API参考 > Workflow工作流管理
升级Lite Cluster资源池驱动 - AI开发平台ModelArts

按节点比例：每批次驱动升级的实例数量为“节点比例*资源池实例总数”。按实例数量：可以设置每批次驱动升级的实例数量。对于不同的升级方式，滚动升级选择实例的策略会不同：如果升级方式为安全升级，则根据滚动节点数量选择无业务的节点，隔离节点并滚动升级。如果升级方式为强制升级，则根据滚动节点数量随机选择节点，隔离节点并滚动升级。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

Step6 推理服务的高阶配置（可选）如需开启以下高阶配置，请在Step3 配置NPU环境时增加需要开启的高阶配置参数。词表切分在分布式场景下，默认不使用词表切分能提升推理性能，同时也会增加单卡的显存占用。不建议开启词表并行，如确需使用词表切分，配置以下环境变量。 export

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.905）
如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

参考下载OBS文件到Notebook中的指导，将OBS中的数据下载至Notebook本地处理。参考pandas用户指南处理pandas数据。父主题：数据存储

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 数据存储

总条数： 694

上一页
1
...
10
11
12
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练精度测试 - AI开发平台ModelArts

AI Gallery功能介绍 - AI开发平台ModelArts

JupyterLab默认工作路径是什么？ - AI开发平台ModelArts

ModelArts中提示OBS相关错误 - AI开发平台ModelArts

准备镜像 - AI开发平台ModelArts

使用MaaS调优模型 - AI开发平台ModelArts

如何对OBS的文件重命名？ - AI开发平台ModelArts

使用大模型在ModelArts Standard创建模型部署在线服务 - AI开发平台ModelArts

查询Workflow Execution - AI开发平台ModelArts

开发Workflow的核心概念介绍 - AI开发平台ModelArts

LoRA微调训练 - AI开发平台ModelArts

自动学习生成的模型，存储在哪里？支持哪些其他操作？ - AI开发平台ModelArts

训练作业卡死检测 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

如何将Keras的.h5格式模型导入到ModelArts中 - AI开发平台ModelArts

训练性能测试 - AI开发平台ModelArts

修改Workflow工作流 - AI开发平台ModelArts

升级Lite Cluster资源池驱动 - AI开发平台ModelArts

在Notebook调试环境中部署推理服务 - AI开发平台ModelArts

如何使用pandas库处理OBS桶中的数据？ - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线