搜索_华为云

训练中的权重转换说明 - AI开发平台ModelArts

如下： hf2hg：用于Hugging Face 转 Megatron mg2hf：用于Megatron 转 Hugging Face TP 8 张量并行数，一般等于单机卡数 PP 1 流水线并行数，一般等于节点数量 ORIGINAL_HF_WEIGHT /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.905） > 训练脚本说明
日志提示"Permission denied" - AI开发平台ModelArts

用户来启动v2容器镜像，将ma-user的uid从1102改为1000，改变方式如下（假若需要sudo权限，可取消sudoers行的注释）： v1训练作业环境变量迁移v2说明： v1的DLS_TASK_NUMBER环境变量，可以使用v2的MA_NUM_HOSTS环境变量替换，即选择的训练节点数

 帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 权限问题
示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

训练作业的任务节点数要大于或等于3。路由加速的原理是改变rank编号，所以代码中对rank的使用要统一。将训练作业完成如下修改后，启动训练作业即可实现网络加速。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 分布式模型训练
ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

用户VPC：安装和配置正向代理在安装正向代理前，需要先购买一台弹性云服务器ECS（镜像可选择Ubuntu最新版本），并配置好弹性EIP，然后登录ECS进行正向代理Squid的安装和配置，步骤如下：如果没有安装Docker，执行以下命令进行Docker安装 curl -sSL https

帮助中心 > AI开发平台ModelArts > 最佳实践 > Standard推理部署
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

“计算节点规格”：在下拉框中选择推理使用的计算资源。如果有免费资源，建议选择免费资源。其他参数可使用默认值。图6 部署在线服务参数配置完成后，单击“下一步”，确认规格参数后，单击“提交”启动在线服务的部署。

帮助中心 > AI开发平台ModelArts > 快速入门
使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

“计算节点规格”：在下拉框中选择“限时免费”资源，勾选并阅读免费规格说明。其他参数可使用默认值。如果限时免费资源售罄，建议选择收费CPU资源进行部署。当选择收费CPU资源部署在线服务时会收取少量资源费用，具体费用以界面信息为准。

帮助中心 > AI开发平台ModelArts > 最佳实践 > 历史待下线案例
动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点 - AI开发平台ModelArts

动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点问题现象在Notebook中动态挂载OBS并行文件系统，本地挂载目录为/data/demo-yf/，实际在JupyterLab左侧导航看不到此目录。图1 本地挂载目录图2 Notebook

帮助中心 > AI开发平台ModelArts > 常见问题 > Standard Notebook > 文件上传下载
训练权重转换说明 - AI开发平台ModelArts

如下： hf2hg：用于Hugging Face 转 Megatron mg2hf：用于Megatron 转 Hugging Face TP 8 张量并行数，一般等于单机卡数 PP 1 流水线并行数，一般等于节点数量 ORIGINAL_HF_WEIGHT /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

如下： hf2hg：用于Hugging Face 转 Megatron mg2hf：用于Megatron 转 Hugging Face TP 8 张量并行数，一般等于单机卡数 PP 1 流水线并行数，一般等于节点数量 ORIGINAL_HF_WEIGHT /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

扩容实例数或者选择性能更好的“计算节点规格”，例如使用GPU资源代替CPU资源，提升服务处理能力。

帮助中心 > AI开发平台ModelArts > 故障排除 > 推理部署 > 服务预测
终止训练作业 - AI开发平台ModelArts

max_num Integer 资源规格的最大节点数。 flavor_type String 资源规格的类型。可选值如下： CPU GPU Ascend billing BillingInfo object 资源规格计费信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
查询训练作业详情 - AI开发平台ModelArts

max_num Integer 资源规格的最大节点数。 flavor_type String 资源规格的类型。可选值如下： CPU GPU Ascend billing BillingInfo object 资源规格计费信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
场景介绍 - AI开发平台ModelArts
场景介绍 - AI开发平台ModelArts

baichuan2-13b https://huggingface.co/baichuan-inc/Baichuan2-13B-Chat 操作流程图1 操作流程图表2 操作任务流程说明阶段任务说明准备工作准备资源本教程案例是基于ModelArts Standard运行的，需要购买并开通

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.905）
创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

Content-Type →application/json 其中，加粗的斜体字段需要根据实际值填写： ma_endpoint为ModelArts的终端节点。 project_id为用户的项目ID。 dataset_id为待启动智能标注任务的数据集ID。

帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

} }, "scope": { "project": { "name": "cn-north-1" } } } } 其中，加粗的斜体字段需要根据实际值填写： iam_endpoint为IAM的终端节点

 帮助中心 > AI开发平台ModelArts > API参考 > 应用示例
查询训练作业列表 - AI开发平台ModelArts

max_num Integer 资源规格的最大节点数。 flavor_type String 资源规格的类型。可选值如下： CPU GPU Ascend billing BillingInfo object 资源规格计费信息。

帮助中心 > AI开发平台ModelArts > API参考 > 训练管理
训练的权重转换说明 - AI开发平台ModelArts

如下： hf2hg：用于Hugging Face 转 Megatron mg2hf：用于Megatron 转 Hugging Face TP 8 张量并行数，一般等于单机卡数 PP 1 流水线并行数，一般等于节点数量 ORIGINAL_HF_WEIGHT /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
安全边界 - AI开发平台ModelArts
安全边界 - AI开发平台ModelArts

部署上线部署服务时，需要注意为服务设置合适计算节点规格，防止服务因资源不足而过载或者资源过大而浪费。尽量避免在容器中监听其他端口，有本地内部需要访问的其他端口，监听在localhost上。避免通过环境变量传递敏感信息，需要通过加密组件进行加密后再通过环境变量配置。

帮助中心 > AI开发平台ModelArts > 产品介绍 > 安全
训练的权重转换说明 - AI开发平台ModelArts

如下： hf2hg：用于Hugging Face 转 Megatron mg2hf：用于Megatron 转 Hugging Face TP 8 张量并行数，一般等于单机卡数 PP 1 流水线并行数，一般等于节点数量 ORIGINAL_HF_WEIGHT /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
训练的权重转换说明 - AI开发平台ModelArts

如下： hf2hg：用于Hugging Face 转 Megatron mg2hf：用于Megatron 转 Hugging Face TP 8 张量并行数，一般等于单机卡数 PP 1 流水线并行数，一般等于节点数量 ORIGINAL_HF_WEIGHT /home/ma-user

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.907） > 训练脚本说明

总条数： 1083

上一页
1
...
42
43
44
...
55
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

训练中的权重转换说明 - AI开发平台ModelArts

日志提示"Permission denied" - AI开发平台ModelArts

示例：创建DDP分布式训练（PyTorch+NPU） - AI开发平台ModelArts

ModelArts Standard推理服务访问公网方案 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

使用ModelArts Standard一键完成商超商品识别模型部署 - AI开发平台ModelArts

动态挂载OBS并行文件系统成功，但是在Notebook的JupyterLab中无法看到本地挂载点 - AI开发平台ModelArts

训练权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

在线服务预测报错ModelArts.4503 - AI开发平台ModelArts

终止训练作业 - AI开发平台ModelArts

查询训练作业详情 - AI开发平台ModelArts

场景介绍 - AI开发平台ModelArts

创建并完成图像分类的智能标注任务 - AI开发平台ModelArts

创建图像分类数据集并进行标注任务 - AI开发平台ModelArts

查询训练作业列表 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

安全边界 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

训练的权重转换说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线