搜索_华为云

DevServer权限 - AI开发平台ModelArts

*.get √ × 查询DevServer实例列表 GET /v1/{project_id}/dev-servers modelarts:devserver:listByUser - √ × 查询租户所有DevServer实例列表 GET /v1/{project_id}/dev-servers/all

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
训练启动脚本说明和参数配置 - AI开发平台ModelArts

TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示contex

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.908） > 训练脚本说明
管理AI Gallery中的AI应用 - AI开发平台ModelArts

“公开”：表示公开资产，所有用户都可以查看该资产。当选择公开AI应用，系统会自动提交资产公开申请，审核通过之前资产还是私密状态，审核通过后就会变成公开状态。 “私密”：表示仅部分用户可见。 “仅自己可见”：默认状态，表示仅AI应用创建者可见该资产。 “指定用户”：表示AI应用创建者和指定的用户可见该资产。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery中的AI应用
训练启动脚本说明和参数配置 - AI开发平台ModelArts

TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 1 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示contex

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard+OBS+SFS适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 4 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示contex

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.908） > 训练脚本说明参考
同步Lite Server服务器状态 - AI开发平台ModelArts

登录ModelArts管理控制台。在左侧导航栏中，选择“AI专属资源池 > 弹性节点 Server”，进入“节点”列表页面。在弹性节点Server列表中，单击的“同步”，在弹出的确认对话框中，确认信息无误，然后单击“确定”，完成同步操作。图1 同步状态父主题： Lite

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Server） > Lite Server资源管理
发布免费算法 - AI开发平台ModelArts

x.x”。设置“谁可以看”。设置资产的公开权限。可选值有： “公开”：表示所有使用AI Gallery的用户都可以查看且使用该资产。 “指定用户”：表示仅特定用户可以查看及使用该资产。 “仅自己可见”：表示只有当前账号可以查看并使用该资产。设置“时长限制”。设置订阅者可以免

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（旧版） > 发布分享
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

登录ModelArts管理控制台，在左侧导航栏中选择“模型管理”，进入模型列表页面。单击左上角的“创建模型”，进入“创建模型”页面。在“创建模型”页面，填写相关参数。填写模型基本信息，详细参数说明请参见表1。表1 模型基本信息参数说明参数名称说明名称模型名称。支持1～64

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
训练作业权限 - AI开发平台ModelArts

训练作业权限表1 训练作业（新版）细化权限说明权限对应API接口授权项依赖的授权项 IAM项目企业项目创建训练作业 POST /v2/{project_id}/training-jobs modelarts:trainJob:create swr:repository:listTags

帮助中心 > AI开发平台ModelArts > API参考 > 权限策略和授权项
训练启动脚本说明和参数配置 - AI开发平台ModelArts

随机种子数。每次数据采样时，保持一致。不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
训练启动脚本说明和参数配置 - AI开发平台ModelArts

随机种子数。每次数据采样时，保持一致。不同模型推荐的训练参数和计算规格要求如表2所示。规格与节点数中的1*节点 & 4*Ascend表示单机4卡，以此类推。表2 不同模型推荐的参数与NPU卡数设置序号支持模型支持模型参数量文本序列长度并行参数设置规格与节点数 1 llama2

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU训练指导（6.3.906） > 训练脚本说明
发布模型到AI Gallery - AI开发平台ModelArts

模型”下，选择未发布的模型，单击模型名称，进入模型详情页。在模型详情页，单击右侧“发布”，在发布模型页面编辑发布信息后，单击“发布”。表1 发布模型的参数说明参数名称说明中文名称模型发布后显示的名称，在创建模型时设置的名称，此处不可编辑。任务类型选择合适的任务类型。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型
发布Workflow到AI Gallery - AI开发平台ModelArts

as wf # 添加指定的白名单用户列表 wf.add_whitelist_users(content_id="**", version_num="*.*.*", user_groups=["**", "**"]) # 删除指定的白名单用户列表 wf.delete_whiteli

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用Workflow实现低代码AI开发 > 开发Workflow命令参考 > 发布Workflow
ModelArts数据管理支持哪些格式？ - AI开发平台ModelArts

支持 - 支持支持支持 - - 视频支持支持 - 支持支持支持 - - 自由格式支持 - 支持支持支持支持 - - 表格型表格支持支持 - 支持支持支持 - - 父主题： Standard数据管理

 帮助中心 > AI开发平台ModelArts > 常见问题 > Standard数据管理
训练启动脚本说明和参数配置 - AI开发平台ModelArts

TP 8 表示张量并行。对应训练参数 tensor-model-parallel-size 。 PP 4 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。对应训练参数 pipeline-model-parallel-size 。 CP 1 表示contex

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于DevServer适配ModelLink PyTorch NPU训练指导（6.3.909） > 训练脚本说明参考
训练启动脚本说明和参数配置 - AI开发平台ModelArts

表示训练中所有机器一个step所处理的样本量。影响每一次训练迭代的时长。 TP 8 表示张量并行。 PP 8 表示流水线并行。一般此值与训练节点数相等，与权重转换时设置的值相等。 CP 1 表示context并行，默认为1。应用于训练长序列文本的模型。若训练时SEQ_LEN超过32768长度，则推荐增加CP值（CP

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Cluster适配PyTorch NPU训练指导（6.3.909） > 训练脚本说明
扩缩容Lite Cluster资源池 - AI开发平台ModelArts

操作。在“专属资源池扩缩容”页面，可通过增减“目标总实例数”实现扩缩容，请用户根据本身业务诉求进行调整。增加目标总实例数即表示扩容，减少目标总实例数即表示缩容。若购买资源池时，节点数量采用整柜方式购买（部分规格支持），则在扩缩容时为整柜方式扩缩容，目标总实例数等于“数量*整柜

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Lite Cluster） > Lite Cluster资源管理
自定义镜像规范 - AI开发平台ModelArts

Gallery仓库内的地址，则填写相对路径。同时，还需要在“模型文件”添加gallery_train文件夹，文件夹内容参考表2。表2 gallery_train文件列表文件类型文件说明 “train_params.json” 必选文件，训练参数文件，定义了模型训练的必要参数，例如

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（AI Gallery） > AI Gallery（新版） > 发布和管理AI Gallery模型 > 构建模型
Workflow工作流管理 - AI开发平台ModelArts

获取Workflow工作流列表新建Workflow工作流删除Workflow工作流查询Workflow工作流修改Workflow工作流总览Workflow工作流查询Workflow待办事项在线服务鉴权创建在线服务包获取Execution列表新建Workflow Execution

帮助中心 > AI开发平台ModelArts > API参考
设置无条件自动重启 - AI开发平台ModelArts

“fault-tolerance/job-retry-num”赋值为1~128表示开启自动重启，“fault-tolerance/job-unconditional-retry”赋值为“true”表示启用了无条件自动重启。 { "kind": "job", "metadata":

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard训练模型 > 模型训练高可靠性

总条数： 1740

上一页
1
...
77
78
79
...
87
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DevServer权限 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

管理AI Gallery中的AI应用 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

同步Lite Server服务器状态 - AI开发平台ModelArts

发布免费算法 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

训练作业权限 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

发布模型到AI Gallery - AI开发平台ModelArts

发布Workflow到AI Gallery - AI开发平台ModelArts

ModelArts数据管理支持哪些格式？ - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

训练启动脚本说明和参数配置 - AI开发平台ModelArts

扩缩容Lite Cluster资源池 - AI开发平台ModelArts

自定义镜像规范 - AI开发平台ModelArts

Workflow工作流管理 - AI开发平台ModelArts

设置无条件自动重启 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线