网络智能体-创建训练服务:新建训练服务

时间:2023-11-01 16:13:43

新建训练服务

训练任务需要基于已经成功打包的训练模型去创建,并选择新的训练数据集、测试数据集和标签列进行模型训练。

  1. 单击“创建”,弹出“创建训练”对话框。

    配置训练服务参数,如新建算法参数说明所示。
    表1 参数说明

    参数名称

    参数说明

    请选择模型训练方式

    模型训练方式,包含如下选项:

    • 新建模型训练工程
    • 新建联邦学习工程
    • 新建训练服务
    • 新建超参优化服务

    请选择:新建训练服务。

    描述

    对新建训练服务的描述信息。

    训练服务名称

    训练服务名称。

    只能以字母(A~Z a~z)开头,由字母、数字(0~9)、下划线(_)组成,不能以下划线结尾,长度范围为[1,26]。

    归档模型包

    从下拉框中选择已归档的模型。

  2. 单击“确定”。

    进入训练服务详情界面,如图1所示。界面说明如表2所示。
    图1 模型训练
    表2 界面说明

    区域

    参数名称

    参数说明

    1(训练服务)

    创建时间

    训练服务创建时间。

    类型

    模型训练的类型。

    创建者

    创建训练服务的用户。

    活动时间

    最近一次模型训练执行的时间。

    创建训练任务,详细请参考模型训练

    删除训练任务。

    模型训练工程描述

    训练服务的描述信息,支持单击“”重新编辑。

    切换到其他的训练工程、联邦学习工程、训练服务或超参优化服务的模型训练页面中。

    模型训练运行环境信息查看和配置。

    新建训练工程、联邦学习工程、训练服务或超参优化服务。

    2(模型训练任务)

    根据训练状态快速检索训练任务。

    根据任务创建时间、任务名称检索训练任务。

    默认按任务创建时间检索。

    按任务创建时间或者任务名称检索训练任务,检索结果按正序或者倒序排列展示。

    默认按倒序排序。

    任务名称

    模型训练任务的名称。

    任务描述

    模型训练任务的描述信息

    任务创建时间

    模型训练任务创建的时间。

    训练用时

    模型训练耗时时长。

    Tensorboard

    Tensorboard状态。

    训练状态

    显示训练任务当前的状态。

    包括如下状态:

    • ALL显示所有训练任务。
    • WAITING表示训练任务准备中。
    • RUNNING表示正在训练。
    • FINISHED表示训练成功
    • FAILED表示训练失败。
    • STOPPED表示被停止的训练任务。

    评估报告

    单击可查看训练评估报告详情。

    资源占用

    显示训练算法CPU、GPU和 RAM 的占用情况。

    峰值

    显示训练算法CPU、GPU和RAM使用过程中的峰值。

    查看训练任务的系统日志、运行日志和运行图。

    训练状态为RUNNING时,可以执行此按钮停止训练任务。

    删除训练任务。

    打包训练模型。

    说明:

    仅训练成功的模型支持打包。

support.huaweicloud.com/usermanual-naie-model-training/naie_model_training_03_0058.html