推荐系统 RES-提交流式训练作业:请求消息
请求消息
请求参数请参见表2。
参数名称 |
是否必选 |
参数类型 |
描述信息 |
---|---|---|---|
workspace_id |
否 |
String |
工作空间ID,默认为0。 |
job_name |
是 |
String |
训练作业名称,最大长度为20字符。 |
job_description |
否 |
String |
训练作业描述,最大长度为256字符。 |
nearline_platform |
是 |
JSON |
请参见表3,近线计算平台。 |
strategy |
是 |
JSON |
请参见表5,策略信息。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
platform |
是 |
String |
平台名称,最大长度64字符,支持 DLI 。 |
platform_parameter |
是 |
JSON |
请参见表4,平台参数。 |
computing_resource |
否 |
String |
指定DLI运行任务的资源规格。 |
config_load_path |
是 |
String |
所选配置生成的文件在OBS上的存储路径。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
strategy_type |
是 |
String |
可选值:nearline。 |
name |
是 |
String |
策略别名,最大长度60字符。 |
algorithm_type |
是 |
String |
算法类型。现仅提供一种字段。 NEARLINE_ONLINE_TRAINING |
parameter |
是 |
JSON |
请参见表6,算法参数。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
data_source |
是 |
JSON |
请参见表7,数据源参数。 实时流近线任务支持的推荐标准数据为用户操作行为表。 |
data_source_config |
是 |
JSON |
请参见表10,数据源参数配置。 |
algorithm_config |
是 |
JSON |
请参见表11,算法参数配置。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
platform |
是 |
String |
平台名称,现在只支持DIS。将实时近线任务需要的数据添加到DIS中,推荐系统通过读取该数据进行近线计算。 |
in_stream_conf |
是 |
JSON |
请参见表8,平台参数。 |
out_stream_conf |
是 |
JSON |
请参见表9,平台参数。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
stream_name |
否 |
String |
输入流DIS通道名称。该通道用于接收近线行为数据。 |
starting_offsets |
是 |
String |
读取DIS数据的起始位置。
|
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
stream_name |
否 |
String |
输出流DIS通道名称。该通道用于存放由行为数据和画像库计算生成的排序预处理数据,以供模型训练。通道中的数据属于流式训练作业产生的中间数据,使用者只需指定通道名称,无需往该通道发送或获取数据。 |
starting_offsets |
是 |
String |
读取DIS数据的起始位置,LATEST表示从最新的数据开始读取。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
interval |
是 |
Integer |
近线策略流处理的窗口时间,单位为秒,10代表每隔10s进行一次。包括数据读取和处理的流计算。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
online_job_uuid |
是 |
String |
关联的在线服务的uuid。 |
flow_name |
是 |
String |
关联在线服务的其中一个在线流程的名称。流式训练作业所需的行为参数、模型文件路径、数据预处理信息等参数会从指定的在线服务的在线流程中获取。 |
online_training_config |
是 |
JSON |
请参见表12,平台参数。 |
bad_record_log |
否 |
String |
异常数据记录日志路径。路径填写到文件夹。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
spec_id |
是 |
Integer |
训练作业选择的资源规格ID。在使用ModelArts之前需要查询ModelArts服务AK/SK并确保关联AK/SK到ModelArts服务,然后通过查询ModelArts计算节点规格获取spec_id返回的值。 |
optimize_parameters |
是 |
JSON |
请参见表13,平台参数。 |
update_interval |
是 |
Integer |
排序模型的更新时间间隔,单位为分钟,例如10代表每隔10分钟保存一次排序模型到OBS,以供在线服务使用。 |
参数名称 |
是否必选 |
参数类型 |
说明 |
---|---|---|---|
type |
是 |
String |
优化器类型。现仅提供一种字段。
|
initial_accumulator_value |
是 |
Double |
用来动态调整学习步长。取值范围(0,1],默认值为0.1。 |
lambda1 |
是 |
Double |
叠加在模型的1范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。 |
lambda2 |
是 |
Double |
叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。取值范围[0,1],默认值为0。 |
learning_rate |
是 |
Double |
决定优化器在优化方向上前进步长的参数。取值范围(0,1],默认值为0.1。 |
- ModelArts模型训练_创建训练作业_如何创建训练作业
- ModelArts分布式训练_分布式训练介绍_分布式调测
- ModelArts模型训练_超参搜索简介_超参搜索算法
- ModelArts资源池_资源池是什么_资源池怎么收费
- 大数据应用范围有哪些_大数据技术与应用要学习什么课程
- RocketMQ主要应用场景有哪些_分布式消息中间件_分布式消息RocketMQ-华为云
- MapReduce服务_什么是Flink_如何使用Flink
- ModelArts模型训练_模型训练简介_如何训练模型
- 华为云ModelArts_ModelArts开发_AI全流程开发
- 函数工作流FunctionGraph支持毫秒级响应文件处理_函数工作流_华为云FunctionGraph-华为云