推荐系统 RES-近线作业:流式训练
流式训练
流式训练接入用户行为数据,进行在线训练,以分钟级更新在线服务依赖的排序模型,减少排序模型的效果衰减。
前提条件
- 已存在运行成功的排序策略。建议“优化器类型”选择“ftrl”。
- 已存在运行成功的在线服务。该在线服务“排序方式”为“点击率预估”并且“模型文件路径”为1排序策略生成的模型存储路径。
- 流式训练仅支持2019年12月4日0点之后创建的排序策略和在线服务。
- 流式训练使用到的排序策略不支持“核函数特征交互神经网络-PIN”算法。
- 建议您定期“重新执行”条件1对应的离线排序任务。重新执行排序策略后,在线服务和流式训练作业将自动同步新产生的模型,无需重新配置或重新执行在线服务和流式训练作业。
- 在线服务可以减少排序模型的效果衰减,但仍需定期重新执行离线任务。
参数名称 |
说明 |
默认值 |
---|---|---|
策略别名 |
策略显示名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~60个字符。 |
默认流式训练。 |
数据源 |
|
服务名默认DIS。 通道名无。 起始位置默认为latest。 |
窗口间隔(秒) |
近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 |
10s。 |
算子参数 |
|
- |
训练设置 |
|
默认“8核|16GiB” 时间间隔10min |
优化策略相关参数 |
|
- |