推荐系统 RES-排序策略-离线特征工程
排序策略-离线特征工程
参数名称 |
说明 |
---|---|
名称 |
自定义离线特征工程名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 |
描述 |
对于特征工程的描述信息。 |
待提取用户特征 |
排序模型需要经特征工程处理后的数据, 选择排序模型需要的用户特征, 未选择的用户特征将不会被处理,即排序模块将忽略这些特征。
说明:
离散的区间个数不能超过100个,请您根据业务需求合理分配参数值。 单击,增加用户特征。在下拉选项中勾选特征参数名称并进行配置。当“特征值类型”为“多值枚举型”时,您可以根据需求自定义枚举个数。其他类型可选的参数信息如下:
|
待提取物品特征 |
排序模型需要经特征工程处理后的数据, 选择排序模型需要的物品特征,未选择的物品特征将不会被处理,即排序模块将忽略这些特征。
说明:
离散的区间个数不能超过100个,请您根据业务需求合理分配参数值。 单击,增加物品特征。在下拉选项中勾选特征参数名称并进行配置。当“特征值类型”为“多值枚举型”时,您可以根据需求自定义枚举个数。其他类型可选的参数信息如下:
|
自定义行为类型 |
如果开启“自定义行为类型”, 算法则按用户设置的行为类型及权重进行排序预处理任务,否则默认使用数据源中的行为类型及权重进行任务。
|
行为去重方式 |
将行为数据中某个用户对某个物品的多条记录进行去重,目前支持按行为权重去重(正向行为且权重越大的优先)和按时间去重(每天、每星期、每个月保留一条数据)。
|
时间类型 |
将行为数据中某个用户对某个物品的多条记录进行去重, 只保留每个时间区间内的一条最新数据。您可以根据数据实际情况选择去重的时间周期,可选天、周、月。默认为“天”。 周一是第一天:行为数据按周去重,是否周一是第一天。 如果选择否, 则认为周日是第一天,保留每个时间区间内的一条最新数据。 |
训练集测试集划分方式 |
数据划分方式按时间比例或个数比例划分训练集测试集。
|
训练数据占比 |
生成的结果中,训练集占整个训练集和测试集的比例,默认0.7。 |
测试数据占比 |
生成的结果中,训练集占整个训练集和测试集的比例,默认0.3。 |
开启调度 |
开启调度,按照指定的调度策略定期执行作业。
|