推荐系统 RES-排序策略-离线排序模型:AutoGroup

时间：2023-11-01 16:19:31

推荐系统 RES

AutoGroup

AutoGroup，使用自动分组技术探索高阶特征交互组合，更深层次地挖掘出多个特征间联系，增强模型排序效果。

表3 AutoGroup参数说明
参数名称	说明
名称	自定义策略名称，由中文、英文、数字、下划线、空格或者中划线组成，并且不能以空格开始和结束，长度为1~64个字符。
描述	对于该策略的描述信息。
最大交互阶数	算法探索的最大的特征交互阶数。例如，当设定最大交互阶数为4时，算法会探索2阶、3阶、4阶的特征交互组合。默认3。
各阶隐向量长度	各阶特征交互使用的隐向量长度，数量需对应最大交互阶数。默认10,60,80。
哈希长度	每阶特征交互所选择的group数量，数量需对应最大交互阶数。默认10,60,80。
特征交互层惩罚项系数	特征交互层输出值的惩罚项系数，用来防止过拟合。默认0.0001,0.0001,0.0001。
神经网络结构	神经网络的层数与每一层的神经元节点个数。默认400,400,400。
激活函数	神经网络中的激活函数，将一个（或一组）神经元的值映射为一个输出值。 relu tanh sigmoid
神经元值保留概率	神经网络前向传播过程中以该概率保留神经元的值。默认0.8。
优化器类型	grad：梯度下降算法学习率：优化算法的参数，决定优化器在最优方向上前进步长的参数。默认0.001。 adam：自适应矩估计算法结合AdaGrad和 RMS Prop两种优化算法的优点，对梯度的一阶矩估计（First Moment Estimation，即梯度的均值）和二阶矩估计（Second Moment Estimation，即梯度的未中心化的方差）进行综合考虑，依次计算出更新步长。学习率：优化算法的参数，决定优化器在最优方向上前进步长的参数。默认0.001。数值稳定常量：为保证数值稳定而设置的一个微小常量。默认1e-8。 adagrad：自适应梯度算法对每个不同的参数调整不同的学习率，对频繁变化的参数以更小的步长进行更新，而稀疏的参数以更大的步长进行更新。学习率：优化算法的参数，决定优化器在最优方向上前进步长的参数。默认0.001。初始梯度累加和：梯度累加和用来调整学习步长。默认0.1。 ftrl：Follow The Regularized Leader 适用于处理超大规模数据的,含大量稀疏特征的在线学习的常见优化算法。学习率：优化算法的参数，决定优化器在最优方向上前进步长的参数。默认0.1。初始梯度累加和：梯度累加和用来调整学习步长。默认0.1。 L1正则项系数：叠加在模型的1范数之上，用来对模型值进行限制防止过拟合。默认0。 L2正则项系数：叠加在模型的2范数之上，用来对模型值进行限制防止过拟合。默认0。
结构部分优化器	详细参数请参见优化器类型。
正则损失计算方式	正则损失计算当前有两种方式。 full：指针对全量参数计算。 batch：则仅针对当前批数据中出现的参数计算说明： batch模式计算速度快于full模式。
L2正则项系数	叠加在模型的2范数之上，用来对模型值进行限制防止过拟合。默认0。
隐向量层L2正则化系数	隐向量层使用的L2正则化系数，作用如“L2正则项系数”描述。默认0.001。
wide部分L2正则化系数	wide层使用的L2正则化系数，作用如“L2正则项系数”描述。默认0.001。
最大迭代轮数	模型训练的最大迭代轮数，默认50。
提前终止训练轮数	在测试集上连续N轮迭代AUC无提高时，迭代停止，训练提前结束，默认5。
重新训练	对第一次训练无影响，仅影响任务重跑。 “是”：清空上一轮的模型结果后重新开始训练。 “否”：导入上一轮的训练结果继续训练。适用于欠拟合的情况。
批量大小	一次训练所选取的样本数。
训练数据集切分数量	将整个数据集切分成多个子数据集，依次训练，每个epoch训练一个子数据集。
融合多值特征	将多值特征的多个embedding融合成一个embedding。
融合线性部分	是否使用模型架构中的线性部分。
固定哈希结构	是否固定结构参数。默认值为“否”，非特殊情况建议使用默认值。