推荐系统 RES-排序策略:核函数特征交互神经网络-PIN
核函数特征交互神经网络-PIN
核函数特征交互神经网络是深度网络因子分解机的改进版本,深度网络因子分解机通过向量点乘来计算特征之间的关系,而核函数特征交互神经网络使用不同的核(kernel)来对特征交互进行建模,以此来计算两个域中特征的相互关系,其中核的种类包括向量内积外积、矩阵乘法、神经网络等。利用核函数建模特征交互,实现了参数共享,减小了模型复杂度。单击查看核函数特征交互神经网络详细信息。
参数名称 |
说明 |
---|---|
计算节点信息 |
用户可使用的计算资源种类。“8核|16GiB”、“8核|32GiB”、“8核|64GiB”、“16核|128GiB”。 |
训练数据的obs路径 |
特征工程排序样本预处理生成的训练数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的训练文件路径。 |
测试数据的obs路径 |
特征工程排序样本预处理生成的测试数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的测试文件路径。 |
特征值数量统计文件 |
该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,需要用户提供此文件完整路径。文件路径为特征工程中排序样本预处理作业输出数据的结果保存路径的“fields_feature_size”目录下文件名称是part-00000开头的文件,需要用户提供文件的OBS路径。 |
最大迭代轮数 |
模型训练的最大迭代轮数,默认50。 |
提前终止训练轮数 |
在测试集上连续N轮迭代AUC无提高时,迭代停止,训练提前结束,默认5。 |
初始化方法 |
模型参数的初始化方法。 |
优化器类型 |
|
L2正则项系数 |
叠加在模型的2范数之上,用来对模型值进行限制防止过拟合。默认0。 |
正则损失计算方式 |
正则损失计算当前有两种方式。
|
隐向量长度 |
分解后的表示特征的向量的长度。默认10。 |
神经网络结构 |
神经网络的层数与每一层的神经元节点个数。默认400,400,400。 |
激活函数 |
神经网络中的激活函数,将一个(或一组)神经元的值映射为一个输出值。
|
神经元值保留概率 |
神经网络前向传播过程中以该概率保留神经元的值。默认0.8。 |
子网络结构 |
特征向量之间使用神经网络核来计算相互关系时,该神经网络的结构。默认40,5。 |
是否移除因子分解机 |
是否移除模型架构中的因子分解机部分,值为true则蜕变为带有核函数的DNN。默认关闭。 |
保存根路径 |
单击选择训练结果在OBS中的保存根路径,训练完成后,会将模型和日志文件保存在该路径下。该路径不能包含中文。 |