检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。 集群名称,选择“资源中心”绑定的CloudTable集群名称。
宽表条目数,行为数据去重以后的数目。 user_complete_degree Double 用户齐全度,一条行为中的用户是否在产生这条行为的时候拥有画像。 item_complete_degree Double 物品齐全度,一条行为中的物品是否在这条行为产生的时候拥有画像。 bhv_count
在购物车场景,使用的召回候选集来自于离线计算基于物品的协同过滤生成的候选集,而为了尽可能保证推荐的匹配度,要求推荐出来的物品尽可能的与用户性别、体质和年龄等属性吻合,所以考虑基于用户性别、体质和年龄等属性用标签索引得到的满足条件物品列表item1, 对离线生成的items2进行如
数值稳定常量:为保证数值稳定而设置的一个微小常量。默认1e-8。 adagrad:自适应梯度算法 对每个不同的参数调整不同的学习率,对频繁变化的参数以更小的步长进行更新,而稀疏的参数以更大的步长进行更新。 学习率:优化算法的参数,决定优化器在最优方向上前进步长的参数。默认0.001。 初
输出流DIS通道名称。该通道用于存放由行为数据和画像库计算生成的排序预处理数据,以供模型训练。通道中的数据属于流式训练作业产生的中间数据,使用者只需指定通道名称,无需往该通道发送或获取数据。 starting_offsets 是 String 读取DIS数据的起始位置,LATEST表示从最新的数据开始读取。 表10
*<>|\":]等特殊字符,最大长度256字符。 基于属性匹配的召回策略 表26 BehaviorsWeight参数说明 参数名称 是否必选 参数类型 说明 portrait_storage 是 JSON 请参见表27,用户画像,物品画像的存储信息。 global_features_information_path
String 作业名称 job_type 是 String 作业类型: WriteUserProfile,用户画像实时导入作业 WriteItemProfile,物品画像实时导入作业 UniversalProcess,行为数据实时导入作业 NearlineRecall,近线召回作业
作业名称,1-64位字母、数字、下划线、中划线组合 job_type 是 String 作业类型: WriteUserProfile,用户画像实时导入作业 WriteItemProfile,物品画像实时导入作业 UniversalProcess,行为数据实时导入作业 NearlineRecall,近线召回作业
用户需要自己手工创建整理这些表并存储到OBS上。 每张表的表结构必须符合推荐系统的要求,列名和字段类型需要和规范中保持一致(参考下面的表结构说明)。 每张表中填充的数据,必须符合推荐引擎的要求。 对于业务数据中无法提供的字段可以填NULL。 用户属性表 用户属性表记录用户的属性信息,例如地域、爱好等,属性名和属性值成对出现。
match_infos 进行召回匹配的参数配置,即搜索的匹配信息。 label:客体的属性名称(可为字符串或字符串数组类型)。 value:相应的属性值。 weight:该属性值的匹配权重,多个匹配条件做加权汇总后按分值从大到小给出候选集。 filter_info 搜索的过滤信息。 black_list:客体需要过滤的黑名单。
提交模板作业接口,根据选择策略的不同,参数也有不同。 召回策略 parameter中包含的参数,请参见策略参数说明中召回策略(recall)各策略参数说明。 排序策略 parameter中包含的参数有以下几部分: spec_id :参数类型Long,训练作业选择的资源规格ID。 run_
最小长度:1 最大长度:64 job_type 是 String 作业类型: WriteUserProfile,用户画像实时导入作业 WriteItemProfile,物品画像实时导入作业 UniversalProcess,行为数据实时导入作业 NearlineRecall,近线召回作业
topK 用户最感兴趣的排序在前K个的物品。 行为 行为类型:用户感兴趣的行为类型。 权重值:行为的初始权重。 衰减系数:用于衰减行为初始权重的系数。 有效时间:用户配置的行为发生时间与当前时间的间隔,以小时为单位。系统只处理在该时间范围内的行为记录。 基于用户相似度的实时召回 基于用
基于大规模机器学习算法,深度挖掘物品之间的联系,自动匹配精准内容。 热门推荐 基于多维度数据分析,自动匹配所覆盖用户群体更关心的内容进行重点展示。 获取推荐结果 根据不同的功能模块,获取对应的推荐结果。 获取推荐结果 父主题: 智能场景
征值都是一个不定长的字符串数组,例如商品的类别特征、用户的兴趣爱好等。排序预处理算子会将所有特征值规范到统一长度以便后续处理; KV数值型(map):Map[String,Double]型,每一个特征值都是一个不定长的key-value对,例如用户画像、物品画像等特征。排序预处理
属性对。 表30 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表31 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
使用推荐系统管理控制台快速搭建推荐服务,利用推荐系统的智能场景和自定义场景功能得到满意的推荐结果。 快速入门 智能场景(猜你喜欢) 自定义场景(热度推荐) 05 实践 根据用户的离线历史数据,推荐系统通过模型训练和召回策略,对用户数据进行初选、融合、过滤、排序。通过用户实时的行为日志进行分析并更新用户数据,得到更优候选集。
属性对。 表31 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表32 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array
strings 需要置顶的候选集列表。 表31 AttrPairRules 参数 参数类型 描述 attr_pairs Array of AttrPair objects 属性对。 表32 AttrPair 参数 参数类型 描述 party_a String 被推荐对象的属性名。 party_b
属性对。 表31 AttrPair 参数 是否必选 参数类型 描述 party_a 否 String 被推荐对象的属性名。 party_b 否 String 被推荐对象的属性名。 表32 Deduplication 参数 是否必选 参数类型 描述 attributes 否 Array