检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户ID。 items 否 List 由itemid组成的List。需要在部署服务的时候与物品-物品协同过滤算法一起使用,并提供物品-物品相似度查询功能。 others_users 否 List 由userid组成的List。提供多用户候选集查询功能。 context 否 String
用于指定从数据源中取最近多少天的行为数据计算相似度。默认取全部数据。 上传物品相似度 支持客户通过obs导入自定义的相似度信息。相似度文件格式为json, 其中subject为用户或物品, relations为与subject相似的用户或物品及其相似度。例如, { "subject": "item108"
在“创建数据质量”页面,单击“添加数据质量算子”选择“数据质量检测算子”。 填写基本信息并选择计算引擎。您可以根据实际情况填写“名称”、“场景”和“描述”信息。其中“场景”信息可选择您在全局配置页面创建的场景。 填写参数配置,参数说明请参见表1。 图1 创建数据质量检测作业 表1 数据质量检测算子参数说明 参数名称 说明
“最大推荐数结果数”:指定召回的结果数量。 “开启时间跨度”:不开启取全部数据,开启则指定从数据源中取最近天数或小时数的行为数据计算相似度。默认关闭。 “开启调度”:开启调度,按照指定的调度策略定期执行作业。默认关闭。 图6 创建召回策略 配置完成召回策略参数之后单击“确认”
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表9 MatrixFactorization 参数 是否必选 参数类型 描述
50 相似性度量方式 计算用户或物品特征表达相似性的方式。在ItemCF算法中,每个物品会基于对它有过行为的用户表示为特征向量,向量每一维是一个<user_id, score>元组,score表示对应user_id的权重,该参数决定了使用何种函数计算物品向量之间的相似度。 相似性度量支持如下方式:
产品功能 数据源 数据源功能可以在用户上传数据后,将离线数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。经过数据质量检测来确保数据的合法性。提供数据源智能检测,输出数据分布和数据质量信息等,智能完成特征工程。 智能场景 根据业务场景选择对应的智能推荐场景,快速搭建专属推荐系统。
“基于用户推荐物品”:某些用户的属性很相似,如电商平台根据这些用户的行为(浏览、点击、购买)计算与这些用户相似用户的行为,为该用户推荐相似用户浏览或购买的物品。 “基于用户推荐用户”:某些用户的属性很相似,如交友平台根据这些用户的行为(浏览、点击)或属性推荐与这些用户相似用户。 “基于物品推荐物
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表10 MatrixFactorization 参数 是否必选 参数类型
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表11 MatrixFactorization 参数 是否必选 参数类型
宽表条目数,行为数据去重以后的数目。 user_complete_degree Double 用户齐全度,一条行为中的用户是否在产生这条行为的时候拥有画像。 item_complete_degree Double 物品齐全度,一条行为中的物品是否在这条行为产生的时候拥有画像。 bhv_count Map<String
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表9 MatrixFactorization 参数 是否必选 参数类型 描述
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表9 MatrixFactorization 参数 是否必选 参数类型 描述
产品价格详情 03 使用 推荐系统对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线策略的数据。通过上述作业训练出可用于在线服务的推荐候选集。当在线作业运行完成,您可以通过效果评估检测推荐结果。 使用推荐系统 推荐系统操作流程 准备工作
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表9 MatrixFactorization 参数 是否必选 参数类型 描述
nearest_neighborhood 是 Integer 最近领域个数。 band 是 Integer 相似程度。 最小值:1 最大值:20 row 是 Integer 相似距离。 最小值:1 最大值:10 表10 MatrixFactorization 参数 是否必选 参数类型
离线数据和近线实时数据如何配合使用? 在推荐系统初始化阶段,需要用户提供批量的离线数据源并按照推荐系统要求的数据格式上传至OBS,完成数据的检测和导入。 近线实时数据源推荐使用RES SDK上传,此操作所有的数据更新都是实时生效的。 父主题: 数据源
描述 nearest_neighborhood Integer 最近领域个数。 band Integer 相似程度。 最小值:1 最大值:20 row Integer 相似距离。 最小值:1 最大值:10 表11 MatrixFactorization 参数 参数类型 描述 implicit_vector_rank
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
选集。 用户通过数据质量作业对离线数据进行质量检测,然后将检测合格的数据通过特征工程处理为可用于召回策略、过滤规则、排序策略、近线作业的数据。通过上述离线作业训练出可用于在线服务的推荐候选集。当在线服务运行完成,您可以通过效果评估检测推荐结果。 离线作业功能说明 表1 功能说明 离线作业