检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在购物车场景,使用的召回候选集来自于离线计算基于物品的协同过滤生成的候选集,而为了尽可能保证推荐的匹配度,要求推荐出来的物品尽可能的与用户性别、体质和年龄等属性吻合,所以考虑基于用户性别、体质和年龄等属性用标签索引得到的满足条件物品列表item1, 对离线生成的items2进行如
用户 推荐系统被推荐的对象,一般是指使用业务系统的客户。例如,某电商的客户。 物品 被推荐的内容,一般是指业务系统提供的给其用户的商品。例如,某视频网站的视频。 召回策略 召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、
登录RES管理控制台,在左侧导航栏单击进入“工作空间”页面。 单击目标工作空间“操作”列的“编辑”,在“编辑工作空间”页面修改工作空间的名称或者描述信息。 单击“是”完成修改。 “状态正常”的工作空间修改时不影响该空间用户正常使用。 “删除中”状态和默认生成的“default”工作空间不支持修改。 删除工作空间
用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像-物品画像-标准宽表生成”算子生成的用户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 数据时间范围 被统计数据的起始时间和终止时间。
单击选择特征工程排序样本预处理生成的训练数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的训练文件路径。 测试数据的obs路径 单击选择特征工程排序样本预处理生成的测试数据所在的OBS路径。 即特征工程“排序样本预处理”结果保存路径下具体的测试文件路径。 特征值数量统计文件
List 每个Flow配置不同流量和候选集的规则,请参见表4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。 feature_uuid 否 String 预处理的离线处理生成的uuid。 filter_uuid
请参见表4,平台参数。 computing_resource 否 String 指定DLI运行任务的资源规格。 config_load_path 是 String 所选配置生成的文件在OBS上的存储路径。 表4 platform_parameter参数说明 参数名称 是否必选 参数类型
看了某个物品的时候,会推荐最相似/最相关的物品。 “基于物品推荐用户”:某些物品的属性、描述很相似,或者经常被一起购买。如房产平台会计算物品之间的相似或关联程度,当用户查看某个物品的时候,会推荐同时拥有该类型房源的房产经纪人。 服务类型 选择您需要的服务类型。 “推荐引擎”:推荐
效果评估 创建效果评估可以对服务设置指标,查看推荐效果的反馈,可以根据系统提供的指标添加。 创建效果评估作业 登录RES管理控制台,在左侧导航栏中选择“推荐业务>智能场景”,默认进入“智能场景”列表。 在智能场景列表中,单击“运行中”状态的目标场景名称,进入详情页。 单击“效果评估”页签
用于存放全局特征文件,例如放入名为“global_feature_info.json”的文件。 │ obs-general-data 用于存放经过特征工程处理的宽表,又名通用格式数据。 │ obs-pretrain-data 用于存放排序预处理任务生成的预训练数据。 │ obs-error-data
管理属性配置 属性配置以键值对的方式进行存储,配置后的配置项可以用于整个服务。该配置项的值为用户指定的OBS路径,OBS相关操作请参见创建OBS桶。 前提条件 已开通OBS服务,并按照推荐系统OBS文件夹规范建议格式创建文件夹。 已上传离线数据。 创建场景 您可以根据自己的业务创建场景进行配
在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理
综合行为热度推荐 BehaviorsWeight 基于物品的协同过滤推荐 ItemCF 基于用户的协同过滤推荐 UserCF 基于交替最小二乘的矩阵分解推荐 AlsCF 基于历史行为记忆生成候选集 HistoryBehaviorMemory 人工录入生成候选集 ManualInput sorting
在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理
输出流DIS通道名称。该通道用于存放由行为数据和画像库计算生成的排序预处理数据,以供模型训练。通道中的数据属于流式训练作业产生的中间数据,使用者只需指定通道名称,无需往该通道发送或获取数据。 starting_offsets 是 String 读取DIS数据的起始位置,LATEST表示从最新的数据开始读取。 表10
在“test-data”文件夹下,将behavior.txt中的每条数据的actionTime字段的值修改到当前时间附近。将item.txt中的每条数据的publishTime字段的值修改到当前时间附近,将item.txt中的每条数据的expireTime字段的值修改成大于当前时间的值,避免数据因为过期被过滤掉。
RES+媒资应用场景 场景描述 媒资推荐场景中,通常对实时性要求比较高,用户产生的行为需要得到即时的反馈,同时结合用户的长期兴趣和短期兴趣进行个性化推荐。 RES提供一站式媒资推荐解决方案,支持针对行为数据实时生成用户的兴趣标签,提供离线、近线、在线三层计算,完成千人千面的个性化媒资推荐。
特征名称:值为时间戳(10位)的特征的名称,任务会根据此特征对候选集进行排序。 推荐天数:推荐数据的时间段,该时间段从当前开始往前推N天,默认15天。 默认热度排序。 候选集最大长度 生成候选集的最大长度,每次计算更新的候选集中的个数不会超过最大值。 默认50。 候选集的召回策略 召回候选集的策略。
数据为前一段时间中的数据,测试数据为后一段时间的数据,取值TIME。 “个数比例”:个数比例是将全部数据按个数比例随机划分成训练集和测试集传入值。取值RAMDOM。 训练数据占比 生成的结果中,训练集占整个训练集和测试集的比例,默认0.7。 测试数据占比 生成的结果中,训练集占整个训练集和测试集的比例,默认0
在作业列表中,刚创建的离线作业“状态”为“计算中”,当离线作业的“状态”变为“计算成功”时,表示作业运行结束,检测完的数据将使用于离线作业。当离线作业的“状态”变为“计算失败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。 父主题: 离线作业