检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 创建离线数据源 上传实时数据(可选) RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理
learning_rate 否 Double 学习率。 initial_accumulator_value 否 Double 初始梯度累加和。 最小值:0 最大值:1 lambda1 否 Double L1正则项系数。 最小值:0 最大值:1 lambda2 否 Double L2正则项系数。
相关文档 1 推荐系统2.0全新上线 推荐系统支持用户自定义场景和智能场景。智能场景根据场景类型预置好对应的智能算法,为匹配的场景提供智能推荐服务。自定义场景面向了解推荐算法等相关的用户,可自定义推荐中涉及算法的使用和组合,能够自定义开发推荐流程,提供推荐服务。 商用 智能场景
本章节介绍热度推荐场景的搭建样例,该场景常见于电商或者视频网站首页的排行榜或者畅销榜等。 上述推荐场景在RES的自定义场景通过简单配置和计算,即可完成典型的热度推荐功能,通过RES内置综合行为热度排序算法,使用户能够快速够获取到时下最流行的信息。 开始使用样例前,请仔细阅读准备工作罗列的要求,提前完成准备工作。
已经获取访问密钥(AK/SK)。 通过OBS管理上传数据 本文档中,采用管理控制台上传数据至OBS。 执行如下操作,将数据导入到您的数据集中,以便用于模型训练和构建。 登录OBS管理控制台,在RES同一区域内创建桶。如果已存在可用的桶,需确保OBS桶与RES在同一区域。 将本地数据上传至OBS桶中。如果您的数据较多,推荐OBS
测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略 召回策略用于生成推荐的候选集,在原始数据中通过算法和规则匹配用户的候选集。 召回策略 排序策略 排序策略根据不同的算法模型对召回
全局配置简介 全局配置界面包括密钥认证、属性配置和计算资源三部分,如图1所示。 图1 全局配置界面 全局配置功能说明 表1 功能说明 功能 说明 详细指导 密钥认证 在使用RES之前,需要获取添加访问密钥,用于授权使用OBS、DLI、Cloudtable、ModelArts等服务
由账号在IAM中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域(Region) 从地理位置和网络时延维度划分,同一个Region内共享弹性计算、块存储、
数如下: 表头,有或无,根据用户数据格式选取。 分隔符,选择逗号(,)、竖线(|)、制表符(\t)和自定义。 引用字符,单引号(')、双引号(")和自定义。 转义字符,反斜杠(\)和自定义。 在对应表的“操作”列中,单击“清除数据”可以删除对应表的数据源。 通用格式 通用数据由特
在“创建过滤规则”页面,填写特征工程“名称”、“场景”和“描述”。 特征工程名称:请以“Filter-”开始,只能由字母、数字、中划线和下划线组成,并且长度小于64个字符。 “场景”信息可选择您在全局配置页面创建的场景。 根据表1设置计算引擎和存储平台相关参数,并根据业务需要在“增加历史行为过滤”,如图2所示。
如购买,收藏,内容评论或分享),并对这些喜好进行度量和打分。根据不同用户对相同物品的态度和偏好程度计算用户之间的关系。在有相同喜好的用户间进行物品推荐。 例如,A、B两个用户都购买了abc三本图书,并且给出了5星的好评。则A和B属于同一类用户。可以将A看过的图书d也推荐给用户B。
、数据修改等操作,为智能场景推荐和自定义场景推荐做好数据准备。 数据类型 当前RES支持创建数据源和导入近线数据。创建数据源的数据格式和近线数据导入的格式要求一致,包括用户数据、物品数据和行为数据。 用户数据 用户数据包括数据源中的“用户属性表”和用于近线计算的“用户画像”数据。
智能场景(猜你喜欢) RES提供了智能场景包括猜你喜欢、热门推荐和关联推荐。仅需要简单的配置和作业训练,即可获取推荐结果。 本章节以猜你喜欢为例,帮助您快速熟悉智能场景的使用过程。开始使用样例前,请仔细阅读准备工作罗列的要求,提前完成准备工作。使用智能场景获取推荐结果的步骤如下所示:
String 流程名称,由汉字、数字、字母、下划线、中划线、空格组成,最大长度60字符。 rules 是 List 每个Flow配置不同流量和候选集的规则,请参见表4。 config 是 Object 流程配置信息,请参见表5。 rank_uuid 否 String 排序策略生成的uuid。
请参见表7,行为权重。 start_time 与retain_day二选一 long 用户行为起始时间。和end_time共存。 end_time 与retain_day二选一 long 用户行为结束时间。和start_time共存。 retain_day 与start_time二选一 Integer
“TIME” 训练数据时间:训练数据起始时间和终止时间,该起始时间和终止时间不得超过行为数据的时间范围。 测试数据时间:测试数据起始时间和终止时间,该起始时间和终止时间不得超过行为数据的时间范围。 “RATE” 训练数据占比:生成的结果中,训练集占整个训练集和测试集的比例,默认0.7。 测试
由itemid组成的List。在线黑名单列表,列表中的物品将不会在返回的推荐候选集中。 online_tags 否 List 由属性、属性值和属性权重组成的数据格式的列表,其中属性值或属性权重可以不提供,权重信息不提供的场景下采用默认值0.01。需要在部署服务时与在线召回配合使用。格式如下:[{"name":
每个Flow配置不同流量和候选集的规则,请参见表4。 backup_uuid 否 String 人工导入召回策略生成的uuid。 need_preferences 否 Boolean 是否开启优选项功能,需匹配global_features_info_path,profile_uuid和attr
够达到更高的精度,但也更容易出现过拟合。FFM算法参数请参见域感知因子分解机。 深度网络因子分解机,结合了因子分解机和深度神经网络对于特征表达的学习,同时学习高阶和低阶特征组合,从而达到准确地特征组合学习,进行精准推荐。DEEPFM算法参数请参见深度网络因子分解机。 核函数特征交
learning_rate 否 Double 学习率。 initial_accumulator_value 否 Double 初始梯度累加和。 最小值:0 最大值:1 lambda1 否 Double L1正则项系数。 最小值:0 最大值:1 lambda2 否 Double L2正则项系数。