检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
说明 fields_feature_size_path 是 String 该文件标识了每一个域下的特征数量,排序数据处理接口会生成这个文件,文件路径为用户在排序数据预处理中输入的结果保存路径参数表示的路径的“fields_feature_size”目录下,文件名称为“part-00000”,需要用户提供文件完整路径。
在使用推荐系统之前,数据接入服务(Data Ingestion Service,简称DIS)采集用户实时日志,在计算引擎中消费实时日志并做近线处理。 登录华为云。在华为云“产品”页签,选择“大数据>数据接入服务DIS”,进入DIS产品页。单击“进入控制台”,开始使用DIS。 父主题:
数据以及推荐候选列表的离线数据源用于推荐系统的离线计算。 离线数据源 准备实时日志数据 RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。 实时日志 运行推荐策略 创建离线作业 创建离线作业包括进行数据质量检测、创建组合作业、特征工程、召回策略、排序策略、过滤规则等作业。
上传实时数据 RES通过DIS SDK上传实时数据,用户实时日数据并做近线处理。当前仅支持Java语言的SDK,示例请参见《数据接入服务SDK参考》。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。
作业运行结束,检测完的数据将使用于离线作业。当离线作业的“状态”变为“计算失败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。 父主题: 离线作业
在使用RES之前,首先您需要创建一个数据源,后续的操作都是基于您创建的数据源进行的。 上传实时数据 RES通过SDK上传实时数据,进行数据计算和处理,更新用户的相关数据。 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 修改或删除数据源 对
文本标签服务为用户提供自然语言处理工具,可用于关键词提取和命名实体识别。 排序 排序服务允许用户提供自己的候选集,使用RES的排序策略进行排序。 前提条件 已经有计算成功的离线作业并且已经生成候选集UUID。 您可以部署10个在线服务,每个在线服务可以创建2个在线流程 ,如需增加配额请您提工单处理。 由于在线运行需消耗资源,确保账户未欠费。
点击率预估默认关闭。打开按钮之后,在“排序”下拉选项中选择计算成功的排序策略名称。 综合排序 综合排序即根据客体和主体的相关属性进行重排序处理。 属性匹配,单击添加匹配特征对,如用户特征名为city,物品特征名选择tags,权重值设置为1,其意思为根据选定的主体和客体相关属性对的匹配情况累计权重值。
001。 初始梯度累加和:梯度累加和用来调整学习步长。默认0.1。 ftrl:Follow The Regularized Leader 适用于处理超大规模数据的,含大量稀疏特征的在线学习的常见优化算法。 学习率:优化算法的参数,决定优化器在最优方向上前进步长的参数。默认0.1。 初始
推荐。 场景式推荐 提供多维度的场景推荐,含猜你喜欢、关联推荐、热门推荐,一键式操作,降低客户接入门槛。 近线处理能力 支持实时数据的接入和更新、模型在线学习,近线处理实时训练兴趣模型。 全面的推荐实体 支持以用户推荐物品、以用户推荐用户、以物品推荐物品、以物品推荐用户四种全面的
behavior_type 否 List<String> 行为类型选取。 interval 是 Integer 近线策略流处理的窗口时间,单位为秒,10代表每隔10s进行一次。包括数据读取和处理的流计算。 表13 algorithm_config 参数说明 参数名称 是否必选 参数类型 说明 update_context
调用服务。 图3 获取预测接口 调用接口 Mozilla、Google都为REST提供了图形化的浏览器插件,发送处理请求消息。 此处以Postman为例,指导您如何通过调用预测接口获取推荐结果。更多接口信息请参见《推荐系统API参考》。 下载Postman软件并安装,您也可以直
作者,一个作者一个元素,信息流推荐场景建议填写。 否 content String 物品的内容描述信息,例如简介/摘要/正文关键片段,最长支持5000个中英文字符,超过则截断处理。 否 tags List[String] 描述物品的标签,每个标签为独立的一个元素。 否 location Json 物品的地理位置信息,精度维度格式:{"lat":
计费相关 如何查看RES正在收费的作业? 如何查看RES消费详情? 数据源如何收费? 智能场景和自定义场景如何收费?
体质和年龄等属性吻合,所以考虑基于用户性别、体质和年龄等属性用标签索引得到的满足条件物品列表item1, 对离线生成的items2进行如下处理:先从items2中取在item1中出现的物品,如果个数不够,再从item2中取其余的物品填补。 global_features_info_path
、过滤、排序算子自由组合,训练形式上支持离线批处理、近线流处理、在线实时处理的三种数据处理方式,提供完备的一站式推荐平台,可快速设置运营规则进行AB测试。 功能优势: 全开放推荐流程,用户根据业务自定义推荐流程。 特征工程,特征处理多样化,支持自定义特征散列等。 丰富的推荐策略,提供丰富的召回、过滤、排序算子。
调用服务。 图3 获取预测接口 调用接口 Mozilla、Google都为REST提供了图形化的浏览器插件,发送处理请求消息。 此处以Postman为例,指导您如何通过调用预测接口获取推荐结果。更多接口信息请参见《推荐系统API参考》。 下载Postman软件并安装,您也可以直
行为类型:用户感兴趣的行为类型。 权重值:行为的初始权重。 衰减系数:用于衰减行为初始权重的系数。 有效时间:用户配置的行为发生时间与当前时间的间隔,以小时为单位。系统只处理在该时间范围内的行为记录。 基于用户相似度的实时召回 基于用户相似度的实时召回策略是根据用户间的相似度信息,找到相似用户短时间内行为数据(
推荐引擎和排序引擎有什么区别? RES支持哪些自定义策略? 重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 在线服务获得推荐的调用次数如何计算? 自定义场景关闭后,为什么会自动启动?
表名 存储的表格名称。 您可以单击设置数据版本。RES的数据版本有两种,“V1”版本即数据按照原有格式存储,未做过分区处理。“V2”版本则会依照用户的分区设置做分区处理,当分区合理时,数据将均匀分布在各个节点,有效利用Cloudtable的高并发特性,提升读写效率。其中“预分区数量”