检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需要存放在OBS桶中的数据包括: 离线数据源:包含用户类数据,物品类数据,行为数据以及推荐候选列表。 黑名单和白名单:黑名单和白名单的过滤配置,便于用户快速得到有效数据。黑白名单数据都以物品ID的形式在OBS上存储。 操作步骤 登录OBS管理控制台,创建OBS桶。
推荐系统(Recommender System,简称RES)基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。 父主题: 基础问题
基于用户数据更新用户画像 基于用户数据更新候选集可以持续更新用户画像,更新频率可达秒级。以DIS中的实时用户数据为数据源,实时捕捉用户数据近线,持续更新或添加用户画像数据,使用户画像处于最新状态。
父主题: 提交数据质量作业
单份画像数据中最多支持的特征数量 30 单场景在线服务最多支持每秒请求的次数(TPS) 200 数据源个数 5 场景个数 10 单场景下推荐预测返回的结果集个数 20 如果当前资源配额限制无法满足使用需要,您可以申请扩大配额。配额查看及修改请参见关于配额。
RES优势 开放式推荐 提供完整的推荐平台和原子推荐算法,不绑定客户的运营场景,客户可以在华为云上根据自己对推荐算法和运营规则的理解,自定义专属的推荐流程。当前只有华为云提供开放式推荐能力,其他友商主打场景式推荐。
本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 用户已经创建自定义场景或新建自定义场景过程中。 创建数据源 参考数据源管理进行创建。
排序策略 过滤规则 过滤规则用于生成推荐的过滤集,包含黑白名单、历史行为过滤等特性。支持用户在线上推理过程中完成对相关物品的过滤。 过滤规则 效果评估 根据用户行为的数据回流,提供多维度的效果统计。 效果评估 父主题: 离线作业
删除离线作业 删除离线作业即清理离线作业产生的数据,数据清理完成后删除元数据。操作必须确保流程中没有使用该作业产生的UUID,可以参考以下操作完成。 删除离线作业 您可以对“计算成功”、“计算失败”等状态的作业进行删除,“启动中”、“计算中”状态的作业不支持删除操作。
涉及计费功能包含:数据源、自定义场景、智能场景中的离线计算和模型训练。 存储资源:用于推荐系统数据存储规格。涉及计费功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。
已在OBS服务中创建桶和文件夹,用于存放样例数据。确保您使用的OBS目录与RES在同一区域。 步骤1:准备数据 RES在公共OBS桶中提供了猜你喜欢的示例数据集,命名为“test-data”,因此,本文的操作示例使用此数据集进行构建。
在使用推荐系统之前,您需要开通数据湖探索(Data Lake Insight,简称DLI)来创建集群。 DLI服务 登录华为云。在华为云“产品”页签,选择“大数据>数据湖探索DLI”,进入DLI产品页。单击“进入控制台”,授权开始使用DLI。 ModelArts服务 登录华为云。
开启时间跨度 不开启取全部数据,开启则指定从数据源中取最近天数或小时数的行为数据计算相似度。 时间单位 开启时间跨度后,支持按照天或者小时为单位从指定从数据源中取行为数据计算相似度。 时间跨度 用于指定从数据源中取最近多少天或者多少小时的行为数据计算热度。默认取全部数据。
黑名单中的物品不能出现在最终推荐结果集里面。 白名单地址,白名单所在的路径。白名单之外的物品不应该出现在最终推荐结果集里。 历史行为过滤,指定与用户个性化的物品候选集过滤准则。例如对于用户过去3天内有过view行为的物品(如新闻)过滤,使之不进入候选集。 过滤ID。
已开通计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关服务。 创建资源 登录RES管理控制台,在左侧菜单栏中选择“资源中心”下的目标服务,单击页面上方“ 去创建”,跳转到对应服务管理控制台。
基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。 您可以使用本文档提供推荐系统服务API的描述、语法、参数说明及样例等内容,进行相关操作,例如推荐系统的具体接口使用说明。
每个数据源默认规格最低是一百万条,如果一个数据源中的用户和物品总条目数不超过100W条,则按照100W条计费,如果超过一百万条,每一百万条为一个计算周期。 计算资源 应用于召回、排序等作业运行时CPU/GPU计算,包含RES的数据源、推荐场景的离线作业计算计费。
存储在OBS中的数据不会被删除。 父主题: 在线服务
从“节点库”中选择“数据集成”下的“RestClient”节点,拖拽节点如图1所示。“RestClient”节点参数配置说明请参见 “数据治理中心 DataArts Studio>用户指南>数据开发>节点> Rest Client”。
召回策略用于配置离线计算逻辑,通过启动离线计算任务进行候选推荐结果集的生成。