检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据
什么是推荐系统 推荐系统(Recommender System,简称RES) ,基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。 RES优势 开放式推荐 提供完整的推荐平台和原子推荐算法,不绑定客
和宽表数据。 执行完成在页面下方会生成数据相关报告。 “数据导入报告”,显示数据“类型”、“总条目数”、“合法条目数”、“非法条目数”、“重复度”和“合法率”信息。 类型包括生成的用户、物品、行为数据。您可以通过单击左侧的查看具体报告信息。 “名称”项显示具体参数的名称。 “条目数”显示各种类型数据的具体数量。
数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下:
多维度管理,支持运营规则设置,一站式推荐平台。 自动挖掘特征,采用AUTOML完成特征的自动挖掘和组合,提高特征选择效率。 高适用性,多种模板选择,适用多个应用场景。 使用便捷,一键式构建推荐系统,提供标准API接口,调用简单,便于被集成。 实时更新,具备实时更新能力,更快反馈用户的精准需求。
ION,请参见表7。 data_source 是 List 算法数据源配置 DATA_QUALITY_INSPECTION,数据源选择通用模板数据,请参见表5。 offline_platform 是 JSON 请参见表3,离线计算平台信息。 表3 offline_platform参数说明
可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可以在选择策略模板后,根据具体需求编辑策略内容;也可以直接在编辑框内编写JSON格式的策略内容。 具体创建步骤请参见:创建自定义策略。本章为您介绍常用的RES自定义策略样例。
召回策略 召回是指对大量的物品做初选,为每一个用户形成个性化侯选集。召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。召回策略中内置了多种召回方式,您可根据自己场景选择。 基于综合行为热度推荐 基于综合行为热度推荐统计用户对物品所有行为的加权热度。如果选择用户分群,将
请参见表9。 data_source 是 List 算法数据源配置 INITIAL_PROFILES_GENERATION,数据源选择通用模板数据, BUILD_RANK_UNIFORM_DATA_FROM_JSON,数据源选择通用格式。 storage 是 JSON 请参见表6,存储平台。
RES的离线数据源包括什么? 如何上传数据至OBS 如何上传实时数据? 离线数据和近线实时数据如何配合使用? 数据探索是什么?近线实时数据如何在数据探索中的报告体现? 如何确定近线数据源导入实时数据成功? 实时数据能否立即应用到推荐场景?
附录 错误码 状态码 获取项目ID 获取账号ID
在“执行步骤”页签,单击数据探索下的“执行”。进入“数据探索”页面,确认页面信息后单击“是”。待状态为“已完成”时,完成数据格式的转化。 执行完成在页面下方会显示数据探索报告,包括“用户报表”、“物品报表”、“行为报表”和“画像查询”。 单击目标报表名称查看具体报表信息。 图1 查看报表 用户报表:根据不同数据
索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建智能场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务>智能场景”,默认进入“智能场景”列表。 在智能场景列表中,单击右上角“创建”,进入“创建智能场景”页面。 在创建智能场景页面的“模板选择”页签,单击“
API概览 类型 API 说明 工作空间 查询企业项目列表 查询用户在当前项目id下的企业项目列表。 创建工作空间 用于在推荐系统下面创建独立的工作空间,用于资源的隔离 查询工作空间列表 用于查询当前用户具有操作权限的工作空间列表。 查询工作空间详情 查询指定工作空间的具体信息。
推荐业务>智能场景”,默认进入“智能场景”列表。 在智能场景列表中,单击右上角“创建”,进入“创建智能场景”页面。 在创建智能场景页面的“模板选择”页签,单击“猜你喜欢”、“关联推荐”或“热门推荐”进行参数配置。填写“基本信息”,选择“场景规格”,配置“个性化配置”相关参数,详情请参见表1。
检测结果生成时间(请求类型为DATA_INSPECTION时返回)。 final_report FinalReport object 数据探索报告(请求类型为DATA_EXPLORATION时返回)。 表5 error_count 参数 参数类型 描述 empty Boolean 为空。
请参见表6,离线数据源。 表6 offline参数说明 参数名称 是否必选 参数类型 说明 table_type_id 是 String 推荐通用数据模板 用户属性表USER_META 物品属性表ITEM_META 用户操作行为表USER_BEHAVIOR 通用格式GENERAL_FORMAT
离线数据源创建完成后,在数据源列表页面单击目标数据源名称进行数据质量管理,具体操作请参见推荐系统用户指南>数据源质量管理,完成数据探索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建自定义场景 在RES管理控制台,在左侧导航栏中选择“推荐业务 > 自定义场景”,然后单击“创建”进行场景的配置。
最新动态 本文介绍了推荐系统RES各特性版本的功能发布和对应的文档动态,新特性将在各个区域(Region)陆续发布,欢迎体验。 2020年9月 序号 功能名称 功能描述 阶段 相关文档 1 支持自定义行为类型 离线数据的行为类型支持自定义行为类型。 商用 准备离线数据源 数据结构