检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
涉及到的用户数据和物品数据整合成一条数据。 画像:画像分为用户画像和物品画像,分别用于存储用户输入的用户特征和物品特征。如果同一用户或物品有多条记录,将会按照用户ID或者物品ID去重。 前提条件 已按照创建离线数据源操作指导完成数据源的创建。 已完成数据结构识别和人工复核确认。 操作步骤
聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 父主题: 数据源
“时间间隔”:如果选择的调度类型为间隔调度,需要配置调度的时间间隔。 基于UCB的召回策略 基于UCB的召回策略综合考虑了用户操作行为表中,物品发生的某几种行为类型及次数,然后给每一个物品都计算一个得分,最终返回得分最高的若干个物品。 表8 基于UCB的召回策略参数说明 参数名称 说明 名称
实时日志 RES根据实时发送到DIS上的日志,进行数据计算和处理,更新用户的相关数据。用户发送到DIS上的数据具体如下: 实时行为日志 实时行为日志的作用包括: 更新用户的兴趣标签。 记录所选行为类型的历史记录。 更新用户的上下文信息。 召回候选集。 表1 实时行为日志字段描述 字段名
聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。 操作步骤 在“执行步骤”页签,单击数据探索下的“执
创建资源 用户在使用RES时需要先创建并绑定计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关资源。 背景信息 使用RES需要消耗其他服务资源,需要收费。根据您选择的资源不同,收费标准不同,针对不同类型资源的价格,详情请参见产品价格详情。 已开通计算引擎DLI、
查询ModelArts服务AK/SK 功能介绍 该接口用于查询用户在ModelArts服务的AK/SK。 URI GET/v1/{project_id}/modelArts/aksk 参数说明请参见表1-URI参数说明。 表1 URI参数说明 名称 是否必选 类型 说明 project_id
基本概念 推荐系统 推荐系统,是全力提供媒资、短视频、电商等行业的推荐系统解决方案,帮助互联网企业降低构建推荐应用的技术门槛,提升点击率、留存率和用户体验。 智能场景 针对对应的场景,由RES根据场景类型预置好对应的智能算法,为匹配的场景提供智能推荐服务。 自定义场景 面向了解推
征工程将对应的数据写入到画像中,同时用于排序训练和线上推理服务中使用。 文件数据信息请参见全局特征信息文件数据格式。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 数据源 数据在OBS的存放路径。 “初始格式”:包
"在 贵州 黔东南苗族侗族自治州 台江县 革一 镇 乡下 , 有 一座 两层 的 小木屋 , 和 这里 的 大部分 木质 吊脚楼 一样 , 小木屋 依山 而 建 。 但 这 座 木屋 又 很 “ 特别 ” , 它 有 一个 “ 山东 哥哥 助学 工作站 ” 的 名字 。 这 座 木屋
基本格式:k1\003v1\002k2\003v2\k3\003v1\004v2\004v3\002k4\003\k1:v1\004k2:v2\004k3:v3 例子:比如用户有四个标签,分别是年龄、性别、爱好、画像,取值分别为18、1、[read,gym,music]、{morality:0.8,iq:0.7,art:0
物品的权重,权重越高,被优先推荐的概率越高,取值范围:1-100。如不设置,默认值为1。 否 publishTime Long 发布时间,采用UTC标准时间,单位以秒计。对物品有实时性要求的则必填。 否 expireTime Long 失效时间,采用UTC标准时间,单位以秒计。当前服务器的时间大于该时间时,此物品将不会被推荐。如不设置,代表永不失效。
导入近线数据源 通过导入近线数据源,达到实时计算并更新用户画像、物品画像,实时更新增量数据的目的。 前提条件 按数据规范准备数据并上传至通道。具体上传方法请参见上传实时数据。 导入近线数据源 登录RES管理控制台,在左侧菜单栏中选择“数据源”,进入“数据源”列表页面。 在数据源列
用户在使用特征工程之前,需要提供一份全局的特征信息文件,后续的特征工程、在线模块都会用到该文件。 文件数据信息请参见全局特征信息文件。 当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 保留已有宽表 对结果保存路径中已有宽表数据的保留方式:
场景ID。 表3 data_param参数说明 参数名称 是否必选 参数类型 说明 header 是 String 是否显示表头。 true:有表头 false:无表头 delimiter 是 String 分隔符,最大长度10字符。 quote 是 String 引用字符,最大长度10字符。
设置的策略返回用户的预测结果。如果物品项有多个,需要用英文逗号隔开。 图1 代码预测 表单:输入“ID”和设置“最大推荐个数”,也可以设置“物品项”。其中ID可以为用户ID或者物品ID,单击“预测”后显示预测结果,如图2所示。如果物品项有多个,需要用英文逗号隔开。 图2 表单预测
表1 创建效果评估参数说明 参数名称 说明 计算引擎 计算引擎信息,选择指定服务名、集群名称、任务配置地址、资源名等信息。 数据源 数据源类型有初始格式和通用格式可以选择。 “初始格式” 用户操作行为表:初始数据中的用户操作行为表。 “通用格式” 通用格式数据:特征工程“初始用户画像
品。 其中排除行为过滤是指将有此行为类型的物品排除掉,不对其进行过滤。 例如对于用户过去3天内有过曝光行为的物品过滤,但是可以对曝光过但是有购买行为的物品进行排除,不对其进行过滤。 开启调度 开启调度,按照指定的调度策略定期执行作业。 “调度周期”:调度周期可选“天”或“周”。 “调度类型”:包括自定义和间隔调度。
通用格式数据源结束时间。例如,“2018-02-01”。 表7 data_param参数说明 参数名称 是否必选 参数类型 说明 header 是 String 是否显示表头,有表头"true"或无表头"false"。 delimiter 是 String 分隔符,最大长度10字符。 quote 是 String 引用字符,最大长度10字符。
的产品。如果物品项有多个,需要用英文逗号隔开。 图1 代码预测 表单:输入“ID”,并设置“最大推荐个数”。其中ID可以为用户ID或者物品ID,单击“预测”后显示预测结果,如图2所示。如果是关联推荐,则需要配置“物品项”,即推荐与物品项相关的产品。如果物品项有多个,需要用英文逗号隔开。