检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
更新索引结构 功能介绍 当用户想要新增或者删除用户、物品特征的时候,该功能可以用于更新CloudTable表的索引结构。 URI POST /v1/{project_id}/update-htable 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id
用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 通用格式时间:用户行为数据时间范围,可只有起始时间、结束时间或为空。 策略参数设置完成后,单击“确定”。 您可以前往过滤规则列表,查看作业的基本情况。在作业列表中,刚创建的作
去重的时间周期,可选天、周、月。默认为“天”。 周一是第一天:行为数据按周去重,是否周一是第一天。 如果选择否, 则认为周日是第一天,保留每个时间区间内的一条最新数据。 训练集测试集划分方式 数据划分方式按时间比例或个数比例划分训练集测试集。 “时间比例”:将全部数据的时间跨度按
灵活配置物品状态和过期时间,保障有效性和实效性 配置物品status状态,完成物品的上下架 配置过期时间实现新闻的过期下架
数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。
expireTime Long 失效时间,采用UTC标准时间,单位以秒计。当前服务器的时间大于该时间时,此物品将不会被推荐。如不设置,代表永不失效。 否 同时,expireTime字段和status字段一样,都可以通过实时数据推送方式,进行字段的更新。该字段为非必选,如不传入,则不会进行失效处理。
数据探索介绍 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于增量数据会实时入库,因此可以通过定时执行数据探索任务来覆盖增量数据。
符。 描述 策略的具体描述。 频次 “相对时间间隔”:指定历史行为时间段,选取数据中每个用户最靠后的行为数据的时间往前N天的行为数据计算用户偏好。建议至少设置30天。 “绝对时间间隔”:指定历史行为时间段,选取数据中每个用户距离现在时间往前N天的行为数据计算用户偏好。建议至少设置30天。
训练集测试集划分方式 按时间或者比例来划分训练集测试集。 “TIME” 训练数据时间:训练数据起始时间和终止时间,该起始时间和终止时间不得超过行为数据的时间范围。 测试数据时间:测试数据起始时间和终止时间,该起始时间和终止时间不得超过行为数据的时间范围。 “RATE” 训练数据
编辑或删除工作空间 工作空间页面主要列举了当前已创建的工作空间项目信息,包括工作空间“名称”、“状态”、“绑定的企业项目”、“创建人”、“创建时间”、“更新时间”和“操作”。 前提条件 已存在创建成功的工作空间。 编辑工作空间 您可以对创建的工作空间进行修改操作,具体操作如下: 登录RES管
的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 数据时间范围 被统计数据的起始时间和终止时间。 统计间隔(天) 统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。
与retain_day二选一 long 用户行为起始时间,与end_time共存。 end_time 与retain_day二选一 long 用户行为结束时间,与start_time共存。 retain_day 与start_time二选一 Integer 用户行为时间跨度,整数 [1,10000]。
TE_SET,则此字段必填。 time_name 否 String 物品数据中代表时间特征的字段名。若rank_type值为TIME,则此字段必填。 rec_day 否 Int 数据的时间段,该时间段从当前开始往前推N天。 若rank_type值为TIME,则此字段必填。 glo
提交数据质量作业 策略参数说明 停止算子作业 查询作业列表 查询作业详情 重新执行作业 删除作业 提交效果评估任务 查询效果指标 编辑修改作业 更新索引结构 父主题: API(V1不推荐)
数据的用户画像更新生成,热度越大排序越靠前。 时间排序:根据时间对候选集进行排序。时间排序需要指定特征名称和推荐天数。 特征名称:值为时间戳(10位)的特征的名称,任务会根据此特征对候选集进行排序。 推荐天数:推荐数据的时间段,该时间段从当前开始往前推N天,默认15天。 默认热度排序。
通用格式数据:从用户属性表、物品属性表和用户操作行为表中提取用户、物品特征和用户行为,并生成JSON数据,即内部通用格式。 通用格式时间:用户行为数据时间范围,可只有起始时间、结束时间或为空。 完成该项配置后,单击“下一步”。 召回策略 您可以根据业务需要,选择合适的召回策略。召回策略用于配置离线
String 按时间或比例划分训练集测试集。 可选值为TIME或RATE。 训练数据起始时间 (training_data_start_time) 否 Long 训练数据起始时间。 divide_by_time_or_rate为TIME时必填。取值不大于行为数据中的最大时间且不大于tr
algorithm_setting参数说明 参数名称 是否必选 参数类型 说明 start_time 否 Long 训练数据开始时间,以毫秒为单位的时间戳。 end_time 否 Long 训练数据结束时间,以毫秒为单位的时间戳。 strategy 是 List 请参见表11,策略集合。 表11 strategy参数说明
物品的权重,权重越高,被优先推荐的概率越高,取值范围:1-100。如不设置,默认值为1。 否 publishTime Long 发布时间,采用UTC标准时间,单位以秒计。对物品有实时性要求的则必填。 否 expireTime Long 失效时间,采用UTC标准时间,单位以秒计。当前服务器的时间大于该时间时,此物品将不会被推荐。如不设置,代表永不失效。
tus字段,实现秒级状态字段更新,来控制物品的上下架状态。具体操作指导可参考上传实时数据进行配置和对接。 父主题: 灵活配置物品状态和过期时间,保障有效性和实效性