检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。 特征工程 召回策略 召回策略用于生成推荐的候选集,在原始数据中通过算法和规则匹配用户的候选集。 召回策略 排序策略 排序策略根据不同的算法模型对召回策略或者近线策略生成的候选集进行重排序,得到推荐候选集列表。 排序策略
阈值:阈值是用来衡量用户行为有效性的标准, 当数据源的actionMeasure的值大于阈值时, 当前用户行为有效。 去重:您可以单击勾选,根据用户对行为记录去重。 指标设置 指标名称:请您定义评估的指标名称。 指标公式:用户指定自定义指标公式,如:A/(A+B),参数A、B代表自定义参数的参数别名。只支持+、-、*、/。
终端节点 终端节点即调用API的请求地址,不同服务不同区域的终端节点不同,您可以从地区和终端节点中查询所有服务的终端节点。 推荐系统的终端节点如表1所示,请您根据业务需要选择对应区域的终端节点。 表1 推荐系统的终端节点 区域名称 区域 终端节点(Endpoint) 华北-北京四
Int 多值枚举型特征的特征值保留个数,如果实际的值数目大于该值, 则多余的值会被删除;如果实际的值数目小于该值, 则保留所有值;如果用户未提供该参数,则会统计出 数据中该多值特征的最大取值数目作为输入。取值范围[1, 100]。 表16 KV数值型特征处理参数列表 参数名称 是否必选
在线服务获得推荐的调用次数如何计算? RES从全局角度计算在线服务获得推荐的调用次数,不区分每次调用的用户。例如A用户调用请求推荐接口是每秒5次,B用户调用请求推荐接口每秒5次,当A用户和B用户同时调用此接口时,总的获得推荐的调用请求为A用户和B用户之和,即5+5=10。 父主题:
上下文信息,可用于配置在线过滤黑名单列表,列表中的条目将会被排除在最终返回的候选集之外。 filter_items 否 List 由itemid组成的List。在线黑名单列表,列表中的物品将不会在返回的推荐候选集中。 online_tags 否 List 由属性、属性值和属性权重组成的数据格式的列表,其中属性
修改自定义场景 对于已创建的自定义场景,您可以修改相关参数配置以匹配业务变化。 前提条件 已存在创建完成的自定义场景。 修改基本信息 登录RES管理控制台,在左侧菜单栏中选择“推荐业务 > 自定义场景”,进入“自定义场景”列表页面。 在自定义场景列表中,单击目标场景名称进入“自定义场景详情”页。
在“执行步骤”页签,单击数据探索下的“执行”。进入“数据探索”页面,确认页面信息后单击“是”。待状态为“已完成”时,完成数据格式的转化。 执行完成在页面下方会显示数据探索报告,包括“用户报表”、“物品报表”、“行为报表”和“画像查询”。 单击目标报表名称查看具体报表信息。 图1 查看报表 用户报表:根据不
Basic Error 工作空间列表为空 请确认工作空间列表是否为空。 400 RES.3409 Basic Error 重复的key值 请检查key值是否重复。 400 RES.3410 Basic Error 不支持的key值({0}) 请检查的key值是否负荷文档要求。 400
数据探索是什么?近线实时数据如何在数据探索中的报告体现? 数据探索是针对当前数据源的数据进行挖掘和分析,主要聚焦在特征的分布范围、统计以及特征齐全度等,使用户能够更了解数据,进而指导在特征工程以及相关算法的配置。 数据探索是一个离线分析任务,任务有对应的启动时间,由于近线实时数据会实时入库
“非法条目数”、“重复度”和“合法率”信息。 类型包括生成的用户、物品、行为数据。您可以通过单击左侧的查看具体报告信息。 “名称”项显示具体参数的名称。 “条目数”显示各种类型数据的具体数量。 图1 查看报告 如果导入错误,会生成“数据导入错误报告”,显示数据“类型”、“数量”和“原因”,方便您定位问题原因。
当您确认导入近线数据源之后,可以查看近线数据源详情或者对数据终止导入。 在数据源详情页面,您可以单击目标近线数据右侧的“详情”,查看该实时数据的名称和通道ID,此ID为全局唯一。 当不需要该数据时,您单击可以单击目标近线数据右侧的“终止”,对“执行”状态的数据终止导入。 当终止导入后,该数据无法正常使用,请您谨慎操作。
配置物品status状态,完成物品的上下架 在推荐系统中,有一种常见的场景,最终推荐列表是否展示无库存或者已下架商品。针对此场景,RES系统在物品表中提供status字段来实现物品的上下架。 参考准备离线数据源中的物品表字段介绍,status置为0,代表该物品可被推荐。status置为1,代表该物品不可
性别为男性的用户。 物品属性:指定在物品属性中需要过滤的字段,包含属性名和属性值。来源于画像数据,即特征工程中初始用户画像-物品画像-标准宽表生成算子作业输出的数据,物品属性的名称来自于公共配置的全局特征信息文件。如过滤产品颜色为红色且产品品牌为华为的物品。 排序方式 “点击率预估”
本实践针对用户的单次推荐预测请求,在返回的物品列表中,对规定的属性进行打散,避免推荐结果出现同一属性物品扎堆出现的现象。 本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果 准备工作 已注册华为云帐号,并且账号为可用状态。 确保用户选择的属性在物品表存在相应的
配置过期时间实现新闻的过期下架 在新闻推荐等对物料的时效性要求较高的场景,可配置物料的过期时间expireTime,设置每一条新闻的有效期,使新闻在有效期内实现可推送,超过有效期,不会被推送。 表1 物品数据中expireTime字段描述 字段名 类型 描述 是否必选 expireTime
M、PIN中的某一个。 algorithm_parameters 是 JSON 每个算法有其各自的参数列表,包括初始化、最优化、正则项等参数。 逻辑斯蒂回归算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑斯蒂回归算法通过在线性回归的基础上叠加一
如上数据表的数据格式规范请参见离线数据源。 在对应表的“数据源”列中,单击选择数据的OBS存储路径。 在对应表的“数据格式”列中,数据格式可选:csv/json。 当选择数据格式为csv时,在弹框中设置数据参数,具体参数如下: 表头,有或无,根据用户数据格式选取。 分隔符,选择逗号(,
重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 不需要。重新执行召回策略,产生新的候选集会被在线服务直接引用,无需重启在线服务。 父主题: 自定义场景
调用API获取项目ID 项目ID还用通过调用查询指定条件下的项目信息API获取。 获取项目ID的接口为“GET https://{Endpoint}/v3/projects/”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如