检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10s。 算子参数 在线服务名:使用的在线服务的名称。该在线服务需满足前提条件的要求。 流程名:在线服务对应的在线流程名称。 异常数据输出路径:单击右侧的按钮,选择数据在OBS中的存放路径,此路径下会记录不符合任务要求的输入数据。
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。 表1 全局特征信息文件字段描述 字段名 类型 描述 是否必选 user_features
API(V1不推荐) 平台资源API 作业相关API 全局配置API 在线服务API
Query参数 参数 是否必选 参数类型 描述 category 是 String 场景类型: customize,自定义推荐 intelligent,智能场景 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 内容类型,取值为application/json。
推荐系统OBS文件夹规范 使用推荐系统时,需要在OBS创建桶并导入离线数据,同时作业所产生的数据也会保存在OBS中。为了方便您快速定位文件路径,建议您按照如下结构准备数据创建文件夹,并上传至OBS桶。 OBS文件夹示例 自定义OBS桶名 │ obs-offline-data
数据源管理流程及功能简介 表1 功能介绍 功能 说明 准备离线数据源 请您按照推荐系统要求的数据格式准备用户数据,物品数据,行为数据。 上传离线数据源至OBS 将准备的离线数据源上传至对象存储服务(OBS)用于推荐系统的离线计算。 创建离线数据源 在使用RES之前,首先您需要创建一个数据源
、CloudTable开启IAM认证的集群和DIS通道供用户选择进行绑定或解绑。 背景信息 绑定资源之后,将该资源应用于RES的作业训练及在线作业获取推荐结果。 解绑资源完成资源释放,已经解绑的资源不再应用于RES的相关计算。 已开通计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关服务。
有排序服务正在运行,无法修改排序模型训练规格 请检查是否有排序服务正在运行。 400 RES.1206 Datasource Error 有在线服务正在运行,无法修改在线并发规格 请检查是否有在线服务正在运行。 400 RES.3004 Basic Error 数据库资源模型配置出错 请联系管理员检查数据库模型配置。
排序策略-近线排序策略 近线排序策略用于对在线实时数据排序。如果使用在线排序模型,需在排序策略-近线特征工程中创建完成后才可以正常使用排序策略。 在“创建自定义场景”页面,进入“排序策略”页签,单击“添加近线排序策略”。 进行在线学习参数配置。 名称:自定义在线排序策略名称。 离线排序策略:
组合作业 创建组合作业 通过创建组合作业,用户可以根据配置的策略规则进行离线计算得到不同策略的候选集ID,来进行在线流程计算,得到用户满意的推荐结果。组合作业具体实现请参见图1。 图1 组合作业 创建组合作业主要包括如下设置: 基本配置 资源选择 召回策略 过滤规则 排序策略 预览配置
配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。 选择已经创建的自定义场景,单击名称,进入到自定义场景详情页。 单击已经创建的在线服务名称下面的“编辑”,进入编辑页面。 图1 修改在线服务参数 打开高级选项,进行打散功能的配置,选取相应的属性即可完成配置。 “高级类型”:选择“打散”。
户推荐系统的数据。从用户特征表、物品特征表以及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 数据时间范围 被统计数据的起始时间和终止时间。 统计间隔(天) 统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval Integer 更新周期(在线训练任务需要提供此参数)。 optimizer Optimizer object 优化器(在线训练任务需要提供此参数)。 flows Flow object 在线流程(在线训练任务需要提供此参数)。
算法介绍及参数说明 召回策略 过滤规则 排序策略-离线特征工程 排序策略-离线排序模型 在线服务 效果评估 父主题: 自定义场景
离线计算规格。 nearline String 实时计算规格。 rank String 深度学习计算规格。 online_tps Integer 在线服务最大并发数。 请求示例 查询场景详情 /v2.0/testuuidxxxxxxxxxxxxxxxxxxxxxxxx/workspace
离线排序作业名称(在线训练任务需要提供此参数)。 update_interval 否 Integer 更新周期(在线训练任务需要提供此参数)。 optimizer 否 Optimizer object 优化器(在线训练任务需要提供此参数)。 flows 否 Flow object 在线流程(在线训练任务需要提供此参数)。
列表页面和自定义场景详情页面进行操作。 发布或终止自定义场景默认对该场景下的所有作业执行发布或终止操作,包括召回策略、过滤规则、排序策略和在线服务等作业。 前提条件 已存在创建成功的自定义场景。 发布自定义场景 登录RES管理控制台,在左侧导航栏中选择“推荐业务” > “自定义场景”,进入自定义场景列表页面。
使用于在线服务,为用户生成推荐列表。当作业“状态”变为“计算失败”时,您可以单击作业的名称,进入详情页面,通过查看日志等手段处理问题。 逻辑斯蒂回归-LR 逻辑斯蒂回归算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑斯蒂回归算法通过在线性回归的
在“增加历史行为过滤”,如图2所示。 图2 创建过滤规则 表1 过滤规则参数说明 参数名称 说明 计算引擎 服务名,计算引擎DLI用于推荐系统的离线计算和近线计算。 集群名称,选择“资源中心”绑定的DLI集群名称。 任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源
参考数据源管理进行创建。 配置“在线服务”参数 如果用户已经创建自定义场景,可以直接修改“在线服务”相关参数。 选择已经创建的自定义场景,单击名称,进入到自定义场景详情页。 单击已经创建的在线服务名称下面的“编辑”,进入编辑页面。 图1 修改在线服务参数 修改“过滤(黑名单)”下面的参数。