检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
"error_msg": "The content for the request is invalid." } 状态码 状态码请参见状态码。 父主题: 提交数据质量作业
该功能使用涉及两部分:实时行为数据的接入和在线服务配置行为过滤。当数据源部分开启近线行为实时接入之后,并且用户通过上传实时行为数据,系统才具备根据实时行为进行曝光过滤的功能,该部分可参考上传实时数据进行配置和对接。 本实践的基本流程如下: 准备工作 创建数据源 配置在线服务参数 获取推荐结果
indicators 是 List 请参见表3,需要统计的指标列表及其对应的参数。 start_time 是 Long 被统计数据的起始时间戳。 end_time 是 Long 被统计数据的终止时间戳。 interval 是 Double 统计间隔,以天为单位,每隔interval天计算一次指标,大于0。
开启时间跨度 不开启取全部数据,开启则指定从数据源中取最近天数或小时数的行为数据计算相似度。 时间单位 开启时间跨度后,支持按照天或者小时为单位从指定从数据源中取行为数据计算相似度。 时间跨度 用于指定从数据源中取最近多少天或者多少小时的行为数据计算热度。默认取全部数据。 开启调度 开启调度,按照指定的调度策略定期执行作业。
组合作业作为一个包含多个子任务的作业,通常用于多个召回、过滤、排序等任务。 组合作业 数据质量 数据质量是用户在进行离线计算之前使用原始初始格式数据或者通用格式数据检测输入数据是否合法。 数据质量 特征工程 特征工程常用于抽取用户、物品的特征和特定算法的特征生成,一般作为某些算法的前置输入条件。
以获得更好的推荐结果。 以上功能,我们也可以使用数据治理中心 DataArts Studio,通过拖拽的方式完成配置。具体操作步骤如下: 登录数据治理中心 DataArts Studio管理控制台,在控制台的左侧导航栏,选择“数据开发 > 作业开发”。 在“工作区”页面的右侧,单击“新建作业”。
由于RES使用的离线数据需存储在OBS中,数据存储产生的费用,请参见《OBS价格说明》。 表1 推荐系统计费项说明 计费项 说明 存储资源 应用于物品画像和用户画像的存储计费,对用户和物品的总条目数统计进行收费。 每个数据源默认规格最低是一百万条,如果一个数据源中的用户和物品总条
开启公共终端节点 推荐系统在需要使用CloudTable集群进行数据存储,CloudTable集群创建后默认没有打开APIG,需开启之后推荐才能正常使用CloudTable集群。 前提条件 已开通CloudTable服务,创建集群并完成资源绑定。 公共终端节点默认不开启。 开启公共终端节点
图4 创建离线数据源 数据路径选择完成后单击“立即创建”。 离线数据源创建完成后,在数据源列表页面单击目标数据源名称进行数据质量管理,具体操作请参见推荐系统用户指南>数据源质量管理,完成数据探索并生成数据质量报告,此步骤完成后创建的数据源才可用。 步骤3:创建智能场景 登录R
load_widetable Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
创建跨源连接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。 前提条件 已开通计算引擎DLI服务,创建集群并完成资源绑定。 创建跨源链接 DLI集群绑定完成后,创建跨源链接。步骤如下: 登录RES管理控制台,在“
AutoGroup,AutoGroup作业 StreamRank,在线训练作业 DataStruct,识别数据结构作业 DataExploration,数据探索作业 DataImport,离线数据导入作业 Evaluate,效果评估作业 schedule 否 String 调度参数 表4 jobConfig
load_widetable 否 Boolean 导入宽表(离线数据导入作业需要提供此参数)。 load_profile 否 Boolean 导入画像(离线数据导入作业需要提供此参数)。 save_mode 否 String 保留已有宽表(离线数据导入作业需要提供此参数): append,是 new,否
获取访问密钥并添加RES全局配置 由于使用RES时,用户上传数据、进行离线计算等需要依赖其他服务,如果没有添加访问密钥则无法使用其他服务。因此,在使用RES前,您需要获取访问密钥并在RES管理控制台完成添加访问密钥的配置。 获取访问密钥 登录华为云,鼠标移动至页面右上方用户名,在
“全局特征信息文件”:根据全局特征信息文件规范准备并上传的全局特征信息文件路径。 “通用格式数据”:经过特征工程处理的宽表路径。 “用户属性表”:离线数据用户属性表的OBS路径。 “物品属性表”:离线数据物品属性表的OBS路径。 “用户操作行为表”:离线数据用户操作行为表的OBS路径。 图1 属性配置 删除场景 登
作”列的“删除”。 在“删除场景”页面确认自定义场景信息后单击“确定”。 删除场景包含删除场景下所有的策略和服务。场景运行存储在OBS中的数据不会被删除,需要您登录OBS进行删除操作。 父主题: 自定义场景
智能创建完成,运行成功后,当服务状态会显示“运行中”,表示状态正常。您可以通过预测功能测试推荐结果进一步调整作业参数,也可以通过预测接口来调用API,获取推荐结果。 如果近线数据源有更新,需要重新调度召回策略,才会有对应的推荐结果。 预测 登录RES管理控制台,在左侧菜单栏中选择“推荐业务>智能场景”,进入智能场景列表页面。
自定义场景”,进入“自定义场景”列表页面。 在自定义场景列表中,单击目标场景名称进入“自定义场景详情”页。 在基本信息页签下单击,在弹出页面修改“数据区间”和“场景规格”等信息。 参考基本信息修改自定义场景基本信息,然后单击“确认”完成修改。 新增作业配置 登录RES管理控制台,在左侧菜单栏中选择“推荐业务
获取访问密钥(AK/SK) 由于使用RES时,上传数据、进行计算等需要依赖其他服务,若没有添加访问密钥则无法使用其他服务。 获取访问密钥 登录华为云,在页面右上方单击“控制台”,进入华为云管理控制台。 图1 控制台入口 在控制台右上角的帐户名下方,单击“我的凭证”,进入“我的凭证”页面。
用户指南(旧版) 准备工作 RES操作流程 管理资源 全局配置 离线作业 近线作业 在线服务 服务总览信息 数据格式规范