检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
数据质量 数据质量检测算子,是用户在进行离线计算之前使用原始初始格式数据(离线数据源中的离线数据)或者通用格式数据检测输入数据是否合法。包括离线数据中是否包含特殊字符,数据类型是否正确,是否缺少必备信息等。 前提条件 已将离线数据上传至OBS桶中。 创建数据质量作业 创建数据质量操作步骤如下:
配额说明 为防止资源滥用,平台限定了各服务资源的配额,对用户的资源数量和容量做了限制。 表1 RES服务配额 资源 限制条件 建议 推荐引擎预测接口中最多请求结果数量 20 可提工单支持更高规格。 单份画像数据中最多支持的特征数量 30 单场景在线服务最多支持每秒请求的次数(TPS)
提交数据质量作业API 功能介绍 该接口用于提交数据质量作业并进行离线计算。 URI POST /v1/{project_id}/data-quality 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用
计费说明 计费项 RES服务根据用户使用的不同资源分别进行收费。 计费支持区域:华北-北京四。 由于RES使用的离线数据需存储在OBS中,数据存储产生的费用,请参见《OBS价格说明》。 表1 推荐系统计费项说明 计费项 说明 存储资源 应用于物品画像和用户画像的存储计费,对用户和物品的总条目数统计进行收费。
概述 欢迎使用推荐系统(Recommender System,简称RES) 。基于华为大数据和人工智能技术,提供推荐平台和算法服务,并帮助企业构建个性化推荐应用,助力提升网站/APP的点击率、留存率和用户体验。 您可以使用本文档提供推荐系统服务API的描述、语法、参数说明及样例等
如何上传实时数据? 推荐系统支持您通过SDK上传实时数据,具体操作方法如下。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。 子账户无法使用SDK上传数据,需要主账号授权子账号DIS
上传实时数据 RES通过DIS SDK上传实时数据,用户实时日数据并做近线处理。当前仅支持Java语言的SDK,示例请参见《数据接入服务SDK参考》。 前提条件 如果需要使用近线上传实时数据的用户,可以使用DIS SDK接口上传,请您按照需求下载DIS SDK,下载完之后按照下面的说明进行SDK升级。
准备离线数据源 在使用RES创建数据源时,您需要准备以下的3种基础数据包并上传至OBS。如果使用近线流程,需先将业务系统埋点日志转换成推荐系统指定格式,并实时写入DIS相应通道。本章节介绍了RES当前离线数据源和近线数据源的数据格式,您可以参考本章节说明,准备相应的数据。 目前数
提交特征工程作业 功能介绍 该接口用于特征工程处理,包含数据预处理,特征提取和排序训练样本生成等。 URI POST /v1/{project_id}/etl-job 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String
离线数据源 调用RES之前,您需要准备3种基础数据包并上传至OBS,离线数据源目前支持CSV和JSON。具体数据包请参见表1 基础数据表。 表1 基础数据表 数据类型 表名 用户类数据 用户属性表 物品类数据 物品属性表 行为类数据 用户操作行为表 用户需要自己手工创建整理这些表并存储到OBS上。
提交组合作业 功能介绍 该接口用于提交组合作业进行离线计算,并完成对应策略的候选集生成。 URI POST /v1/{project_id}/training 参数说明请参见表1-URI参数说明。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String
离线作业简介 RES提供了离线作业训练的功能,方便您根据业务需求查看作业结果并不断调整您的作业参数。您还可以基于离线作业得到的推荐候选集,用于在线服务计算得到推荐结果。RES提供了多种推荐离线作业功能,您可以直接使用得到满意的推荐候选集。 用户通过数据质量作业对离线数据进行质量检
策略参数说明 RES支持多种策略,本章介绍召回策略(recall)、排序策略(sorting)。具体描述请参见表1 策略类型说明。 表1 策略类型说明 strategy_type name algorithm_type recall 特定行为热度推荐 SpecificBehavior
效果评估 创建效果评估可以对线上服务设置指标,查看推荐效果的反馈,可以根据系统提供的指标添加。 表1 效果评估参数说明 参数名称 说明 名称 自定义名称,由中文、英文、数字、下划线、空格或者中划线组成,并且不能以空格开始和结束,长度为1~64个字符。 描述 对于该效果评估作业的描述信息。
删除作业 功能介绍 该接口用于删除作业以及作业产生的数据。 URI DELETE /v1/{project_id}/del-job 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
提交流式训练作业 功能介绍 该接口用于提交流式训练作业。 URI POST /v1/{project_id}/stream-etl-job 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
过滤规则 过滤规则用于配置候选集的过滤方式,使之不进入候选集。过滤规则说明请参见图1。 图1 过滤规则 创建过滤规则 在“创建过滤规则”页面,用户可以对目标数据选择不同策略进行离线计算,得到合适的候选集。 创建过滤规则操作步骤如下: 在“离线作业”下,单击“过滤规则”页签,单击该
提交实时流近线作业 功能介绍 该接口用于提交实时流作业并进行近线计算。 URI POST /v1/{project_id}/nearline-job 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
召回策略 召回是指对大量的物品做初选,为每一个用户形成个性化侯选集。召回策略是指通过大数据计算或深度训练生成推荐候选集的算法策略。召回策略中内置了多种召回方式,您可根据自己场景选择。 基于综合行为热度推荐 基于综合行为热度推荐统计用户对物品所有行为的加权热度。如果选择用户分群,将
获取访问密钥(AK/SK) 由于使用RES时,上传数据、进行计算等需要依赖其他服务,若没有添加访问密钥则无法使用其他服务。 获取访问密钥 登录华为云,在页面右上方单击“控制台”,进入华为云管理控制台。 图1 控制台入口 在控制台右上角的帐户名下方,单击“我的凭证”,进入“我的凭证”页面。