检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
如何开始使用RES? 使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源
是否必选 参数类型 说明 data_source_config 是 JSON 请参见表3,数据源参数配置。 algorithm_config 是 JSON 算法参数配置。 candidate_set_config 是 JSON 请参见表4,候选集参数配置。 表3 data_source_config参数说明
任务配置地址,在创建作业时, 会自动生成一个JSON格式的配置源文件,该文件存储在指定的OBS路径中,计算引擎可以通过读取配置源文件来进行离线计算。 资源名,指定DLI运行作业的资源规格。 存储平台 服务名称,CloudTable作为存储平台,用于用户推荐在线数据和推荐候选集的存储。 集群名
、CloudTable开启IAM认证的集群和DIS通道供用户选择进行绑定或解绑。 背景信息 绑定资源之后,将该资源应用于RES的作业训练及在线作业获取推荐结果。 解绑资源完成资源释放,已经解绑的资源不再应用于RES的相关计算。 已开通计算引擎DLI、存储平台CloudTable、数据接入资源DIS相关服务。
及用户行为表中提取用户、物品特征和用户行为,并生成json数据,即内部通用格式。 数据时间范围 被统计数据的起始时间和终止时间。 统计间隔(天) 统计间隔,以天为单位,每隔多少天计算一次指标,大于0。 在线服务 选择已发布的在线服务进行推荐效果指标计算。 结果保存路径 效果评估结果在OBS的文件输出路径。
约束与限制 您能创建的在线服务的数量与配额有关系,具体请参见关于配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑,包括设置在线流量、组装推荐结果和设置排序策略。根据策略做在线推荐结果融合、过滤、重排以及多流程之间的AB,并返回最终结果。 创建在线服务 获取推荐结果 - 您可以通过在线服务预测结果,也可以通过API接口获取最终的推荐结果。
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
窗口间隔(秒) 近线策略处理的窗口间隔,单位为秒,10代表每隔10s进行一次算。 10s。 算子参数 在线服务名:使用的在线服务的名称。该在线服务需满足前提条件的要求。 流程名:在线服务对应的在线流程名称。 异常数据输出路径:单击右侧的按钮,选择数据在OBS中的存放路径,此路径下会记录不符合任务要求的输入数据。
功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。 套餐介绍 计算资源分为“计算型CPU(1U4G)实例”、“计算型GPU(P100)实例”、“计算型GPU(V100)实例”3种类型。存储资源支持“画像存储(一百万)”。在线服务支持“在线并发9000TPS-时
训练作业描述,最大长度为256字符。 nearline_platform 是 JSON 请参见表3,近线计算平台。 storage 是 JSON 请参见表5,信息存储。 strategy 是 JSON 请参见表8,策略信息。 表3 nearline_platform参数说明 参数名称
请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 内容类型,取值为application/json 表4 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 数据源名称:,1-64位字母、数字、下划线、中划线组合。
数据质量检测日志的保存路径。包括错误数据输出及定位等。 全局特征信息文件 用户在使用数据质量检测算子之前,需要提供一份全局的特征信息文件,后续的特征工程、排序算法、在线服务都会用到该文件。全局特征信息文件需要和画像中字段一致,其中BASIC_INFO为画像表中定义的基本属性字段,TAGS为画像表中定义的带
请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 内容类型,取值为application/json。 X-Auth-Token 是 String 用户token,获取方式请参见获取用户Token。 表3 请求Body参数 参数 是否必选
UPDATE_INDEX_SCHEMA algorithm_parameters 是 JSON 算法参数。 UPDATE_INDEX_SCHEMA,请参见表6。 storage 是 JSON 请参见表5,存储平台。 offline_platform 是 JSON 请参见表3,离线计算平台信息。 表3 offline_platform参数说明
训练作业描述,最大长度为256字符。 offline_platform 是 JSON 请参见表3,离线计算平台信息。 storage 是 JSON 请参见表8,信息存储。 strategy 是 JSON 请参见表5,策略信息 表3 offline_platform参数说明 参数名称
请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 内容类型,取值为application/json。 X-Auth-Token 是 String 用户token,获取方式请参见获取用户Token。 响应参数 状态码: 200 表3 响应Body参数
BUILD_RANK_UNIFORM_DATA_FROM_JSON algorithm_parameters 是 JSON 算法参数,每一种算法都有其特定的参数。 INITIAL_PROFILES_GENERATION,请参见表8 BUILD_RANK_UNIFORM_DATA_FROM_JSON,请参见表9。 data_source
algorithm_parameters 是 JSON 每个算法有其各自的参数列表,包括初始化、最优化、正则项等参数。 逻辑斯蒂回归算法是一种广义的线性回归分析模型,常用于数据挖掘、疾病自动诊断、经济预测等领域。逻辑斯蒂回归算法通过在线性回归的基础上叠加一个sigmoid激活函数将输出值映射到[0
resource 是 JSON 请参见表3,资源信息。 表3 resource参数说明 参数名称 是否必选 参数类型 说明 type 是 String 资源类型,取值DLI、DIS、CloudTable。 resource_info 是 JSON 资源详细信息,JSON字符串。 当type为DLI时,请参见表4。