检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
父主题: 在线服务API
父主题: 在线服务API
重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 不需要。重新执行召回策略,产生新的候选集会被在线服务直接引用,无需重启在线服务。 父主题: 自定义场景
预测接口(文本标签) 分词模型 命名实体识别模型 父主题: 在线服务API
父主题: 在线服务API
父主题: 在线服务API
在线服务获得推荐的调用次数如何计算? RES从全局角度计算在线服务获得推荐的调用次数,不区分每次调用的用户。例如A用户调用请求推荐接口是每秒5次,B用户调用请求推荐接口每秒5次,当A用户和B用户同时调用此接口时,总的获得推荐的调用请求为A用户和B用户之和,即5+5=10。
父主题: 在线服务API
分词模型 模型名称 res-word-segmentation 功能1 -- 关键词提取(未排序) 将待处理的文本进行分词处理并筛选保留关键词。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选
表1 RES服务配额 资源 限制条件 建议 推荐引擎预测接口中最多请求结果数量 20 可提工单支持更高规格。
命名实体识别模型 模型名称 res-default-ner 功能 将待处理的文本中的人名、地名、组织名提取出来。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 text 是 String 待处理的文本
特征工程 特征工程可对推荐系统的离线数据进行处理,它包含两个功能: 从离线数据中提取用户、物品画像和RES内部通用格式数据; 把RES内部通用格式数据处理成训练排序模型所需的训练数据、测试数据等。
存储资源:用于推荐系统数据存储规格。涉及计费功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。 套餐介绍 计算资源分为“计算型CPU(1U4G)实例”、“计算型GPU(P100)实例”、“计算型GPU(V100)实例”3种类型。
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。
目前最大配额是20,如需要调整,需要提工单进行调整。 search_info - 配置动态搜索召回候选集,需要在线服务配置部分增加 "dynamic-search" 候选集,为非必选项。 match_infos 进行召回匹配的参数配置,即搜索的匹配信息。
例如:当系统DAU为10W,并且推荐接口在登录首页时触发,在线服务一般可配置为10TPS。 计费模式 RES目前提供按需、预付套餐包共2种计费方式。 按需购买:这种购买方式比较灵活,可以即开即停。
查询规格 查询训练规格 查询当前推荐系统所提供的离线计算规格,实时计算规格和排序模型训练规格。在创建数据源和场景时,需要提供此信息。 数据源 创建数据源 在指定的工作空间下面创建一个新的数据源。 查询数据源列表 查询当前工作空间下的数据源列表。
绑定资源 创建跨源链接 在使用DLI进行推荐系统的离线和近线计算时,建议创建跨源连接,用于访问CloudTable的数据源,提高读写性能。
使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
支持用户在线上推理过程中完成对相关物品的过滤。 特征工程 特征工程常用于对原始数据进行特征挖掘的处理,形成的结果用于排序策略的训练。 排序策略 排序策略利用CTR预估或综合性计算的算法给候选集做打分。 在线服务 在线服务应用于做线上推荐,每个服务之间是独立的。