检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在线服务获得推荐的调用次数如何计算? RES从全局角度计算在线服务获得推荐的调用次数,不区分每次调用的用户。例如A用户调用请求推荐接口是每秒5次,B用户调用请求推荐接口每秒5次,当A用户和B用户同时调用此接口时,总的获得推荐的调用请求为A用户和B用户之和,即5+5=10。
父主题: 在线服务API
父主题: 在线服务API
父主题: 在线服务API
最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 目前推荐系统支持的默认在线并发规格为5。由于伸缩资源有一定的时延导致预测接口出现变慢的情况,因此在可预见的并发规格中,建议填写实际并发的规格,推荐系统后台会根据并发规格提前预留好资源,避免峰值的到来。
父主题: 在线服务API
父主题: 在线服务API
分词模型 模型名称 res-word-segmentation 功能1 -- 关键词提取(未排序) 将待处理的文本进行分词处理并筛选保留关键词。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选
命名实体识别模型 模型名称 res-default-ner 功能 将待处理的文本中的人名、地名、组织名提取出来。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 text 是 String 待处理的文本
代码:输入预测代码,单击“预测”后显示预测结果,如图1所示。输入用户ID和推荐数量,或者物品项,根据您设置的策略返回用户的预测结果。如果物品项有多个,需要用英文逗号隔开。 图1 代码预测 表单:输入“ID”和设置“最大推荐个数”,也可以设置“物品项”。
在创建自定义场景时,如果设置了自动召回策略,且此召回策略关联了在线服务,就会自动运行场景实例。用户可关闭召回策略,或者在在线服务中删除依赖的这个策略。 父主题: 自定义场景
使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。
图8 发布服务 步骤5:获取预测结果 在线服务发布执行成功后,您可以进入在线服务,发起预测请求进行测试。 在“自定义场景”列表页面,单击目标场景名称,进入“自定义场景详情”页面。 单击“预测”页签,进入预测页面。 预测方式选择“代码”,在“预测代码”部分输入预测代码。
约束与限制 您能创建的在线服务的数量与配额有关系,具体请参见关于配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑,包括设置在线流量、组装推荐结果和设置排序策略。根据策略做在线推荐结果融合、过滤、重排以及多流程之间的AB,并返回最终结果。
RES操作流程 操作流程 本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。
在线服务支持“在线并发9000TPS-时”,“TPS-时”表示每小时平均TPS。 规格和支持功能请参见表1。
全局特征信息文件 在特征工程、在线模块,近线模块时都会用到该全局的特征信息文件。当上传的数据中的特征有变化时,用户需要同步更新该文件。该文件为JSON格式,包含特征名、特征大类、特征值类型。
排序策略-离线排序模型 在线服务 在线服务用来做线上推荐时的应用,每个服务之间是独立的。即根据不同的离线计算得到的候选集以及相关参数,提供不同的推荐服务。
状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于获取用户Token接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。