检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
"envs": { "ONLINE_CONFIG": "<在线配置文件存储路径>" } } }
重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 不需要。重新执行召回策略,产生新的候选集会被在线服务直接引用,无需重启在线服务。 父主题: 自定义场景
预测接口(文本标签) 分词模型 命名实体识别模型 父主题: 在线服务API
"Failed to resolve the token from the request." } 状态码 状态码请参见状态码。 父主题: 在线服务API
"Failed to resolve the token from the request." } 状态码 状态码请参见状态码。 父主题: 在线服务API
在线服务获得推荐的调用次数如何计算? RES从全局角度计算在线服务获得推荐的调用次数,不区分每次调用的用户。例如A用户调用请求推荐接口是每秒5次,B用户调用请求推荐接口每秒5次,当A用户和B用户同时调用此接口时,总的获得推荐的调用请求为A用户和B用户之和,即5+5=10。 父主题:
最小在线并发规格支持弹性伸缩,是否设置最小规格即可? 目前推荐系统支持的默认在线并发规格为5。由于伸缩资源有一定的时延导致预测接口出现变慢的情况,因此在可预见的并发规格中,建议填写实际并发的规格,推荐系统后台会根据并发规格提前预留好资源,避免峰值的到来。 如果需要更多的规格,请您提工单联系工程师解决。
"Failed to resolve the token from the request." } 状态码 状态码请参见状态码。 父主题: 在线服务API
分词模型 模型名称 res-word-segmentation 功能1 -- 关键词提取(未排序) 将待处理的文本进行分词处理并筛选保留关键词。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选
命名实体识别模型 模型名称 res-default-ner 功能 将待处理的文本中的人名、地名、组织名提取出来。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 text 是 String 待处理的文本。
计算资源:用于推荐作业的计算规格。涉及计费功能包含:数据源、自定义场景、智能场景中的离线计算和模型训练。 存储资源:用于推荐系统数据存储规格。涉及计费功能包括:数据源。 在线服务:用于推荐系统在线推理,获得最终推荐结果。 套餐介绍 计算资源分为“计算型CPU(1U4G)实例”、“计算型GPU(P10
本章节介绍使用RES,从资源准备到在线服务完成推荐的全流程。RES流程图如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源
49*4=1.96元。 在线服务 应用于在线服务预测计费。 TPS统计规则为每小时平均TPS,例如每秒调用5次,持续调用1小时,TPS即为5,这一小时按需计费消耗为5*0.95=4.95元。 最终纳入计费的有效TPS值由两部分决定: 配置TPS:客户在场景中配置的在线服务TPS。 说明:
删除训练作业信息。 在线服务 新建在线服务 新建在线服务元数据,新建成功之后可手动发布此服务。 查询在线服务详情 根据给定的workspace_id和resource_id及category查询在线服务。 修改在线服务参数 修改指定在线服务的元数据内容。 删除在线服务 删除在线服务实例。 调度
运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑,包括设置在线流量、组装推荐结果和设置排序策略。根据策略做在线推荐结果融合、过滤、重排以及多流程之间的AB,并返回最终结果。 创建在线服务 获取推荐结果 - 您可以通过在线服务预测结果,也可以通过API接口获取最终的推荐结果。
如何开始使用RES? 使用RES,从资源准备到在线服务完成推荐的全流程,如图1所示。 图1 RES操作流程 表1 使用流程说明 流程 子任务 说明 详细指导 数据源 准备离线数据源 需要您准备包含用户数据,物品数据,行为数据上传至对象存储服务(OBS)用于推荐系统的离线计算。 准备离线数据源 上传离线数据源至OBS
约束与限制 您能创建的在线服务的数量与配额有关系,具体请参见关于配额。 更详细的限制请参见具体API的说明。 父主题: 使用前必读
以推荐为业务逻辑的引擎,即系统根据配置生成召回集作为起点,输出推荐结果集为终点的引擎。 排序引擎 以排序为业务逻辑的引擎,即用户提供排序集为输入,系统根据排序算法输出排序结果的引擎。 效果评估 指用于通过推荐系统推荐出去的结果集并利用trace_id回流到推荐系统的行为的点击率、转化率等指标的计算。
由浅入深,带您玩转RES 01 了解 推荐系统(Recommender System) ,提供媒资,短视频、电商等行业的推荐系统解决方案,帮助互联网企业降低构建推荐应用的技术门槛,提升点击率、留存率和用户体验。 产品介绍 什么是RES 推荐系统应用场景 推荐系统产品功能 推荐系统基本概念 02 入门
RES服务配额 资源 限制条件 建议 推荐引擎预测接口中最多请求结果数量 20 可提工单支持更高规格。 单份画像数据中最多支持的特征数量 30 单场景在线服务最多支持每秒请求的次数(TPS) 200 数据源个数 5 场景个数 10 单场景下推荐预测返回的结果集个数 20 如果当前资源配额限制