检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
部署服务 功能介绍 该接口用于部署推理服务。 URI POST /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
计算生成的数据。“部署中”的在线服务不支持编辑。操作步骤如下: 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表。 在“在线服务”页面,您可以单击目标服务操作列的“编辑”,进入“编辑在线服务”页面。 在线服务配置方法,请参见创建在线服务,配置结束单击“立即修改”。
重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 不需要。重新执行召回策略,产生新的候选集会被在线服务直接引用,无需重启在线服务。 父主题: 自定义场景
务类型”等。 当服务部署成功:您可以单击服务名称左侧的查看预测接口、ID、在线流程名称、在线流程ID进行调用。 当服务部署失败:您可以单击服务名称左侧的查看失败原因,根据失败原因对服务配置进行调整,重新部署。常见的可能失败原因及解决方法请参见表1。 表1 部署失败解决方法 报错 失败原因
获取推荐结果 在线服务创建完成,部署成功后,当服务状态会显示“运行中”,表示服务状态正常。您可以通过在线预测功能测试推荐结果进一步调整作业参数,也可以通过预测接口来调用API,获取推荐结果。 在线预测 登录RES管理控制台,在左侧菜单栏中选择“在线服务”,进入服务列表页面。 单击
、资源以及请求条件等。基于策略的授权是一种更加灵活的授权方式,能够满足企业对权限最小化的安全管控要求。例如:针对ECS服务,管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。多数细粒度策略以API接口为粒度进行权限拆分,RES支持的API授权项请参见《权限策略和授权项》。
目前最大配额是20,如需要调整,需要提工单进行调整。 search_info - 配置动态搜索召回候选集,需要在线服务配置部分增加 "dynamic-search" 候选集,为非必选项。 match_infos 进行召回匹配的参数配置,即搜索的匹配信息。 label:客体的属性名称(可为字符串或字符串数组类型)。
景”信息可选择您在全局配置页面创建的场景。 图1 基本信息 根据业务需求选择服务类型。包括“推荐引擎”、“排序”和“文本标签”。 单击“添加在线流程”,并进行命名,您最多可以部署5个在线流程。根据选择的服务类型配置在线流程,包括融合、过滤、排序和模型及配置等关键信息。具体参数信息参见表1。服务类型选择推荐引擎。
配置过期时间实现新闻的过期下架 在新闻推荐等对物料的时效性要求较高的场景,可配置物料的过期时间expireTime,设置每一条新闻的有效期,使新闻在有效期内实现可推送,超过有效期,不会被推送。 表1 物品数据中expireTime字段描述 字段名 类型 描述 是否必选 expireTime
关数据。 上传实时数据 数据质量管理 数据质量管理操作可以将数据源经过数据特征抽取,生成推荐系统内部通用的数据格式。 数据质量管理 选择并配置推荐业务 智能场景 针对对应的场景,由RES根据场景类型预置好对应的智能算法,为匹配的场景提供智能推荐服务。 智能场景简介 自定义场景 面
项相对应,只有发起请求的用户被授予授权项所对应的策略,该用户才能成功调用该接口。例如,用户要调用接口来查询云服务器列表,那么这个IAM用户被授予的策略中必须包含允许“ecs:servers:list”的授权项,该接口才能调用成功。 支持的授权项 策略包含系统策略和自定义策略,如果
命名实体识别模型 模型名称 res-default-ner 功能 将待处理的文本中的人名、地名、组织名提取出来。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 text 是 String 待处理的文本。
预测接口(排序) 功能介绍 线上预测接口。 URI POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 rec_num 否 Integer 请求返回数量,默认返回50条。 user_id 是
由itemid组成的List。需要在部署服务的时候与物品-物品协同过滤算法一起使用,并提供物品-物品相似度查询功能。 others_users 否 List 由userid组成的List。提供多用户候选集查询功能。 context 否 String 上下文信息,可用于配置在线过滤黑名单列表,列
Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
res-word-segmentation 功能1 -- 关键词提取(未排序) 将待处理的文本进行分词处理并筛选保留关键词。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 title 是
情。 如何选择可用区? 是否将资源放在同一可用区内,主要取决于您对容灾能力和网络时延的要求。 如果您的应用需要较高的容灾能力,建议您将资源部署在同一区域的不同可用区内。 如果您的应用要求实例之间的网络延时较低,则建议您将资源创建在同一可用区内。 区域和终端节点 当您通过API使用
请求什么类型的操作。 GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时
获取访问密钥并添加RES全局配置 由于使用RES时,用户上传数据、进行离线计算等需要依赖其他服务,如果没有添加访问密钥则无法使用其他服务。因此,在使用RES前,您需要获取访问密钥并在RES管理控制台完成添加访问密钥的配置。 获取访问密钥 登录华为云,鼠标移动至页面右上方用户名,在
创建离线作业包括进行数据质量检测、创建组合作业、特征工程、召回策略、排序策略、过滤规则等作业。 运行推荐作业 创建在线服务 - 创建在线服务用于部署上线服务、更新模型。配置实时计算的逻辑,包括设置在线流量、组装推荐结果和设置排序策略。根据策略做在线推荐结果融合、过滤、重排以及多流程之间的AB,并返回最终结果。