检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
部署服务 功能介绍 该接口用于部署推理服务。 URI POST /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
更新服务 功能介绍 该接口用于更新推理服务。 URI PUT /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
删除服务 功能介绍 该接口用于删除服务信息。 URI DELETE /v1/{project_id}/infer-services/{service_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 参数类型 说明 project_id 是 String 项目编
查询服务详情 功能介绍 该接口用于查询推理服务信息详情。 URI GET /v1/{project_id}/infer-services/{service_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目
停止/启动服务 功能介绍 该接口用于停止或启动服务。 URI PATCH /v1/{project_id}/infer-services/{service_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 参数类型 说明 project_id 是 String
在线服务API 获取规格列表 部署服务 预测接口 预测接口(排序) 预测接口(文本标签) 更新服务 查询服务列表 查询服务详情 订阅服务 停止/启动服务 删除服务 查询镜像列表 父主题: API(V1不推荐)
预测接口(排序) 功能介绍 线上预测接口。 URI POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 rec_num 否 Integer 请求返回数量,默认返回50条。 user_id 是
预测接口 功能介绍 线上预测接口。 URI POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 rec_num 否 Integer 请求返回数量,默认返回50条。 user_id 是 String
查询服务列表 功能介绍 该接口用于查询推理服务列表。 URI GET /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
在线服务 在线服务用来做线上推荐时的应用,每个服务之间是独立的。即根据不同的离线计算得到的候选集以及相关参数,提供不同的推荐服务。 表1 在线服务参数说明 参数名称 子参数 说明 召回池 “推荐候选集” “添加推荐候选集” 选择表名:添加离线、近线任务或者在线自定义检索召回策略生
获取规格列表 功能介绍 该接口用于获取节点规格列表。 URI GET /v1/{project_id}/specifications 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
查询镜像列表 功能介绍 该接口用于查询镜像列表。 URI GET /v1/{project_id}/image?type={type} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目ID。
预测接口(文本标签) 分词模型 命名实体识别模型 父主题: 在线服务API
在线服务获得推荐的调用次数如何计算? RES从全局角度计算在线服务获得推荐的调用次数,不区分每次调用的用户。例如A用户调用请求推荐接口是每秒5次,B用户调用请求推荐接口每秒5次,当A用户和B用户同时调用此接口时,总的获得推荐的调用请求为A用户和B用户之和,即5+5=10。 父主题:
请求什么类型的操作。 GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时
分词模型 模型名称 res-word-segmentation 功能1 -- 关键词提取(未排序) 将待处理的文本进行分词处理并筛选保留关键词。 URL POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选
Key)加密调用请求。 Token认证 Token的有效期为24小时,需要使用一个Token鉴权时,可以先缓存起来,避免频繁调用。 Token在计算机系统中代表令牌(临时)的意思,拥有Token就代表拥有某种权限。Token认证就是在调用API的时候将Token加到请求消息头,从而通过身份认证,获得操作API的权限。
关联AK/SK到ModelArts服务 功能介绍 该接口用于关联AK/SK到ModelArts服务。 URI GET/v1/{project_id}/associate/modelArts-aksk 参数说明请参见表1-URI参数说明。 表1 URI参数说明 名称 是否必选 类型
查询ModelArts服务AK/SK 功能介绍 该接口用于查询用户在ModelArts服务的AK/SK。 URI GET/v1/{project_id}/modelArts/aksk 参数说明请参见表1-URI参数说明。 表1 URI参数说明 名称 是否必选 类型 说明 project_id
重新运行被在线服务所引用的召回策略,是否需要重新部署在线服务? 不需要。重新执行召回策略,产生新的候选集会被在线服务直接引用,无需重启在线服务。 父主题: 自定义场景