检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
查询服务列表 功能介绍 该接口用于查询推理服务列表。 URI GET /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目
套餐介绍 计算资源分为“计算型CPU(1U4G)实例”、“计算型GPU(P100)实例”、“计算型GPU(V100)实例”3种类型。存储资源支持“画像存储(一百万)”。在线服务支持“在线并发9000TPS-时”,“TPS-时”表示每小时平均TPS。 规格和支持功能请参见表1。
管理在线服务 您可以对在线作业进行“编辑”、“启动”、“开通”、“停止”、“删除”等操作。您也可以通过单击在线服务名称查看在线服务的详细信息。 编辑服务 用户可以通过“编辑”在线服务修改该参数信息进行计算。生成的数据会覆盖原来的在线服务计算生成的数据。“部署中”的在线服务不支持编辑
更新服务 功能介绍 该接口用于更新推理服务。 URI PUT /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目
specs List 计算资源规格列表,表3。 error_code String 请求失败时的错误码,请求成功时无此字段。 error_msg String 请求失败时的错误信息,请求成功时无此字段。
查询服务详情 功能介绍 该接口用于查询推理服务信息详情。 URI GET /v1/{project_id}/infer-services/{service_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号
部署服务 功能介绍 该接口用于部署推理服务。 URI POST /v1/{project_id}/infer-services 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 类型 说明 project_id 是 String 项目编号,用于资源隔离。获取方法请参见获取项目
413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。
在线服务 创建在线服务 获取推荐结果 查看在线服务详情 管理在线服务 父主题: 用户指南(旧版)
预测接口 功能介绍 线上预测接口。 URI POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 rec_num 否 Integer 请求返回数量,默认返回50条。 user_id 是 String
订阅服务 功能介绍 该接口用于订阅共享的服务。 URI POST /v1/{project_id}/infer-services/{service_id}/share 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 参数类型 说明 project_id 是 String
停止/启动服务 功能介绍 该接口用于停止或启动服务。 URI PATCH /v1/{project_id}/infer-services/{service_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 参数类型 说明 project_id 是 String 项目编号
在线服务API 获取规格列表 部署服务 预测接口 预测接口(排序) 预测接口(文本标签) 更新服务 查询服务列表 查询服务详情 订阅服务 停止/启动服务 删除服务 查询镜像列表 父主题: API(V1不推荐)
API(V1不推荐) 平台资源API 作业相关API 全局配置API 在线服务API
删除服务 功能介绍 该接口用于删除服务信息。 URI DELETE /v1/{project_id}/infer-services/{service_id} 参数说明请参见表1。 表1 URI参数说明 名称 是否必选 参数类型 说明 project_id 是 String 项目编号
预测接口(排序) 功能介绍 线上预测接口。 URI POST 服务部署成功后返回的预测地址。 请求消息 请求参数请参见表1 请求参数说明。 表1 请求参数说明 参数名称 是否必选 参数类型 说明 rec_num 否 Integer 请求返回数量,默认返回50条。 user_id 是
GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。
智能场景 智能场景简介 创建智能场景 发布或终止智能场景 获取推荐结果 效果评估 编辑或删除智能场景
例如,用户要调用接口来查询云服务器列表,那么这个IAM用户被授予的策略中必须包含允许“ecs:servers:list”的授权项,该接口才能调用成功。
当前服务器的时间大于该时间时,此物品将不会被推荐。如不设置,代表永不失效。 否 同时,expireTime字段和status字段一样,都可以通过实时数据推送方式,进行字段的更新。该字段为非必选,如不传入,则不会进行失效处理。 示例: 配置新闻在上架五天后进行自动下架。