自动驾驶云服务 OCTOPUS-推理服务:推理服务相关操作

时间:2024-09-06 18:25:48

推理服务相关操作

图2 推理服务列表

在“推理服务”列表,可对任务进行以下操作。

表1 推理服务相关操作

任务

操作步骤

编辑服务

单击操作栏中的“编辑”,打开编辑推理服务弹出框,修改推理服务配置后,单击“确认”。不支持修改服务的名称和模型仓库,当修改了模型版本、资源规格、实例数和环境变量后,根据编辑前的状态,推理服务会重新构建或重新排队,期间服务将不可用。

启动服务

单击操作栏中的“启动”,可以启动服务,在启动服务时,支持重新设置“是否自动停止”配置和自动停止时间。

状态为部署失败或已停止的推理服务才能进行启动操作

停止服务

单击操作栏中的“停止”,可以停止服务,推理服务停止后再启动将重新构建或排队,请谨慎操作。

状态为构建失败、部署失败、已停止或停止中的推理服务不能进行停止操作

删除服务

单击操作栏中的“删除”,可以删除服务,推理服务删除后无法恢复,请谨慎操作。

查询服务

在搜索输入框中输入搜索条件,按回车键即可查询。

查看服务详情

单击服务名称,可在服务详情页查看推理服务详情、监控、事件、日志等信息。

  • 推理服务详情:展示ID、状态、模型及版本、镜像、环境变量、资源池、资源规格、实例数、公网地址等信息。其中,公网地址将在服务部署成功后展示。属于私密信息,请勿轻易泄露。
  • 监控:展示AI应用调用次数统计实时资源统计信息。
  • 事件:展示当前服务使用过程中的关键操作,比如服务构建进度、部署进度、部署异常的原因、服务被启动、停止、更新的时间点等。
  • 日志:展示当前服务的日志信息。支持查询日志,包含最近5分钟、最近30分钟、最近1小时和自定义时间段(自定义时间段您可以选择开始时间和结束时间)。支持输入关键字搜索服务日志。

推理服务各状态允许的操作如下:

表2 推理服务各状态允许的操作

状态

编辑

启动

停止

删除

导入中

x

x

构建中

x

x

构建失败

x

x

排队中

x

部署中

x

x

运行中

x

部署失败

x

告警

x

停止中

x

x

x

已停止

x

support.huaweicloud.com/usermanual-octopus/octopus-07-0028.html