华为云用户手册

  • 示例 请求示例 POST https://{endpoint}/v1/optverse/2dcut/regular-plate/tasks Request Header: Content-Type: application/json;charset=utf-8 Auth-Token: Body: { "items": [ { "item_id": 0, "item_material": "18MM_PLATE", "item_length": 60.0, "item_width": 553.0, "item_turn": true, "item_num": 1, "item_name": "底板", "item_thick": 18, "is_substitute": false, "label_info": { "order_code": "订单号", "plan_code": "批次号", "item_code": "小板标识" } }, { "item_id": 0, "item_material": "18MM_PLATE", "item_length": 60.0, "item_width": 553.0, "item_turn": true, "item_num": 1, "item_name": "底板", "item_thick": 18, "is_substitute": true, "label_info": { "order_code": "订单号", "plan_code": "批次号", "item_code": "小板标识" } } ], "parameters": [ { "calculate_time": 30, "first_cut_direction": 2, "item_backward_trim": 0.0, "item_forward_trim": 0.0, "kerf_horizontal": 4.4, "kerf_vertical": 4.4, "max_stack_height": 80, "plate_trim_horizontal": 10.0, "plate_trim_vertical": 10.0, "time_cost": 200, "max_cut_stage_num": 3, "min_stack_utilization": 0.8, "item_sort_location": false, "item_num_limit": 0 } ], "plates": [ { "plate_grain": true, "plate_id": 0, "plate_length": 2440.0, "plate_material": "18MM_PLATE", "plate_num": 9999, "plate_thick": 18.0, "plate_width": 1220.0, "plate_cost": 100 } ] } 成功响应示例 { "task_id": "40axxxx-701a-47cf-8b56-648xxxxxxd25" } 参数说明如表4所示。 表4 参数说明 参数 参数类型 说明 task_id String 任务ID 失败响应示例 { "error_code": "optverse.00000006", "error_msg": "Input data validate error: the item material is 18MM_PLATE, item_id is 0: Length and width are larger than plate.\n" }
  • AK/SK认证 AK/SK签名认证方式仅支持消息体大小12M以内,12M以上的请求请使用Token认证。 AK/SK认证就是使用AK/SK对请求进行签名,在请求时将签名信息添加到消息头,从而通过身份认证。 AK(Access Key ID):访问密钥ID。与私有访问密钥关联的唯一标识符;访问密钥ID和私有访问密钥一起使用,对请求进行加密签名。 SK(Secret Access Key):与访问密钥ID结合使用的密钥,对请求进行加密签名,可标识发送方,并防止请求被修改。 使用AK/SK认证时,您可以基于签名算法使用AK/SK对请求进行签名,也可以使用专门的签名SDK对请求进行签名。详细的签名方法和SDK使用方法请参见API签名指南。 签名SDK只提供签名功能,与服务提供的SDK不同,使用时请注意。
  • 概述 天筹求解器服务(OptVerse)是一种基于华为云基础架构和平台的智能决策服务,以自研AI求解器为核心引擎,结合机器学习与深度学习技术,为企业提供生产计划与排程、切割优化、路径优化、库存优化等一系列有竞争力的行业解决方案。 OptVerse以开放API(Application Programming Interface,应用程序编程接口)的方式提供给用户,用户通过实时访问和调用API获取推理结果,帮助用户自动采集关键数据,打造智能化业务系统,提升业务效率。 您可以使用本文档提供的天筹求解器服务API的描述、语法、参数说明及样例等内容,进行相关操作,例如天筹求解器服务包含的二维切割等具体接口使用说明。支持的全部操作请参见2 API概览。 在调用天筹求解器服务API之前,请确保已经充分了解运筹优化算法相关概念,详细信息请参见“产品介绍”。 父主题: 使用前必读
  • 状态码 状态码如下所示。 状态码 编码 状态说明 100 Continue 继续请求。 这个临时响应用来通知客户端,它的部分请求已经被服务器接收,且仍未被拒绝。 101 Switching Protocols 切换协议。只能切换到更高级的协议。 例如,切换到HTTPS的新版本协议。 200 OK 服务器已成功处理了请求。 201 Created 创建类的请求完全成功。 202 Accepted 已经接受请求,但未处理完成。 203 Non-Authoritative Information 非授权信息,请求成功。 204 No Content 请求完全成功,同时HTTP响应不包含响应体。 在响应OPTIONS方法的HTTP请求时返回此状态码。 205 Reset Content 重置内容,服务器处理成功。 206 Partial Content 服务器成功处理了部分GET请求。 300 Multiple Choices 多种选择。请求的资源可包括多个位置,相应可返回一个资源特征与地址的列表用于用户终端(例如:浏览器)选择。 301 Moved Permanently 永久移动,请求的资源已被永久的移动到新的URI,返回信息会包括新的URI。 302 Found 资源被临时移动。 303 See Other 查看其它地址,使用GET和POST请求查看。 304 Not Modified 所请求的资源未修改,服务器返回此状态码时,不会返回任何资源。 305 Use Proxy 所请求的资源必须通过代理访问。 306 Unused 已经被废弃的HTTP状态码。 400 Bad Request 非法请求。 建议直接修改该请求,不要重试该请求。 401 Unauthorized 在客户端提供认证信息后,返回该状态码,表明服务端指出客户端所提供的认证信息不正确或非法。 402 Payment Required 保留请求。 403 Forbidden 请求被拒绝访问。 返回该状态码,表明请求能够到达服务端,且服务端能够理解用户请求,但是拒绝做更多的事情,因为该请求被设置为拒绝访问,建议直接修改该请求,不要重试该请求。 404 Not Found 所请求的资源不存在。 建议直接修改该请求,不要重试该请求。 405 Method Not Allowed 请求中带有该资源不支持的方法。 建议直接修改该请求,不要重试该请求。 406 Not Acceptable 服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Timeout 服务器等候请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict 服务器在完成请求时发生冲突。 返回该状态码,表明客户端尝试创建的资源已经存在,或者由于冲突请求的更新操作不能被完成。 410 Gone 客户端请求的资源已经不存在。 返回该状态码,表明请求的资源已被永久删除。 411 Length Required 服务器无法处理客户端发送的不带Content-Length的请求信息。 412 Precondition Failed 未满足前提条件,服务器未满足请求者在请求中设置的其中一个前提条件。 413 Request Entity Too Large 由于请求的实体过大,服务器无法处理,因此拒绝请求。为防止客户端的连续请求,服务器可能会关闭连接。如果只是服务器暂时无法处理,则会包含一个Retry-After的响应信息。 414 Request URI Too Long 请求的URI过长(URI通常为网址),服务器无法处理。 415 Unsupported Media Type 服I务器无法处理请求附带的媒体格式。 416 Requested Range Not Satisfiable 客户端请求的范围无效。 417 Expectation Failed 服务器无法满足Expect的请求头信息。 422 Unprocessable Entity 请求格式正确,但是由于含有语义错误,无法响应。 429 Too Many Requests 表明请求超出了客户端访问频率的限制或者服务端接收到多于它能处理的请求。建议客户端读取相应的Retry-After首部,然后等待该首部指出的时间后再重试。 500 Internal Server Error 表明服务端能被请求访问到,但是不能理解用户的请求。 501 Not Implemented 服务器不支持请求的功能,无法完成请求。 502 Bad Gateway 充当网关或代理的服务器,从远端服务器接收到了一个无效的请求。 503 Service Unavailable 被请求的服务无效。 建议直接修改该请求,不要重试该请求。 504 Gateway Timeout 请求在给定的时间内无法完成。客户端仅在为请求指定超时(Timeout)参数时会得到该响应。 505 HTTP Version Not Supported 服务器不支持请求的HTTPS协议的版本,无法完成处理。 父主题: 附录
  • 响应消息体 响应消息体通常以结构化格式返回,与响应消息头中Content-type对应,传递除响应消息头之外的内容。 对于获取用户Token接口,返回如下消息体。为篇幅起见,这里只展示部分内容。 { "token": { "expires_at": "2019-02-13T06:52:13.855000Z", "methods": [ "password" ], "catalog": [ { "endpoints": [ { "region_id": "cn-north-4", ...... 当接口调用出错时,会返回错误码及错误信息说明,错误响应的Body体格式如下所示。 { "error_msg": "The format of message is error", "error_code": "AS.0001" } 其中,error_code表示错误码,error_msg表示错误描述信息。
  • 响应消息头 对应请求消息头,响应同样也有消息头,如“Content-type”。例如表1所示。 表1 响应消息头 名称 说明 Content-Length 响应消息体的字节长度,单位为Byte。 Date 系统响应的时间。 Content-Type 响应消息体的MIME类型。 对于获取用户Token接口,返回如图1所示的消息头,其中“x-subject-token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 图1 获取用户Token响应消息头
  • 基本概念 账号 用户注册华为云时的账号,账号对其所拥有的资源及云服务具有完全的访问权限,可以重置用户密码、分配用户权限等。由于账号是付费主体,为了确保账号安全,建议您不要直接使用账号进行日常管理工作,而是创建用户并使用他们进行日常管理工作。 用户 由账号在OptVerse中创建的用户,是云服务的使用人员,具有身份凭证(密码和访问密钥)。 在我的凭证下,您可以查看账号ID和用户ID。通常在调用API的鉴权过程中,您需要用到账号、用户和密码等信息。 区域 指云资源所在的物理位置,同一区域内可用区间内网互通,不同区域间内网不互通。通过在不同地区创建云资源,可以将应用程序设计的更接近特定客户的要求,或满足不同地区的法律或其他要求。 可用区 一个可用区是一个或多个物理数据中心的集合,有独立的风火水电,AZ内逻辑上再将计算、网络、存储等资源划分成多个集群。一个Region中的多个AZ间通过高速光纤相连,以满足用户跨AZ构建高可用性系统的需求。 项目 华为云的区域默认对应一个项目,这个项目由系统预置,用来隔离物理区域间的资源(计算资源、存储资源和网络资源),以默认项目为单位进行授权,用户可以访问您账号中该区域的所有资源。如果您希望进行更加精细的权限控制,可以在区域默认的项目中创建子项目,并在子项目中购买资源,然后以子项目为单位进行授权,使得用户仅能访问特定子项目中资源,使得资源的权限控制更加精确。 图1 项目隔离模型 父主题: 使用前必读
  • 响应参数 表2 响应参数说明 参数 参数类型 说明 error_detail String 如果运行出错会提示 result Object 如果运行正常会在该属性内给出结果 status String 任务运行状态,详情请参见表3 task_id String 任务id result_list Array of objects 切割方案列表 plan_info Array of objects 切割方案的统计信息列表 cut_file String 以字符串形式保存的切割方案文件 plan_name String 此方案序号(根据参数设置可给出多组方案) material_info String 统计信息,详情请参见表4 material_name String 材料名称 problem_id Int 按材料划分的问题序列号 表3 任务状态说明 状态 说明 waiting 在任务队列中,等待执行, 当等待时间超过一定时间,会超时,转为abnormal状态 running 任务正在执行 finished 任务成功运行结束,通过`result`获取结果 failed 任务执行出错,通过`error_detail`获取错误信息 abnormal 任务异常,可能是排队超时,可能是重试次数超时,可能是计算时间超时,通过`error_detail`获取错误信息 表4 统计信息响应参数说明 参数 单位 参数类型 说明 cut_length 米(m) float 切割长度 cut_sum - Int 切割刀数 cut_time 分钟(min) float 锯切时间 item_num - Int 开料件数 material - String 材料 program_num - Int 锯切图数量 run_program_num - Int 运行的锯切图数 rate 百分比(%) float 原材料利用率 sum_area 平方米(m2) float 原材料使用面积 sum_cost - Float 锯切成本 sum_plate_num - Int 原材料使用数量 sum_used_area 平方米(m2) float 原材料利用面积
  • 错误码说明 错误码 参数类型 说明 建议解决方法 optverse.00000001 基础错误 HTTP请求头的内容类型未设置 在请求头设置Content-Type为application/json。 optverse.00000002 基础错误 JSON数据解析失败 请检查输入数据是否符合JSON格式。 optverse.00000004 基础错误 服务当前不可用 服务当前正在启动,请稍候重试 optverse.00000005 基础错误 太多的并发请求 当前服务处理的请求数量已达到上限,请稍候重试 optverse.00000006 基础错误 输入数据校验失败 根据返回结果的错误提示改正数据后再重试 optverse.00009999 基础错误 未知错误 请联系华为云支持人员
  • 数值计算求解方法及类型 线性直接法:线性直接法是一种重要的求解线性方程组的手段,具有求解稳定性好、精度高的优点。 线性迭代法:基于Krylov子空间的迭代方法是一种重要的求解线性方程组的手段,尤其是对于大型稀疏矩阵的方程组,迭代法是求解线性方程组的优先选择。 预处理子:预处理技术试图改变系数矩阵的谱性质,将一个困难问题转化为另一个易于迭代求解的同解线性方程组。 非线性迭代法:基于迭代法实现CAE场景中非线性问题的高效快速求解。 特征值:高效求解CAE仿真场景中出现的大型稀疏矩阵的特征值问题。 AI4Solver: 利用人工智能技术加速传统数值计算引擎的求解过程。 云HPC高性能计算:支持云HPC高性能计算及云原生异构并行计算。
  • 应用场景 OptVerse是为客户提供生产运作、资源分配和管理效率优化的服务,通过数学规划和元启发式算法等多种优化引擎,以及不同的策略选择和约束场景,为用户构建高效、多样化的运筹优化解决方案和服务。运筹优化已运用于制造、运输、物流、金融服务、政府公用事业等各个领域。 数学优化求解器 适用于以下优化场景: 供应链领域中的生产计划与排程制定的优化求解能力 交通领域核心生产环节,涉及各种生产资源、机械、人员等计划与调度策略的优化求解能力 电力领域发电机组优化,资源调度,智能电网, 定价 ,电网设计,能源、碳配额交易 金融领域资产组合优化,对冲策略,风险管理 数值计算求解器 适用于以下场景: 流体仿真 电磁仿真 结构仿真 动力学仿真 高级计划与排程 适用于以下场景: 离散制造行业的生产计划与排程 流程制造行业的生产一体化排产 交通领域的运输计划与调度 二维切割 适用于以下切割场景: 家具板材切割 机械制造中的钢板、卷板等的切割 建筑领域的玻璃切割 服装领域的布料和皮革的剪裁
  • 二维切割服务优化方案需要多少时间? 单批次运行:以开料件数为700-1100件的批次为例。 定制产品(种类较多):成品种类在200以上,需要优化运行10-15分钟。 工程单(种类少,相同种类多):成品种类在50以下,需要优化运行5分钟以内。 多批次运行 每个批次需要占用服务器六个线程资源,32核云服务器可提供32线程,可支持5个批次同时运行。 同时运行六个批次及以上时,会在线程之间进行资源调度,需延长优化时间达到相同结果。 父主题: 应用性问题
  • 定义问题 根据业务的需求,一般需要定义的问题内容包括问题描述、已知参数、约束条件、优化目标。 问题描述:运筹优化算法所要解决的实际问题描述,例如计划生产的产品收益等。 已知参数:解决问题过程中的已知参数,例如生产原料,具备不同技能的生产工人、各种生产机器等。 约束条件:解决问题过程中的约束条件,例如每台机器不能连续生产20小时,每个工人不能连续工作16小时等。 优化目标:待解决的问题目标,例如最大化生产利润、最低运营成本等。
  • 二维切割服务提供的优化方案涉及哪些对比指标? 锯切图数量:切割图案的数量。 周期数:锯切图的周期 = 锯切图叠板数/最大叠板数(向上取整)。例如一张锯切图叠板数量为7,但是最大叠板数为4,则这张锯切图需要运行一次4张板,一次3张坂。则该锯切图的周期为2。 该指标适用于叠板率较高的场景,即工程单涉及该指标, 当锯切图数与周期数相等时略去此指标。 原材料用量:使用的大板数量。 使用原材料总面积:使用原材料大板的面积之和。 利用面积:开料成品小板的面积之和。 利用率: 利用面积 / 使用原材料总面积。 切割刀数:原材料边到边贯穿式切割的数量。 叠板率:使用原材料数量 / 周期数。 父主题: 应用性问题
  • 功能描述 OptVerse服务为用户提供数学规划求解器、数值计算求解器、高级计划与排程、二维切割等多种运筹优化和数值计算问题求解能力。简要介绍如下: 数学规划求解器:找到一组满足若干约束条件,且最优化目标函数取值的解。根据目标函数、约束和变量类型可划分为不同问题。OptVerse服务提供线性规划和混合整数线性规划问题的求解服务。 数值计算求解器:通过数值计算方法,高效求解CAE仿真底层的数学问题。OptVerse服务提供线性方程组的直接法和迭代法及预处理求解、非线性方程组的迭代求解、矩阵的特征值求解、智能加速求解以及基于云HPC的高性能计算服务。 高级计划与排程:以运筹学理论基础,旨在通过先进的算法和计算机系统,优化和解决生产制造过程中的计划、调度、产能、人员、物料等一系列问题,达成工厂智能化、精益化制造的目标。OptVerse服务提供生产计划、生产排程、运输计划等服务。 二维切割:在一定约束条件下,将一定数量的零件放置在指定的原料中,以达到最佳的利用率,减少原料的浪费。OptVerse服务提供服装切割、钣金切割、木材电子锯和雕刻机切割等服务。 父主题: 产品介绍
  • 步骤3:调用服务 Token认证。 在Postman界面上,单击左侧导航栏“get-token”,选中Body的配置项,添加华为云账户、密码及二维切割服务部署的区域“cn-north-4”。 获取token的华为云服务所在区域需要和调用的服务所在区域需一致,否则会导致调用失败。 图14 Token认证 单击右上角“Send”,发送“POST https://optverse.cn-north-4.myhuaweicloud.com/v3/auth/tokens”。获取返回结果中的token值(Token有效期为24小时)。 图15 Token值 调用二维切割服务。 单击左侧导航栏“OptVerse-2dcut-AddTask”,选中“Headers”配置项,复制获取的token值到“X-Auth-Token”。 图16 复制token 单击“Body”,查看已有的简单的输入数据,也可以根据API说明,填入自己的数据。 单击右上角“Send”按钮发送请求,返回异步计算的任务标识task_id,如图17所示。 图17 获取task_id 若输入数据错误则会提示错误原因,如图18所示。 图18 获取task_id失败 单击左侧导航栏“OptVerse-2dcut-QueryTask”,选中“Headers”配置项,复制token值到“X-Auth-Token”。 图19 查询任务 复制步骤c获取的task_id到API路径的末尾,如图19所示。 单击右上角“Send”按钮发送请求,若计算已完成,则返回任务结果,否则返回任务状态。 图20 发送请求
  • 前提条件 使用OptVerse服务之前,必须先申请华为云账号并进行实名认证。通过此账号,您可以使用所有华为云服务,并且只需为您所使用的服务付费。具体申请信息请见账号注册和实名认证。 使用Postman调用OptVerse服务的具体步骤如下: 步骤1:申请服务:用户在OptVerse管理控制台页面“服务列表”栏选择二维切割服务申请开通。 步骤2:配置环境:下载并安装Postman环境。 步骤3:调用服务:使用Postman调用API接口,查看返回结果或状态码与错误码。
  • 步骤1:申请服务 登录 a. 使用Chrome浏览器访问系统,打开登录页面。 图1 登录页 b. 输入华为云账号,用户名和密码 ,点击“登录”按钮, 登录成功后,进入OptVerse首页界面,如下图所示: 图2 OptVerse首页 套餐包管理(当前需要联系华为侧操作) a. 在使用OptVerse服务之前,用户需要进入套餐包管理页面点击购买套餐包,如下图所示: 图3 套餐包管理 b. 用户需要选择要使用的region(当前仅支持北京四)和服务,并选择总并发数进行分配,点击购买进行支付。 授权 a. 用户支付成功之后,进入授权管理页面,按照如下步骤创建自己的应用 图4 总览 图5 授权管理 图6 创建应用 图7 应用授权 图8 授权服务1 图9 授权服务2 获取AppCode a. 调用服务需要获取应用的AppCode及用户所在节点的ProjectId,点击对应的应用进入应用详情,复制AppCode,如下图所示: 图10 应用详情 b. 鼠标移动至右上角用户名处,之后在弹框中选在我的凭证跳转至用户API凭证页,复制用户所需项目的ProjectId,如下图所示: 图11 基本信息 图12 项目列表
  • OptVerse服务使用简介 华为云天筹求解器服务OptVerse以开放API(Application Programming Interface,应用程序编程接口)的方式提供天筹求解器功能,支持使用Postman方式调用华为云OptVerse服务。 您可以通过可视化工具Postman发送请求调用OptVerse服务API。该方式需要下载工具Postman并安装,熟悉工具使用方法。 调用API接口需要具备一定的编程开发能力,用户需要通过编程来处理识别结果。
  • 修订记录 发布日期 修订记录 2023-12-29 在线服务支持定时伸缩:扩缩容 升级、扩缩容支持自动停止功能:升级服务、扩缩容 优化AI应用基本信息:查看AI应用详情 2023-10-30 在线服务支持存储挂载功能。 在线服务支持重启功能。 2023-9-7 调整手册大纲。 将常见问题中的“AI应用的事件类型和事件信息”、“服务的事件类型和事件信息”章节迁移至本手册查看AI应用的事件和查看服务的事件 2023-8-1 新增修订记录章节。 新增从模板中选择元模型下线公告。 支持使用大模型创建AI应用部署在线服务的功能。
  • 创建边缘资源池 登录ModelArts管理控制台,在左侧菜单栏中选择“边缘资源池”。 单击“ 资源池”页签,进入资源池列表页。 单击“创建”,进入创建边缘资源池页面,参见下表填写参数。 表1 资源池信息参数 参数名称 说明 名称 边缘资源池名称。 描述 边缘资源池简要描述。 边缘节点类型 选择边缘节点的类型。目前支持ModelArts边缘节点和IEF边缘节点。 ModelArts边缘节点:即创建边缘节点创建的边缘节点。 主控节点:资源池中的控制节点,负责整个资源池的管理和控制。最多可添加3个主控节点。 最大工作节点数限制:资源池最多容纳的工作节点数。取值范围为1-64。 工作节点:资源池中的机器节点,运行由主控节点分配的工作。 说明: 主控节点和工作节点不能重合。 IEF边缘节点:即被IEF纳管的边缘节点。 资源实例类型:可选择专业版服务实例和一体机铂金实例类型。 边缘节点:边缘节点是您自己的边缘计算设备,用于运行边缘应用,处理您的数据,并安全、便捷地和云端应用进行协同。 确认配置无误后,单击“确认”,开始创建边缘资源池。
  • 注册证书 创建边缘节点成功后,需要注册节点证书。固件的操作系统不同,节点注册证书的方式不同。 Windows操作系统 前提条件:PC系统版本要求为Windows 10及以上。 解压6下载的固件压缩包,并运行程序。 将5下载的证书,拷贝到解压的文件目录下。 打开CMD命令行程序,切换到解压的文件目录下。 执行注册命令。 hdad.exe hdactl bind -p {证书名称} Linux操作系统 登录Linux机器后,将6下载的固件压缩包,拷贝到Linux机器的任意位置。 解压Agent固件压缩包并安装Agent。命令如下: tar -xvf {固件包名} 安装Agent固件。命令如下: sh {运行文件} 将5下载的证书,拷贝到固件解压包的文件目录下。 执行注册命令。 hdactl bind -p {证书名称}
  • 监控指标 监控数据见下表: 表1 监控指标 参数名称 参数说明 CPU使用率 服务和AI应用版本的CPU使用率。 内存使用率 服务和AI应用版本的内存使用率。 GPU使用率 使用GPU资源时显示。服务和AI应用版本的GPU使用率。 服务访问量 服务和AI应用版本的总的调用量。 成功率 服务和AI应用版本的调用成功率。 分钟级访问量 显示服务前一分钟的调用次数。 正常实例数/总实例数 服务的总实例数和正常实例数。
  • 查看监控信息 服务列表-监控列 方式1:服务创建完成后,在服务列表页面,您可以单击对应服务“监控”列的监控图标,底部会弹出服务的监控数据。单击选中服务所在行的空白处,可退出监控界面。 方式2:单击服务名称前面的复选框,展开列表页面底部的延展视图(未展开延展视图时,可单击页面底部浮层区域或右下角展开),将鼠标悬停在“监控”列的监控图标上,查看服务的监控数据。若单击该图标,可进入到服务详情页查看“监控信息”页签。 服务详情-监控信息页签 服务创建完成后,进入服务详情页,单击“监控信息”页签,查看服务和AI应用版本的监控数据详情。 当存在多个AI应用版本时,您需要单击“查看各灰度版本监控”,展开AI应用版本面板,查看AI应用版本监控数据详情。 如果您想查看更多更详细的监控指标,可以单击“查看服务监控详情”和“查看版本监控详情”,前往 云监控服务 控制台查看。您还可以设置服务和AI应用的告警规则,单击“设置告警策略”,前往 云监控 服务控制台,设置服务或AI应用版本的监控指标。 云监控平台监控您的ModelArts在线服务和对应模型负载,执行自动实时监控、告警和通知操作,帮助您更好地了解服务和模型的各项性能指标。了解云监控平台ModelArts监控,请参见ModelArts支持的监控指标。
  • 约束限制 服务升级关系着业务实现,不当的升级操作会导致升级期间业务中断的情况,请谨慎操作。 ModelArts支持部分场景下在线服务进行无损滚动升级。按要求进行升级前准备,做好验证,即可实现业务不中断的无损升级。 支持在线服务无损升级的场景请参见表1。 异步在线服务仅支持滚动升级(扩实例)的升级模式。 表1 支持无损升级的场景 创建AI应用的元模型来源 服务使用的是公共资源池 服务使用的是专属资源池 从训练中选择元模型 不支持 不支持 从模板中选择元模型 不支持 不支持 从容器镜像中选择元模型 不支持 支持 镜像需要满足创建AI应用的 自定义镜像 规范。 须知: AI应用的版本有如下操作,不支持无损滚动升级: 没有配置健康检查; 修改了接口协议。例如:把http协议修改为https协议; 修改了模型的端口; 从OBS中选择元模型 不支持 不支持
  • corn表达式 通过设置cron表达式,触发自动扩缩容。corn表达式由5个时间字段组成:分钟 小时 日 月 星期,如“30 10 15 * *”表示每月15日上午10:30触发,请根据当地时区进行设置。 图2 corn表达式语法 时间参数说明 表3 时间参数说明 名称 可选值 可选特殊字符 分 0-59 * , - / 小时 0-23 * , - / 日 1-31 * , - / 月 1-12 或 JAN-DEC * , - / 星期 0-6 或 SUN-SAT * , - / 特殊符号说明 表4 特殊符号说明 特殊符号 说明 通配符(*) 代表任意值,例如:0 0 1 * * 代表每月1号的0点整。 逗号(,) 用于分隔列表项。例如:0 12,16 * * * 代表每天的12:00 和16:00。 连字符(-) 代表一段取值范围。例如: 0 12-16 * * * 代表每天的12:00到16:00。 斜杠(/) 代表范围增量,例如: */10 * * * * 代表每小时的 0分、10分、20分、30分、40分和40分。斜杠可以和连字符配合使用,例如 3-59/15 * * * * 代表每小时从3分到59分钟之间,每隔15分钟取一个值,有效时间点可以是 0:03,0:18,0:43,0:58。
  • 扩缩容简介 ModelArts在线服务当前提供两种方式的扩缩容方式,手动扩缩容和自动扩缩容,应对用户多样化的需求。目前只支持对单个AI应用实例数进行修改。 手动扩缩容:用户可以手动触发在线服务扩缩容,支持对单个AI应用的实例数量进行修改,减少修改实例数的耗时。 自动扩缩容:用户可以设置弹性伸缩策略,根据设置的策略对实例数进行修改,提高资源利用率。手动扩缩容,用户可以设置合理的弹性伸缩策略,在高、低峰时间段自动对实例进行扩容或缩容的操作,进而提高资源的利用率。 表1 手动扩缩容和自动扩缩容差异对比 伸缩类型 手动扩缩容 自动扩缩容 配置方式 手动 自动 配置内容 修改计算节点个数 设置伸缩策略 执行方式 手动配置后执行 定期触发或指标触发 伸缩失败后的表现 回滚到扩缩容之前的实例个数 按实际扩缩的实例个数为准 父主题: 扩缩容
  • 边缘资源池简介 边缘资源池是边缘服务部署专用的资源池,是租户边缘侧的运行节点集合。推理服务在边缘池上运行,用户创建对应异步服务或边缘同步服务后,边缘服务会调度选择合适的节点运行异步算法容器,进行异步服务或边缘同步服务的处理。 节点 边缘节点是ModelArts平台提供的用于部署边缘服务的终端设备。创建边缘资源池之前需要先创建ModelArts边缘节点并激活节点。 资源池 边缘资源池是边缘服务部署专用的资源池。创建边缘资源池时,可以添加ModelArts边缘节点设备,也可以添加IEF纳管的边缘节点设备。 图1 创建边缘资源池流程图 父主题: 边缘资源池
  • 背景信息 可以通过创建图片样式对图片进行剪切、压缩、添加水印等处理。对于需要相同处理操作的多张图片,可以通过创建样式避免重复的设置操作。创建成功的样式可以被桶中的多张图片使用。 在创建样式过程中,可以在右侧的样例图片中实时看到设置的样式效果。 使用RESTful API接口访问时,可以在URL中直接调用样式名称对图片进行处理,避免输入复杂的处理命令。接口访问的 域名 规则请参见样式访问方式。 每个桶您最多可以创建100个样式。 您可以新建图片处理样式,也可以从其他桶复制已有图片处理样式。
  • GAUSS-01481 -- GAUSS-01490 GAUSS-01481: "parameter '%s' cannot be set in a secondary extension control file" SQLSTATE: 42601 错误原因:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在secondary control file中指定了default_version或者directory参数。 解决办法:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,不能在secondary control file中指定default_version或者directory参数。 GAUSS-01482: "parameter '%s' requires a Boolean value" SQLSTATE: 22023 错误原因:"(1)CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中没有给参数relocatable/sysadmin指定一个BOOL值。 解决办法:"(1)CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中,必须给参数relocatable/sysadmin指定一个BOOL值。 GAUSS-01483: "'%s' is not a valid encoding name" SQLSTATE: 42704 错误原因:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中没有给参数encoding指定一个合法的encoding名字。 解决办法:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中必须给参数encoding指定一个合法的encoding名字。 GAUSS-01484: "parameter '%s' must be a list of extension names" SQLSTATE: 22023 错误原因:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中没有给参数requires指定a list of extension names 解决办法:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中必须给参数requires指定a list of extension names GAUSS-01485: "unrecognized parameter '%s' in file '%s'" SQLSTATE: 42601 错误原因:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中指定了非法参数。 解决办法:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中仅可指定如下参数。directory/default_version/module_pathname/comment/schema/relocatable/sysadmin/encoding/requires。 GAUSS-01486: "parameter 'schema' cannot be specified when 'relocatable' is true" SQLSTATE: 42601 错误原因:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中,当指定relocatable为true时,同时又指定了schema参数。 解决办法:CREATE EXTENSION时或ALTER EXTENSION时或执行EXTENSION相关的系统函数时,在控制文件中,当指定relocatable为true时,不能再指定了schema参数。 GAUSS-01487: "transaction control statements are not allowed within an extension script" SQLSTATE: 0A000 错误原因:CREATE EXTENSION时或ALTER EXTENSION时,EXTENSION的SQL脚本文件中出现了控制事务的SQL语句。 解决办法:CREATE EXTENSION时或ALTER EXTENSION时,EXTENSION的SQL脚本文件中不能使用控制事务的SQL语句。 GAUSS-01488: "permission denied to create extension '%s'" SQLSTATE: 42501 错误原因:CREATE EXTENSION时,EXTENSION的控制文件要求必须以系统管理员权限运行,但是实际账户不是系统管理员。 解决办法:CREATE EXTENSION时,EXTENSION的控制文件要求必须以系统管理员权限运行,则实际账户也必须是系统管理员。 GAUSS-01489: "permission denied to update extension '%s'" SQLSTATE: 42501 错误原因:ALTER EXTENSION时,EXTENSION的控制文件要求必须以系统管理员权限运行,但是实际账户不是系统管理员。 解决办法:ALTER EXTENSION时,EXTENSION的控制文件要求必须以系统管理员权限运行,则实际账户也必须是系统管理员。 GAUSS-01490: "extension '%s' has no update path from version '%s' to version '%s'" SQLSTATE: 22023 错误原因:CREATE EXTENSION/ALTER EXTENSION时,不存在从旧版本到新版本的更新路径。 解决办法:CREATE EXTENSION/ALTER EXTENSION时,如果有版本FROM old_version、UPDATE TO new_version,确保新旧版本号对应的SQL文件名称和路径的正确性。 父主题: GAUSS-01401 -- GAUSS-01500
共100000条