华为云用户手册

  • 安装硬件设备 根据部署规划时的网络设备安装点位设计、设备间互联等信息,完成网络设备的硬件安装、连线、上电等操作,具体指导文档请参见表1。 表1 硬件安装与布线任务一览表 任务 任务说明 参考链接 安装硬件设备 硬件设备安装需要遵循施工规范,常见的硬件施工规范有: 物理设备必须可靠接地。 物理设备谨慎搬运,要连带外纸箱或泡沫垫,不要裸机搬运。 所有光纤、网线、高速电缆和电源线分开布线,规范折弯有序捆扎。 所有光纤、网线和电源线需要考虑长度和传输距离是否能够满足环境的需求。 请单击以下设备名称,进入“硬件安装与维护指南”手册,查看对应设备款型的安装指导。 若无法找到,请在搜索框中输入设备款型查找安装指导。 AR 连接线缆 根据布线规划完成线缆连接,连接时注意按照规范在线缆两端打上标签。 设备配电、上电 请按照规划的配电参数和各个产品的产品文档来执行设备上电操作。 父主题: 配置前准备
  • 部署流程 表1 部署流程 部署任务 子任务 配置前准备 开通云管理网络服务 安装华为乾坤APP(可选) 安装硬件设备 AR开局部署 开启SD-WAN服务 创建站点并添加设备 配置网络设计参数 配置WAN链路模板 配置站点接入WAN侧网络的链路 配置NTP 配置站点连接RR 邮件开局 确认开局成功 站点互联配置 配置Underlay网络 创建Overlay网络 确认配置是否成功 配置站点上网策略 应用管理 查看预定义应用 创建自定义应用 创建应用组 使用应用及应用组 业务体验优化策略 配置流量分配 配置Overlay ACL策略 配置QoS策略 配置智能选路策略 查看全网数据 查看全网数据 父主题: 部署指导
  • 前提条件 数据已完成准备:已在ModelArts中创建状态“正常”可用的AI应用。 已在IEF上创建边缘节点。如果您未创建边缘节点,具体操作请参见创建边缘节点。 确认用户的委托权限已包含Tenant Administrator权限。由于边缘服务依赖IEF纳管的边缘节点,而使用IEF服务需要授予 IAM 用户Tenant Administrator权限,所以若ModelArts委托不包含Tenant Administrator权限时,将导致边缘服务部署失败。 在ModelArts管理控制台,左侧导航栏选择“全局配置”,进入全局配置列表页。 在用户名对应的“操作”列,单击“查看权限”,在“权限详情”弹出框中确认委托权限已包含Tenant Administrator。 图1 查看委托权限详情 由于在线运行需消耗资源,确保帐户未欠费。
  • 最佳实践 免费体验 :一键完成商超商品识别模型部署:ModelArts的AI Gallery中提供了大量免费的模型供用户一键部署,进行AI体验学习。 使用 自定义镜像 创建AI应用:提供了在ModelArts平台使用自定义镜像导入模型的样例,帮助您快速熟悉平台的使用方法。 纳管Atlas 500,将模型部署为边缘服务:Atlas人工智能计算平台,是基于华为昇腾系列AI处理器,打造面向“端、边、云”的全场景AI基础设施方案。配合Atlas系列边缘设备,华为云智能边缘服务(IEF)和 AI开发平台 (ModelArts)结合,将构建的AI模型快速部署至Atlas设备中,满足在安防、交通、社区、园区、 商场、超市等复杂环境区域的应用需求。 推理服务访问公网:提供了推理服务访问公网的方法。 推理服务端到端运维:ModelArts推理服务的端到端运维覆盖了算法开发、服务运维和业务运行的整个AI流程。 使用自定义引擎创建AI应用:用户可以通过选择自己存储在SWR服务中的镜像作为AI应用的引擎,指定预先存储于OBS服务中的文件目录路径作为模型包,来创建AI应用,轻松地应对ModelArts平台预置引擎无法满足个性化诉求的场景。 推理服务支持虚拟私有云(VPC)直连的高速访问通道:使用VPC直连的高速访问通道,用户的业务请求不需要经过推理平台,而是直接经VPC对等连接发送到实例处理,访问速度更快。 WebSocket在线服务全流程开发:用户在部署在线服务时如果选择了“升级为WebSocket”,服务部署完成后,API接口公网地址将是一个WebSocket协议地址。本案例介绍WebSocket在线服务全流程开发过程。 使用大模型创建AI应用部署在线服务:目前大模型的参数量已经达到千亿甚至万亿,随之大模型的体积也越来越大。千亿参数大模型的体积超过200G,在版本管理、生产部署上对平台系统产生了新的要求。例如:导入AI应用管理时,需要支持动态调整租户存储配额;模型加载、启动慢,部署时需要灵活的超时配置;当负载异常重启,模型需要重新加载,服务恢复时间长的问题亟待解决。为了应对如上诉求,ModelArts推理平台针对性给出解决方案,用于支持大模型场景下的AI应用管理和服务部署。 TFServing框架迁移到推理自定义引擎:从TFServing迁移到使用ModelArts推理的AI应用管理和服务管理时,需要对原生TFServing镜像的构建方式做一定的改造,以使用ModelArts推理平台的模型版本管理能力和动态加载模型的部署能力。本案例将一步一步指导用户完成原生TFServing镜像到ModelArts推理自定义引擎的改造。
  • 计费说明 需求管理不支持单独购买,开通CodeArts基础版或购买CodeArts专业版即可使用需求管理服务。 CodeArts基础版/专业版介绍请参考计费说明。 详细计费规则与使用额度请参考需求管理产品价格详情。 CodeArts基础版、专业版于2020年10月推出,目前只开放给CodeArts新用户与存量免费体验用户。 新用户定义:在华为云当前区域未开通过CodeArts按需服务组合、单个服务的按需,未购买过CodeArts包月套餐包(1元/1000元),未创建过任何CodeArts项目和资源。 在此之前已开通CodeArts服务组合或单个服务的用户仍沿用旧版计费方式,后续将支持此类用户购买基础版、专业版,过渡至新计费模式。旧版计费详情请参见旧版计费方式说明,开通方式请参考旧版本开通/关闭按需计费方式说明。
  • 身份认证 用户访问需求管理的方式有多种,包括需求管理用户界面、API、SDK,无论访问方式封装成何种形式,其本质都是通过需求管理提供的REST风格的API接口进行请求。 需求管理的接口需要经过认证请求后才可以访问成功。 需求管理支持两种认证方式: Token认证:通过Token认证调用请求,访问需求管理用户界面默认使用Token认证。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。推荐使用AK/SK认证,其安全性比Token认证要高。 关于认证鉴权的详细介绍及获取方式,请参见认证鉴权。
  • 添加VPC访问CAE环境配置 如果要使用此功能,您需要在使用具备“安全管理员 Security Administrator 权限”的华为云账号、访问CAE页面单击“授权”,才能使用此功能,未授权不影响已有功能。 登录CAE控制台。 在左侧导航栏中选择“系统设置”。 单击“系统网络配置”模块中的“编辑”,进入“系统网络配置”页面。 在“CAE与VPC网络连通性配置”模块中,单击“添加配置”。 在下拉框中选择子网,单击“确定”。 VPC固定为创建环境时关联的VPC,子网选择环境所属子网。 目前只支持添加一条配置。 图4 配置VPC访问CAE环境
  • 操作步骤 使用创建组织合规规则包的组织帐号登录管理控制台。 单击页面左上角的图标,在弹出的服务列表中,选择“管理与监管”下的“配置审计 Config”。 单击页面左侧的“合规规则包”,进入“合规规则包”页面。 选择“组织合规规则包”页签,在组织合规规则包列表中单击操作列的“删除”。 在弹出的确认框中单击“确定”,完成组织合规规则包的删除。 组织合规规则包删除后,此组织合规规则包部署的成员帐号的合规规则包列表中也将自动删除此合规规则包。 图1 删除组织合规规则包
  • MFS和 SMN 服务对比 MFS和SMN服务的主要不同点,如下表所示。 表1 服务差异说明 差异 MFS SMN 区域限制 “华北-北京一”和“华东-上海二”区域不支持使用MFS。 无 时效性 高,一般在5分钟以内。 中等,全局高峰期会出现排队现象,偶发十分钟以上的延迟。 计费 免费 SMN将对发送的 消息通知 单独计费,具体的计费标准请参考SMN价格详情。 通知方式 仅支持发送REST消息。 支持发送短信、邮件、REST等多类型的消息。 JSON消息体 JSON消息体示例如图1所示。 JSON消息体示例如图2所示。 图1 MFS的JSON消息体 图2 SMN的JSON消息体
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 node_list Array of ClusterNodeInfo objects 逻辑集群节点列表。 count Integer 逻辑集群节点总数。 failed_count Integer 逻辑集群节点失败总数。 表4 ClusterNodeInfo 参数 参数类型 描述 id String 节点ID。 name String 节点名称。 status String 节点状态。 sub_status String 节点子状态。 spec String 节点规格。 inst_create_type String 实例创建类型。 alias_name String 节点别名。 az_code String 可用区编码。
  • URI GET /v2/{project_id}/clusters/{cluster_id}/nodes 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 cluster_id 是 String 集群ID。获取方法,请参见获取集群ID。 表2 Query参数 参数 是否必选 参数类型 描述 deleted 否 String 是否被删除,true/false。 node_ids 否 Array 节点ID列表。 offset 否 Integer 分页查询,偏移。 limit 否 Integer 分页查询,每页显示的条目数量。 filter_by 否 String 过滤字段。 filter 否 String 过滤字段内容。 order_by 否 String 排序字段。 order 否 String 排序:升序/降序。
  • 响应示例 状态码: 200 查询集群节点信息成功 { "node_list" : [ { "id" : "16413746-258e-4a3c-bea9-8496fdbefde3", "name" : "ty-default--BGy6PUIN-K-dws-cn-cn-2-1", "status" : "ACTIVE", "sub_status" : "CREATED", "spec" : "dws2.kc1.2xlarge", "inst_create_type" : null, "alias_name" : null, "az_code" : "cn-north-4c" }, { "id" : "46d8754b-3ed3-4b92-85b5-7479ef5b10ac", "name" : "ty-default--BGy6PUIN-K-dws-cn-cn-1-1", "status" : "ACTIVE", "sub_status" : "CREATED", "spec" : "dws2.kc1.2xlarge", "inst_create_type" : null, "alias_name" : null, "az_code" : "cn-north-4c" } ], "count" : 2, "failed_count" : 0 }
  • 响应示例 状态码: 200 查询集群拓扑ring环节点信息成功 { "cluster_rings" : [ { "instance_info_lists" : [ { "id" : "a57e49db-c04b-45c7-9863-f7b6f3eed1b8", "name" : "ty-default--BGy6PUIN-K-dws-cn-cn-1-1", "manage_ip" : "172.16.26.233", "traffic_ip" : "192.168.0.217", "internal_ip" : "172.16.66.153", "internal_mgnt_ip" : null, "eip" : null, "elb" : null, "status" : 200, "az_code" : "cn-north-4c" }, { "id" : "3a37f794-be37-42d1-a299-a3eb94888ccb", "name" : "ty-default--BGy6PUIN-K-dws-cn-cn-2-1", "manage_ip" : "172.16.34.21", "traffic_ip" : "192.168.0.80", "internal_ip" : "172.16.65.89", "internal_mgnt_ip" : null, "eip" : null, "elb" : null, "status" : 200, "az_code" : "cn-north-4c" }, { "id" : "8763cbf1-5851-44a5-9e71-cbae35201f27", "name" : "ty-default--BGy6PUIN-K-dws-dn-1-1", "manage_ip" : "172.16.9.16", "traffic_ip" : "192.168.0.88", "internal_ip" : "172.16.67.64", "internal_mgnt_ip" : null, "eip" : null, "elb" : null, "status" : 200, "az_code" : "cn-north-4c" } ] } ], "count" : 1 }
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 cluster_rings Array of TopoRingInfo objects 集群拓扑环列表信息。 count Integer 集群环数量。 表4 TopoRingInfo 参数 参数类型 描述 instance_info_lists Array of TopoInstanceInfo objects 集群实例列表信息。 表5 TopoInstanceInfo 参数 参数类型 描述 id String 实例ID。 name String 实例名称。 manage_ip String 实例管理IP。 traffic_ip String 业务IP。 internal_ip String 内部通信IP。 internal_mgnt_ip String 内部管理IP。 eip String EIP。 elb String elb地址。 status String 实例状态。 az_code String 可用区编码。
  • URI GET /v2/{project_id}/clusters/{cluster_id}/topo/rings 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 cluster_id 是 String 集群ID。获取方法,请参见获取集群ID。 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 分页查询,偏移。 limit 否 Integer 分页查询,每页显示的条目数量。
  • 响应示例 状态码: 200 查询集群列表成功。 { "logical_clusters" : [ { "logical_cluster_id" : "fa9d69a0-3814-4fb9-98df-d9f4f5ef53ca", "logical_cluster_name" : "elastic_group", "cluster_rings" : [ { "ring_hosts" : [ { "host_name" : "host-172-16-20-246", "back_ip" : "172.16.73.90", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-4-26", "back_ip" : "172.16.123.5", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-43-90", "back_ip" : "172.16.92.175", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 } ] } ], "status" : "Normal", "first_logical_cluster" : false, "action_info" : { "progress" : 100, "completed" : true, "result" : "success", "logs" : null, "action_name" : "Grow", "start_time" : "2023-06-05 01:58:43", "end_time" : "2023-06-05 02:11:50" }, "edit_enable" : true, "restart_enable" : true, "delete_enable" : false, "add_to_elastic" : true, "mode" : null, "cluster_type" : null } ], "count" : 1, "add_enable" : true }
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 logical_clusters Array of LogicalClusterInfo objects 逻辑集群列表信息。 count Integer 逻辑集群总数量。 add_enable Boolean 作为互斥结果,如果集群内有其他运维操作,该值为false,此时不能添加逻辑集群。 表4 LogicalClusterInfo 参数 参数类型 描述 logical_cluster_id String 逻辑集群ID。 logical_cluster_name String 逻辑集群名称。 cluster_rings Array of ClusterRing objects 逻辑集群主机信息。 status String 逻辑集群状态。 first_logical_cluster Boolean 是否为第一个逻辑集群。第一个创建或者转换的逻辑集群不能删除,因为其中包含了一些系统视图。 action_info ActionInfo object 逻辑集群操作信息。 edit_enable Boolean 是否允许编辑。 restart_enable Boolean 是否允许重启。 delete_enable Boolean 是否允许删除。 add_to_elastic Boolean 是否允许弹性伸缩。 mode String 逻辑集群模式。 waiting_for_killing Integer 等待被销毁。 cluster_type String 集群类型。 表5 ClusterRing 参数 参数类型 描述 ring_hosts Array of RingHost objects 集群主机信息。 表6 RingHost 参数 参数类型 描述 host_name String 主机名称。 back_ip String 后端IP地址。 cpu_cores Integer 主机CPU核数。 memory Double 主机内存。 disk_size Double 主机磁盘大小。 表7 ActionInfo 参数 参数类型 描述 action_name String 操作名称。当前允许操作如下: Create:创建 Expand:扩容 Restart:重启 Delete:删除 Shrink:缩容 progress Integer 操作进度,默认10。 completed Boolean 是否完成操作。 start_time String 操作开始时间。 end_time String 操作结束时间。 result String 操作结果。success或者failed,默认空字符串。 logs String 操作日志。
  • URI GET /v2/{project_id}/clusters/{cluster_id}/logical-clusters 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 cluster_id 是 String 集群ID。获取方法,请参见获取集群ID。 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 分页查询,偏移。 limit 否 Integer 分页查询,每页显示的条目数量。
  • 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 logical_cluster 是 CreateLogicalClusterInfo object 创建逻辑集群信息。 表3 CreateLogicalClusterInfo 参数 是否必选 参数类型 描述 logical_cluster_name 是 String 逻辑集群名称。 cluster_rings 是 Array of ClusterRing objects 逻辑集群环信息。 表4 ClusterRing 参数 是否必选 参数类型 描述 ring_hosts 是 Array of RingHost objects 集群主机信息。 表5 RingHost 参数 是否必选 参数类型 描述 host_name 是 String 主机名称。 back_ip 是 String 后端IP地址。 cpu_cores 是 Integer 主机CPU核数。 memory 是 Double 主机内存。 disk_size 是 Double 主机磁盘大小。
  • 请求示例 POST https://{Endpoint}/v2/9b06d044ea4f49f1a58b2bed2b0084bd/clusters/9b7ff56b-47b3-4d00-a1fd-4c023d34404b/logical-clusters { "logical_cluster" : { "logical_cluster_name" : "v3_logical", "cluster_rings" : [ { "ring_hosts" : [ { "host_name" : "host-172-16-20-246", "back_ip" : "172.16.73.90", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-4-26", "back_ip" : "172.16.123.5", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-4-26", "back_ip" : "172.16.123.5", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 } ] } ] } }
  • URI POST /v2/{project_id}/clusters/{cluster_id}/logical-clusters/{logical_cluster_id}/restart 表1 路径参数 参数 是否必选 参数类型 描述 cluster_id 是 String 指定重启集群的ID。获取方法,请参见获取集群ID。 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 logical_cluster_id 是 String 指定待重启逻辑集群的ID。
  • 请求示例 GET https://{Endpoint}/v2/9b06d044ea4f49f1a58b2bed2b0084bd/clusters/9b7ff56b-47b3-4d00-a1fd-4c023d34404b/logical-clusters/tasks?offset=0&limit=10&logical_cluster_name=test_logical&type=Expand&order_by=startTime&order=DESC
  • URI GET /v2/{project_id}/clusters/{cluster_id}/logical-clusters/tasks 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 cluster_id 是 String 集群ID。获取方法,请参见获取集群ID。 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 分页查询,偏移。 limit 否 Integer 分页查询,每页显示的条目数量。 logical_cluster_name 否 String 集群名称。 type 否 String 类型。 order_by 否 String 排序字段。 order 否 String 排序:升序/降序。
  • 响应示例 状态码: 200 查询任务信息成功。 { "logical_cluster_tasks" : [ { "type" : "Grow", "logical_cluster_name" : "elastic_group", "start_time" : "2023-06-05 01:58:43", "end_time" : "2023-06-05 02:11:50", "result" : "success", "log" : "Expand from outside success" }, { "type" : "Create", "logical_cluster_name" : "test_logical", "start_time" : "2023-06-21 08:35:58", "end_time" : "2023-06-21 08:36:14", "result" : "failed", "log" : "list index out of range\\nChecking whether the reentry command is consistent with the previous command." } ], "count" : 2 }
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 logical_cluster_tasks Array of LogicalClusterTaskInfo objects 逻辑集群任务信息。 count Long 逻辑集群任务总数。 表4 LogicalClusterTaskInfo 参数 参数类型 描述 type String 任务类型。 logical_cluster_name String 逻辑集群名称。 start_time String 任务开始时间。 end_time String 任务结束时间。 result String 任务执行结果。 log String 任务执行日志。
  • URI GET /v2/{project_id}/clusters/{cluster_id}/logical-clusters/rings 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 cluster_id 是 String 集群ID。获取方法,请参见获取集群ID。 表2 Query参数 参数 是否必选 参数类型 描述 offset 否 Integer 分页查询,偏移。 limit 否 Integer 分页查询,每页显示的条目数量。
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 cluster_rings Array of LogicalClusterRingInfo objects 集群环列表信息。 count Integer 集群环数量。 表4 LogicalClusterRingInfo 参数 参数类型 描述 ring_hosts Array of RingHost objects 集群主机环信息。 表5 RingHost 参数 参数类型 描述 host_name String 主机名称。 back_ip String 后端IP地址。 cpu_cores Integer 主机CPU核数。 memory Double 主机内存。 disk_size Double 主机磁盘大小。
  • 响应示例 状态码: 200 查询逻辑集群可用ring环节点信息成功 { "cluster_rings" : [ { "ring_hosts" : [ { "host_name" : "host-172-16-20-246", "back_ip" : "172.16.73.90", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-4-26", "back_ip" : "172.16.123.5", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-43-90", "back_ip" : "172.16.92.175", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 } ] } ], "count" : 1 }
  • URI POST /v2/{project_id}/clusters/{cluster_id}/convert-to-logical-cluster/{name} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID。获取方法,请参见获取项目ID。 cluster_id 是 String 集群ID。获取方法,请参见获取集群ID。 name 是 String 逻辑集群名称。
  • 请求示例 PUT https://{Endpoint}/v2/89cd04f168b84af6be287f71730fdb4b/clusters/4ca46bf1-5c61-48ff-b4f3-0ad4e5e3ba90/logical-clusters/0b494d0d-8431-4c4f-8a06-2cc42d0d0c7d { "cluster_rings" : [ { "ring_hosts" : [ { "host_name" : "host-172-16-20-246", "back_ip" : "172.16.73.90", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-4-26", "back_ip" : "172.16.123.5", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 }, { "host_name" : "host-172-16-43-90", "back_ip" : "172.16.92.175", "cpu_cores" : 8, "memory" : 32.0, "disk_size" : 800.0 } ] } ], "mode" : null, "waiting_for_killing" : 0 }
共100000条