华为云用户手册

  • 请求示例 更新应用,更新应用cpu资源为1C,内存资源为1G https://eihealth.cn-north-4.myhuaweicloud.com/v1/{project_id}/eihealth-projects/{eihealth_project_id}/apps/{app_id} { "name" : "demo-app", "version" : "1.0.0", "summary" : "summary", "description" : "description", "labels" : [ "labelA", "labelB" ], "image" : "gwj-test-01/busybox:latest", "commands" : [ "echo eihealth;" ], "resources" : { "cpu_type" : "X86", "cpu" : "1C", "memory" : "1G", "gpu_type" : "GPU", "gpu" : 0 }, "inputs" : [ { "name" : "dir-parameter", "description" : "parameter description", "required" : true, "concurrent" : "vars_iter", "type" : "DIRECTORY", "pattern" : "*.fastq", "values" : [ "/test" ] } ], "outputs" : [ { "name" : "dir-parameter", "description" : "parameter description", "required" : true, "type" : "DIRECTORY", "pattern" : "*.fastq", "values" : [ "/test" ] } ], "node_labels" : [ "health.node" ], "icon" : "data:image/png;base64,xxxxx" }
  • 请求示例 更新自动作业,更新自动作业的名称为demo-auto-job,使用的数据库列为user_name。 https://eihealth.cn-north-4.myhuaweicloud.com/v1/{project_id}/eihealth-projects/{eihealth_project_id}/auto-jobs { "name" : "demo-auto-job", "description" : "description", "database_id" : "2adc4b5fbeeb4a518f177167074a5fb2", "database_column" : "user_name", "database_column_type" : "NEW", "clean_database_column" : false, "database_trigger" : [ { "name" : "status", "judge_mode" : "gte", "value" : "100" } ], "tool_id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "tool_type" : "workflow", "job_name" : "demo-job", "job_name_type" : "AUTO", "job_description" : "description", "labels" : [ "labelA", "labelB" ], "priority" : 0, "timeout" : 1440, "output_dir" : "/job", "output_dir_type" : "MANUAL", "node_labels" : [ "health.node" ], "io_acc_id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "tasks" : [ { "task_name" : "app1-1", "inputs" : [ { "name" : "dir-parameter", "source" : "MANUAL", "values" : [ "/test" ] } ], "resources" : { "cpu" : "1C", "cpu_type" : "X86", "memory" : "1G", "gpu_type" : "GPU", "gpu" : "0" }, "io_acc_type" : "SFS" } ] }
  • URI PUT /v1/{project_id}/eihealth-projects/{eihealth_project_id}/auto-jobs/{auto_job_id} 表1 路径参数 参数 是否必选 参数类型 描述 eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。 最小长度:1 最大长度:128 auto_job_id 是 String 自动作业id 最小长度:1 最大长度:128
  • 响应示例 状态码: 200 OK { "id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "name" : "demo-app", "version" : "1.0.0", "summary" : "summary", "description" : "description", "labels" : [ "labelA", "labelB" ], "image" : "gwj-test-01/busybox:latest", "commands" : [ "echo eihealth;" ], "resources" : { "cpu_type" : "X86", "cpu" : "1C", "memory" : "1G", "gpu_type" : "GPU", "gpu" : 0 }, "inputs" : [ { "name" : "dir-parameter", "description" : "parameter description", "required" : true, "concurrent" : "var_iter", "type" : "DIRECTORY", "pattern" : "*.fastq", "values" : [ "/test" ] } ], "outputs" : [ { "name" : "dir-parameter", "description" : "parameter description", "required" : true, "type" : "DIRECTORY", "pattern" : "*.fastq", "values" : [ "/test" ] } ], "create_time" : "2021-01-30T02:34:36Z", "update_time" : "2021-01-30T02:53:26Z", "user_name" : "gwj-test-01", "source_project_name" : "null", "source_resource_id" : "null", "node_labels" : [ "health.node" ], "icon" : "data:image/png;base64,xxxxx" }
  • URI GET /v1/{project_id}/eihealth-projects/{eihealth_project_id}/apps/{app_id} 表1 路径参数 参数 是否必选 参数类型 描述 app_id 是 String 应用id 最小长度:1 最大长度:128 eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。 最小长度:1 最大长度:128
  • 请求示例 创建自动作业,自动作业名称为demo-auto-job,使用如下数据库,使用数据库列为user_name。 https://eihealth.cn-north-4.myhuaweicloud.com/v1/{project_id}/eihealth-projects/{eihealth_project_id}/auto-jobs { "name" : "demo-auto-job", "description" : "description", "database_id" : "2adc4b5fbeeb4a518f177167074a5fb2", "database_column" : "user_name", "database_column_type" : "NEW", "clean_database_column" : false, "database_trigger" : [ { "name" : "status", "judge_mode" : "gte", "value" : "100" } ], "tool_id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "tool_type" : "workflow", "job_name" : "demo-job", "job_name_type" : "AUTO", "job_description" : "description", "labels" : [ "labelA", "labelB" ], "priority" : 0, "timeout" : 1440, "output_dir" : "/job", "output_dir_type" : "MANUAL", "node_labels" : [ "health.node" ], "io_acc_id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "tasks" : [ { "task_name" : "app1-1", "inputs" : [ { "name" : "dir-parameter", "source" : "MANUAL", "values" : [ "/test" ] } ], "resources" : { "cpu" : "1C", "cpu_type" : "X86", "memory" : "1G", "gpu_type" : "GPU", "gpu" : "0" }, "io_acc_type" : "SFS" } ] }
  • 响应示例 状态码: 201 CREATED { "id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "app_infos" : [ { "app_id" : "baabcb56-5bb6-11eb-8a0d-fa163e3ddba1", "app_name" : "demo-app", "app_version" : "1.0.0", "app_node_labels" : [ "health.node" ] } ], "job_info" : { "job_name" : "demo-job", "job_node_labels" : [ "health.node" ] } }
  • URI POST /v1/{project_id}/eihealth-projects/{eihealth_project_id}/auto-jobs 表1 路径参数 参数 是否必选 参数类型 描述 eihealth_project_id 是 String 平台项目ID,您可以在平台单击所需的项目名称,进入项目设置页面查看。 最小长度:1 最大长度:128 project_id 是 String 华为云项目ID,您可以从获取项目ID中获取。 最小长度:1 最大长度:128
  • 健康状态类图表(蜂巢图和表格) 健康状态类图表支持将关注的一个或多个阈值规则、主机或组件的状态信息分别置于同一图表中监控,并以蜂巢图或表格形式展示。 阈值状态图表:实时监控阈值规则的状态,阈值状态图表仅支持表格形式展示,最多可添加10条阈值监控数据。 图15 阈值状态图表 添加阈值状态图表前请先创建指标告警规则。 主机状态图表:实时监控主机的状态。主机状态图表支持蜂巢图或表格形式展示,最多可添加10条主机监控数据。 图16 主机状态图表-蜂巢图 图17 主机状态图表-表格 组件状态图表:实时监控组件的状态。组件状态图表支持蜂巢图或表格形式展示,最多可添加10条组件监控数据。 图18 组件状态图表-蜂巢图 图19 组件状态图表-表格
  • 基础指标:IEF指标 介绍IEF服务上报到 AOM 的监控指标,包括指标的类别、名称、含义等信息。 IEF服务的指标上报到AOM后,系统会根据指标映射规则将IEF指标转换后,呈现在AOM控制台的“指标浏览”界面。 表1 IEF服务监控指标 指标类别 分类 AOM呈现的指标 IEF上报的指标 指标名称 指标含义 取值范围 单位 主机指标 CPU aom_node_cpu_limit_core cpuCoreLimit CPU内核总量 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) aom_node_cpu_used_core cpuCoreUsed CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) aom_node_cpu_usage cpuUsage CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) 内存 aom_node_memory_total_megabytes totalMem 物理内存容量 该指标用于统计测量对象申请的物理内存总量。 ≥0 兆字节(MB) aom_node_memory_free_megabytes freeMem 可用物理内存 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(MB) aom_node_memory_usage memUsedRate 物理内存使用率 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 0~100 百分比(%) aom_node_virtual_memory_usage virMemUsedRate 虚拟内存使用率 该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。 ≥0 兆字节(MB) 网络 aom_node_network_receive_bytes recvBytesRate 下行Bps 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) aom_node_network_transmit_bytes sendBytesRate 上行Bps 该指标用于统计测试对象的出方向网络流速。 ≥0 字节/秒(Byte/s) 磁盘 aom_node_disk_capacity_megabytes diskCapacity 磁盘空间容量 总的磁盘空间容量。 ≥0 兆字节(MB) aom_node_disk_available_capacity_megabytes diskAvailableCapacity 可用磁盘空间 还未经使用的磁盘空间。 ≥0 兆字节(MB) aom_node_disk_usage diskUsedRate 磁盘使用率 已使用的磁盘空间占总的磁盘空间容量百分比。 0~100 百分比(%) aom_node_disk_read_kilobytes diskReadRate 磁盘读取速率 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) aom_node_disk_write_kilobytes diskWriteRate 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) GPU aom_node_gpu_memory_free_megabytes gpuMemCapacity 显存容量 该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) aom_node_gpu_memory_usage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) aom_node_gpu_memory_used_megabytes gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_node_gpu_usage gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。 0~100 百分比(%) 主机 aom_node_process_number processNum 进程数量 该指标用于统计测量对象上正在运行的进程个数。 ≥0 无 Atlas 500 智能小站 aom_node_npu_temperature_centigrade node_temperature 节点温度 Atlas 500小站节点温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) node_power node_power 节点功率 Atlas 500小站节点功率,由用户调用edgecore接口上报。 ≥0 瓦(W) node_voltage node_voltage 节点电压 Atlas 500小站节点电压,由用户调用edgecore接口上报。 ≥0 伏(V) npu_temperature npu_temperature 芯片温度 Atlas 500小站节点NPU卡温度,由用户调用edgecore接口上报。 ≥0 摄氏度(℃) npu_health npu_health 芯片健康状态 Atlas 500小站节点NPU卡的健康状态,由用户调用edgecore接口上报。 ≥0 无 ai_cpu_rate ai_cpu_rate AI cpu占用率 昇腾AI加速卡的AI CPU使用率,由用户调用edgecore接口上报。 0~100 百分比(%) ai_core_rate ai_core_rate AI core占用率 昇腾AI加速卡的AI Core使用率,由用户调用edgecore接口上报。 0~100 百分比(%) ctrl_cpu_rate ctrl_cpu_rate 控制cpu占用率 昇腾AI加速卡在控制CPU使用率,由用户调用edgecore接口上报。 0~100 百分比(%) ddr_cap_rate ddr_cap_rate ddr内存占用率 Atlas 500小站节点的ddr内存占用率,由用户调用edgecore接口上报。 0~100 百分比(%) ddr_bw_rate ddr_bw_rate ddr带宽占用率 Atlas 500小站节点的ddr带宽占用率,由用户调用edgecore接口上报。 0~100 百分比(%) 容器指标 CPU aom_container_cpu_limit_core cpuCoreLimit CPU内核总量 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) aom_container_cpu_used_core cpuCoreUsed CPU内核占用量 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) aom_container_cpu_usage cpuUsage CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) 内存 aom_container_memory_request_megabytes memCapacity 物理内存容量 该指标用于统计测量对象申请的物理内存总量。 ≥0 兆字节(MB) aom_container_memory_used_megabytes memUsed 物理内存使用量 该指标用于统计测量对象上已使用的物理内存。 ≥0 兆字节(MB) memUsedRate memUsedRate 物理内存使用率 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 0~100 百分比(%) 磁盘 aom_container_disk_read_kilobytes diskReadRate 磁盘读取速率 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(kB/s) aom_container_disk_write_kilobytes diskWriteRate 磁盘写入速率 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(kB/s) 网络 aom_container_network_receive_bytes recvBytesRate 下行Bps 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Byte/s) aom_container_network_transmit_bytes sendBytesRate 上行Bps 该指标用于统计测试对象的出方向网络流速。 ≥0 字节/秒(Byte/s) GPU aom_container_gpu_memory_free_megabytes gpuMemCapacity 显存容量 该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) aom_container_gpu_memory_usage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) aom_container_gpu_memory_used_megabytes gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) aom_container_gpu_usage gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。 0~100 百分比(%) 容器状态 aom_container_status status 容器状态 该指标用于统计容器的状态。 ≥0 无 进程指标 CPU aom_process_cpu_usage cpuUsage CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) 内存 aom_process_memory_used_megabytes memUsed 物理内存使用量 该指标用于统计测量对象上已使用的物理内存。 ≥0 兆字节(MB) 进程状态 aom_process_status status 进程状态 该指标用于统进程的状态。 ≥0 无 GPU gpuMemCapacity gpuMemCapacity 显存容量 该指标用于统计测量对象的显存容量。 ≥0 兆字节(MB) gpuMemUsage gpuMemUsage 显存使用率 该指标用于统计测量对象已使用的显存占显存容量的百分比。 0~100 百分比(%) gpuMemUsed gpuMemUsed 显存使用量 该指标用于统计测量对象已使用的显存。 ≥0 兆字节(MB) gpuUtil gpuUtil GPU使用率 该指标用于统计测量对象显卡使用率。 0~100 百分比(%) 父主题: 指标总览
  • 修订记录 表1 版本说明列表 日期 修订记录 2023-09-30 新增以下章节: AOM与 CES 的云服务监控功能对比 安全 优化以下章节: 基础指标:容器指标 2023-09-15 删除“计费说明”章节。 2023-08-04 删除“基础指标-云服务指标”章节。 2023-06-30 新增以下章节: 与AOM 1.0对比 基础指标:IoTDA指标 优化以下章节: 基础指标:容器指标 基础指标-云服务指标 2022-12-30 新增以下章节: 基础指标:虚机指标 基础指标:容器指标 基础指标-云服务指标 指标维度 优化以下章节: 简介 计费说明 2022-06-30 第一次发布。
  • 基础指标: CS E指标 介绍CSE服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 CSE服务监控指标 指标类别 分类 指标 指标名称 指标含义 取值范围 单位 ServiceComb registry servicecomb_service_center_db_service_total 微服务版本数 微服务版本数。 ≥0 个 servicecomb_service_center_db_instance_total 微服务实例数 微服务实例数。 ≥0 个 servicecomb_service_center_http_request_total http请求次数 http请求次数,包括多种url、方法、code。 ≥0 次 servicecomb_service_center_http_request_durations_microseconds http请求总耗时 http请求总耗时,包括多种url、方法、code。 ≥0 微秒(μs) config servicecomb_kie_request_count http请求次数 http请求次数,包括多种url、方法、code。 ≥0 次 servicecomb_kie_request_process_duration http请求总耗时 http请求总耗时,包括多种url、方法、code。 ≥0 毫秒(ms) servicecomb_kie_config_count 配置个数 ServiceComb配置个数。 ≥0 个 Nacos config nacos_configCount Nacos config配置个数 Nacos集群内各节点的配置个数。 ≥0 个 nacos_getConfig Nacos config读配置请求数 Nacos集群内各节点的读配置请求次数。 ≥0 次 nacos_longPolling Nacos config HTTP长连接数(监听者数) Nacos config HTTP长连接数。 ≥0 个 nacos_publish Nacos config写配置请求数 Nacos集群内各节点的写配置请求次数。 ≥0 次 nacos_subscriberCount Nacos config订阅者数量 Nacos config订阅者数量。 ≥0 个 nacos_configPushCost Nacos config推送时延 Nacos config推送时延。 ≥0 毫秒(ms) http nacos_http_server_requests_seconds_count http请求次数 http请求次数,包括多种url、方法、code。 ≥0 次 nacos_http_server_requests_seconds_max http请求总耗时最大值 统计周期内http请求时延的最大值,包括多种url、方法、code,使用Nacos-Client 1.x时上报。 ≥0 秒(s) nacos_http_server_requests_seconds_sum http请求总耗时 http请求总耗时,包括多种url、方法、code。 ≥0 秒(s) naming nacos_avgPushCost Nacos naming平均推送耗时 Nacos naming平均推送耗时(ms)。 ≥0 毫秒(ms) nacos_maxPushCost Nacos naming最大推送耗时 Nacos naming最大推送耗时(ms)。 ≥0 毫秒(ms) nacos_failedPush Nacos naming推送失败数 Nacos naming推送失败数。 ≥0 次 nacos_ipCount Nacos naming ip个数 微服务注册实例数。 ≥0 个 nacos_serviceSubscriberCount Nacos naming订阅者数量 Nacos naming订阅者数量。 ≥0 个 nacos_serviceCount Nacos naming 域名 个数(2.x 版本) Nacos集群内各节点的服务个数。 ≥0 个 应用网关 envoy cpuUsage CPU使用率 该指标用于统计测量对象的CPU使用率。 0~100 百分比(%) envoy_http_downstream_cx_active 活跃连接总数 该指标用于统计活跃连接数。 ≥0 个 downstream_cx_delayed_close_timeout 延迟关闭连接总数 该指标用于统计延迟关闭的连接数。 ≥0 个 envoy_http_downstream_cx_destroy 摧毁连接总数 该指标用于统计摧毁的链接数。 ≥0 个 envoy_http_downstream_cx_destroy_active_rq 摧毁活跃连接数 该指标用于统计摧毁的活跃链接数。 ≥0 个 envoy_http_downstream_cx_destroy_local 摧毁本地的连接数 该指标用于统计摧毁的本地连接数。 ≥0 个 envoy_http_downstream_cx_destroy_local_active_rq 摧毁本地活跃连接数 该指标用于统计摧毁本地活跃连接数。 ≥0 个 envoy_http_downstream_cx_destroy_remote 摧毁远端关闭的连接数 该指标用于统计因为远端关闭而摧毁的连接数。 ≥0 个 envoy_http_downstream_cx_destroy_remote_active_rq 摧毁远端关闭的活跃连接数 该指标用于统计因为远端关闭而摧毁的活跃连接数。 ≥0 个 envoy_http_downstream_cx_drain_close 驱逐关闭连接数 该指标用于统计因为驱逐而关闭的连接数。 ≥0 个 envoy_http_downstream_cx_http1_active http1获取连接数 该指标用于统计http1的连接数。 ≥0 个 envoy_http_downstream_cx_max_duration_reached 超时连接数 该指标用于统计因超过最大连接时间而关闭的连接数。 ≥0 个 envoy_http_downstream_cx_tx_bytes_total 总发送字节数 该指标用于统计总发送的字节数。 ≥0 字节(Byte) envoy_http_downstream_rq 总请求数 该指标用于统计总请求数。 ≥0 个 envoy_http_downstream_rq_http1_total http1总请求数 该指标用于统计http1总请求数。 ≥0 个 envoy_http_downstream_rq_http2_total http2总请求数 该指标用于统计http2总请求数。 ≥0 个 envoy_http_downstream_rq_idle_timeout 空闲时间超时关闭请求数 该指标用于统计因空闲时间超时的请求数。 ≥0 个 envoy_http_downstream_rq_too_large 请求体过大请求数 该指标用于统计请求body过大返回413的请求数。 ≥0 个 downstream_rq_ws_on_non_ws_route websocket没有路由的请求数 该指标用于统计因为没有路由而被拒绝的请求数。 ≥0 个 envoy_http_local_rate_limiter_http_local_rate_limit_enforced 限流请求数 该指标用于统计被限流的请求数。 ≥0 个 envoy_cluster_circuit_breakers_default_cx_open 连接断路器触发状态 0:连接断路器低于其并发限制。 1:连接断路器已达到容量限制不再接纳。 0、1 无 envoy_cluster_circuit_breakers_high_cx_open envoy_cluster_circuit_breakers_default_cx_pool_open 连接池断路器触发状态 0:连接池断路器低于其并发限制。 1:连接池断路器已达容量限制不再接纳。 0、1 无 envoy_cluster_circuit_breakers_high_cx_pool_open envoy_cluster_circuit_breakers_default_remaining_cx 连接断路器的剩余连接数 断路器达到并发限制之前的剩余连接数。 ≥0 个 envoy_cluster_circuit_breakers_high_remaining_cx envoy_cluster_circuit_breakers_default_remaining_cx_pools 连接池断路器的剩余连接数 断路器连接池达到并发限制之前的剩余连接数。 ≥0 个 envoy_cluster_circuit_breakers_high_remaining_cx_pools envoy_cluster_circuit_breakers_default_remaining_pending 断路器达到并发限制之前剩余的待处理请求数 断路器达到并发限制之前剩余的待处理请求数。 ≥0 个 envoy_cluster_circuit_breakers_high_remaining_pending envoy_cluster_circuit_breakers_default_remaining_retries 断路器达到并发限制之前的剩余重试次数 断路器达到并发限制之前的剩余重试次数。 ≥0 次 envoy_cluster_circuit_breakers_high_remaining_retries envoy_cluster_circuit_breakers_default_remaining_rq 断路器达到并发限制之前剩余的请求数 断路器达到并发限制之前剩余的请求数。 ≥0 个 envoy_cluster_circuit_breakers_high_remaining_rq envoy_cluster_circuit_breakers_default_rq_open 请求断路器触发状态 0:请求断路器低于其并发限制。 1:请求断路器已达容量限制不再接纳。 0、1 无 envoy_cluster_circuit_breakers_high_rq_open envoy_cluster_circuit_breakers_default_rq_retry_open 重试断路器触发状态 0:重试断路器低于其并发限制。 1:重试断路器已达容量限制不再接纳。 0、1 无 envoy_cluster_circuit_breakers_high_rq_retry_open envoy_cluster_ejections_overflow 驱逐达到最大驱逐阈值的次数 主机因请求异常率达到最大驱逐比例而被限制驱逐的次数。 ≥0 次 envoy_cluster_ejections_consecutive_5xx 连续5xx 驱逐次数 主机因连续返回5xx导致的驱逐次数。 ≥0 次 envoy_cluster_ejections_detected_consecutive_5xx 连续5xx 驱逐次数(即使未强制执行) 主机因连续返回5xx导致的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_detected_consecutive_gateway_failure 检测到的连续网关故障的驱逐次数 检测到的连续网关故障的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_detected_consecutive_local_origin_failure 连续本地源故障的驱逐次数 检测到的连续本地源故障导致的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_enforced_consecutive_local_origin_failure 连续本地源故障强制驱逐次数 主机因检测到的连续本地源故障导致的驱逐次数。 ≥0 次 envoy_cluster_ejections_detected_failure_percentage 请求失败率超阈值的驱逐次数 主机因请求失败率达到失败率阈值而被驱逐的次数。 ≥0 次 envoy_cluster_ejections_detected_local_origin_failure_percentage 本地主动请求检测失败率超阈值的驱逐次数 主机因本地主动请求检测失败率超阈值的驱逐次数。 ≥0 次 envoy_cluster_ejections_detected_local_origin_success_rate 本地主动请求检测成功率未达阈值的驱逐次数 主机因本地主动请求检测成功率未达到阈值而触发的驱逐次数(即使未强制执行)。 ≥0 次 envoy_cluster_ejections_detected_success_rate 本地主动请求检测成功率未达阈值的驱逐次数 主机因本地主动请求检测成功率未达到阈值而触发的驱逐次数。 ≥0 次 envoy_cluster_ejections_enforced_consecutive_5xx 连续 5xx 强制驱逐次数 主机因连续 5xx 强制驱逐次数。 ≥0 次 envoy_cluster_ejections_enforced_consecutive_gateway_failure 连续网关故障强制驱逐次数 主机因连续网关故障强制驱逐次数。 ≥0 次 envoy_cluster_ejections_enforced_failure_percentage 请求失败率超阈值而被强制驱逐次数 主机因请求失败率超阈值而被强制驱逐的次数。 ≥0 次 envoy_cluster_ejections_enforced_local_origin_failure_percentage 本地主动请求失败率超阈值而被强制驱逐次数 主机因本地主动请求失败率超过阈值而被强制驱逐的次数。 ≥0 次 envoy_cluster_ejections_enforced_local_origin_success_rate 本地主动请求成功率未达阈值驱逐次数 主机因本地主动请求成功率未达阈值而强制驱逐的次数。 ≥0 次 envoy_cluster_ejections_enforced_success_rate 请求成功率未达阈值驱逐次数 主机因请求成功率未达阈值而强制驱逐的次数。 ≥0 次 envoy_cluster_ejections_enforced_total 强制驱逐的次数 由于任何异常类型而强制驱逐的次数。 ≥0 次 envoy_http_downstream_cx_rx_bytes_total 请求收到的总字节数 请求收到的总字节数。 ≥0 字节(Byte) 父主题: 指标总览
  • 基础指标:IoTDA指标 介绍IoTDA服务上报到AOM的监控指标,包括指标的类别、名称、含义等信息。 表1 IoTDA服务监控指标 指标类别 指标 指标名称 指标含义 取值范围 单位 设备总数 iotda_device_status_onlineCount 在线设备数 统计租户在当前实例/资源空间下的在线的设备数量 ≥0 个 iotda_device_status_totalCount 设备总数 统计租户在当前实例/资源空间下的总的设备数量 ≥0 个 iotda_device_status_offlineCount 离线设备数 统计租户在当前实例/资源空间下的离线的设备数量 ≥0 个 iotda_device_status_abnormalCount 异常设备数 统计租户在当前实例/资源空间下的异常的设备数量 ≥0 个 iotda_device_status_inactiveCount 未激活设备数 统计租户在当前实例/资源空间下的未激活的设备数量 ≥0 个 NB数据上报数 iotda_south_dataReport_totalCount NB数据上报总数 统计当前实例/资源空间下NB数据上报总次数 ≥0 次 iotda_south_dataReport_successCount NB数据上报成功次数 统计当前实例/资源空间下NB数据上报成功次数 ≥0 次 iotda_south_dataReport_failedCount NB数据上报失败次数 统计当前实例/资源空间下NB数据上报失败次数 ≥0 次 MQTT事件上报数 iotda_south_eventUp_totalCount MQTT事件上报总数 统计当前实例/资源空间下MQTT事件上报总数 ≥0 次 iotda_south_eventUp_successCount MQTT事件上报成功次数 统计当前实例/资源空间下MQTT事件上报成功次数 ≥0 次 iotda_south_eventUp_failedCount MQTT事件上报失败次数 统计当前实例/资源空间下MQTT事件上报失败次数 ≥0 次 MQTT属性上报数 iotda_south_propertiesReport_totalCount MQTT属性上报总数 统计当前实例/资源空间下MQTT属性上报总数 ≥0 次 iotda_south_propertiesReport_successCount MQTT属性上报成功次数 统计当前实例/资源空间下MQTT属性上报成功次数 ≥0 次 iotda_south_propertiesReport_failedCount MQTT属性上报失败次数 统计当前实例/资源空间下MQTT属性上报失败次数 ≥0 次 MQTT消息上报数 iotda_south_messageUp_totalCount MQTT消息上报总数 统计当前实例/资源空间下MQTT消息上报总数 ≥0 次 iotda_south_messageUp_successCount MQTT消息上报成功次数 统计当前实例/资源空间下MQTT消息上报成功次数 ≥0 次 iotda_south_messageUp_failedCount MQTT消息上报失败次数 统计当前实例/资源空间下MQTT消息上报失败次数 ≥0 次 AMQP流转次数 iotda_amqp_forwarding_totalCount AMQP流转次数 统计当前实例/资源空间下AMQP流转次数 ≥0 次 iotda_amqp_forwarding_successCount AMQP流转成功次数 统计当前实例/资源空间下AMQP流转成功次数 ≥0 次 iotda_amqp_forwarding_failedCount AMQP流转失败次数 统计当前实例/资源空间下AMQP流转失败次数 ≥0 次 FunctionGraph流转次数 iotda_functionGraph_forwarding_totalCount FunctionGraph流转次数 统计当前实例/资源空间下FunctionGraph流转次数 ≥0 次 iotda_functionGraph_forwarding_successCount FunctionGraph流转成功次数 统计当前实例/资源空间下FunctionGraph流转成功次数 ≥0 次 iotda_functionGraph_forwarding_failedCount FunctionGraph流转失败次数 统计当前实例/资源空间下FunctionGraph流转失败次数 ≥0 次 MRS Kafka流转次数 iotda_mrsKafka_forwarding_totalCount MRS Kafka流转次数 统计当前实例/资源空间下MRS Kafka流转次数 ≥0 次 iotda_mrsKafka_forwarding_successCount MRS Kafka流转成功次数 统计当前实例/资源空间下MRS Kafka流转成功次数 ≥0 次 iotda_mrsKafka_forwarding_failedCount MRS Kafka流转失败次数 统计当前实例/资源空间下MRS Kafka流转失败次数 ≥0 次 MQTT流转次数 iotda_mqtt_forwarding_totalCount Mqtt流转次数 统计当前实例/资源空间下MQTT流转次数 ≥0 次 iotda_mqtt_forwarding_successCount Mqtt流转成功次数 统计当前实例/资源空间下MQTT流转成功次数 ≥0 次 iotda_mqtt_forwarding_failedCount Mqtt流转失败次数 统计当前实例/资源空间下MQTT流转失败次数 ≥0 次 MySql流转次数 iotda_mysql_forwarding_totalCount MySql流转次数 统计当前实例/资源空间下MySql流转次数 ≥0 次 iotda_mysql_forwarding_successCount MySql流转成功次数 统计当前实例/资源空间下MySql流转成功次数 ≥0 次 iotda_mysql_forwarding_failedCount MySql流转失败次数 统计当前实例/资源空间下MySql流转失败次数 ≥0 次 InfluxDB流转次数 iotda_influxDB_forwarding_totalCount InfluxDB流转次数 统计当前实例/资源空间下InfluxDB流转次数 ≥0 次 iotda_influxDB_forwarding_successCount InfluxDB流转成功次数 统计当前实例/资源空间下InfluxDB流转成功次数 ≥0 次 iotda_influxDB_forwarding_failedCount InfluxDB流转失败次数 统计当前实例/资源空间下InfluxDB流转失败次数 ≥0 次 HTTP推送流转次数 iotda_http_forwarding_totalCount HTTP推送流转次数 统计当前实例/资源空间下HTTP推送流转次数 ≥0 次 iotda_http_forwarding_successCount HTTP推送流转成功次数 统计当前实例/资源空间下HTTP推送流转成功次数 ≥0 次 iotda_http_forwarding_failedCount HTTP推送流转失败次数 统计当前实例/资源空间下HTTP推送流转失败次数 ≥0 次 OBS流转次数 iotda_obs_forwarding_totalCount OBS流转次数 统计当前实例/资源空间下OBS流转次数 ≥0 次 iotda_obs_forwarding_successCount OBS流转成功次数 统计当前实例/资源空间下OBS流转成功次数 ≥0 次 iotda_obs_forwarding_failedCount OBS流转失败次数 统计当前实例/资源空间下OBS流转失败次数 ≥0 次 DMS Kafka流转次数 iotda_dmsKafka_forwarding_totalCount DMS Kafka流转次数 统计当前实例/资源空间下DMS Kafka流转次数 ≥0 次 iotda_dmsKafka_forwarding_successCount DMS Kafka流转成功次数 统计当前实例/资源空间下DMS Kafka流转成功次数 ≥0 次 iotda_dmsKafka_forwarding_failedCount DMS Kafka流转失败次数 统计当前实例/资源空间下DMS Kafka流转失败次数 ≥0 次 DIS流转次数 iotda_dis_forwarding_totalCount DIS流转次数 统计当前实例/资源空间下DIS流转次数 ≥0 次 iotda_dis_forwarding_successCount DIS流转成功次数 统计当前实例/资源空间下DIS流转成功次数 ≥0 次 iotda_dis_forwarding_failedCount DIS流转失败次数 统计当前实例/资源空间下DIS流转失败次数 ≥0 次 ROMA流转次数 iotda_roma_forwarding_totalCount ROMA流转次数 统计当前实例/资源空间下ROMA流转次数 ≥0 次 iotda_roma_forwarding_successCount ROMA流转成功次数 统计当前实例/资源空间下ROMA流转成功次数 ≥0 次 iotda_roma_forwarding_failedCount ROMA流转失败次数 统计当前实例/资源空间下ROMA流转失败次数 ≥0 次 LTS流转次数 iotda_lts_forwarding_totalCount LTS流转次数 统计当前实例/资源空间下LTS流转次数 ≥0 次 iotda_lts_forwarding_successCount LTS流转成功次数 统计当前实例/资源空间下LTS流转成功次数 ≥0 次 iotda_lts_forwarding_failedCount LTS流转失败次数 统计当前实例/资源空间下LTS流转失败次数 ≥0 次 查询设备影子 iotda_query_shadow_totalCount 查询设备影子总数 统计当前实例/资源空间下查询设备影子总数 ≥0 次 iotda_query_shadow_successCount 查询设备影子成功数 统计当前实例/资源空间下查询设备影子成功数 ≥0 次 iotda_query_shadow_failedCount 查询设备影子失败数 统计当前实例/资源空间下查询设备影子失败数 ≥0 次 消息下发 iotda_message_down_totalCount 消息下发总数 统计当前实例/资源空间下消息下发总数 ≥0 次 iotda_message_down_successCount 消息下发成功数 统计当前实例/资源空间下消息下发成功数 ≥0 次 iotda_message_down_failedCount 消息下发失败数 统计当前实例/资源空间下消息下发失败数 ≥0 次 属性设置 iotda_properties_set_totalCount 属性设置总数 统计当前实例/资源空间下属性设置总数 ≥0 次 iotda_properties_set_successCount 属性设置成功数 统计当前实例/资源空间下属性设置成功数 ≥0 次 iotda_properties_set_failedCount 属性设置失败数 统计当前实例/资源空间下属性设置失败数 ≥0 次 属性查询 iotda_properties_query_totalCount 属性查询总数 统计当前实例/资源空间下属性查询总数 ≥0 次 iotda_properties_query_successCount 属性查询成功数 统计当前实例/资源空间下属性查询成功数 ≥0 次 iotda_properties_query_failedCount 属性查询失败数 统计当前实例/资源空间下属性查询失败数 ≥0 次 命令数 iotda_command_totalCount 命令总数 统计当前实例/资源空间下命令总数 ≥0 次 iotda_command_successCount 命令成功数 统计当前实例/资源空间下命令成功数 ≥0 次 iotda_command_failedCount 命令失败数 统计当前实例/资源空间下命令失败数 ≥0 次 流控数据 iotda_flowcontrol_north_failedCount API调用流控失败数 统计当前实例下调用API流控失败次数 ≥0 次 iotda_flowcontrol_south_failedCount 南向调用流控失败数 统计当前实例下数据上报流控失败次数 ≥0 次 iotda_flowcontrol_forwarding_failedCount 流转流控失败数 统计当前实例下流转流控失败数 ≥0 次 同时在线设备数 iotda_max_online_devices_totalCount 每天最大同时在线设备数 统计当前实例下每天最大同时在线设备数 ≥0 个 iotda_max_online_devices_percent 最大同时在线设备数百分比 统计当前实例下每天最大同时在线设备数百分比 0~100 百分比(%) 父主题: 指标总览
  • 计费模式 提供按小时、按月、按年的计费方式供您灵活选择,使用越久越便宜。 包年/包月:该方式为一种预付费模式,相对于按需付费提供更大的折扣,对于长期使用者,推荐该方式。 按需付费(小时):这种购买方式比较灵活,可以即开即停,按实际使用时长计费。以自然小时为单位整点计费,不足一小时按实际使用时长计费。创建按需实例时会冻结一部分保证金,冻结的保证金在满足以下条件之一时返还,在解冻保证金时,若该资源欠费,解冻的保证金优先抵扣该资源的欠费。 客户释放资源。 客户资源开通失败。 保证金冻结24小时以后客户未释放资源。 计费方式更改:支持包周期和按需计费方式转换。 如需更改计费方式,请参考按需实例转包周期和包周期实例转按需计费章节进行计费方式转换。
  • 变更配置 您可以根据业务需求对现有数据库实例进行规格变更,变更后即刻按照新的规格计费。 增加实例或节点数量:您可以根据业务需求增加您现有实例的数量,增加后即刻按照新的实例数量计费。在集群实例中,您需要注意的是集群节点只能增加,不能减少。dds mongos数量可选范围2~32、Shard数量可选范围2~32、Config数量默认1个,不需要选择。 扩容存储空间:您可以根据业务需求增加您的存储空间,扩容后即刻按照新的存储空间计费。您需要注意的是为了您的数据完整和安全,存储空间只允许扩容,不能缩容。
  • 续费 目前DDS提供“包年/包月”和“按需计费”购买方式,您可以根据业务需要定制相应计算能力和存储空间的数据库实例。 “按需计费”方式,即按实际使用时长计费,以自然小时为单位整点计费,不足一小时按一小时计费,只要您账户上有足够余额,就可以一直使用服务。当账户余额不足时,就会导致欠费,因此在欠费前请及时充值。 “包年/包月”计费方式,您在购买时一次性付费,使用过程中不会再另外扣费,只要您的账户上有足够余额,则不会影响您的使用。 如需续费,请进入“续费管理”页面进行续费操作。
  • 计费项及计费标准 表1 计费项说明 计费项 计费说明 计费标准 实例规格 按照您选择的实例规格收费。 其中,对于集群实例,规格费用包含了dds mongos规格费用、shard规格费用和config规格费用。 华为云DDS管理费用详情,请参见产品价格详情。您可以通过DDS提供的价格计算器,选择您需要的实例规格,来快速计算出购买DDS实例的参考价格。 存储空间 按照您选择存储空间收费。 其中,对于集群实例,存储空间费用包含了shard存储空间费用和config存储空间费用。 备份存储(可选) 文档数据库的备份文件存储在 对象存储服务 (OBS)中,不会占用文档数据库实例的存储空间。 DDS提供了部分免费存储空间,用于存放您的备份数据,其总容量约为您购买容量的100%。备份存储用量超过数据库存储空间的100%,开始按需计费。 审计日志空间(可选) 审计日志记录您对数据库或集合执行的操作,生成的日志文件将以文件的形式存储在对象存储服务(OBS)中。 开启审计日志会收取一定费用,收费详情请参见产品价格详情。 公网流量(可选) DDS实例支持公网访问,公网访问会产生带宽流量费。 DDS数据库实例在云内部网络产生的流量不计费。 详情请参见弹性公网IP计费详情。 -
  • 其他各领域应用 社交应用:使用文档数据库服务DDS可以通过地理位置索引轻松实现查找附近的人、位置等功能。因为文档数据库服务DDS提供了非常丰富的查询,所以适合用来存储聊天内容,在读取和写入方面都相对较快。 大数据应用:使用文档数据库服务DDS作为大数据的 云存储 系统,可以利用其灵活的聚合功能,方便的进行数据提取分析。 物流应用:使用文档数据库服务DDS以内嵌数组的形式来存储订单信息,即使订单状态在运送过程中会不断更新,一次查询也能将订单所有的变更读取出来。
  • IoT DDS兼容MongoDB,具有高性能和异步数据写入功能,特定场景下可达到内存数据库的处理能力。同时,DDS中的集群实例,可动态扩容和增加dds mongos和shard组件的性能规格和个数,性能及存储空间可实现快速扩展,非常适合IoT的高并发写入的场景。 物联网(Internet of Things,简称IoT)智能终端往往需要进行多样化的数据采集,且需要存储设备日志信息,并对这些信息进行多维度分析。IoT业务增长快,数据量大,访问量增长迅速,对数据存储要求具备水平扩展能力。 DDS提供二级索引功能满足动态查询的需求,利用兼容MongoDB的MapReduce聚合框架进行多维度的数据分析。 优势: 写性能:文档数据库的高性能写入,基于分片构建的集群支持物联网TB级的数据需求。 高性能和扩展性:对高QPS应用有很好的支持,同时分片架构可以快速进行水平扩展,灵活应对应用变化。
  • 游戏 在游戏应用中,可以将一些用户信息,如用户装备、用户积分等存储在DDS数据库中。游戏玩家活跃高峰期,对并发能力要求较高,可以使用DDS的集群类型,应对高并发场景。DDS副本集和集群架构的高可用特性,能够满足游戏在高并发场景下持续稳定运行。 另外,DDS兼容MongoDB,具有No-Schema的方式,能免去您在游戏玩法变化中需要变更表结构的痛苦,非常适用于灵活多变的游戏业务需求。您可以将模式固定的结构化数据存储在云数据库RDS中,模式灵活的业务存储在DDS中,高热数据存储在GeminiDB Redis里,实现对业务数据高效存取,降低存储数据的投入成本。 优势: 支持内嵌文档:内嵌文档可以避免join的使用,降低应用开发的复杂性,灵活的schema支持,方便快速开发迭代。 轻松应对数据峰值压力:基于分片构建的集群支持TB级的数据需求。
  • 互联网 DDS的副本集模式采用三节点Replica Set的高可用架构,三个数据节点组成一个反亲和组,部署在不同的物理服务器上,自动同步数据。Primary节点和Secondary节点提供服务,两个节点分别拥有独立内网地址,配合Driver实现读取压力分配。 大型企业的数据库往往需要应对TB级数据,有较强的数据存储需求。且大数据场景下,还需要满足业务在线数据实时写入数据库、大数据计算分析、分析结果反馈等实时查询、动态分析的需求。 优势: MapReduce:解决数据分析场景需求,用户可以自己写查询语句或脚本,将请求都分发到DDS上完成。 性能扩展能力强:应对业务增长快,数据量大的内容管理系统。具备较好的扩展能力。
  • 对接OBS 在“spark/conf/spark-defaults.conf”中添加以下配置: # 对接OBS固定配置,Endpoint需要根据区域进行配置 spark.hadoop.fs.obs.impl=org.apache.hadoop.fs.obs.OBSFileSystem spark.hadoop.fs.AbstractFileSystem.obs.impl=org.apache.hadoop.fs.obs.OBS spark.hadoop.fs.obs.endpoint=obs.xxx.huawei.com # 指定访问OBS凭证获取类为LakeFormationObsCredentialProvider spark.hadoop.fs.obs.credentials.provider=com.huawei.cloud.dalf.lakecat.client.obs.LakeFormationObsCredentialProvider # 可选参数,关闭OBS文件系统缓存,长任务需要增加该配置,避免缓存中的临时AKSK失效 spark.hadoop.fs.obs.impl.disable.cache=true Endpoint:不同服务不同区域的Endpoint不同。您可以从地区和终端节点中获取。 将上述配置添加到core-site.xml文件中亦可生效,添加时需要去除“spark.hadoop”前缀。
  • 集成SQL鉴权插件 使用鉴权插件必须实现并指定自定义用户信息获取类,详细操作请参考自定义用户信息获取类。 在spark-default.conf配置文件中添加如下配置: com.huawei.cloud.dalf.lakecat.client.spark.v31.authorizer.LakeFormationSparkSQLExtension spark.sql.extensions=com.huawei.cloud.dalf.lakecat.client.spark.authorizer.LakeFormationSparkSQLExtension 集成权限插件后,如果当前用户(通过自定义用户信息获取类指定)无对应元数据权限,在执行SQL时将抛出异常。 当前用户如果拥有 IAM LakeFormation:policy:create权限,且当前用户(可通过自定义用户信息获取类指定)和认证信息(可通过自定义认证信息获取类指定)为统一用户,将跳过SQL鉴权。 当前,过滤相关功能暂未支持,包括库、表、行过滤,列掩码等。
  • 对接通用配置 在“spark/conf/spark-defaults.conf”中添加以下配置: # 项目ID,必选参数,此处配置值仅作为参考 spark.hadoop.lakeformation.project.id=项目ID # LakeFormation实例ID,可选参数,通过LakeFormation实例界面获取,如不填写则连接到默认实例,此处配置值仅作为参考 spark.hadoop.lakeformation.instance.id=LakeFormation实例ID #访问lakeformation IAM认证AK信息,可选参数,如果为自定义认证信息获取类可忽略 spark.hadoop.lakeformation.authentication.access.key=AK信息 #访问lakeformation IAM认证SK信息,可选参数,如果为自定义认证信息获取类可忽略 spark.hadoop.lakeformation.authentication.secret.key=SK信息 #访问lakeformation IAM认证信息securitytoken,可选参数,搭配临时AK/SK使用,如果使用永久AK/SK或自定义认证信息获取类可忽略 spark.hadoop.lakeformation.authentication.security.token=securitytoken信息 其中项目ID为必选配置,其他为可选配置,根据实际情况进行填写。 项目ID:可参考获取项目ID获取。 LakeFormation实例ID:可参考如何获取LakeFormation实例ID获取。 AK/SK信息可参考如何获取AK/SK获取。 securitytoken可参考通过token获取临时访问密钥和securitytoken获取。 将上述配置添加到hive-site.xml或core-site.xml中亦可生效,添加时需要去除“spark.hadoop”前缀。
  • DLI SQL防御功能介绍 DLI在Spark SQL引擎中增加SQL防御能力,基于用户可理解的SQL防御策略,实现对典型大SQL、低质量SQL的主动防御,包括事前提示、拦截和事中熔断,并不强制改变用户的SQL提交方式、SQL语法,对业务零改动且易落地。 支持可视化配置SQL防御策略,同时可支持防御规则的查询和修改。 每个SQL引擎在进行SQL业务响应、执行过程中,基于SQL防御策略进行主动防御行为。 管理员可将SQL防御行为在“提示”、“拦截”、“熔断”选项之间进行灵活切换,系统会将发生的SQL防御事件实时写入到防御审计日志中。运维人员可进行 日志分析 ,评估现网SQL质量,提前感知潜在SQL风险,并做出有效预防措施。 SQL防御规则包含以下类型的动作: 提示:基于纯粹的SQL语法规则进行拦截或提示。系统在SQL请求满足条件时,可对该SQL请求进行提示处理。 拦截:基于与数据表的统计信息、元数据信息等内容有关的规则进行拦截。系统在SQL请求满足条件时,可对该SQL请求进行中止处理。 熔断:基于SQL语句运行时的系统动态信息(如CPU、内存、IO等)的规则进行阻断。系统在SQL请求满足条件时,会阻断该SQL任务。
  • 设计器支持资源 设计器集合各资源,目前支持的资源如表1所示。 表1 支持资源列表 资源类型 资源名称 计算 弹性云服务器 ECS 裸金属服务器 BMS 镜像服务 IMS 函数工作流 FunctionGraph 网络 虚拟私有云 VPC 子网 Subnet 安全组 Security Group 弹性公网IP EIP 独享型弹性负载均衡 ELB 共享型弹性负载均衡 ELB 虚拟专用网络 VPN 对等链接 VPC Peering NAT 网关 终端节点服务 VPC Endpoint 共享带宽 Shared Bandwidth 容器 云容器引擎 CCE 数据库 云数据库 GaussDB 云数据库 RDS 存储 云硬盘 EVS 对象存储服务 OBS 弹性文件服务 SFS Turbo 大数据 MapReduce服务 MRS 云 数据仓库 DWS 云搜索服务 CSS 迁移 云数据迁移 CDM 应用中间件 分布式缓存服务Redis版 DCS 分布式缓存服务Kafka版 DMS API网关 APIG 微服务引擎 CSE 分布式消息服务RabbitMQ版 DMS 安全与合规 数据加密 服务 DEW Web应用防火墙 WAF 云堡垒机 CBH 管理与监管 云审计 服务追踪器 CTS Tracker
  • 责任共担 华为云秉承“将公司对网络和业务安全性保障的责任置于公司的商业利益之上”。针对层出不穷的 云安全 挑战和无孔不入的云安全威胁与攻击,华为云在遵从法律法规业界标准的基础上,以安全生态圈为护城河,依托华为独有的软硬件优势,构建面向不同区域和行业的完善云服务安全保障体系。 安全性是华为云与您的共同责任,如图1所示。 华为云:负责云服务自身的安全,提供安全的云。华为云的安全责任在于保障其所提供的 IaaS、PaaS 和 SaaS 类云服务自身的安全,涵盖华为云数据中心的物理环境设施和运行其上的基础服务、平台服务、应用服务等。这不仅包括华为云基础设施和各项云服务技术的安全功能和性能本身,也包括运维运营安全,以及更广义的安全合规遵从。 租户:负责云服务内部的安全,安全地使用云。华为云租户的安全责任在于对使用的 IaaS、PaaS 和 SaaS 类云服务内部的安全以及对租户定制配置进行安全有效的管理,包括但不限于虚拟网络、 虚拟主机 和访客虚拟机的操作系统,虚拟防火墙、API 网关和高级安全服务,各项云服务,租户数据,以及身份账号和密钥管理等方面的安全配置。 《华为云安全白皮书》详细介绍华为云安全性的构建思路与措施,包括云安全战略、责任共担模型、合规与隐私、安全组织与人员、基础设施安全、租户服务与租户安全、工程安全、运维运营安全、生态安全。 图1 华为云安全责任共担模型 父主题: 安全
  • 与其他服务的关系 除直接使用弹性伸缩提供的对资源进行调整的功能外,若您同时购买了云服务中的其他产品,可以结合其他产品一起使用,能满足您多种场景下对云产品的需求。 弹性伸缩服务与周边服务的依赖关系如图1所示。 图1 弹性伸缩服务与其他服务的关系示意图 表1 弹性伸缩与其他服务的关系 服务名称 说明 交互功能 相关内容 弹性负载均衡(Elastic Load Balance) 当配置了负载均衡服务后,弹性伸缩组在添加或移除云服务器时,自动会为云服务器绑定或解绑负载均衡监听器。 AS支持ELB的前提是:弹性伸缩组和负载均衡器必须处于同一VPC内。 使伸缩组中每一个实例均可分配到应用程序流量 添加负载均衡器到伸缩组 云监控服务 (Cloud Eye) 弹性伸缩配置了告警触发策略时,会根据 云监控 的告警条件触发弹性伸缩活动。 通过监控伸缩组内实例的状态指标调节资源。 弹性伸缩支持的监控指标 弹性云服务器(Elastic Cloud Server) 弹性伸缩活动中添加的云服务器可以通过弹性云服务器进行管理和维护。 自动调整弹性云服务器数量 动态扩展资源 虚拟私有云(Virtual Private Cloud) 弹性伸缩支持自动调整虚拟私有云中创建的弹性公网IP带宽或共享带宽大小。 自动调整带宽大小 创建伸缩带宽策略 消息通知 服务(Simple Message Notification) 用户使用消息通知功能后,系统会将伸缩组的多种情况及时推送给用户,便于用户及时了解伸缩组的状态。 消息通知 为伸缩组配置通知 云审计服务(Cloud Trace Service) 开通云审计服务后,可以记录弹性伸缩相关的操作事件,便于日后的查询、审计和回溯。 日志审计 记录弹性伸缩 标签管理服务(Tag Management Service) 当您具有许多相同类型的弹性伸缩资源时,标签可以为您提供灵活的资源管理能力。 标签 标记伸缩组和实例
  • 身份认证 统一身份认证 服务(Identity and Access Management,简称IAM)提供用户身份认证、权限分配、访问控制等功能,可以帮助您安全的控制华为云资源的访问。 通过IAM,您可以在账号中给员工创建IAM用户,并授权控制他们对华为云资源的访问范围。例如您的员工中有负责软件开发的人员,您希望他们拥有AS的使用权限,但是不希望他们拥有删除伸缩组等高危操作的权限,那么您可以使用IAM为开发人员创建用户,通过授予仅能使用伸缩组,但是不允许删除伸缩组的权限策略,控制他们对AS资源的使用范围。
  • 访问控制 AS支持通过权限控制(IAM权限)、项目和企业项目、敏感操作、安全组进行访问控制。 表1 AS访问控制 访问控制方式 简要说明 详细介绍 权限控制(IAM权限) 默认情况下,管理员创建的IAM用户没有任何权限,需要将其加入用户组,并给用户组授予策略或角色,才能使得用户组中的用户获得对应的权限,这一过程称为授权。授权后,用户就可以基于被授予的权限对云服务进行操作。 权限管理 项目和企业项目 项目和企业项目都可以授权给一个或者多个用户组进行管理,管理企业项目的用户归属于用户组。通过给用户组授予策略,用户组中的用户就能在所属项目/企业项目中获得策略中定义的权限。 管理项目和企业项目 敏感操作 当您开启操作保护后,进行删除伸缩组操作时,需要进行身份认证。 敏感操作 安全组 安全组是一个逻辑上的分组,为具有相同安全保护需求并相互信任的云服务器提供访问策略。安全组创建后,用户可以在安全组中定义各种访问规则,当云服务器加入该安全组后,即受到这些访问规则的保护。 系统会为每个用户默认创建一个默认安全组,默认安全组的规则是在出方向上的数据报文全部放行,入方向访问受限,安全组内的云服务器无需添加规则即可互相访问。 配置安全组规则
共100000条