云服务器内容精选

  • 指标说明 运行监控指标说明如表1所示。 表1 监控指标说明表 指标 单位 说明 调用次数 次 函数总的调用请求数,包含了错误和被拒绝的调用。异步调用在该请求实际被系统执行时才开始计数。 运行时间 毫秒 最大运行时间为某统计粒度(周期)下,即某一时间段内单次函数执行最大的运行时间。 最小运行时间为某统计粒度(周期)下,即某一时间段内单次函数执行最小的运行时间。 平均运行时间为某统计粒度(周期)下,即某一时间段内单次函数执行平均的运行时间。 错误次数 次 指发生异常请求的函数不能正确执行完并且返回200,都计入错误次数。函数自身的语法错误或自身执行错误也会计入该指标。 被拒绝次数 次 由于并发请求太多,系统流控而被拒绝的请求次数。 资源统计 个 该函数的请求并发数和预留实例数。 内存使用量 MB 最大内存使用量为某统计粒度(周期)下,即某一时间段内单次函数执行最大的内存使用量。 最小内存使用量为某统计粒度(周期)下,即某一时间段内单次函数执行最小的内存使用量。 平均内存使用量为某统计粒度(周期)下,即某一时间段内单次函数执行平均的内存使用量。
  • SAP系统指标 SAP系统指标分为SAP HANA指标、SAP NetWeaver ABAP与Java应用指标,详情请参考: 表1 表2 表1 SAP HANA指标 指标组 指标名 指标含义 单位 database_version sap_hanadb_database_version_info 数据库版本 service_quantity sap_hanadb_service_quantity_count 实例进程总数 count sap_hanadb_active_service_quantity_count 实例活跃进程数 count database_ha_active sap_hanadb_database_ha_active_status 数据库HA状态 status sr_active sap_hanadb_sr_active_status 数据库系统复制状态 status threads sap_hanadb_all_threads_count 线程总数 count sap_hanadb_active_threads_count active线程数 count sap_hanadb_blocked_threads_count 阻塞线程数 count sap_hanadb_sqlexecutor_threads_count SQL执行线程数 count sap_hanadb_sqlexecutor_threads_active_count SQL执行active线程数 count sap_hanadb_jobworker_threads_count job工作线程总数 count sap_hanadb_jobworker_threads_active_count job工作线程active线程数 count recent_data_backup sap_hanadb_age_of_recent_data_backup_hours 最近一次成功完全数据备份距现在的时间间隔小时数。如果没有成功备份为-1。 hours recent_savepoint sap_hanadb_age_of_recent_savepoint_minutes 最近一次SAVEPOINT距现在的时间间隔分钟数。没有为-1。 minutes sap_hanadb_recent_savepoint_duration_seconds 最近一次SAVEPOINT的持续时间秒数。没有为-1。 seconds column_tables_used_memory sap_hanadb_column_tables_used_memory_mb 数据表内存使用量 mb schema_used_memory sap_hanadb_schema_used_memory_mb 数据库schema内存使用量 mb disk_data_files sap_hanadb_disk_data_files_used_size_mb 数据文件已使用磁盘大小 mb sap_hanadb_disk_data_files_total_size_mb 数据文件磁盘总量 mb sap_hanadb_disk_data_files_available_size_mb 数据文件可用磁盘大小 mb sap_hanadb_disk_data_files_fragmentation_percent 数据文件可用磁盘空间率 percent disk_usage sap_hanadb_disk_total_device_size_mb 操作系统返回的磁盘设备总大小,同一磁盘设备在不同使用类型磁盘设备(DATA、 LOG 等)之间共享时,结果会重复 mb sap_hanadb_disk_total_size_mb 磁盘数据卷总大小,同一磁盘设备在不同使用类型卷(DATA、LOG等)之间共享时,结果会重复 mb sap_hanadb_disk_total_used_size_mb 磁盘数据卷已使用大小,同一磁盘设备在不同使用类型卷(DATA、LOG等)之间共享时,结果会重复 mb sap_hanadb_disk_used_size_mb 按使用类型(DATA、LOG等)统计的已使用磁盘大小 mb service_memory sap_hanadb_memory_service_shared_allocated_mb 服务从内存池分配的共享内存 mb sap_hanadb_memory_service_shared_used_size_mb 服务从内存池分配已使用的共享内存 mb sap_hanadb_memory_service_shared_used_percent 服务从内存池分配已使用的共享内存占服务从内存池分配的共享内存比例 percent sap_hanadb_memory_service_heap_allocated_mb 服务从内存池已分配的堆内存 mb sap_hanadb_memory_service_heap_used_size_mb 服务从内存池分配已使用的堆内存 mb sap_hanadb_memory_service_heap_used_percent 服务从内存池分配已使用的堆内存占服务从内存池已分配的堆内存比例 percent sap_hanadb_memory_service_total_used_mb 服务从内存池已申请使用的总内存 mb sap_hanadb_memory_service_physical_total_mb 服务已使用的总物理内存 mb sap_hanadb_memory_service_virtual_total_mb 服务已使用的总虚拟内存 mb sap_hanadb_memory_service_code_size_mb 服务已使用的代码段大小(包括动态链接库) mb sap_hanadb_memory_service_stack_size_mb 服务已使用的栈大小 mb sap_hanadb_memory_service_compactors_freeable_size_mb 服务内存不足时可释放的内存 mb sap_hanadb_memory_service_compactors_allocated_size_mb 服务内存不足时内存池潜在可释放的内存 mb sap_hanadb_memory_service_alloc_limit_mb 服务最大内存池大小 mb sap_hanadb_memory_service_effective_alloc_limit_mb 服务最大有效内存池大小(考虑其他进程计算出的内存池大小) mb host_memory sap_hanadb_host_memory_physical_total_mb 主机总物理内存 mb sap_hanadb_host_memory_resident_mb 主机常驻(已使用)的物理内存 mb sap_hanadb_host_memory_physical_free_mb 主机空闲物理内存 mb sap_hanadb_host_memory_swap_free_mb 主机空闲交换内存 mb sap_hanadb_host_memory_swap_used_mb 主机已使用交换内存 mb sap_hanadb_host_memory_alloc_limit_mb 主机所有进程可分配的最大内存 mb sap_hanadb_host_memory_used_total_mb SAP HANA 进程从内存池中占用的总内存当前大小 mb sap_hanadb_host_memory_used_peak_mb 实例启动后,SAP HANA 进程从内存池中占用的总内存最大值 mb sap_hanadb_host_memory_pool_size_mb SAP HANA 进程的总内存池大小 mb sap_hanadb_host_memory_code_size_mb SAP HANA 进程的总代码段大小,包括动态链接库 mb sap_hanadb_host_memory_shared_alloc_mb SAP HANA 进程的总共享内存大小 mb sql_service sap_hanadb_sql_service_executions_count 不同类型SQL的执行总次数 count sap_hanadb_sql_service_elapsed_time_ms 不同类型SQL执行的总时间消耗 ms sap_hanadb_sql_service_elap_per_exec_avg_ms 不同类型SQL执行的平均时间消耗 ms sap_hanadb_sql_service_lock_per_exec_ms 不同类型SQL执行的平均锁等待时间 ms sap_hanadb_sql_service_max_ela_time_ms 不同类型SQL执行的最大时间消耗 ms sql_top_time sap_hanadb_sql_top_time_consumers_execution_time_mu SQL语句执行耗时TOP 10 mu sap_hanadb_sql_top_time_consumers_execution_count SQL语句执行耗时TOP 10的总执行次数 count sql_top_mem sap_hanadb_sql_top_mem_consumers_total_execution_memory_size_byte SQL语句内存消耗TOP 10 byte sap_hanadb_sql_top_mem_consumers_execution_count SQL语句内存消耗TOP 10的总执行次数 count connections_total sap_hanadb_connections_total_count 不同类型的连接总数 count table_cs_top_mem sap_hanadb_table_cs_top_mem_total_mb 数据库表内存消耗TOP10 mb sap_hanadb_table_cs_top_mem_estimated_max_mb 数据库表内存消耗TOP10的预估最大内存占用 mb sap_hanadb_table_cs_top_mem_record_count 数据库表内存消耗TOP10的数据行数 count sap_hanadb_table_cs_top_mem_disk_size_mb 数据库表内存消耗TOP10的磁盘占用大小 mb alerts sap_hanadb_alerts_current_rating 数据库告警 rating 表2 SAP NetWeaver ABAP与Java应用指标 指标组 指标名 指标含义 单位 application_version sap_netweaver_application_version_info 应用的版本 instance_quantity sap_netweaver_instance_quantity_count 应用系统总的实例数 count sap_netweaver_active_instance_quantity_count 应用系统活跃的实例数 count application_ha_active sap_netweaver_application_ha_active_status 应用的HA状态 status abap_short_dumps sap_netweaver_abap_short_dumps_count ABAP Dump数量,过去1小时的ABAP dumps统计 count abap_short_dumps_5m sap_netweaver_abap_short_dumps_5m_count 过去5分钟的ABAP dumps统计 count jobs sap_netweaver_canceled_jobs_count 过去1小时已删除(撤销)的作业数 count sap_netweaver_finished_jobs_count 过去1小时已完成的作业数 count logged_in_users sap_netweaver_logged_in_users_count SAP应用已登录的用户数 count lock_entries_usage sap_netweaver_lock_entries_usage_percent 锁使用率 percent extended_memory_utilization sap_netweaver_extended_memory_utilization_percent extended memory 使用率 percent heap_memory_utilization sap_netweaver_heap_memory_utilization_percent heap memory 使用率 percent dialog_response_time sap_netweaver_dialog_response_time_ms Dialog响应耗时 ms dialog_db_request_time sap_netweaver_dialog_db_request_time_ms Dialog到数据库的请求处理耗时 ms work_processes sap_netweaver_work_processes_utilization_percent 进程使用率,进程类型包括:会话,后台,打印,更新1,更新2 percent sap_netweaver_number_of_total_work_processes_count 进程总数,进程类型包括:会话,后台,打印,更新1,更新2 count sap_netweaver_number_of_free_work_processes_count 空闲进程数,进程类型包括: 会话,后台,打印,更新1,更新2 count jobs sap_netweaver_running_jobs_count 运行中的作业数 count failed_idocs sap_netweaver_failed_idocs_count 失败的idoc文档数 count update_records sap_netweaver_update_records_count 过去1分钟更新请求(update records)数量 count sap_netweaver_failed_updates_count 过去1分钟失败的更新请求(update records)数 count rfc_ping sap_netweaver_rfc_ping_ms 各实例到PAS节点的RFC调用时延 ms j2ee_running_process sap_netweaver_j2ee_running_process_count Java运行进程数量。 count j2ee_thread sap_netweaver_j2ee_thread_count Java线程数量 count j2ee_session sap_netweaver_j2ee_session_count Java session数量 count j2ee_websession sap_netweaver_j2ee_websession_count Java web session数量 count j2ee_ejbsession sap_netweaver_j2ee_ejbsession_count Java EJB session数量 count j2ee_vm_heap_size sap_netweaver_j2eevmheap_size_mb Java进程local classes或local objects堆大小 mb sap_netweaver_j2eevmheap_commitSize_mb Java进程local classes或local objects堆提交大小 mb sap_netweaver_j2eevmheap_maxUsedSize_mb Java进程local classes或local objects堆最大使用大小 mb sap_netweaver_j2eevmheap_initialSize_mb Java进程local classes或local objects堆初始大小 mb sap_netweaver_j2eevmheap_maxSize_mb Java进程local classes或local objects堆最大大小 mb
  • SAP HANA(单节点HA) 在SAP HANA(单节点HA)场景,您需要在主备节点上都部署监控Agent,具体请参考SAP HANA(单节点无HA)。 hostname填写各自的主机名,在主节点将database.hana的enable配置项改为true,启用监控。 HA切换后,在主节点需将database.hana的enable配置项改为false,停止原主节点的监控;在备节点需将database.hana的enable配置项改为true,启用新主节点。 父主题: 安装监控Agent
  • 前提条件 GUC参数enable_resource_track为on (默认为on)。 GUC参数resource_track_level为query、perf或operator(默认为query)。设置方法详见表2。 GUC参数enable_resource_record为on(默认为on)。 GUC参数resource_track_duration小于作业执行时间和排队时间之和(默认为60s)。 GUC参数enable_track_record_subsql控制是否记录存储过程、匿名块内部语句(默认为off)。 监控作业类型为:资源监控实时视图(参见表1)中记录的作业执行时间和排队时间之和大于或等于resource_track_duration的作业。 Cgroups功能正常加载,可通过gs_cgroup -P查看控制组信息。
  • 操作步骤 查询当前实例最近的资源使用情况。 1 SELECT * FROM GS_WLM_INSTANCE_HISTORY ORDER BY TIMESTAMP DESC; 查询结果如下: instancename | timestamp | used_cpu | free_mem | used_mem | io_await | io_util | disk_read | disk_write | process_read | process_write | logical_read | logical_write | read_counts | write_counts --------------+-------------------------------+----------+----------+----------+----------+----------+-----------+------------+--------------+---------------+--------------+---------------+-------------+-------------- dn_6015_6016 | 2022-01-10 17:29:17.329495+08 | 0 | 14570 | 8982 | 662.923 | 99.9601 | 697666 | 93655.5 | 183104 | 30082 | 285659 | 30079 | 357717 | 37667 dn_6015_6016 | 2022-01-10 17:29:07.312049+08 | 0 | 14578 | 8974 | 883.102 | 99.9801 | 756228 | 81417.4 | 189722 | 30786 | 285681 | 30780 | 358103 | 38584 dn_6015_6016 | 2022-01-10 17:28:57.284472+08 | 0 | 14583 | 8969 | 727.135 | 99.9801 | 648581 | 88799.6 | 177120 | 31176 | 252161 | 31175 | 316085 | 39079 dn_6015_6016 | 2022-01-10 17:28:47.256613+08 | 0 | 14591 | 8961 | 679.534 | 100.08 | 655360 | 169962 | 179404 | 30424 | 242002 | 30422 | 303351 | 38136
  • 约束与限制 当前仅华北-乌兰察布二零一、华北-北京一、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域可以直接使用 APM 配置功能,华北-北京四区域需提前在“菜单开关”中开启应用监控和配置的开关,详细操作请参见菜单开关。 APM配置功能当前仅在华北-乌兰察布二零一、华北-北京一、华北-北京四、华南-广州、西南-贵阳一、亚太-新加坡、中国-香港、华东-上海一、华东-上海二区域开放。
  • 内置发现规则说明 AOM 提供了Sys_Rule和Default_Rule两个内置的发现规则,内置的发现规则会在所有主机上执行,包括后续新增的主机。其中Sys_Rule优先级大于Default_Rule,即优先在主机上执行Sys_Rule,如果满足Sys_Rule,则不执行Default_Rule,如果不满足Sys_Rule,则执行Default_Rule。规则内容如下: Sys_Rule(不能停用) 使用Sys_Rule规则的场景下,组件名和应用名配对使用,必须同时设置组件名和应用名信息,取值优先级如下: 应用名称取值优先级: 取进程的启动命令中“Dapm_application”字段的值。 如果1为空,则取环境变量“JAVA_TOOL_OPTIONS”中“Dapm_application”字段的值。 如果2为空,则取环境变量“PAAS_MONITORING_GROUP”的值。 如果3为空,则取进程的启动命令中“DAOM.APPN”字段的值。 组件名称取值优先级: 取进程的启动命令中“DAOM.PROCN”字段的值,如果为空则取“Dapm_tier”字段的值。 如果1为空,则取环境变量“JAVA_TOOL_OPTIONS”中“Dapm_tier”字段的值。 如果2为空,则取环境变量“PAAS_APP_NAME”的值。 如下示例所示,则组件名为atps-demo,应用名为atpd-test。 PAAS_MONITORING_GROUP=atpd-test PAAS_APP_NAME=atps-demo JAVA_TOOL_OPTIONS=-javaagent:/opt/oss/servicemgr/ICAgent/pinpoint/pinpoint-bootstrap.jar -Dapm_application=atpd-test -Dapm_tier=atps-demo Default_Rule(可停用) 如果进程的“COMMAND”列的值为“java”,则组件名依次按照优先级从命令行中的jar包名、命令行中主类名、命令行中第一个非-开头的关键字获取,应用名使用默认值unknownapplicationname。 如果进程的“COMMAND”列的值为“python”,则组件名取命令行中第一个py/pyc脚本名,应用名使用默认值unknownapplicationname。 如果进程的“COMMAND”列的值为“node”,则组件名取命令行中第一个js脚本名,应用名使用默认值unknownapplicationname。
  • 更多应用发现规则操作 应用发现规则添加完成后,您还可以执行表2中的操作。 表2 相关操作 操作 说明 查看规则详情 在“名称”列单击规则的名称。 启、停规则 单击“操作”列的“启用”。 单击“操作”列的“停用”。停用后,AOM将不采集进程的指标数据。 删除规则 删除一个发现规则:在“操作”列选择“删除”。 删除一个或多个发现规则:选中一个或多个发现规则前的复选框,单击页面左上角的“删除”。 内置发现规则不支持删除操作。 修改规则 在“操作”列选择“修改”。 内置发现规则不支持修改操作。
  • 过滤规则说明 ICAgent会在目标主机上进行周期性探测,类似ps -e -o pid,comm,lstart,cmd | grep -v defunct命令的效果,查出目标主机的所有进程。然后将每一个进程分别与过滤规则(过滤规则详见表1)进行匹配。如果进程满足过滤规则,则进程会被过滤掉,不会被AOM发现;如果进程不满足过滤规则,则进程不会被过滤,会被AOM发现。 探测结果类似如下回显信息: PID COMMAND STARTED CMD 1 systemd Tue Oct 2 21:12:06 2018 /usr/lib/systemd/systemd --switched-root --system --deserialize 20 2 kthreadd Tue Oct 2 21:12:06 2018 [kthreadd] 3 ksoftirqd/0 Tue Oct 2 21:12:06 2018 (ksoftirqd/0) 1140 tuned Tue Oct 2 21:12:27 2018 /usr/bin/python -Es /usr/sbin/tuned -l -P 1144 sshd Tue Oct 2 21:12:27 2018 /usr/sbin/sshd -D 1148 agetty Tue Oct 2 21:12:27 2018 /sbin/agetty --keep-baud 115200 38400 9600 hvc0 vt220 1154 docker-containe Tue Oct 2 21:12:29 2018 docker-containerd -l unix:///var/run/docker/libcontainerd/docker-containerd.sock --shim docker-containerd-shim --start-timeout 2m --state-dir /var/run/docker/libcontainerd/containerd --runtime docker-runc --metrics-interval=0 表1 过滤规则 过滤规则 举例 如果进程的“COMMAND”列的值为“docker-containe”、“vi”、“vim”、“pause”、“sshd”、“ps”、“sleep”、“grep”、“tailf”、“tail”或“systemd-udevd”,且为非容器内的进程,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“1154”的进程,因为其“COMMAND”列的值为“docker-containe”,所以该进程不会被AOM发现。 如果进程的“CMD”列的值以“[”开头,且以“]”结尾,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“2”的进程,因为其“CMD”列的值为“[kthreadd]”,所以该进程不会被AOM发现。 如果进程的“CMD”列的值以“(”开头,且以“)”结尾,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“3”的进程,因为其“CMD”列的值为“(ksoftirqd/0)”,所以该进程不会被AOM发现。 如果进程的“CMD”列的值以“/sbin/”开头,则该类进程会被过滤掉,不会被AOM发现。 例如,上面信息中“PID”为“1148”的进程,因为其“CMD”列的值以“/sbin/”开头,所以该进程不会被AOM发现。
  • 功能说明 告警行动规则:通过创建告警行动规则关联 SMN 主题与消息模板,当日志、资源或指标数据满足对应的告警条件时,系统根据关联SMN主题与消息模板来发送告警通知。 告警降噪:在发送告警通知前按告警降噪规则对告警进行处理,处理完成后再发送通知,避免产生告警风暴。 告警规则:通过创建告警或事件规则,实时监控资源使用情况。 查看告警或事件:提供告警和事件的查询和处理功能,便于您更快地发现、定位并恢复故障。
  • 时间范围和统计周期的关系说明 AOM约束单个指标单次查询最大返回1440个数据点,因此统计周期与时间范围的关系如下所示: 最大可查询时间范围=统计周期×1440 当您选中的查询时间范围小于等于最大可查询时间范围时,所有满足以上条件的统计周期可以被选择。例如,查询1小时的指标时,可选的统计周期为1分钟和5分钟。 以“仪表盘”页面为例,时间范围与统计周期的关系如下表所示。 表7 时间范围和统计周期关系表 时间范围 统计周期 近30分钟 1分钟、5分钟 近1小时 近6小时 1分钟、5分钟、15分钟、1小时 近1天 近1周 1小时 自定义时间段 1分钟、5分钟、15分钟、1小时
  • 更多仪表盘操作 仪表盘创建完成后,您还可以执行表5中的操作。 表5 相关操作 操作 说明 设置列表项 在仪表盘列表右上角单击,通过选中/取消选中各展示项前的复选框,自定义列表项的展示/隐藏。 收藏仪表盘 选择一个仪表盘,单击“操作”列的。 移动仪表盘分组 移动一个仪表盘分组:选择一个仪表盘,单击“操作”列的,选择“移动分组”。 批量移动仪表盘分组:选中多个仪表盘前的复选框,在弹出框中选择“移动分组”可修改仪表盘分组。 删除仪表盘 删除一个仪表盘:选择一个仪表盘,单击“操作”列的,选择“删除”。 批量删除仪表盘:选中多个仪表盘前的复选框,在弹出框中选择“删除”可批量删除仪表盘。 修改仪表盘分组名称 在“仪表盘”列表,单击仪表盘名称。 进入对应仪表盘页面,在“仪表盘”页面左上角,单击仪表盘名称。 将光标移至待操作的仪表盘分组名称后,单击,选择“编辑”可修改分组名称。 删除仪表盘分组 删除仪表盘分组功能有两种入口方式: 入口一: 在“仪表盘”列表,单击仪表盘名称。 进入对应仪表盘页面,在“仪表盘”页面左上角,单击仪表盘名称。 将光标移至待操作的仪表盘分组名称后,单击 ,选择“删除”。 在弹出框中单击“确定”,删除仪表盘分组。 入口二:在仪表盘分组列表中,将光标移至需要删除的仪表盘分组名称后,单击,选择“删除”,在弹出框中单击“确定”,删除仪表盘分组。 删除仪表盘中的图表 选择待操作的仪表盘,在“仪表盘”页面右上角单击,将光标移至某个图表框右上角,单击,在下拉列表中选择“删除图表”。 单击,将已创建图表删除。 调整仪表盘中图表的位置 选择待操作的仪表盘,在“仪表盘”页面右上角单击,将光标移至待操作的图表框内,选中该图表,可将该图表移动至仪表盘内任意位置。 单击,调整当前图表布局。 全屏显示 选择待操作的仪表盘,在“仪表盘”页面右上角单击,可全屏显示仪表盘。 退出全屏显示 将光标移至屏幕上方,单击弹出的,或者单击,或者按键盘中的“Esc”可退出全屏模式。 手动刷新 选择待操作的仪表盘,在“仪表盘”页面右上角单击可手动刷新当前页面。 自动刷新 选择待操作的仪表盘,在“仪表盘”页面右上角单击后的下拉箭头,开启仪表盘自动刷新开关。 手动刷新单个图表 选择待操作的仪表盘,将光标移至某个图表框右上角,单击,在下拉列表中选择“刷新”,可手动刷新当前图表。 修改单个图表 选择待操作的仪表盘,将光标移至某一图表框右上角,单击,选择“编辑”,可修改图表数据,具体操作请参见添加图表至仪表盘。 修改完成后,单击“确定”。 在“仪表盘”页面右上角单击,保存修改结果。 新版仪表盘功能的图表配置与旧版仪表盘功能的图表配置不相同: 使用旧版仪表盘编辑新版仪表盘中创建的图表时,旧版仪表盘的图表配置无法兼容新版仪表盘的图表配置。 使用新版仪表盘编辑旧版仪表盘中创建的图表时,新版仪表盘的图表配置可以兼容旧版仪表盘的图表配置。 新增告警规则 添加图表时,新增告警规则 单击页面中的“添加图表”或单击页面右上角的。 选择指标后,在指标列表右上方单击,可为当前添加的所有指标新增告警规则。具体操作请参见创建指标告警规则。 修改图表时,新增告警规则 选择待操作的仪表盘,将光标移至某一图表框右上角,单击,选择“编辑”。 选择指标后,在指标列表右上方单击,可为当前添加的所有指标新增告警规则。具体操作请参见创建指标告警规则。 全屏显示单个图表 选择待操作的仪表盘,将光标移至某一图表框右上角,单击,选择“全屏”,可全屏显示图表数据。 退出全屏显示单个图表 将光标移至屏幕上方,单击弹出的,或者单击,选择“退出全屏”,或者按键盘中的“Esc”可退出全屏模式。 轮播仪表盘 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见设置全屏模式在线时长。 仪表盘设置 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见新增变量。 查询时间设置 选择待操作的仪表盘,在“仪表盘”页面右上角单击前面的下拉框,在下拉框可选择“近30分钟”、“近1小时”、“近6小时”、“近一天”、“近一周”、“自定义时间段”。若选择“自定义时间段”,在弹出日历表中选择对应的时间段,时间可精确至秒数。单击“确定”后,可根据选择时间查询仪表盘中所有图表数据。 导出仪表盘 可将该仪表盘的指标图表数据以JSON格式导出,并保存到本地便于进一步分析。导出仪表盘功能有两种入口方式: 入口一:在仪表盘列表中,选择一个仪表盘,单击“操作”列的,选择“导出仪表盘”。 入口二:选择待操作的仪表盘,在“仪表盘”页面右上角单击,并选择“导出仪表盘”。 导入仪表盘 将本地存储的JSON格式仪表盘数据导入AOM,便于在AOM上可视化分析。导入仪表盘功能有两种入口方式: 入口一:在“仪表盘”页面,单击“导入仪表盘”。 入口二:在仪表盘分组列表中,将光标移至需要导入仪表盘的分组名称后,单击,选择“导入仪表盘”。 导入方法: 选择待导入的JSON格式仪表盘文件,上传或拖入“导入仪表盘”对话框的文本上传区域,然后单击“创建”。 在“新建仪表盘”对话框,依次设置仪表盘名称等信息,具体请参见表1。 设置完成,单击“创建”。 导出监控报告 选择待操作的仪表盘,在“仪表盘”页面右上角单击,选择“导出折线图监控报告”,可将该指标的折线图表以 CS V格式导出,以便进行本地存储及进一步分析。 表6 日志图表相关操作 操作 说明 创建日志组 输入日志组名称。日志组名称只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 设置日志存储时间。存储时间默认为7天,可设置为1-30天内的时间节点。超出存储时间的日志将会被自动删除,您可以按需将日志数据转储至OBS桶中长期存储。 单击“确定”完成创建。 创建日志流 输入日志流名称。日志流名称只支持输入英文、数字、中文、中划线、下划线及小数点,且不能以小数点、下划线开头或以小数点结尾。 单击“确定”完成创建。
  • 更多操作 表1 仪表盘相关操作 操作 说明 全屏显示 选择待操作的仪表盘,在“仪表盘”页面右上角单击,可全屏显示仪表盘。 退出全屏显示 将光标移至屏幕上方,单击弹出的,或者单击,或者按键盘中的“Esc”可退出全屏模式。 手动刷新 选择待操作的仪表盘,在“仪表盘”页面右上角单击可手动刷新当前页面。 自动刷新 选择待操作的仪表盘,在“仪表盘”页面右上角单击后的下拉箭头,开启仪表盘自动刷新开关。 轮播仪表盘 选择待操作的仪表盘,在“仪表盘”页面右上角单击。具体操作请参见设置全屏模式在线时长。 查询时间设置 选择待操作的仪表盘,在“仪表盘”页面右上角单击前面的下拉框,在下拉框可选择“近30分钟”、“近1小时”、“近6小时”、“近一天”、“近一周”、“自定义时间段”。若选择“自定义时间段”,在弹出日历表中选择对应的时间段,时间可精确至秒数。单击“确定”后,可根据选择时间查询仪表盘中所有图表数据。 导出监控报告 选择待操作的仪表盘,在“仪表盘”页面右上角单击,选择“导出折线图监控报告”,可将该指标的折线图表以CSV格式导出,以便进行本地存储及进一步分析。
  • 前提条件 已购买弹性 云服务器ECS 。 已购买弹性公网IP,并绑定到购买的弹性云服务器ECS上,具体操作请参见《弹性公网IP快速入门》。 服务已接入可观测Prometheus 监控。具体操作,请参见: Prometheus实例 for 云服务 Prometheus实例 for ECS Prometheus实例 for CCE Prometheus 通用实例 Prometheus实例 for 多账号聚合实例
  • 操作步骤 登录MAS控制台,在“多活管理”页面单击实例,进入实例控制台。 在页面顶端导航栏选择“监控列表”,单击页面左上角的“监控配置”。 配置全局监控配置(建议使用默认值),完成后单击“确定”。 表1 监控配置 参数 配置说明 监控类型 选择需要配置的监控类型,可选的监控类型依赖实例已经创建的监控器类型。 监控超时时间 一个周期内监控器对数据库探测监控的超时时间,超过这个时间,则认为探测数据库失败,监控状态变为监控异常。 以毫秒为单位,输入值必须在4000到400000之间。 重试时间间隔 尝试重连时间间隔。 输入值必须在2000到30000之间。 数据库访问超时时间 当“监控类型”配置为“MySQL/Oracle/PostgreSQL监控”和“MongoDB监控”时可见; 访问数据库超时时间,超过这个时间认为一次访问数据库失效。 输入值必须在3000到100000之间。 健康精度 探测的健康精度。配置为1,表示多活实例的监控集群中只要有一个worker探测到数据库,则认为探测成功;当探测失败时,由Leader做故障处理。 输入值必须为1或2。 说明: “API监控”仅需配置“健康精度”,无需配置其他参数。