云服务器内容精选

  • 监控指标 表1 高性能弹性文件服务支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) client_connections 客户端连接数 该指标用于统计测量客户端连接数。 说明: 连接数统计的是活跃的客户端链接。 如果客户端长时间无 IO,网络链接会自动断开,当有 IO 时客户端会自动重新建立网络链接。 ≥ 0 高性能弹性文件服务 1分钟 data_read_io_bytes 读带宽 该指标用于测量读I/O负载。 单位:byte/s ≥ 0 bytes/s 高性能弹性文件服务 1分钟 data_write_io_bytes 写带宽 该指标用于测量写I/O负载。 单位:byte/s ≥ 0 bytes/s 高性能弹性文件服务 1分钟 metadata_io_bytes 元数据读写带宽 该指标用于测量元数据读写I/O负载。 单位:byte/s ≥ 0 bytes/s 高性能弹性文件服务 1分钟 total_io_bytes 总带宽 该指标用于测量总I/O负载。 单位:byte/s ≥ 0 bytes/s 高性能弹性文件服务 1分钟 iops IOPS 该指标用于测量单位时间内处理的I/O数。 ≥ 0 高性能弹性文件服务 1分钟 used_capacity 已用容量 该指标用于统计文件系统已用容量。 单位:byte ≥ 0 bytes 高性能弹性文件服务 1分钟 used_capacity_percent 容量使用率 该指标用于统计文件系统已用容量占总容量的比例。 单位:百分比 0 - 100% 高性能弹性文件服务 1分钟 used_inode 已用inode数 该指标用于统计文件系统已用inode数 ≥ 1 高性能弹性文件服务 1分钟 used_inode_percent inode使用率 该指标用于统计文件系统已用inode数占总inode数的比率。单位:百分比 0 - 100% 高性能弹性文件服务 1分钟
  • 告警处置举例 此处以“【应用】源ip xx.xx.xx.xx 对 域名 demo.host.com进行了xx次攻击”告警为例进行说明。 收到告警: 图7 告警示例 分析思路: 源IP对域名进行爆破攻击,会对可能的子域名产生大量的枚举和测试。 安全云脑 通过分析 Web应用防火墙 的告警,统计1小时内的攻击次数,过滤出次数超过阈值的攻击进行告警。 查看告警: 告警详情页面可以看到告警攻击IP、攻击域名,分析模型是“应用-源ip对域名进行爆破攻击”数据管道名称为“sec-waf-attack”。 图8 查看总览信息 图9 查看上下文信息 因为是统计类模型告警,可以结合WAF日志进行安全分析。单个源IP对域名进行多次攻击,虽然已经被WAF阻断,但是由于攻击次数较多,存在绕过WAF的风险,将多次攻击的行为冒泡出来。 分析/处理告警: 进入安全分析页面,打开sec-waf-access日志。 输入查询语句,筛选查询时间,并单击“查询/分析”。 response_code='200' and remote_ip=MATCH_QUERY('xx.xx.xx.xx') 图10 分析告警 根据查询结果,分析查询该IP有没有成功的访问请求。 通过分析,如果该攻击ip请求成功的都是非敏感url,不存在攻击成功或绕过WAF检测的风险,直接在告警详情页面,单击“关闭”,并根据提示关闭告警。 图11 关闭告警 如果是有风险url访问成功,直接在告警详情页面,单击“一键阻断”,填写风险IP,选择WAF防线,阻断老化15天,进行危险IP封堵。 图12 一键阻断
  • 典型告警处理指导 表3 典型告警处理指导 告警类型 安全防线 依赖数据源 云脑智能模型 护网推荐处理建议 侦察阶段典型告警 网络防线 NIP攻击日志 网络-高危端口对外暴露 排查源IP对系统中的高危端口连接是否为业务需要。如果为业务需要,可修改模型脚本将该源IP过滤掉;如果非业务需要,则可修改相应安全组入方向规则,禁止高危端口暴漏公网,或者对源ip进行封堵拦截。同时为保证系统安全,尽量关闭不必要的端口。 侦察阶段典型告警 应用防线 WAF攻击日志 应用-源ip进行url遍历 应急处理可以记录所有的访问请求和响应,及时发现攻击行为,针对攻击源IP进行限制或者阻断,可以通过配置黑名单策略进行封锁。 侦察阶段典型告警 应用防线 WAF访问日志 应用-疑似存在源码泄露风险 应急处理可以记录所有的访问请求和响应,及时发现攻击行为,针对攻击源IP进行限制或者阻断,可以通过配置黑名单策略进行封锁。 尝试攻击典型告警 应用防线 WAF攻击日志 应用-WAF关键攻击告警、应用-疑似存在Shiro漏洞、应用-疑似存在log4j2漏洞、应用-疑似存在 Java框架通用代码执行漏洞、应用-疑似存在fastjson漏洞 需要联系业务责任人,排查Web服务器是否存在相关漏洞,确认是否攻击成功。如果存在漏洞,应及时修改漏洞并加固安全;如果攻击成功,可结合威胁情报对攻击IP进行拦截。 尝试攻击典型告警 网络防线 NIP攻击日志 网络-检测黑客工具攻击、网络-登录爆破告警 请确认该操作是否为正常业务人员的行为,如果不是,可以参考以下处置建议: 切断网络连接:立即停止受攻击的设备或系统与网络的连接,以防止攻击者继续进行攻击或窃取数据。 收集证据:记录攻击发生的时间、攻击者使用的IP地址、攻击类型和受影响的系统等信息,这些信息可能有助于后续的调查和追踪。 尝试攻击典型告警 网络防线 CFW访问控制日志 网络-疑似存在DOS攻击 请确认该操作是否为正常业务人员的行为,如果不是,可在相关网络设备上进行IP拦截或封堵。 入侵成功典型告警 网络防线 NIP攻击日志 网络-命令注入告警 如果发现源端口或目的端口为4444、8686、7778等非常用端口(可疑端口一般为4个数字),需联系责任人确认业务场景。如果不是正常业务行为,可能是黑客正在进行命令注入攻击,需要结合业务及主机日志查看是否被成功入侵,同时也可以对攻击ip采取拦截封堵等措施。 入侵成功典型告警 网络防线 NIP攻击日志 网络-恶意软件 [蠕虫、病毒、木马] 首先应该立即断开与互联网的连接,防止恶意软件进一步传播或者窃取您的敏感信息。之后可通过系统还原,杀毒软件等方式扫描和清除恶意软件。 入侵成功典型告警 主机防线 主机安全告警日志 主机-暴力破解成功、主机-异常shell、主机-异地登录 请确认该事件是否攻击成功,如果攻击成功,表明该主机已经失陷,需要进行主机隔离,防止风险扩散,之后对失陷的主机进行加固。 入侵成功典型告警 主机防线 主机安全日志 主机-进程和端口信息隐匿、主机-异常文件属性修改 及时判断是否是内部人员操作,是否为误操作。如果是异常进程,或文件存在恶意行为,执行相关命令结束进程。 防御绕过典型告警 主机防线 主机安全告警日志 主机-rootkit事件 立即确认该Rootkit安装是否正常业务引起。如果是非正常业务引起的,建议您立即登录系统终止该Rootkit安装行为,利用主机安全告警信息全面排查系统风险,避免系统遭受进一步破坏。 权限维持典型告警 主机防线 主机安全告警日志 主机-反弹shell、主机-恶意程序 联系所属主机的责任人,登录到主机上停止恶意程序并删除恶意文件,同时进一步排查是否存在可疑进程,是否开放了可疑端口,是否有可疑连接等,并进一步检查自启动项,避免遗留,此外可以结合其他方式进行综合判断。 权限维持典型告警 网络防线 NIP攻击日志 网络-检测异常连接行为 首先需要确认是否为真实的异常行为,而非误报或误判。可以通过多个方法进行确认,例如,查看日志记录、使用网络监控工具等。一旦确认存在异常连接行为,需要立即采取措施切断该异常连接,消除恶意软件,以避免进一步安全问题的发生。 横向移动典型告警 主机防线 主机安全日志 主机-虚拟机横向连接 建议通过 堡垒机 等审计记录查看该命令是程序执行还是人为操作,如果为人为操作,需联系对应操作人确定,风格为非正常业务人员操作,需尽快确定该行为是否为异常恶意行为,是否危害到对应虚拟机,及时采取措施,保护计算机和系统的安全。 持久化控制典型告警 网络防线 NIP攻击日志 网络-后门 首先应该立即断开与互联网的连接,防止后门进一步传播或者窃取您的敏感信息。可以使用杀毒软件进行扫描和清除后门,并查找和删除可疑文件,确保系统的安全性。 持久化控制典型告警 主机防线 主机安全日志 主机-恶意定时任务写入 请确认是否为正常业务任务,如果不是,可以停用计划任务。
  • 操作场景 安全云脑提供了4+1个大屏,一个是综合 态势感知 大屏,其他四个大屏是值班响应大屏、资产大屏、威胁态势大屏和脆弱性大屏。 护网开始之前我们已经完成了自查整改,清零了所有未处理的运营数据。 护网及重保期间,安全值班人员需要重点关注“值班响应大屏”的数据信息,当有告警冒泡出来的时候,及时进行告警处理,清零全部告警数据。 通过告警详情页数据进行告警分析,如果需要结合其他日志数据,可通过安全分析在对应数据管道进行查询统计溯源。误报告警直接关闭,有风险告警可通过“一键阻断”能力应急阻断。
  • 事件监控简介 事件监控提供了事件类型数据上报、查询和告警的功能。方便您将业务中的各类重要事件或对云资源的操作事件收集到 云监控服务 ,并在事件发生时进行告警。 事件即 云监控 服务保存并监控的RDS资源的关键操作,您可以通过“事件”了解到谁在什么时间对系统哪些资源做了什么操作,如重置数据库管理员密码、修改备份策略等。 事件监控默认开通,您可以在事件监控中查看系统事件和自定义事件的监控详情,目前支持的系统事件请参见事件监控支持的事件说明。 事件监控为您提供上报自定义事件的接口,方便您将业务产生的异常事件或重要变更事件采集上报到云监控服务。 上报自定义事件请参见上报事件。 父主题: 事件监控
  • 实例监控指标 RDS for MariaDB实例性能监控指标,如下表所示。 表1 RDS for MariaDB实例支持的监控指标 索引 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) 1 rds001_cpu_util CPU使用率 该指标用于统计测量对象的CPU使用率,以比率为单位。 0-100% RDS for MariaDB实例 1分钟 2 rds002_mem_util 内存使用率 该指标用于统计测量对象的内存使用率,以比率为单位。 0-100% RDS for MariaDB实例 1分钟 3 rds003_iops IOPS 该指标用于统计当前实例,单位时间内系统处理的I/O请求数量(平均值)。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 4 rds004_bytes_in 网络输入吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输入的流量,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 5 rds005_bytes_out 网络输出吞吐量 该指标用于统计平均每秒从测量对象的所有网络适配器输出的流量,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 6 rds006_conn_count 数据库总连接数 该指标用于统计试图连接到MariaDB服务器的总连接数,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟 7 rds007_conn_active_count 当前活跃连接数 该指标用于统计当前打开的连接的数量,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟 8 rds008_qps QPS 该指标用于统计SQL语句查询次数,含存储过程,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 9 rds009_tps TPS 该指标用于统计事务执行次数,含提交的和回退的,以次/秒为单位。 ≥ 0 transactions/s RDS for MariaDB实例 1分钟 10 rds010_innodb_buf_usage 缓冲池利用率 该指标用于统计空闲的页与InnoDB缓存中缓冲池页面总数的比例,以比率为单位。 0-1 RDS for MariaDB实例 1分钟 11 rds011_innodb_buf_hit 缓冲池命中率 该指标用于统计读命中与读请求数比例,以比率为单位。 0-1 RDS for MariaDB实例 1分钟 12 rds012_innodb_buf_dirty 缓冲池脏块率 该指标用于统计InnoDB缓存中脏数据与InnoDB缓存中使用的页比例,以比率为单位。 0-1 RDS for MariaDB实例 1分钟 13 rds013_innodb_reads InnoDB读取吞吐量 该指标用于统计Innodb平均每秒读字节数,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 14 rds014_innodb_writes InnoDB写入吞吐量 该指标用于统计Innodb平均每秒写字节数,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 15 rds015_innodb_read_count InnoDB文件读取频率 该指标用于统计Innodb平均每秒从文件中读的次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 16 rds016_innodb_write_count InnoDB文件写入频率 该指标用于统计Innodb平均每秒向文件中写的次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 17 rds017_innodb_log_write_req_count InnoDB日志写请求频率 该指标用于统计平均每秒的日志写请求数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 18 rds018_innodb_log_write_count InnoDB日志物理写频率 该指标用于统计平均每秒向日志文件的物理写次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 19 rds019_innodb_log_fsync_count InnoDB日志fsync()写频率 该指标用于统计平均每秒向日志文件完成的fsync()写数量,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 20 rds020_temp_tbl_rate 临时表创建速率 该指标用于统计每秒在硬盘上创建的临时表数量,以个/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 21 rds021_myisam_buf_usage Key Buffer利用率 该指标用于统计MyISAM Key buffer的利用率,以比率为单位。 0-1 RDS for MariaDB实例 1分钟 22 rds022_myisam_buf_write_hit Key Buffer写命中率 该指标用于统计MyISAM Key buffer写命中率,以比率为单位。 0-1 RDS for MariaDB实例 1分钟 23 rds023_myisam_buf_read_hit Key Buffer读命中率 该指标用于统计MyISAM Key buffer读命中率,以比率为单位。 0-1 RDS for MariaDB实例 1分钟 24 rds024_myisam_disk_write_count MyISAM硬盘写入频率 该指标用于统计向磁盘写入索引的次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 25 rds025_myisam_disk_read_count MyISAM硬盘读取频率 该指标用于统计从磁盘读取索引的次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 26 rds026_myisam_buf_write_count MyISAM缓冲池写入频率 该指标用于统计向缓冲池写入索引的请求次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 27 rds027_myisam_buf_read_count MyISAM缓冲池读取频率 该指标用于统计从缓冲池读取索引的请求次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 28 rds028_comdml_del_count Delete语句执行频率 该指标用于统计平均每秒Delete语句执行次数,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 29 rds029_comdml_ins_count Insert语句执行频率 该指标用于统计平均每秒Insert语句执行次数,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 30 rds030_comdml_ins_sel_count Insert_Select语句执行频率 该指标用于统计平均每秒Insert_Select语句执行次数,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 31 rds031_comdml_rep_count Replace语句执行频率 该指标用于统计平均每秒Replace语句执行次数,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 32 rds032_comdml_rep_sel_count Replace_Selection语句执行频率 该指标用于统计平均每秒Replace_Selection语句执行次数,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 33 rds033_comdml_sel_count Select语句执行频率 该指标用于统计平均每秒Select语句执行次数。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 34 rds034_comdml_upd_count Update语句执行频率 该指标用于统计平均每秒Update语句执行次数,以次/秒为单位。 ≥ 0 queries/s RDS for MariaDB实例 1分钟 35 rds035_innodb_del_row_count 行删除速率 该指标用于统计平均每秒从InnoDB表删除的行数,以行/秒为单位。 ≥ 0 rows/s RDS for MariaDB实例 1分钟 36 rds036_innodb_ins_row_count 行插入速率 该指标用于统计平均每秒向InnoDB表插入的行数,以行/秒为单位。 ≥ 0 rows/s RDS for MariaDB实例 1分钟 37 rds037_innodb_read_row_count 行读取速率 该指标用于统计平均每秒从InnoDB表读取的行数,以行/秒为单位。 ≥ 0 rows/s RDS for MariaDB实例 1分钟 38 rds038_innodb_upd_row_count 行更新速率 该指标用于统计平均每秒向InnoDB表更新的行数,以行/秒为单位。 ≥ 0 rows/s RDS for MariaDB实例 1分钟 39 rds039_disk_util 磁盘利用率 该指标用于统计测量对象的磁盘利用率,以比率为单位。 0-100% RDS for MariaDB实例 1分钟 40 rds047_disk_total_size 磁盘总大小 该指标用于统计测量对象的磁盘总大小。 40GB~4000GB RDS for MariaDB实例 1分钟 41 rds048_disk_used_size 磁盘使用量 该指标用于统计测量对象的磁盘使用大小。 0GB~4000GB RDS for MariaDB实例 1分钟 42 rds049_disk_read_throughput 硬盘读吞吐量 该指标用于统计每秒从硬盘读取的字节数。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 43 rds050_disk_write_throughput 硬盘写吞吐量 该指标用于统计每秒写入硬盘的字节数。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 44 rds072_conn_usage 连接数使用率 该指标用于统计当前已用的MariaDB连接数占总连接数的百分比。 0-100% RDS for MariaDB实例 1分钟 45 rds073_replication_delay 实时复制时延 该指标为备库或只读与主库的实时延迟,对应seconds_behind_master。该值为实时值。 ≥ 0 s RDS for MariaDB实例 1分钟 5秒 46 rds074_slow_queries 慢日志个数统计 该指标用于展示每分钟MariaDB产生慢日志的数量。 ≥ 0 RDS for MariaDB实例 1分钟 47 rds075_avg_disk_ms_per_read 硬盘读耗时 该指标用于统计某段时间平均每次读取磁盘所耗时间。 ≥ 0 ms RDS for MariaDB实例 1分钟 48 rds076_avg_disk_ms_per_write 硬盘写耗时 该指标用于统计某段时间平均写入磁盘所耗时间。 ≥ 0 ms RDS for MariaDB实例 1分钟 49 rds077_vma VMA数量 该指标用于监控RDS进程的虚拟内存区域大小 ≥ 0 counts RDS for MariaDB实例 1分钟 50 rds078_threads 进程中线程数量 监控RDS进程中的线程数量,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟 51 rds079_vm_hwm 进程的物理内存占用峰值 监控RDS进程的物理内存占用峰值,以KB为单位。 ≥ 0 KB RDS for MariaDB实例 1分钟 52 rds080_vm_peak 进程的虚拟内存占用峰值 监控RDS进程的虚拟内存占用峰值,以KB为单位。 ≥ 0 KB RDS for MariaDB实例 1分钟 53 rds082_semi_sync_tx_avg_wait_time 事务平均等待时间 监控半同步复制模式下平均等待时间,以微秒为单位。 ≥ 0 μs RDS for MariaDB实例 1分钟 54 rds173_replication_delay_avg 平均复制时延 该指标为备库或只读与主库的平均延迟,对应seconds_behind_master ≥ 0 s RDS for MariaDB实例 1分钟 55 rds_buffer_pool_wait_free 缓冲池空闲页等待次数 该指标用于统计InnoDB缓冲池空闲页等待次数 ≥ 0 counts RDS for MariaDB实例 1分钟 56 rds_bytes_recv_rate 数据库每秒接受字节 该指标用于统计数据库每秒接收字节,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 57 rds_bytes_sent_rate 数据库每秒发送字节 该指标用于统计数据库每条发送字节,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 58 rds_conn_active_usage 活跃连接数使用率 该指标统计活跃连接数占最大连接数的比率,以比率为单位。 0-100% RDS for MariaDB实例 1分钟 59 rds_created_tmp_tables_rate 每秒创建临时表数 该指标用于统计每秒创建临时表数,以个/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 60 rds_innodb_buffer_pool_pages_flushed_rate innodb_buffer_pool每秒页面刷新数 该指标用于统计innodb_buffer_pool每秒页面刷新数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 61 rds_innodb_buffer_pool_read_requests_rate innodb_buffer_pool每秒读请求次数 该指标用于统计innodb_buffer_pool每秒读请求次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 62 rds_innodb_buffer_pool_write_requests_rate innodb_buffer_pool每秒写请求次数 该指标用于统计innodb_buffer_pool每秒写请求次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 63 rds_innodb_lock_waits 等待行锁事务数 该指标用于统计当前等待行锁的Innodb事务数,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟 64 rds_innodb_log_waits_count 日志等待次数 该指标用于统计日志等待次数,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟 65 rds_innodb_log_waits_rate 因log buffer不足导致等待flush到磁盘次数 该指标用于统计因log buffer不足导致等待flush到磁盘次数,以次/秒为单位。 ≥ 0 counts/s RDS for MariaDB实例 1分钟 66 rds_innodb_os_log_written_rate 平均每秒写入redo log的大小 该指标用于统计平均每秒写入redo log的大小,以字节/秒为单位。 ≥ 0 bytes/s RDS for MariaDB实例 1分钟 67 rds_innodb_pages_read_rate innodb平均每秒读取的数据量 该指标用于统计innodb平均每秒读取的数据量,以页/秒为单位。 ≥ 0 Pages/s RDS for MariaDB实例 1分钟 68 rds_innodb_pages_written_rate innodb平均每秒写入的数据量 该指标用于统计innodb平均每秒写入的数据量,以页/秒为单位。 ≥ 0 Pages/s RDS for MariaDB实例 1分钟 69 rds_innodb_row_lock_current_waits 当前行锁等待数 该指标用于统计innodb当前行锁等待数,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟 70 rds_innodb_row_lock_time_avg 行锁平均等待时间 该指标用于统计行锁平均等待时间,以毫秒为单位。 ≥ 0 ms RDS for MariaDB实例 1分钟 71 rds_wait_thread_count 等待线程数 该指标用于统计等待线程数量,以个为单位。 ≥ 0 counts RDS for MariaDB实例 1分钟
  • 分析处理 在您采取措施处理问题前,首先需要判断影响CPU或带宽占用率高的进程是正常进程还是异常进程。不同类型的进程状态需要做不同处理。 正常进程分析处理建议 如果您的操作系统是Windows 2008/Windows 2012,请检查内存大小,建议内存配置在2GB或以上。 检查后台是否有执行Windows Update的行为。 检查杀毒软件是否正在后台执行扫描操作。 核对云服务器运行的应用程序中是否有对网络和CPU要求高的需求,如果是,建议您修改带宽。 如果 云服务器配置 已经比较高,建议考虑云服务器上应用场景的分离部署,例如将数据库和应用分开部署。 异常进程分析处理建议 如果CPU或带宽利用率高是由于病毒、木马入侵导致的,那么需要手动结束进程。建议的处理顺序如下: 使用商业版杀毒软件或安装安全工具Microsoft Safety Scanner,在安全模式下扫描病毒。 安装Windows最新补丁。 使用MSconfig禁用所有非官方自带服务驱动,检查问题是否再次发生,具体请参考:如何在Windows中执行干净启动。 若服务器或站点遭受DDOS攻击或CC攻击等,短期内产生大量的访问需求。 您可以登录管理控制台执行以下操作: 查看Anti-DDOS攻击是否开启,并检查防护策略是否配置合适;如未配置,请参考:设置防护策略。 查看CC防护策略是否开启,并检查防护策略是否配置合适;如未配置,请参考:配置CC防护策略。
  • 请求示例 创建监控系统配置。 POST https://{endpoint}/v1/{project_id}/cae/monitor-system { "api_version" : "v1", "kind" : "MonitorSystem", "spec" : { "type" : "opentelemetry", "access_token" : "******", "apm_application" : "default", "image_pull_policy" : "Always", "version" : "1.32.0.14", "instrumentation" : "automatic" } }
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 获取Token ,请参考《 统一身份认证 服务API参考》的“获取用户Token”章节。 请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 最大长度:16384 X-Enterprise-Project-ID 否 String 企业项目ID。 创建环境时,环境会绑定企业项目ID。 最大长度36字节,带“-”连字符的UUID格式,或者是字符串“0”。 该字段不传(或传为字符串“0”)时,则查询默认企业项目下的资源。 说明: 关于企业项目ID的获取及企业项目特性的详细信息,请参见《企业管理服务用户指南》。 X-Environment-ID 是 String 环境ID。 获取环境ID,通过《云应用引擎API参考》的“获取环境列表”章节获取环境信息。 请求响应成功后在响应体的items数组中的一个元素即为一个环境的信息,其中id字段即是环境ID。 表3 请求Body参数 参数 是否必选 参数类型 描述 api_version 否 String API版本,固定值“v1”,该值不可修改。 枚举值: v1 kind 否 String API类型,固定值“MonitorSystem”,该值不可修改。 枚举值: MonitorSystem spec 否 MonitorSystemRequestBodySpec object 创建或更新监控系统配置。 表4 MonitorSystemRequestBodySpec 参数 是否必选 参数类型 描述 type 是 String 采集方式。 枚举值: opentelemetry apm2 instrumentation 是 String 探针注入方式。 枚举值: manual automatic access_key 否 String apm2访问密钥Key。 access_value 否 String apm2访问密钥value。 access_token 否 String apm2 opentelemetry接入token。 apm_application 是 String apm2应用。 version 是 String 增强型探针/opentelemetry探针版本。 image_pull_policy 是 String 探针镜像更新策略。 枚举值: Always IfNotPresent
  • 监控指标 表1 SFS容量型(已售罄)支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) read_bandwidth 读带宽 该指标用于统计文件系统在周期内的读数据量。 单位:字节/秒 ≥ 0 bytes/s 文件共享 4分钟 write_bandwidth 写带宽 该指标用于统计文件系统在周期内的写数据量 单位:字节/秒 ≥ 0 bytes/s 文件共享 4分钟 rw_bandwidth 读写带宽 该指标用于统计文件系统在周期内的读写数据量。 单位:字节/秒 ≥ 0 bytes/s 文件共享 4分钟 read_ops 读OPS 该指标用于统计文件系统在周期内的读次数。 单位:次/秒 ≥ 0 counts/s 文件共享 4分钟 write_ops 写OPS 该指标用于统计文件系统在周期内的写次数。 单位:次/秒 ≥ 0 counts/s 文件共享 4分钟 rw_ops 读写OPS 该指标用于统计文件系统在周期内的读写次数。 单位:次/秒 ≥ 0 counts/s 文件共享 4分钟 used_capacity 已用容量 该指标用于统计文件系统在周期内的已用容量。 单位:字节 ≥ 0 bytes 文件共享 4分钟 表2 通用文件系统支持的监控指标 指标ID 指标名称 指标含义 取值范围 测量对象 监控周期(原始指标) capacity_standard 容量型存储用量 容量型存储数据所占用的存储空间容量。 单位:字节/秒 ≥ 0 bytes/s 用户 文件共享 30分钟 capacity_infrequent_access 低频型存储用量 低频型存储数据所占用的存储空间容量。 单位:字节/秒 ≥ 0 bytes/s 用户 文件共享 30分钟 read_bandwidth 读带宽 该指标用于统计文件系统在周期内的读数据量。 单位:字节/秒 ≥ 0 bytes/s 文件共享 4分钟 write_bandwidth 写带宽 该指标用于统计文件系统在周期内的写数据量 单位:字节/秒 ≥ 0 bytes/s 文件共享 4分钟 read_tps 读TPS 该指标用于统计文件系统在周期内的读次数。 单位:次/秒 ≥ 0 counts/s 文件共享 4分钟 write_tps 写TPS 该指标用于统计文件系统在周期内的写次数。 单位:次/秒 ≥ 0 counts/s 文件共享 4分钟 通用文件系统的监控指标仅在有业务访问时展示数据。
  • 响应示例 状态码: 201 Created [ { "instance_id" : "instancexxx001", "ret_status" : "successful" }, { "instance_id" : "instancexxx002", "ret_status" : "error", "error_msg" : "do not meet the installation conditions" } ]
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 Content-Type 是 String 发送的实体的MIME类型。默认使用application/json; charset=UTF-8。 缺省值:application/json; charset=UTF-8 最小长度:1 最大长度:64 X-Auth-Token 是 String 用户project Token。用户Token也就是调用获取用户Token接口的响应值,该接口是唯一不需要认证的接口。请求响应成功后在响应消息头中包含的“X-Subject-Token”的值即为Token值。 最小长度:1 最大长度:16384 表3 请求Body参数 参数 是否必选 参数类型 描述 instance_ids 否 Array of strings 主机id列表(INSTALL和UPDATE时必须) 数组长度:1 - 100 invocation_type 是 String 任务类型,INSTALL 安装,UPDATE升级,ROLLBACK回退,RETRY重试 枚举值: INSTALL UPDATE ROLLBACK RETRY invocation_target 否 String 任务对象,目前仅支持telescope 缺省值:telescope 枚举值: telescope invocation_ids 否 Array of strings 任务ID列表(ROLLBACK和RETRY时必须) 数组长度:1 - 100 version_type 否 String 插件升级时需要选择升级“基础版本”还是“增强版本”,传值“BASIC_VERSION”表示升级成基础版本,传值“ADVANCE_VERSION”表示升级成增强版本 枚举值: BASIC_VERSION ADVANCE_VERSION origin 否 String Agent任务接口调用源, CES 表示由Console调用,APICOM_BMS表示由裸金属服务器调用,ADMIN_SERVER表示由运维平台调用 枚举值: CES APICOM_BMS ADMIN_SERVER version 否 String 版本号 最小长度:0 最大长度:64 正则匹配:^([0-9A-Za-z]|_|-|\.)+$
  • 响应参数 状态码: 201 表4 响应Body参数 参数 参数类型 描述 invocations Array of BatchCreateInvocationInfo objects 创建任务的信息列表 数组长度:0 - 100 表5 BatchCreateInvocationInfo 参数 参数类型 描述 instance_id String 主机id 正则匹配:^[a-zA-Z0-9-]{1,64}$ ret_status String 任务结果, successful成功,error失败 枚举值: successful error error_msg String 错误信息 最小长度:1 最大长度:128 invocation_id String 任务id 正则匹配:^[a-zA-Z0-9-]{1,64}$ error_code String 错误码 正则匹配:^(invocationmgr\.[0-9]{4})$ 状态码: 400 表6 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(taskmgr\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256 状态码: 401 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(taskmgr\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256 状态码: 403 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(taskmgr\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(taskmgr\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256
  • 响应示例 状态码: 200 插件状态查询返回体 { "agent_status" : [ { "instance_id" : "111111111111", "uniagent_status" : "none", "extensions" : [ { "name" : "telescope", "status" : "none", "version" : "2.5.6" } ] } ] }
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 agent_status Array of AgentStatusInfo objects agent插件状态列表 数组长度:1 - 2000 表5 AgentStatusInfo 参数 参数类型 描述 instance_id String 机器id 正则匹配:^[a-zA-Z0-9-]{1,64}$ uniagent_status String uniagent运行状态,none无,running运行中,silent静默中,unknown故障 枚举值: none running silent unknown extensions Array of ExtensionInfo objects 插件信息列表 数组长度:1 - 10 表6 ExtensionInfo 参数 参数类型 描述 name String 插件名称 最小长度:1 最大长度:64 status String 插件状态, none未安装,running运行中,stopped已停止,fault故障(进程异常),unknown故障(连接异常) 枚举值: none running stopped fault unknown version String 插件版本 最小长度:1 最大长度:32 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(ces\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256 状态码: 401 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(ces\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256 状态码: 403 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(ces\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256 状态码: 500 表10 响应Body参数 参数 参数类型 描述 error_code String 错误码 正则匹配:^(ces\.[0-9]{4})$ error_msg String 错误信息 最小长度:1 最大长度:256