云服务器内容精选

  • 支持采集的Windows主机监控指标 当前支持采集的监控指标如表2所示。 表2 Windows主机监控指标说明 指标名称 指标含义 取值范围 单位 ops_node_cpu_usage 该指标用于统计测量对象的CPU使用率。 0~100% 百分比(Percent) ops_node_cpu_limit_core 该指标用于统计测量对象申请的CPU核总量。 ≥1 核(Core) ops_node_cpu_used_core 该指标用于统计测量对象已经使用的CPU核个数。 ≥0 核(Core) ops_node_disk_capacity_megabytes 总的磁盘空间容量。 ≥0 兆字节(Megabytes) ops_node_disk_available_capacity_megabytes 还未经使用的磁盘空间。 ≥0 兆字节(Megabytes) ops_node_disk_usage 已使用的磁盘空间占总的磁盘空间容量百分比。 ≥0 百分比(Percent) ops_node_virtual_memory_total_megabytes 该指标用于统计测量对象上的虚拟内存总量。 ≥0 兆字节(Megabytes) ops_node_virtual_memory_usage 该指标用于统计测量对象已使用虚拟内存占虚拟内存总量的百分比。 0~100% 百分比(Percent) ops_node_memory_total_megabytes 该指标用于统计测量申请的物理内存总量。 ≥0 兆字节(Megabytes) ops_node_virtual_memory_free_megabytes 该指标用于统计测量对象上的尚未被使用的虚拟内存。 ≥0 兆字节(Megabytes) ops_node_memory_free_megabytes 该指标用于统计测量对象上的尚未被使用的物理内存。 ≥0 兆字节(Megabytes) ops_node_memory_usage 该指标用于统计测量对象已使用内存占申请物理内存总量的百分比。 0~100% 百分比(Percent) ops_node_process_number 该指标用于统计测量对象上的进程数量。 ≥0 无 ops_node_network_receive_bytes 该指标用于统计测试对象的入方向网络流速。 ≥0 字节/秒(Bytes/Second) ops_node_network_receive_packets 每秒网卡接收的数据包个数。 ≥0 个/秒(Packets/Second) ops_node_network_receive_error_packets 每秒网卡接收的错误包个数。 ≥0 个/秒(Packets/Second) ops_node_network_transmit_bytes 该指标用于统计测试对象的出方向网络流速。 ≥0 字节/秒(Bytes/Second) ops_node_network_transmit_packets 每秒网卡发送的数据包个数。 ≥0 个/秒(Packets/Second) ops_node_network_transmit_error_packets 每秒网卡发送的错误包个数。 ≥0 个/秒(Packets/Second) ops_node_network_total_bytes 该指标用于统计测试对象出方向和入方向的网络流速之和。 ≥0 字节/秒(Bytes/Second) ops_node_network_total_packets 每秒网卡处理的数据包个数。 ≥0 个/秒(Packets/Second) ops_node_disk_read_kilobytes 该指标用于统计每秒从磁盘读出的数据量。 ≥0 千字节/秒(Kilobytes/Second) ops_node_disk_write_kilobytes 该指标用于统计每秒写入磁盘的数据量。 ≥0 千字节/秒(Kilobytes/Second) ops_node_disk_read_io_num 该指标用于统计每秒从磁盘读的次数。 ≥0 个/秒(Packets/Second) ops_node_disk_write_io_num 该指标用于统计每秒向磁盘写的次数。 ≥0 个/秒(Packets/Second) ops_node_disk_kilobytes 该指标用于统计每秒磁盘的IO数据量。 ≥0 千字节/秒(Kilobytes/Second) ops_node_disk_util 该指标用于统计磁盘使用时间。 ≥0 百分比(Percent)
  • 业务报表开发流程 使用业务报表进行业务监控的流程如图2所示。 图2 业务报表开发流程图 服务运维岗位或运维管理员权限人员开发业务报表 新增业务报表数据源:首次使用数据源进行报表开发,需要先新增数据源后才能使用。 新增业务报表页面:业务报表以页面来呈现,开发报表需要先新增报表页面。如需对页面进行管理,请参见在监控服务管理业务报表页面。 开发业务报表:为报表新增数据图表,以图表来体现业务数据的动态变化。 基于数仓配置图表:新增warehouse类型数据源后,可以基于数仓中创建的指标或视图配置图表。 基于SQL配置图表:新增其他类型数据源后,可以基于SQL配置图表。 服务所有人员可以查看已开发业务报表 查看业务报表:查看已开发业务报表进行业务监控。
  • 其他报表开发功能介绍 功能 功能介绍 添加告警数据图表 可以对告警数据生成图表并添加在报表中。 在“告警配置”,单击“保存”,系统会自动生成告警图表“_alertlist-_alert”。 在报表编辑页面,单击“配置图表”选择该图表,将告警数据展示在报表中。 配置报表查询条件 在报表编辑页面,单击“配置查询条件”可以配置页面的查询条件,目前每个页面最多支持配3个查询框,查询字段可以从数据源自动获取,也可以自定义输入。 新增辅助图形 在报表编辑页面,单击“新增辅助图形”,可以对图表进行组合,也可以为报表新增标题框、背景框和时钟。 切换至预览模式 进入报表编辑页面,默认为编辑模式,单击“切换至预览模式”,可以切换至预览模式,查看编辑效果。 画辅助线 在报表编辑页面,单击“画辅助线”,可以选择多种辅助线,便于编辑页面时对页面报表布局。 保存业务报表 在报表编辑页面,单击“保存”,保存已开发的业务报表。 发布业务报表 在报表编辑页面,单击“发布”,发布业务报表,发布后服务下所有用户可以在“业务报表”页面查看该报表。 下线业务报表 在报表编辑页面,单击“下线”,下线业务报表后将不会展示在“业务报表”页面。 复制业务报表 在报表编辑页面,单击“复制”,可以复制已开发的业务报表。
  • 创建告警规则 在告警配置界面单击“创建告警规则”,进入创建告警规则界面。 图2 创建告警规则 表1 参数说明 参数 说明 名称 系统会随机产生一个名称,用户也可以进行修改。 取值样例:alarm-poxz 监控范围 选择告警规则适用的资源范围,当前仅支持选择全部资源。 告警策略 自定义触发告警的条件,触发告警具体的事件为一个瞬间的事件。例如运行状态异常,则触发告警。详情请参见告警策略。 通知策略 通知策略是包含通知组选择、生效时间、通知内容模板等参数的组合编排。创建通知策略请参见创建/修改/删除通知策略。
  • 认识监控服务概览页 监控服务概览页如图1所示,展示近7天各级别告警数量、告警列表及关键事件列表等信息。 图1 监控服务概览 告警 - 近7天:展示近7天各级别告警数量。 告警列表 - 近7天:展示近7天严重和紧急级别的告警,可单击“更多”查看对应告警详情。 关键事件列表 - 近7天:展示近7天关键事件,可单击“更多”跳转至“事件列表”页面查看事件详情。 关键体验指标/黄金指标:展示关键体验指标/黄金指标,可以设置查询时间及查询粒度。 XXXX标准指标:展示各标准指标的监控数据,如负载均衡(SLB)标准指标、数据库治理(WiseDBA)标准指标、主机管理服务(VMS)标准指标等,如图2所示。 图2 VMS指标 父主题: 使用监控服务进行资源及业务监控
  • 简介 电商业务内存要求高、数据量大并且数据访问量大、要求快速的数据交换和处理,监控要求极其高。 E CS 为核心服务,全面、立体的ECS监控系统对业务稳定起到了至关重要的作用。主机监控功能可提供服务器的系统级、主动式、细颗粒度监控服务。为业务的顺畅运行保驾护航。 网站为电商平台的入口,双12、618等大型购物节会导致不同网络用户访问电商网站出现网页打开慢、网络延时高等问题。站点监控可对网站或ECS的弹性IP等进行持续拨测,监控业务入口的可用性及响应时间。 针对电商平台使用的RDS、ELB、VPC等服务,可以使用云服务监控,在云服务监控页面实时查看云服务运行状态、各个指标的使用情况并对监控指标设置告警规则,精确掌握云服务的运行情况。 电商业务主要涉及ECS、CDN、AS、安全服务、RDS、ELB、OBS等服务。通过资源分组功能从业务视角查看资源使用情况、告警情况、健康情况,管理告警规则,可以极大的降低运维复杂度,提高运维效率。 父主题: 电商平台业务监控
  • 更多操作 日志指标规则创建完成后,您还可以执行表3中的相关操作。 表3 相关操作 操作 说明 查看日志指标规则 在左侧日志指标规则列表中,单击规则名称。 在右侧可查看该规则的启用状态、日志类型、接入指标等信息。 停用日志指标规则 在左侧日志指标规则列表中,单击规则名称。 在右侧页面右上角,单击“停用规则”。 编辑日志指标规则 在左侧日志指标规则列表中,单击规则名称。 在右侧页面右上角,单击,在下拉列表中选择“编辑”。具体操作请参见创建日志指标规则。 删除日志指标规则 在左侧日志指标规则列表中,单击规则名称。 在右侧页面右上角,单击,在下拉列表中选择“删除”。 添加接入指标 在左侧日志指标规则列表中,单击规则名称。 在右侧页面单击“添加接入指标”。具体操作请参见添加接入指标。 编辑接入指标 在左侧日志指标规则列表中,单击规则名称。 在右侧页面选择一个接入指标卡片,单击。具体操作请参见添加接入指标。 删除接入指标 在左侧日志指标规则列表中,单击规则名称。 在右侧页面选择一个接入指标卡片,单击。 搜索接入指标 在左侧日志指标规则列表中,单击规则名称。 在右侧页面“添加接入指标”后的搜索框中输入规则名称关键字,单击后显示匹配对象。
  • 相关操作 还可以根据需要执行以下相关操作: 搜索指标:在搜索框中输入指标名称搜索指标。 刷新指标列表:单击搜索框后的,刷新指标列表。 返回旧版:单击页面右上角“返回旧版”按钮,即可切换至旧版操作界面,具体请参见创建日志指标规则(旧版)。 查看指标详情:在指标列表中,选择需要查看的指标,单击指标操作列的。 表3 指标参数说明 参数名称 说明 统计方式 指标数据按照所设置的统计方式进行聚合,包括:平均值、最小值、最大值、总计、样本个数。 说明: 样本个数为指标数据点的计数。 统计周期 指标数据按照所设置的统计周期进行聚合。 统计周期与统计时段相关联,选择的时段不同,统计周期的显示也会相应变化。 统计时段 指标数据按照所设置的时间范围进行聚合。设置时间范围的方式包括:近30分钟、近1小时、近6小时、近1天、近1周、自定义时间段。 刷新频率 指标数据按照所设置的频率进行刷新。包括:手动刷新、30秒、1分钟、5分钟。 Prometheus实例 根据接入业务指标时选择的Prometheus实例显示,不可修改。 图表类型 指标数据按照所设置的图表类型展示,包括:折线图、数字图、TopN、表格、柱状图、数字折线图。 图表配置 配置指标图表的显示信息,具体请参见指标数据类图表(折线图、数字图、Top N、表格、柱状图、数字折线图)。 条件 指标监控的维度。指标的范围为key:value键值对格式,可从下拉列表中直接选择,通过AND、OR三种关键词可为同一指标设置多个监控条件。 分组条件 指标数据按指定字段分组聚合,对聚合的结果进行运算。包括:不分组、avg by、max by、min by、sum by。例如,将分组条件设置为:avg by clusterName,表示将指标按集群名称分组,然后将分组后的指标按平均值运算并展示在当前图表中。 别名 用固定名称或变量展示时间序列名称。别名语法:以{{}}表示变量(维度名)。 例如,{{hostname}} 将替换为标签主机名的标签值。(数字图,表格,数字折线图不支持别名)。 添加指标图表至仪表盘:单击指标操作列的,在指标列表详情页单击,可添加指标图表到仪表盘。 添加至告警规则:单击指标操作列的将指标添加至告警规则。 删除指标:单击指标操作列的。
  • 注意事项 可查询的时间跨度最长为31天,支持查看最近90天的历史数据。 如果查询的 域名 在所指定时间跨度范围内无数据,则流量/带宽、请求数/QPS、流量/请求命中率图不会有数据展示。 最小统计粒度为5分钟,当查询跨度为8天及以上时,最小统计粒度为1小时。 使用量统计有1小时左右的时延。 支持导出将查询的数据详情。 支持按照标签、业务类型、区域范围、运营商、HTTP协议、传输协议筛选域名。 支持数据对比功能。