云服务器内容精选

  • 实例概况 进入图实例的运维监控页面后,您可以看到图实例概况,展示了图实例的状态,实时资源消耗,资源消耗,业务负载等信息。下面为您进行详细说明各个模块的作用: 图集群状态 在图集群状态模块,您可以浏览当前图实例基本信息和容量、请求数等统计信息。 集群信息:包括图规格、CPU架构等信息。 集群容量:包括点和边的使用量、容量和使用率。 集群节点:包括各个类型节点数量/总数量。 集群请求数统计(内存版):包括等待中的读请求个数、运行中的读请求个数、等待中的写请求个数、运行中的写请求个数。 图2 图集群状态 实例资源 在实例资源模块,您可以查看当前实例资源使用情况,包括“CPU使用率”,“磁盘I/O”,“磁盘使用率”,“内存使用率”,“网络I/O值”。单击对应资源指标可显示过去72小时该指标的变化趋势,以及该资源当前时刻的Top5节点使用情况。 图3 实例资源 业务负载 在业务负载模块,您可以查看当前数据库业务负载指标QPS在过去72小时该指标的变化趋势。 图4 业务负载
  • 操作场景 与环境、业务要求等紧密相关的参数取值经常变化,可以将这样的参数设置为系统参数。华为云Astro轻应用提供统一的系统参数配置页面,便于集中维护与管理。当参数发生变化时,仅需要修改一次系统参数取值,引用该系统参数的地方都会更新成为修改后的值。 例如,华为云Astro轻应用预置的内置系统参数“bingo.expiretask.execute.time”,为系统执行数据清理任务的时间。当系统执行清理任务时,会自动查询该参数值,查询到后,会按照配置的时间来启动数据清理任务。开发者用户也可根据需求创建自定义的系统参数,创建后,可以在脚本、服务编排、工作流和数据接入中使用系统参数。如何使用系统参数,请参考使用系统参数。
  • 响应示例 状态码: 200 成功响应示例 { "instance_name": "ges_demo-ges-dn-2-1", "edge_capacity": 0, "edge_number": 0, "edge_usage": 0, "vertex_capacity": 0, "vertex_number": 0, "vertex_usage": 0, "read_waiting_queue_length": 2, "read_running_queue_length": 1, "write_waiting_queue_length": 0, "write_running_queue_length": 0, "current_queries": [ { "task_name": "incremental_load_graph", "request": { "vertex_file_format": "csv", "parallel_edge": "allow", "graph_name": "ges_demo", "vertex_file_path": "wepbucket/movie1/sit_ges_data_uat/nodes/", "edge_file_path": "wepbucket/movie1/sit_ges_data_uat/edges/", "schema_file_path": "wepbucket/movie1/sit_ges_data_uat/sit_ges_metadata_v6.xml", "vidSerialize": true, "offline": false, "trim_quote": "\"", "ignore_label": true, "delimiter": ",", "edge_file_format": "csv", "parameters": { "secret_key": "xxxxxxxx", "access_key": "xxxxxxxx", "region": "cn-north-7" } }, "pending_duration": 9.91311, "request_id": "0c56e2d14369586da38d7fe3b81bb1bd", "status": "pending", "begin_time": "", "running_duration": 0, "progress": 0 } ]} 状态码: 400 失败响应示例 Http Status Code: 400 { "errorMessage": "graph ges_fdb_hyg1 not exist.", "errorCode": "GES.8000"}
  • 删除 BCS 实例后,如何清理残留日志文件? 删除B CS 实例后,集群节点会残留日志文件,系统并不会自动清理,建议您手动将残留文件删除以免占用您的空间资源。 首先使用远程管理工具分别登录已删除实例对应的集群节点,检查如下路径下是否存在残留日志文件: /var/paas/sys/log/baas-agent/var/paas/sys/log/baas-restapi/var/paas/sys/log/baas-service 若存在残留日志文件,可参考使用如下命令进行删除: rm -rf /var/paas/sys/log/baas-agent /var/paas/sys/log/baas-restapi /var/paas/sys/log/baas-service 父主题: 运维监控类
  • 运维监控原则 当应用部署在公有云上,云平台需提供已开通资源的监控能力,包括计算、存储、网络、数据库等云服务资源。资源监控指标反馈资源的运行状态、资源消耗和性能参数等,运维人员可根据不同参数配置相应的阈值告警,当资源异常时通过短信或邮件等方式通知。除了开箱即用的指标数据以外,部分云服务提供完整的日志采集、上报和存储能力,如负载均衡、VPC、WAF等服务日志,应用日志通过安装代理采集并集中管理。通过日志洞察完成日志聚合查询,可视化分析和实时告警。 业务监控指标,如业务登录成功率等。可通过ELB(弹性负载均衡)日志洞察分析,日志系统对该日志ETL后,提取业务URL请求,状态码、访问IP、时延等关键数据,通过SQL聚合可得到不同时间段内业务的运行状态,配置SQL阈值规则可实现业务的实时监控,如下图所示。 图1 业务监控指标 运维人员可根据资源和应用维度选择监控服务,满足多层次运维要求。下表列出各云服务提供的监控能力。 表1 云服务提供的监控能力 分类 云服务 数据 数据描述 资源监控 CES 指标 提供云资源,如虚机/网络/存储等100+云服务开箱即用指标监控。 指标告警 CES 告警 自定义指标阈值规则,如CPU超过90%。 告警通知 SMN 告警 统一通知服务,支持短信/邮箱/钉钉/微信/webhook等方式。 事件告警 CES 事件 支持事件类型告警,如EIP带宽超限事件告警。 资源分组 CES 指标 将云资源按照项目或应用维度划分资源组,满足企业权限控制。 日志监控 LTS 日志 提供应用/云资源/移动端等日志采集,满足运维日志集中管理能力。 日志告警 LTS 告警 支持关键词和SQL告警规则,提供日志实时监控能力。 日志报表 LTS 日志 提供日志可视化能力,包括图表、柱状图、饼图,同时支持仪表盘和模板能力。 日志备份 LTS 日志 将日志转储OBS,提供冷备份,支持跨账号转储。 日志订阅 LTS 日志 将日志转储至kafka,实时消费日志,支持跨账号转储。 业务监控 LTS 日志 LTS收集业务日志并对其结构化处理,提供可视化分析。或直接将ELB日志提取成业务指标。 容器监控 AOM 监控 当使用CCE容器引擎,AOM将提供一站式容器应用的监控、告警和 日志分析 ; 性能监控 APM 性能 提供应用性能分析,包括应用拓扑、分布式链路追踪等能力。 父主题: 运维监控