检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
常见的运维流程有: 变更管理流程:适用于生产环境软、硬件的变更活动管理,减少变更导致服务意外中断或服务质量下降,确保企业的环境安全、稳定地运行,并最大化的提升系统的可用性,满足所承诺的服务水平。
2.观测性能指标实践 性能监控有助于实时了解业务和系统的负载情况以及资源使用情况,结合告警规则的设置,云服务可自动对负载异常部分进行告警,以便更好地使用和维护云数据库系统。以GeminiDB 为例,您可以通过管理控制台,直观地查看GeminiDB Redis的各项监控指标。
实时通知:通过在告警规则中开启消息通知服务,当云服务的状态变化触发告警规则设置的阈值时,系统通过短信、邮件通知或发送消息至服务器地址等多种方式实时通知用户,让用户能够实时掌握云资源运行状态变化。
使用防火墙、ACL控制内部和外部网络之间的访问流量以及内部网络中敏感区域的输入及输出流量,并对所有网络流量进行检查,阻止与已制定安全标准不相符的流量,以避免系统组件受到来自不可信网络的非授权访问。 使用应用负载均衡时,七层负载均衡更换为安全的证书。 启用VPC流量日志。
CustomedHPA策略 Prometheus Prometheus(停止维护) 云原生监控插件 一套开源的系统监控报警框架,负责采集kubernetes集群中kubelet的公开指标项(CPU利用率、内存利用率)。
审批:使系统能够根据预定义规则自动做出审批决策,以提高具有审批关口的工作流程的效率。这种方法鼓励使用标准化表格和模板,从而提高流程的效率。在高环境下自动批准可能存在风险。密切关注并测试您的自动批准,以确保定义特定标准来授予批准。
系统重新实现了分区分配策略,但策略逻辑有问题,会导致分区间的数据不均衡。 Kafka扩容了Broker节点,新增的节点没有分配分区,会导致节点间的数据不均衡。
目前FunctionGraph已经对系统侧的冷启动做了大量优化,针对用户侧参考以下方案。: 选择合适的编程语言 目前FunctionGraph支持的编程语言(Runtime)有 .NET Core、Go、Java、Node.js、Python。
如组织多角色参与的例会(如月度例会),审视预算执行情况、讨论风险应对策略、总结优化经验和计划下一步重点工作等; 事前规划,做好成本模型,预算规划和成本预测 理解每个组织,项目的成本并非易事,尤其是很多云资源是事实上的跨组织和项目的公共资源,故而,在一开始的时候,就需要建立一个基础的,得到管理团队认可的成本模型