搜索_华为云

OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

运维人员获取知识，学习和解决问题，运维知识管理能力变得必要。运维知识管理应集成丰富的运维知识，可以帮助运维人员快速解决问题，提高工作效率。一般通过运维知识库系统承载，运维人员可以轻松地查找和获取各种运维知识，包括网络配置、服务器管理、数据库维护等方面的知识。下面将介绍运维知识库系统的五个主要功能和优势。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
OPS07-01 创建可操作的告警 - 云架构中心

OPS07-01 创建可操作的告警风险等级高关键策略收到告警时，一般需要做出响应，消除无须响应的告警。比如磁盘IO 量瞬间飙升，CPU 使用率瞬间飙高，这类告警无需做出响应，对业务而言，意义就不大了。遵循可操作性原则能避免很多误报。并且要定期统计和分析告警频率，识别高

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS07 进行故障分析和管理
PERF06-01 分层看护 - 云架构中心

高关键策略基于业务的部署架构，一般可以从最底层的硬件基础设施到最上层的应用分成5层资源，云上服务可以只需要关注虚拟网络、实例、应用三层。结合每一层资源的特征指标进行分层建模，分别设置不同梯度的性能看护指标。通常按照指标劣化程度可以设计成一般、紧急、重要三个梯度，对应每个梯度的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
数据持久度 - 云架构中心
数据持久度 - 云架构中心

是否丢失的概率，不体现数据丢失多少；数据持久度的预计周期，一般按一年进行预计。影响存储数据持久度的主要因子有：冗余数、磁盘失效率与数据修复时间。其中每多一个冗余，数据持久度通常可增加2~3个9；云上常用的对象存储，一般采用3副本冗余，通常可提供11~12个9的数据持久度。父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念 > 可用性目标定义
SEC10-01 建立安全响应团队 - 云架构中心

SEC10-01 建立安全响应团队建立安全事件响应团队，明确各角色与职责。风险等级高关键策略安全事件响应团队一般包含如下角色及职责：安全响应专家：主导网络安全事件调查，负责对事件进行定级、通报、攻击溯源以及确定影响范围，制定应急处置措施，推动服务控制风险。攻击溯源专

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC10 安全事件响应
RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

不同数据的重要性不一样，针对应用系统内的所有数据，需要明确其重要性及对应的RPO/RTO指标要求。比如对于重要数据，通常允许数据丢失的时间会比较少，从而需要更频繁的备份；对于一般的数据，允许数据丢失的时间比较长，可以使用较低的备份频率；对于一些不重要的数据，其数据丢失对业务没有影响，则不需要进行备份。风险等级高

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES02 备份
Serverless性能优化 - 云架构中心

Serverless性能优化 Serverless函数配置最佳实践运行时语言当选择编译型语言（如Java，C#等），冷启动时延一般由于首次初始化消耗比较大会导致冷启动时延偏高，但是初始化完成后每次执行的时延相较其他解释型语言（NodeJs，Python等）会有一定优势。如果流

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
COST02-02 精细化预算管理和跟踪 - 云架构中心

针对企业不同项目/业务/应用，应该建立预算管理机制，精细化管理每个项目/业务/应用全生命周期的云开销。企业的项目/业务是随时间变化而变化的，一般而言，新兴业务/项目常有更多云资源扩容的需求，而稳定的业务/项目则可以更多考虑单位收益的云成本是否可以持续优化，而处于生命周期末尾的项目/业务则需要考虑逐步释放不再需要的资源。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST02 实施预算规划管理机制
OPS03-01 推行开发者测试 - 云架构中心

OPS03-01 推行开发者测试风险等级高关键策略开发者测试是现代软件工程中非常重要的一环，一般而言，开发者的测试代码可以在本地，或者构建阶段反复多次执行，依赖低，也是在软件系统运维之前成本最低的发现软件问题的方式，尤其是各种异常场景或者用户输入，开发者测试的过程实际上“

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
COST06-01 了解云上不同计费模式的特点 - 云架构中心

务形态和降低费率，实现成本节省。按需计费：适用于临时、突发的业务场景；包年包月：通过预付一定周期的资源使用费用，来获取优惠的计费模式。一般适用于资源长期使用，业务较稳定的场景；资源包：一种特殊的包年包月，可通过预付一定周期下某种资源使用量的费用，来获取优惠的计费模式。资源包

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST06 使用不同计费模式优化成本
PERF04-02 选择合适的测试方式 - 云架构中心

性能验收：性能验收测试的运行环境必须是确定的，验证系统在确定的场景条件下是否达到了其宣称的能力规格。负载测试：是在被测系统上进行负载阶梯加载，直至摸到系统性能极限，一般用来测试系统性能容量或调优。压力测试：是检查系统处于超负载压力下的性能表现，可以考察系统的流控机制和极限场景下的性能。长时间稳定性测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
PERF03-05 选择合适类型的存储云服务 - 云架构中心

使用场景如高性能计算、媒体处理、文件共享和内容管理和Web服务等。说明：高性能计算：主要是高带宽的需求，用于共享文件存储，比如基因测序、图片渲染这些。如大数据分析、静态网站托管、在线视频点播、基因测序和智能视频监控等。如高性能计算、企业核心集群应用、企业应用系统和开发测试等。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模 > 选择合适的存储云服务
PERF02-01 定义性能目标 - 云架构中心

可以提高用户满意度。比如购物网站，我们可以设定页面加载时间不能超过5秒，如果页面加载时间超过设定的阈值，我们就可以采取优化措施，例如优化图片大小、减少HTTP请求等，以提高页面加载速度。记录并公开性能目标满足性能目标是一个持续的过程，需要开发和运营团队的共同努力。开发团队需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF02 性能规划 > 性能规划
RES06-01 故障模式分析 - 云架构中心

据故障(被误删等)、AZ故障、Region故障等。定义严酷度类别严酷度是度量故障给系统造成的最坏潜在后果，一般分为四个等级：Ⅰ类（严重）、Ⅱ类（较严重）、Ⅲ类（一般）、Ⅳ类（轻微）。 I类：这种故障会导致整个系统崩溃或主要功能受到严重影响； II类：这种故障会导致系统主要功能

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
PERF05 性能优化 - 云架构中心
PERF05 性能优化 - 云架构中心

PERF05 性能优化性能优化工作中，需警惕“过早优化”的问题。我们的基本指导策略还是首先让系统运行起来，再考虑怎么让它变得更快。一般只有在我们证实某部分代码的确存在一个性能瓶颈的时候，才应进行优化。除非用专门的工具分析瓶颈，否则很有可能是在浪费自己的时间。另外，性能优化的隐含

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

根据错误响应码进行有针对性的重试；对于临时性故障，如错误码指示为系统繁忙时，可等待一段时间后重试，否则无需重试。请求SDK中内置了消息重试时，客户端无需重复重试。多层业务栈一般只在源端重试，避免逐层重试。父主题： RES09 故障重试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

fer cache，一般预留20%。从HDFS中读入数据时，要考虑block解压缩后的数据膨胀。规划一定的磁盘作为缓存空间，包括缓存数据与日志。调优目标 Flink调优的目标是在不影响其他业务正常运行的前提下，高效的完成业务目标，通常为了达成该目标，一般需要最大限度利用集群

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

中断的时间会比较少，从而需要保障故障场景下的业务快速恢复，可采用双活/多活容灾；对于重要业务，允许一定的业务中断时间，可采用主备容灾；对于一般业务，允许中断的业务时间可达到天级，则可采用远程备份；对于一些不重要的业务，其业务中断对外部客户没有影响，则不需要进行容灾。父主题： RES04

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES06-02 面向所有故障进行检测 - 云架构中心

检测到故障后需及时告警或自动恢复。针对具体故障进行检测时，根据检测的类型通常可以分为资源检测、功能检测和业务检测。资源检测：云环境中一般指虚拟化后的物理硬件资源及其对应的软件资源，具体包含CPU、内存、网络和磁盘资源等。功能检测：对组成产品系统的各个内部模块对象进行检测的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES06-03 支持亚健康检测 - 云架构中心

能下降、CPU/内存过载等，当应用系统内组件出现亚健康时，可能会导致应用系统对外业务成功率下降。由于亚健康并非故障，因此针对亚健康的检测一般是针对业务监控指标设置阈值，当指标超过阈值时进行告警和恢复处理。父主题： RES06 故障检测

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测

总条数： 32

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS08-03 知识管理 - 云架构中心

OPS07-01 创建可操作的告警 - 云架构中心

PERF06-01 分层看护 - 云架构中心

数据持久度 - 云架构中心

SEC10-01 建立安全响应团队 - 云架构中心

RES02-01 识别和备份应用中所有需要备份的关键数据 - 云架构中心

Serverless性能优化 - 云架构中心

COST02-02 精细化预算管理和跟踪 - 云架构中心

OPS03-01 推行开发者测试 - 云架构中心

COST06-01 了解云上不同计费模式的特点 - 云架构中心

PERF04-02 选择合适的测试方式 - 云架构中心

PERF03-05 选择合适类型的存储云服务 - 云架构中心

PERF02-01 定义性能目标 - 云架构中心

RES06-01 故障模式分析 - 云架构中心

PERF05 性能优化 - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

Flink性能优化 - 云架构中心

RES04-01 定义应用系统的容灾目标RPO与RTO - 云架构中心

RES06-02 面向所有故障进行检测 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线