搜索_华为云

OPS08-03 知识管理 - 云架构中心
OPS08-03 知识管理 - 云架构中心

OPS08-03 知识管理风险等级高关键策略日益庞大的数据量和复杂的业务系统，对运维人员的要求越来越高。为了方便运维人员获取知识，学习和解决问题，运维知识管理能力变得必要。运维知识管理应集成丰富的运维知识，可以帮助运维人员快速解决问题，提高工作效率。一般通过运维知识库系统

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度某平台服务的认证驾驶员用户1000万人，货主用户500万人，集团业务覆盖全国339个主要城市，覆盖线路数量超过11万条，实现了全国多中心运营的架构。客户痛点：多云双活场景运维难保障：大规模集群场景，单个云厂商灾备不足以保障业

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
RES06-03 支持亚健康检测 - 云架构中心

RES06-03 支持亚健康检测系统内组件有可能完全故障，也有可能处于亚健康状态；亚健康是指系统整体业务未超标，但系统中局部实例业务超标。亚健康更多是个相对概念，相对历史表现的统计，或相对系统整体。因此针对亚健康的检测和判断有所不同。当处于亚健康状态时，系统也需要及时进行隔离或恢复处理，避免对业务造成影响。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES06 故障检测
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

RES11-01 混沌测试混沌工程（Chaos Engineering）是通过故障注入的方式，触发或模拟实际故障，验证系统的稳定性和容错保护能力。风险等级高关键策略在真实环境中测试。作为CI/CD管道的一部分例行执行。主动注入故障，以便在问题发生前提前发现并解决问题。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
RES12-05 应急恢复回溯 - 云架构中心

RES12-05 应急恢复回溯在业务进行应急恢复处理后，需要对事件进行回溯并进行优化，以避免故障的再次发生。风险等级高关键策略对问题进行定位和修复，优化产品能力，减少同类事件的发生。针对应急恢复过程进行总结，优化恢复过程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

可靠性功能集群HA ELB采用集群化部署，支持多可用区的同城多活容灾，无缝实时切换。后端服务器健康检查 ELB弹性负载均衡支持定期向后端服务器发送请求以测试其运行状态。当判断后端服务器健康检查异常后，就不会将流量分发到异常后端服务器，而是分发到健康检查正常的后端服务器，从而提

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > ELB弹性负载均衡
RES09-03 重试需要避免造成流量压力 - 云架构中心

RES09-03 重试需要避免造成流量压力对于链路闪断等原因导致的临时性故障，客户端进行一定的重试，可取得较好的效果；对于流量过载等原因导致的故障，重试可能会导致情况进一步恶化，因此需要避免这种影响。风险等级高关键策略客户端进行重试处理时，建议：增加指数回退和抖动方法

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
常见故障模式 - 云架构中心
常见故障模式 - 云架构中心

常见故障模式云数据库 TaurusDB的CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率过高检测：通过CES监控CPU /内存/磁盘容量/磁盘IOPS/数据库连接数使用率。恢复：根据业务情况，手工变更规格以扩展资源。开启自动扩缩容，以便在过载时自动扩容规格和/或只读节点。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
SEC06-04 应用安全配置 - 云架构中心

SEC06-04 应用安全配置对应用运行时的各项配置进行加固，以避免因安全配置错误而产生的安全漏洞和风险。风险等级高关键策略根据安全配置规范，对您工作负载中的应用，如Nginx、Tomcat、Apache、Jetty、JBoss、PHP、Redis等完成安全配置加固和Web攻击防护。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
Kafka性能优化 - 云架构中心
Kafka性能优化 - 云架构中心

Kafka性能优化 Kafka性能优化优化客户端配置生产者配置建议可参考配置建议。消费者配置建议参数推荐值说明 max.poll.records 500 消费者一次能消费到的最大消息数量，默认为500，如果每条消息处理时间较长，建议调小该值，确保在max.poll.interval

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 消息队列性能优化
SEC09-03 实施安全审计 - 云架构中心

SEC09-03 实施安全审计对云服务的关键操作开启安全审计，审计覆盖到每个用户。对审计日志进行保护并定期备份，避免受到未预期的删除、修改或覆盖。风险等级高关键策略云服务的关键操作包含高危操作（如创建IAM用户、删除IAM用户、重启虚拟机、变更安全配置等）、成本敏感操作

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 安全运营 > SEC09 安全感知及分析
PERF04-02 选择合适的测试方式 - 云架构中心

PERF04-02 选择合适的测试方式风险等级高关键策略性能测试的常见方式如下，需要注意的是，各种测试方式并不是正交的，而是有耦合关系的：性能验收：性能验收测试的运行环境必须是确定的，验证系统在确定的场景条件下是否达到了其宣称的能力规格。负载测试：是在被测系统上进行负

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
PERF04-03 性能测试步骤 - 云架构中心

PERF04-03 性能测试步骤风险等级高关键策略 1.确定验收性能指标对被测系统从用户角色、开发角色、维护管理员等角色出发分析，结合生产环境系统当前情况，识别并定义业务指标、数据指标、资源指标三种维度指标需要达到的目标基线，指导系统能达到以最小的资源占用管理最大的数据并

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
PERF05-04 大数据场景资源优化 - 云架构中心

PERF05-04 大数据场景资源优化风险等级中关键策略在大数据场景下，可以通过优化资源的使用和分配，提高系统的性能和效率。以下是一些常见的大数据场景资源优化方法：分布式存储：使用分布式存储系统，如Hadoop HDFS、Apache Cassandra等，将数据分散存

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF05 性能优化 > 资源优化
OPS03-05 进行混沌测试和演练 - 云架构中心

OPS03-05 进行混沌测试和演练混沌工程（Chaos Engineering）是通过故障注入，验证故障快速恢复能力及系统可靠性的实践活动。风险等级高关键策略通过混沌工程的方法模拟可能出现的故障，进而综合验证系统在不同故障场景下的容错能力、监控能力、应急响应能力、定界定位、快速恢复等确定性恢复能力。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS03 完备的测试验证体系
OPS04-01 有效落地持续集成 - 云架构中心

OPS04-01 有效落地持续集成风险等级高关键策略持续集成是一种软件开发实践，开发人员使用它定期将软件更新集成到源代码控制系统中。当工程师向代码仓提交代码时，持续集成过程就开始了。理想情况下，集成过程会根据多个基线和测试来验证代码。然后，它向提交者提供有关这些测试状态的

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS04-03 基础设施即代码 - 云架构中心

OPS04-03 基础设施即代码基础设施即代码（IaC）是指使用代码而不是手动流程来管控基础设施的能力。应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink性能优化概述 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
OPS06-04 规范化应用日志 - 云架构中心

OPS06-04 规范化应用日志日志是随时间推移发生的不可变、记录时间戳的离散事件。系统需要记录关键事件和故障，以帮助诊断问题和解决故障。风险等级高关键策略对于一个系统来说，日志是非常重要的。它可以记录在系统中发生的一切，包括成功的操作、错误的操作、警告信息等等。因此，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES12-03 定期应急恢复演练 - 云架构中心

RES12-03 定期应急恢复演练定期测试突发事件应急恢复处理，以便在出现问题后能进行高效的恢复处理。风险等级高关键策略每年至少进行一次应急恢复演练；通过演练可提升操作人员的熟练程度。演练期间严格按照应急预案进行恢复，以检验应急预案的准确性。演练结束后需要对恢复过程进行回溯，并优化应急预案。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理

总条数： 381

上一页
1
...
14
15
16
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS08-03 知识管理 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

RES06-03 支持亚健康检测 - 云架构中心

RES11-01 混沌测试 - 云架构中心

RES12-05 应急恢复回溯 - 云架构中心

可靠性功能 - 云架构中心

RES09-03 重试需要避免造成流量压力 - 云架构中心

常见故障模式 - 云架构中心

SEC06-04 应用安全配置 - 云架构中心

Kafka性能优化 - 云架构中心

SEC09-03 实施安全审计 - 云架构中心

PERF04-02 选择合适的测试方式 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

PERF05-04 大数据场景资源优化 - 云架构中心

OPS03-05 进行混沌测试和演练 - 云架构中心

OPS04-01 有效落地持续集成 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

Flink性能优化 - 云架构中心

OPS06-04 规范化应用日志 - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线