搜索_华为云

OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

OPS06-07 通过可观测性指标引入自动化措施风险等级高关键策略可观测与自动化运维工具联动，实现自动化的故障检测、恢复及弹性伸缩等功能，进一步提升运维响应速度和准确性，降低人为干预带来的延误，甚至错误。父主题： OPS06 可观测性体系

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS06 可观测性体系
RES12-04 出现问题后尽快恢复业务 - 云架构中心

应急响应。预测：维护团队需要根据系统运行现状，通过数据分析、机器学习等方式，预测系统的风险情况，提前进行预防和处理。在进行应急恢复处理时，通常需要尽快缓解或恢复业务，快速结束业务中断对客户的影响，然后再启动问题定位和修复处理流程，以减少业务中断时间。组织协调：故障发生后，应

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
SEC06-03 实行代码白盒检视 - 云架构中心

成后，或者定期的大规模检视。培训团队成员：提供培训以确保团队成员了解如何进行有效的代码检视。确保团队了解代码检视的目的和重要性，以及如何识别常见问题和潜在的安全漏洞，建议将常犯的TOP问题整理成清单，在开发人员编写代码后自检以及他人检视时进行对照。选择合适的工具：使用代

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
OPS08-01 使用度量指标衡量运营目标 - 云架构中心

OPS08-01 使用度量指标衡量运营目标风险等级高关键策略定义清晰的运营成功的目标和 KPI，设置基线作为参考点并定期重新评估。与业务领导者和利益相关者确定服务的总体目标。确定各个运营团队的任务以及可能面临的挑战。并明确运营目标的关键绩效指标 (KPI)，可能是客户满意度、TTM、平均问题解决时间等等。根据

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

负载均衡分发时需检查后端节点的负载状态，并根据各节点的负载进行业务分发。在后端节点故障的情况下，需要自动将业务分发给其他健康节点处理，以避免业务失败。相关云服务和工具弹性负载均衡 ELB：支持业务负载均衡处理，还支持后端服务器健康状态检测，自动隔离异常状态的ECS。父主题： RES13

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 过载控制 > RES13 过载保护
RES14-04 提供runbook进行标准化变更 - 云架构中心

RES14-04 提供runbook进行标准化变更 runbook是指运行手册，是用来实现变更的详细操作过程。变更前需提供标准化runbook用于变更和回退，变更过程中严格按照runbook执行，在变更失败时根据runbook进行回退。风险等级高关键策略 runbook需

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES14 配置防差错
SEC01-01建立安全管理团队 - 云架构中心

跨职能团队：组建一个跨职能的安全管理团队，涵盖安全运营、安全架构、安全合规等不同领域的专业人员，以确保综合性的安全管理。制定安全政策和流程：制定详细的安全政策和流程，明确安全管理的标准和规范。团队成员应遵守这些政策和流程，确保安全管理的一致性和有效性。建立应急响应计划：开发和测试应急响应计划，以应对安全事件和紧

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
SEC05-06 使用托管云服务 - 云架构中心

构建增加的开发和运维成本。风险等级低关键策略实施用于托管资源的服务以便在责任共担模式中减少安全维护任务。例如使用华为云的数据库服务而不是自建关系型数据库的实例。使用Serverless架构的云服务，将计算资源的安全交给华为云处理，减免了用户自行运维服务器带来的工作量和人

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
SEC06-01 安全合规使用开源软件 - 云架构中心

品或企业的声誉受损。归一化管理。企业应进行开源软件归一化管理，对开源软件的引入进行归一，建立优选库、路标库，减少开源的种类和数量。牵引团队使用优选的开源软件，保障使用质量和安全。降低开源漏洞的影响。开源软件的安全漏洞传播快，影响大。一旦出现安全漏洞，快速排查受影响的产品并进行修复是降低影响的关键。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 应用安全 > SEC06 应用安全性
基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

长，且成本高解决方案：业务价值：端侧日志全面采集接入，自定义域名上报：集成LTS提供的多端SDK，全面采集端侧日志，接入LTS，且支持上报服务端域名自定义，在用户面保持了业务一致性与合规性，降低了问题定位复杂度，提升了运维效率端侧日志数据毫秒级上报，数据0丢失：端侧采集日

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例
COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

识别标签缺失和错误：在确定需要进行标签治理后，需要首先识别所有未打标签的资源和标签key&value错误的资源，然后从费用最高的资源开始逐步治理。建议利用云厂商提供的工具或者自建工具，通过自动化规则的方式，在资源创建的时候，就判断标签是否规范。另外一个更好的方式通过权限管理，识别资源创建人和组织，自动为资源打上标签。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST04 持续进行成本治理
RES09-01 API及命令调用需要设计为可重试 - 云架构中心

次重复执行，需要保证重复执行多次的结果不变。风险等级高关键策略应用系统在设计时，应使操作具有幂等性，也就是允许一个操作连续执行两次或多次时，应该与单次调用产生的结果相同，从而保证重试安全；若不支持操作的幂等性，会导致客户端难以重试或重试的处理更复杂。父主题： RES09

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
OPS04-04 自动化工程运维任务 - 云架构中心

增加复杂性的变量，并且作为正常路径的一部分执行。示例包括：重新启动服务器、创建帐户以及将日志传输到数据存储。这些任务可能会按计划发生，作为对事件或监视警报的响应，或者根据外部因素的需要而发生。可以解放运维工程师的任务：为应用的DevOps团队提供自动服务，通过运行的脚本自动执行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS08-02 进行事故复盘和改进 - 云架构中心

可用性和技术能力的提升。故障复盘的技术过程按照 RASA 法、Review（回顾）、Analyze（分析）、Summary（总结）、Action（行动）。 Review（回顾）：完整记录故障的发生、发现、根因定位、决策、处理、预案执行、回滚、故障解决等的关键人与关键时间点，保证信息尽可能的客观、准确。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS08 度量运营状态和持续改进
SEC01-06 识别并验证安全措施 - 云架构中心

根据团队制定的安全基线以及威胁建模分析的结果，对工作负载中涉及的安全措施进行验证，以确保它们按照预期方式运行并有效地保护系统，从而缓解或消除安全威胁。风险等级高关键策略依据系统的安全设计文档，通过验证确保安全措施被正确地集成到系统中，并符合最佳实践和标准。尽早检视系统的代码（

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 云安全治理策略 > SEC01 云安全治理策略
RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

主备容灾能力的实施步骤建议如下：选择另一个Region作为灾备Region，部署一套相同的应用系统，包括工作负载、数据库实例等。针对应用系统内的关键数据，利用云服务或应用系统自身实现跨Region的数据复制。若云服务实例支持跨Region容灾，则配置生产站点与灾备Regio

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
PERF06-02 性能劣化自动定界定位 - 云架构中心

关键策略通过建立的分层性能模型，判断系统是否会出现性能劣化的情况。当出现劣化事件时，需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层指标的聚合可视化能力，需要依赖持续的资源治理和数据治理。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

1）准确评价产品可用性、维护能力并明确相关上线标准；不满足上云标准的服务，原则上不允许上线。 2）持续导入服务可服务性、运维需求基线，实现标准化、减少例外操作，帮助服务快速上云。 3）持续提升自动化验证能力，减少手工评估，提升产品的交付与运维效率。相关云服务和工具 COC PRR评审父主题：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS05 运维准备和变更管理
RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

客户端在请求失败时，通过重复消息来获得预期的结果，避免业务失败，但也会消耗更多的服务器时间来获取所需的成功响应。风险等级高关键策略请求超时，可能是链路闪断或其他临时性故障导致消息丢失，可以进行重试。根据错误响应码进行有针对性的重试；对于临时性故障，如错误码指示为系统繁忙

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES09 故障重试
COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源风险等级中关键策略根据工作负载和资源特征选择合适的资源大小或类型。您可通过持续监控资源利用率，发现资源的利用率低于/高于阈值，选择降配或者升配资源来优化成本。父主题： COST07 管理和优化资源

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 成本优化支柱 > COST07 管理和优化资源

总条数： 381

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS06-07 通过可观测性指标引入自动化措施 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

SEC06-03 实行代码白盒检视 - 云架构中心

OPS08-01 使用度量指标衡量运营目标 - 云架构中心

RES13-02 应用系统负载均衡，避免流量不均匀 - 云架构中心

RES14-04 提供runbook进行标准化变更 - 云架构中心

SEC01-01建立安全管理团队 - 云架构中心

SEC05-06 使用托管云服务 - 云架构中心

SEC06-01 安全合规使用开源软件 - 云架构中心

基于LTS采集多类端侧日志，问题全链路追踪分析和业务运营分析 - 云架构中心

COST04-01 建立规范，持续提升成本分配比例 - 云架构中心

RES09-01 API及命令调用需要设计为可重试 - 云架构中心

OPS04-04 自动化工程运维任务 - 云架构中心

OPS08-02 进行事故复盘和改进 - 云架构中心

SEC01-06 识别并验证安全措施 - 云架构中心

RES04-02 部署容灾系统以满足容灾目标 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

OPS05-01 进行生产准备度评审（Product Readiness Review） - 云架构中心

RES09-02 客户端需要根据综合评估是否要重试 - 云架构中心

COST07-04 合理降配低负载资源或升配高负载资源 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线