搜索_华为云

OPS04-04 自动化工程运维任务 - 云架构中心

度自动化，没有增加复杂性的变量，并且作为正常路径的一部分执行。示例包括：重新启动服务器、创建帐户以及将日志传输到数据存储。这些任务可能会按计划发生，作为对事件或监视警报的响应，或者根据外部因素的需要而发生。可以解放运维工程师的任务：为应用的DevOps团队提供自动服务，通过运行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
责任共担模式 - 云架构中心
责任共担模式 - 云架构中心

责任共担模式云上应用系统的韧性，依赖于云基础设施及应用系统本身的韧性，任何一方故障，都可能会导致云上应用系统故障；因此需要华为云与客户共同承担责任，来保障应用系统的韧性。华为云责任：华为云提供高可用的基础设施，包括运行华为云服务的硬件、软件和机房设施，并确保服务可用性满足SLA服务等级协议。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 基本概念
选择合适的数据库资源 - 云架构中心

对业务系统中其他组件的影响（如服务中断的影响、数据转移效率），这是具体实施业务上云过程中的重点关切。业务应用场景的评估：如果是在云上新建业务系统，则要通过业务的实际需要进行云数据库的选型，它的评估与数据库是否建立在云上无关，而是根据实际业务系统的特点来决定的。如电商系统，考虑选

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF03 性能建模
PERF01-01 全生命周期性能管理 - 云架构中心

量化的、可测量的性能目标。若要设置这些目标，需要充分了解业务要求以及预期将提供的服务质量。需要与业务利益干系人共同关键功能的体验要求，而不是只关注技术指标。通过明确地说明性能需求来控制性能，说明要足够明确，以便可以定量地确定软件系统是否满足该目标。具体要求：定义明确的性能需求目标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
SEC05-01 云服务安全配置 - 云架构中心

全配置建议，例如：容器安全，例如容器安全配置，CCE里不安全的容器配置可能导致容器逃逸问题系统漏洞，例如操作系统的版本有没有升到最新版，使用版本是否存在漏洞开放必要的端口，例如系统是否对公网开放22，3306等高危端口禁止将重要业务数据所在的OBS桶设置为公开桶或者配置为公共可读。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC05 运行环境安全
RES01 冗余 - 云架构中心
RES01 冗余 - 云架构中心

RES01 冗余 RES01-01 应用组件高可用部署 RES01-02 应用组件多位置部署 RES01-03 云服务器反亲和父主题：高可用设计

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES08-03 减少被依赖项故障的影响 - 云架构中心

使用优先队列，优先处理高优先级用户的请求，以便在流量过载时不影响应用系统的核心功能。流量过载时支持功能逐步降级。被依赖项本身的功能受损时，提供缺省处理，以便应用系统仍可继续正常运行；由于缺省处理可能与实际配置有差异，此时需要告警以便通知系统管理员解决问题。父主题： RES08 依赖减少与降级

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES08 依赖减少与降级
RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

目标通过定期的容灾演练，可以验证灾备系统是否可用，且数据丢失时间以及恢复时间符合数据的RPO与RTO指标要求。风险等级高关键策略每年至少进行一次容灾演练；通过演练可提升操作人员的熟练程度。演练期间需要对恢复过程计时，以确定应用系统的RPO与RTO目标能否满足。演练期

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
RES12-04 出现问题后尽快恢复业务 - 云架构中心

出现问题后尽快恢复业务应用系统出现故障后，需要能尽快发现，尽快响应。风险等级高关键策略可以通过以下途径实现故障的快速发现：监控：应用系统需要提供业务监控信息，以便实时了解系统运行状态；维护团队需要有专人观测，并在发现故障发生时，需要及时响应。告警：应用系统在检测到故障后需要及时告警，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
缓存性能优化 - 云架构中心
缓存性能优化 - 云架构中心

Redis使用规范如下的规范可以帮助我们在系统运行过程中，尽可能减少遇到redis不稳定或异常的概率，保证系统的长稳运行。业务使用规范原则原则说明级别备注就近部署业务，避免时延过大如果部署位置过远（非同一个region）或者时延较大（例如业务服务器与Redis实例通过公网连接），网络延迟将极大影响读写性能。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

Flink作为流数据处理引擎，依赖内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：根据自己的业务目标，规划CPU资源和内存资源。规划时，需要结合当前的数据分布情况，业务复杂度，设置JobManager的内存，TaskManager的数量，Ta

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
跨云容灾方案 - 云架构中心
跨云容灾方案 - 云架构中心

当重要应用系统已经在IDC或其他云上部署，并需要容灾到华为云，以提供高可用的容灾方案。假定应用系统在IDC或其他云上可以达到99.9%的可用性，则在容灾到华为云后，能提供99.99%的可用性。跨云应用典型架构为前端无状态应用层+后端数据库，其中前端无状态应用可采用虚拟机或容器（以

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构 > 跨云场景典型部署架构（99.99%）
OPS01-02 规划标准化的运维组织 - 云架构中心

或服务等级协议(SLA），同时应该记录团队间沟通信息，确保有足够的数据用于后续的改进。例如一种运维组织设计是：将运维组织分为一线、二线和三线阶梯型运维支持团队，一线受理客户的服务请求，第一时间将大部分的服务请求闭环。二线处理一线升级的服务请求和监控发现的客户的问题，按照SLA完成闭环，

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS01 建立持续改进的团队文化和标准化的运维体系
SEC03-02 按需分配合适的权限 - 云架构中心

SEC03-02 按需分配合适的权限权限管理应遵循按需分配、最小授权、职责分离原则。需要根据工作职责限定人员对于关键业务系统的访问权限，以免非必要人员或非授权人员访问到关键系统和敏感数据。如需要临时权限，应仅向用户授予有限的时间段内执行特定任务的权限，并且在任务完成后，应撤销访问权限。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 安全性支柱 > 基础设施安全 > SEC03 权限管理
RES07-02 日志统计监控 - 云架构中心

日志统计监控应用系统需要收集日志，在必要时对日志进行统计分析，设置告警规则触发告警，统计分析的内容可以是统计一定时间段内某些关键字出现的次数。风险等级中关键策略日志关键字与出现次数阈值需要合理设置，以免监控信息不正确。日志信息（如关键字或出现频率）发生变化时，需要及时更新告警规则。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

服务规模与业务容量参数配置对照表 Spark作为内存计算引擎，需要更多的内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：当程序运行在yarn-client模式下时，需要关注在driver端汇聚的数据量大小，根据自己的业务场景，为driver设置合理的内存。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
基础概念 - 云架构中心
基础概念 - 云架构中心

IaC 基础设施即代码基础设施即代码（IaC）是指使用代码而不是手动流程和设置来配置和支持基础设施的能力。任何应用程序环境都需要许多基础设施组件，例如操作系统、数据库连接和存储。开发人员必须定期设置、更新和维护基础设施，以开发、测试和部署应用程序。手动管理基础设施既耗时又容易出错，尤其是在大规模管理应用程序时。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱
PERF06-02 性能劣化自动定界定位 - 云架构中心

关键策略通过建立的分层性能模型，判断系统是否会出现性能劣化的情况。当出现劣化事件时，需要通过自动化手段快速定位定界发现根因。可以通过应用模型建设三维的拓扑，把架构-空间-时间数据关联起来。这里面的关键是架构模型的建立及分层指标的聚合可视化能力，需要依赖持续的资源治理和数据治理。相关云服务和工具：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF06 性能看护 > 性能看护
RES12-02 制定应急预案 - 云架构中心

以便在出现问题后，可以有序的完成恢复操作，避免操作失误。风险等级高关键策略需要覆盖常用典型场景。应急恢复需要有标准的操作流程和动作，确保在事件发生时，相关干系人都能够明确自身职责和所需要采取的措施。每个恢复操作动作必须明确无歧义，可指导操作人员。相关云服务和工具云运维中心

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

以满足运维需要无法采集云服务指标信息：客户自建运维体系无法采集到云服务等场景的指标信息，不能满足大屏展示需要告警通知能力不足：自建运维平台告警通知能力不能完全满足多场景通知的需要，且没有告警降噪能力解决方案：业务价值：降低了运维成本与难度：降低了运维多套系统的难度，减少

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > 参考案例

总条数： 244

上一页
1
2
3
4
5
...
13
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

OPS04-04 自动化工程运维任务 - 云架构中心

责任共担模式 - 云架构中心

选择合适的数据库资源 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

SEC05-01 云服务安全配置 - 云架构中心

RES01 冗余 - 云架构中心

RES08-03 减少被依赖项故障的影响 - 云架构中心

RES04-04 定期进行容灾演练，以检查恢复能否满足容灾目标 - 云架构中心

RES12-04 出现问题后尽快恢复业务 - 云架构中心

缓存性能优化 - 云架构中心

Flink性能优化 - 云架构中心

跨云容灾方案 - 云架构中心

OPS01-02 规划标准化的运维组织 - 云架构中心

SEC03-02 按需分配合适的权限 - 云架构中心

RES07-02 日志统计监控 - 云架构中心

Spark性能优化 - 云架构中心

基础概念 - 云架构中心

PERF06-02 性能劣化自动定界定位 - 云架构中心

RES12-02 制定应急预案 - 云架构中心

通过AOM助力系统运维能力提升，降低运维成本与难度 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线