搜索_华为云

可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

后，快速切换到备节点并自动恢复，在异常检测和恢复期间，可能会影响业务，时间在半分钟内。数据备份和恢复 DCS支持将当前时间点的实例缓存数据备份并存储到OBS中，以便在缓存实例发生异常后能够从备份数据进行恢复。DCS实例支持定时和手动两种备份方式，定时备份频率以天为单位，最多保存

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > DCS分布式缓存服务
Spark性能优化 - 云架构中心
Spark性能优化 - 云架构中心

Spark作为内存计算引擎，需要更多的内存和CPU。用户在规划规格时，应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：当程序运行在yarn-client模式下时，需要关注在driver端汇聚的数据量大小，根据自己的业务场景，为driver设置合理的内存。根据自己的业务目标

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES04-03 容灾恢复过程自动化 - 云架构中心

RES04-03 容灾恢复过程自动化由于容灾恢复场景涉及容灾站点的业务恢复、数据库的主备切换、业务到容灾站点的流量切换等，恢复过程比较复杂，因此需要提供容灾管理功能，实现容灾状态及RPO监控，以及灾难场景下的一键式自动切换，减少人工干预。风险等级高关键策略实时监控容灾状态，了解容灾运行状态。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES04 跨Region/跨云容灾
OPS04-04 自动化工程运维任务 - 云架构中心

增加复杂性的变量，并且作为正常路径的一部分执行。示例包括：重新启动服务器、创建帐户以及将日志传输到数据存储。这些任务可能会按计划发生，作为对事件或监视警报的响应，或者根据外部因素的需要而发生。可以解放运维工程师的任务：为应用的DevOps团队提供自动服务，通过运行的脚本自动执行

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
OPS04-02 采用持续部署模型 - 云架构中心

选择这两种模型时，部署的每个阶段之间的时间应该足够长，以便能够监控工作负载的运行状况指标。应该提供充足的部署间隔时间（即部署组之间的时间），以确保来自不同区域的用户或执行不同任务的用户有时间使用工作负载。间隔时间应以小时和天而不是分钟来衡量。每个部署组的间隔时间也应该增加，以便考虑不同的时区和使用模式。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
Serverless性能优化 - 云架构中心

、可靠性要求较低的测试业务使用。 VPC访问：函数提供了指定VPC访问的能力，但在冷启动时会初始化到该VPC网络的网络链路造成额外的冷启动时延。如果需要访问公网，且对带宽有要求的生产业务可以通过配置绑定了NAT网关的VPC来访问公网；如果函数没有网络访问场景的，不建议配置VPC。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍
OPS04-01 有效落地持续集成 - 云架构中心

将软件更新集成到源代码控制系统中。当工程师向代码仓提交代码时，持续集成过程就开始了。理想情况下，集成过程会根据多个基线和测试来验证代码。然后，它向提交者提供有关这些测试状态的反馈。如果基线检查和测试进展顺利，集成过程将生成并暂存部署更新软件的资产。这些资产包括编译的代码和容器映像。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
PERF04-03 性能测试步骤 - 云架构中心

标、数据指标、资源指标三种维度指标需要达到的目标基线，指导系统能达到以最小的资源占用管理最大的数据并给用户提供最优的体验目标，输出系统各个场景所要达到的SLA。 2.创建测试方案创建测试方案是指设计适合性能测试系统负载的特定场景或条件的过程，性能测试方案设计要求全面、无遗漏，使

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF04 性能分析 > 性能测试
OPS04-03 基础设施即代码 - 云架构中心

IaC 的更好的整体选择。声明性工具对其定义文件使用更简单的语法，仅定义部署完成后所需的环境状态。命令式工具需定义达到所需最终状态所需的步骤，因此文件可能比声明性文件复杂得多。声明性定义文件还有助于减少维护命令式代码（例如部署脚本）的技术债务，这些技术债务会随着时间的推移而增加。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 卓越运营支柱 > OPS04 自动化构建和部署流程
RES03-01 集群跨AZ部署 - 云架构中心

OBS桶等，则需要新申请跨AZ高可用实例替换原来的单AZ高可用实例。若云服务实例为单节点实例，如ECS，则通过申请多个AZ的多个实例承载相同业务，并利用跨AZ的ELB实现跨AZ的负载均衡和自动故障切换，或由应用层实现跨AZ多实例的自动故障切换能力，来实现跨AZ高可用。相关云服务和工具

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计 > RES03 跨AZ容灾
PERF01-01 全生命周期性能管理 - 云架构中心

免功能过剩、并对性能影响较大的调用；选择云服务的时候，选择合适的云服务，结合业务的特征选择合适的云服务类型和规格，利用好云弹性的特性的优势。设计功能过于复杂的组件，有时候是为了通用，有时候则是一种不好的软件设计习惯。够用原则适用于自己设计或者调用已有的功能，使用时注意避免过度设计。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > PERF01 流程与规范 > 全生命周期性能管理
内部工具或公测类应用典型部署架构（99%） - 云架构中心

不方便，可以承受长时间的恢复时间和恢复点；公测类应用用于面向客户的实验性的工作负载，在必要时可以隐藏其功能；针对这些应用，其可用性目标通常要求不高，可达到99%，即每年中断时间可以为3.65天。导致业务中断的时间包含故障中断时间及由于升级配置维护等导致的中断时间，假定分别中断时间如下：

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 参考架构
RES12-03 定期应急恢复演练 - 云架构中心

相关云服务和工具云运维中心 COC：支持混沌演练，为用户提供一站式的自动化演练能力，覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端的演练流程。父主题： RES12 应急恢复处理

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES12 应急恢复处理
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实例之间的单主灾备（详见“MySQL到MySQL单主灾备”）或双主灾备（详见“MySQL到MySQL双主灾备”）。监控告警配合CES服务，支持对RDS的CPU、内存、磁盘、网络等进行监控和告警。详见“支持的监控指标”。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > RDS云数据库
可靠性功能 - 云架构中心
可靠性功能 - 云架构中心

数据库链接地址后，即可快速恢复应用的业务访问。数据复制服务提供的实时灾备功能，可实现主实例和跨区域的灾备实例之间的单主灾备（详见“云数据库 TaurusDB到云数据库 TaurusDB单主灾备” ），或双主灾备（详见“云数据库 TaurusDB到云数据库 TaurusDB双主灾备”）。

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 云服务可靠性介绍 > 云数据库 TaurusDB云数据库
RES04 跨Region/跨云容灾 - 云架构中心

较为完善的数据保护与灾难恢复能力，以便在站点级灾难发生时，可以保证生产系统的数据尽可能少的丢失，业务系统能在最短时间内由灾备中心接替，恢复业务系统的正常运行，将损失降到最小。对于跨Region容灾场景，应用系统可在多个Region中部署，并将数据从一个Region复制到另一个R

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 高可用设计
RES15-04 灰度部署和升级 - 云架构中心

金丝雀部署（灰度发布）是将少量客户引导到新版本的做法，通常在单个服务实例（Canary）上运行；当检查到任何行为更改或错误时，可以将Canary中的流量删除，并将用户发回到以前的版本。如果部署成功，则可以继续以期望的速度进行部署，同时监控更改以便发现错误，直到所有部署完成。蓝绿部署与

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 变更防差错 > RES15 升级不中断业务
RES11-01 混沌测试 - 云架构中心
RES11-01 混沌测试 - 云架构中心

段，支持故障和业务流程编排的可靠性评估测试、压力负荷测试、CHAOS随机故障注入、生产环境故障演练等能力。云运维中心 COC：支持混沌演练，为用户提供一站式的自动化演练能力，覆盖从风险识别、应急预案管理、故障注入到复盘改进的端到端的演练流程。父主题： RES11 可靠性测试

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障快速恢复 > RES11 可靠性测试
Flink性能优化 - 云架构中心
Flink性能优化 - 云架构中心

应根据当前的业务容量和增长速度，规划合理的内存和CPU资源，特别需要关注以下几点：根据自己的业务目标，规划CPU资源和内存资源。规划时，需要结合当前的数据分布情况，业务复杂度，设置JobManager的内存，TaskManager的数量，TaskManager的内存，每个Ta

帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 性能效率支柱 > 云服务性能优化介绍 > 大数据性能优化
RES07-01 定义关键指标与阈值并监控 - 云架构中心

对资源进行监控时，需要先定义资源的关键指标以及对应的阈值，以便快速有效的发现业务表现和系统状态，以便在异常状态下尽早干预恢复，或定位改进系统缺陷。风险等级中关键策略关键指标需要与系统内工作负载的关键性能指标相关，并能确定为系统性能下降的早期警告信号，如系统处理的API数量及成功率，相

 帮助中心 > 云架构中心 > 卓越架构技术框架与实践 > 韧性支柱 > 故障全面检测 > RES07 监控告警

总条数： 123

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

可靠性功能 - 云架构中心

Spark性能优化 - 云架构中心

RES04-03 容灾恢复过程自动化 - 云架构中心

OPS04-04 自动化工程运维任务 - 云架构中心

OPS04-02 采用持续部署模型 - 云架构中心

Serverless性能优化 - 云架构中心

OPS04-01 有效落地持续集成 - 云架构中心

PERF04-03 性能测试步骤 - 云架构中心

OPS04-03 基础设施即代码 - 云架构中心

RES03-01 集群跨AZ部署 - 云架构中心

PERF01-01 全生命周期性能管理 - 云架构中心

内部工具或公测类应用典型部署架构（99%） - 云架构中心

RES12-03 定期应急恢复演练 - 云架构中心

可靠性功能 - 云架构中心

可靠性功能 - 云架构中心

RES04 跨Region/跨云容灾 - 云架构中心

RES15-04 灰度部署和升级 - 云架构中心

RES11-01 混沌测试 - 云架构中心

Flink性能优化 - 云架构中心

RES07-01 定义关键指标与阈值并监控 - 云架构中心

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线