检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
些工具和系统支持在海量数据集上进行查询、聚合和可视化,以提供数据洞见和决策支持。 任务调度: 大数据平台通常需要处理复杂的数据作业。任务调度系统(如Azkaban等)用于管理和调度各种数据处理作业,可以设置作业的依赖关系、调度频率、重试策略等,以确保作业的顺利执行和任务的准时完成。
性能匹配 存储服务的性能指标包括传输带宽、IOPS和时延等,如下表所示,您需要根据业务系统的性能要求和特点选择最合适的存储服务及对应的规格。 另外,EVS和OBS对所存储对象的大小无限制,SFS通用容量型不适合1MB以下的海量小文件应用,SFS Turbo和后续的SFS通用性能型可支撑海量小文件应用。
能的故障或异常情况。 异常处理和故障恢复:建立故障处理和恢复计划,包括对集群、任务和应用程序可能出现的问题进行分类并定义相应的响应和恢复步骤。 团队培训和知识共享:培训团队成员以适应新的环境和技术栈。建立知识分享机制,促进团队内部的交流和经验分享。 父主题: 大数据迁移
等,作为非核心业务的数据,如果有微量损失,并不会影响客户的业务使用和体验。建议若切换时间有限,可以只进行数据的行数对比。 边缘业务 90% 电商系统的首页推荐数据、用户浏览数据、用户画像数据等,如果有一部分损失,并不会影响客户的业务使用可体验。建议进行表级的的行数对比,抽样内容对比。
设计原则 大数据的部署架构设计包括大数据集群、大数据任务调度平台和大数据应用,其中大数据应用的部署架构请参考应用架构设计。 图1 大数据架构设计分类 大数据架构设计同样要考虑架构设计的6要素: 成本 可用性 安全性 可扩展性 可运维性 性能 图2 架构设计6要素 父主题: 大数据架构设计
当前企业业务中使用比较多的中间件类型为缓存中间件和消息中间件。中间件作为数据存储的临时场所,数据一般不用迁移,但在切换时,为了确保源端和目的端数据的一致性,需要等中间件消息队列中的消息完成消费后再切换。如果中间件缓存数据是持久化的,即作为数据库使用,此场景需要进行数据的迁移。所以中间件的迁移方案
根据源端数据权限控制组件的不同,选择不同的权限数据迁移方式 Sentry、Ranger等 数据重要性 调研数据重要性的目的是区分核心数据和非核心数据,用于迁移优先级和数据校验标准。 交易类是核心数据,日志类是非核心数据 数据更新频率 针对不同的刷新周期,制定数据的迁移计划和校验计划。
响数据的一致性,因此,应尽量减少批次的数量。 批次间相互独立:批次划分时,确保不同批次间尽量是相互独立的、松耦合的,很少有相互依赖的任务和数据流。独立的批次划分,有助于降低迁移中对其它业务域的影响。 批次内紧耦合:批次划分时,确保每个批次包含相关性较高的主题域和相互依赖的任务和数据流,包括数据共享场景。
SMS迁移过程 主机迁移服务的安全传输原理指的是:源端服务器中的迁移Agent从主机迁移服务获取到迁移指令后,会动态生成安全证书和密钥并且通过华为云OpenStack 元数据管理服务传输给目的端服务器,此后,源端服务器和目的端服务器会重启并使用新生成的动态安全证书建立安全的SSL通道。SMS
主备实例配置了数据持久化,数据不仅会持久化到主节点磁盘,还会实时同步到备节点,同时备节点也会持久化一份数据。 主备实例部署在不同的可用区内,不同可用区的电力、网络相互隔离,当主节点所在的机房因为电力或者网络出现故障,备节点将接管服务,客户端与备节点正常建立连接以及读写数据。 Redis集群搭配Ke
求,选择最合适的云服务商及其优势服务,从而最大化地发挥云计算的价值。 合规遵从:某些国家和地区有特定的数据存储和处理的法规要求,但每家云服务商的全球布局和合规遵从程度不一样。多云战略可以帮助企业选择最合适的云服务商来满足这些法规要求,例如将敏感数据存储在特定地区的云平台上。 多云
审查和调整访问控制 审查目标平台上的访问控制机制,并根据源端平台的权限设置进行调整。确保访问控制能够限制用户的访问范围,并遵循源端平台的权限规则。 安全审计和监测 设置安全审计和监测机制,确保目标平台上的权限设置得到有效的审计和监测。这可以帮助发现和防止未经授权的访问,并及时采取相应的措施。
数据中心网络(可信网络)访问云资源的请求也会被拒绝,可信身份访问其他企业的对象存储桶(不可信资源)的请求还会被拒绝,只有可信身份通过本地数据中心网络(可信网络)访问本企业的云资源的请求是允许的。 图1 全方位数据边界 通过全方位的数据边界提供的保护措施,您可以实现如下数据保护能力:
本升级需求的需要评估适配改造工作量。 弹性和可扩展性:在云上部署大数据任务调度平台时,应考虑平台的弹性和可扩展性。云环境提供了弹性计算和存储资源,可以根据工作负载的需求自动调整容量。确保任务调度平台能够快速处理增加的任务负载,并支持水平扩展以满足业务需求。 高可用性和容错性:确保
识别出所有任务的详细信息,包括任务ID、名称、责任部门、责任人、执行时间、更新周期等。用于后续任务改造和迁移时,和关键人员及时沟通。 任务依赖关系 识别关键任务,识别任务间依赖关系。 调研的方法主要是通过当前大数据平台获取,并辅助一些调研访谈进行补充和确认。 父主题: 大数据调研
到好处的权限,确保他们只能访问与其工作相关的资源和操作。这不仅提高了安全性,还减少了权限滥用的风险。关于IAM策略的详细介绍,请查看这个链接。 在华为云中,身份控制策略主要通过SCP和IAM策略来实现。如果同时设置了SCP和IAM策略,对用户来讲实际有效的权限范围是两者的交集。 网络控制策略
度。 智能生产和供应链管理:AI技术在生产和供应链管理方面的应用可以提高生产效率和供应链的可视化与规划。例如,利用机器学习和物联网,可以实现智能制造和预测性维护,提高生产线的运行效率和设备的可靠性。同时,AI还可以优化供应链中的库存管理、运输计划和交付路线,减少成本并提升响应能力。
华为云对云安全整体设计和实践更侧重于为您提供完善的、多维度的、按需定制和组合的各种安全和隐私保护功能和配置,涵盖基础设施、平台、应用及数据安全等各个层面。同时,不同的云安全服务又进一步为您提供了各类可自主配置的高级安全选项。这些云安全服务需要通过深度嵌入各层云服务的安全特性、安全配置和安全管控
关注应用系统的开发和部署,可以从云服务商按需获取上述各种资源,资源可以快速部署、调整和扩展,运维负担轻,并大幅降低了初始投资。云计算提供了巨大的灵活性、可靠性和扩展性,但整个组织的云化转型是一项系统性工程,涉及组织、流程和技术的方方面面,您的组织需要一个成熟且一致的方法确保云化转型的成功,最大化业务收益。
性、配置项间的关系等),记录配置信息等。并通过专业的CMDB工具对配置项、配置项的属性和配置项之间的关系进行管理。 应用系统的各项变更都是影响应用系统安全稳定运行的因素。生产环境中的操作系统、数据库、中间件和应用程序等的变更,包括软件更新、配置改变等,都需要通过有序的活动进行变更