搜索_华为云

支持的大数据平台简介 - 对象存储服务 OBS

华为云MapReduce服务（MRS）是华为云提供的大数据服务，可以在华为云上部署和管理Hadoop系统，一键即可部署Hadoop集群。 MRS提供用户完全可控的一站式企业级大数据集群云服务，完全兼容开源接口，结合华为云计算、存储优势及大数据行业经验，为客户提供高性能、低成本、灵活易用的全栈大数据平台，轻松运

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
对接大数据平台 - 对象存储服务 OBS

对接大数据平台支持的大数据平台简介华为云MRS对接OBS Cloudera CDH对接OBS Hortonworks HDP对接OBS 父主题：大数据场景下使用OBS实现存算分离

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
支持的大数据组件简介 - 对象存储服务 OBS

支持的大数据组件简介在华为云大数据存算分离方案中，OBS除了可以与大数据平台对接外，还可以直接与开源的大数据组件对接。当前支持的大数据组件如下： Hadoop Hive Spark Flume DataX Druid Flink logstash 父主题：对接大数据组件

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
华为云MRS对接OBS - 对象存储服务 OBS

配置存算分离集群。详细操作，请参见使用委托方式配置存算分离集群。使用存算分离集群。详细操作，请参见使用存算分离集群。父主题：对接大数据平台

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
Hortonworks HDP对接OBS - 对象存储服务 OBS

BSA版本号，y值最大为最新版本。如：hadoop-huaweicloud-3.1.1-hw-53.8.jar，3.1.1是配套hadoop版本号，53.8是OBSA的版本号。如hadoop版本为3.1.x，则选择hadoop-huaweicloud-3.1.1-hw-53.8

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
DataX对接OBS - 对象存储服务 OBS
DataX对接OBS - 对象存储服务 OBS

DataX对接OBS 概述 DataX是一个数据同步框架，实现了包括MySQL、SQL Server、Oracle、PostgreSQL、HDFS、Hive、HBase、OTS、ODPS等各种异构数据源之间高效的数据同步功能。OBS在大数据场景中可以替代Hadoop系统中的HDF

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Cloudera CDH对接OBS - 对象存储服务 OBS

BSA版本号，y值最大为最新版本。如：hadoop-huaweicloud-3.1.1-hw-53.8.jar，3.1.1是配套hadoop版本号，53.8是OBSA的版本号。如hadoop版本为3.1.x，则选择hadoop-huaweicloud-3.1.1-hw-53.8

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据平台
大数据场景下使用OBS实现存算分离方案概述 - 对象存储服务 OBS

大数据场景下使用OBS实现存算分离方案概述应用场景随着大数据技术的飞速发展，对数据价值的认识逐渐加深，大数据已经融入到了各行各业。根据相关调查报告数据显示，超过39.6%的企业正在应用大数据并从中获益；超过89.6%的企业已经成立或计划成立相关的大数据分析部门；超过六成的企业

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
对接大数据组件 - 对象存储服务 OBS

对接大数据组件支持的大数据组件简介 Hadoop对接OBS Hive对接OBS Spark对接OBS Presto对接OBS Flume对接OBS DataX对接OBS Druid对接OBS Flink对接OBS Logstash对接OBS 父主题：大数据场景下使用OBS实现存算分离

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
Hadoop对接OBS - 对象存储服务 OBS

OBSFileSystem 是 - fs.AbstractFileSystem.obs.impl org.apache.hadoop.fs.obs.OBS 是 - fs.obs.endpoint 无是华为云OBS的终端节点（Endpoint）。 fs.obs.access.key 无是华为云的AK（Access

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Druid对接OBS - 对象存储服务 OBS
Druid对接OBS - 对象存储服务 OBS

加hdfs-site.xml，配置如下（其中endpoint按照桶所在的实际endpoint填写）：启动Druid服务。父主题：对接大数据组件

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Logstash对接OBS - 对象存储服务 OBS

开头）。执行以下命令，运行logstash。 bin/logstash -f ../conf/file2obs.conf 父主题：对接大数据组件

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
大数据场景下使用OBS实现存算分离 - 对象存储服务 OBS

大数据场景下使用OBS实现存算分离大数据场景下使用OBS实现存算分离方案概述操作流程对接大数据平台对接大数据组件迁移HDFS数据至OBS

帮助中心 > 对象存储服务 OBS > 最佳实践
迁移HDFS数据至OBS - 对象存储服务 OBS

您实现数据自由流动。支持关系数据库，数据仓库，NoSQL，大数据云服务等数据源。详细内容请参见云数据迁移。 OMS方式迁移对象存储迁移服务（Object Storage Migration Service，OMS）是一种线上数据迁移服务，帮助您将其他云服务商对象存储服务中的数

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离
Spark对接OBS - 对象存储服务 OBS
Spark对接OBS - 对象存储服务 OBS

Spark对接OBS 概述 Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎。前提条件已安装Hadoop，具体请参见Hadoop对接OBS。注意事项为了减少日志输出，在/opt/spark-2.3.3/conf/log4j.properties文件中增加配置：

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Flink对接OBS - 对象存储服务 OBS
Flink对接OBS - 对象存储服务 OBS

Flink对接OBS 概述 Flink是一个分布式的数据处理引擎，用于处理有界和无界流式数据。Flink定义了文件系统抽象，OBS服务实现了Flink的文件系统抽象，使得OBS可以作为flink StateBackend和数据读写的载体。注意事项 flink-obs-fs-hadoop目前仅支持OBS并行文件系统。

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Flume对接OBS - 对象存储服务 OBS
Flume对接OBS - 对象存储服务 OBS

Flume对接OBS 概述 Flume是一个分布式的、可靠的和高可用的服务，用于收集、聚合以及移动大量日志数据，具体请参见Apache Flume。OBS在大数据场景中可以替代Hadoop系统中的HDFS服务。注意事项多sink写同一文件 OBS和HDFS在一致性保证上是有差别的：HDFS租约

 帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Hive对接OBS - 对象存储服务 OBS
Hive对接OBS - 对象存储服务 OBS

Hive对接OBS 概述 Hive是一个数据仓库工具，可以对存储在分布式存储中的大规模数据进行数据提取、转化和加载，它提供了丰富的SQL查询方式来进行数据分析。前提条件已安装Hadoop，具体请参见Hadoop对接OBS。对接步骤以Hive 2.3.3为例。下载apache-hive-2

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
Presto对接OBS - 对象存储服务 OBS

JVM配置文件 JVM配置文件etc/jvm.config，包含启动Java虚拟机时的命令行选项。格式是每一行是一个命令行选项。此文件数据是由shell解析，所以选项中包含空格或特殊字符会被忽略。以下是参考配置： -server -Xmx16G -XX:-UseBiasedLocking -XX:+UseG1GC

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离 > 对接大数据组件
操作流程 - 对象存储服务 OBS
操作流程 - 对象存储服务 OBS

操作流程大数据场景下使用OBS实现存算分离的操作流程如图1所示。图1 操作流程配置的核心是完成大数据平台与OBS对接，实现OBS作为大数据的统一数据湖存储。本文档提供三种主流大数据平台的对接指导，详情请参见支持的大数据平台简介。（可选）OBS除了可以与主流大数据平台对接外，

帮助中心 > 对象存储服务 OBS > 最佳实践 > 大数据场景下使用OBS实现存算分离

总条数： 1323

上一页
1
2
3
4
5
...
67
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

支持的大数据平台简介 - 对象存储服务 OBS

对接大数据平台 - 对象存储服务 OBS

支持的大数据组件简介 - 对象存储服务 OBS

华为云MRS对接OBS - 对象存储服务 OBS

Hortonworks HDP对接OBS - 对象存储服务 OBS

DataX对接OBS - 对象存储服务 OBS

Cloudera CDH对接OBS - 对象存储服务 OBS

大数据场景下使用OBS实现存算分离方案概述 - 对象存储服务 OBS

对接大数据组件 - 对象存储服务 OBS

Hadoop对接OBS - 对象存储服务 OBS

Druid对接OBS - 对象存储服务 OBS

Logstash对接OBS - 对象存储服务 OBS

大数据场景下使用OBS实现存算分离 - 对象存储服务 OBS

迁移HDFS数据至OBS - 对象存储服务 OBS

Spark对接OBS - 对象存储服务 OBS

Flink对接OBS - 对象存储服务 OBS

Flume对接OBS - 对象存储服务 OBS

Hive对接OBS - 对象存储服务 OBS

Presto对接OBS - 对象存储服务 OBS

操作流程 - 对象存储服务 OBS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线