搜索_华为云

配置Hive读取关系型数据库数据 - MapReduce服务 MRS

配置Hive读取关系型数据库数据操作场景 Hive支持创建与其他关系型数据库关联的外表。该外表可以从关联到的关系型数据库中读取数据，并与Hive的其他表进行Join操作。目前支持使用Hive读取数据的关系型数据库如下： DB2 Oracle 本章节适用于MRS 3.x及后续版本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置NameNode黑名单功能 - MapReduce服务 MRS

配置NameNode黑名单功能配置场景本章节适用于MRS 3.x及后续版本。在现有的缺省DFSclient failover proxy provider中，一旦某进程中的一个NameNode发生故障，在同一进程中的所有HDFS client实例都会尝试再次连接NameNode，导致应用长时间等待超时。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略操作场景默认情况下，NameNode会随机选择DataNode节点写文件。当集群内某些数据节点的磁盘容量不一致（某些节点的磁盘总容量大，某些总容量小），会导致磁盘总容量小的节点先写满。通过修改集群默认的DataNode写数据时

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
配置用户在具有读和执行权限的目录中创建外表 - MapReduce服务 MRS

配置用户在具有读和执行权限的目录中创建外表操作场景此功能在MRS 3.x之前版本适用于Hive，Spark。在MRS3.x及后续版本适用于Hive，Spark2x。开启此功能后，允许有目录读权限和执行权限的用户和用户组创建外部表，而不必检查用户是否为该目录的属主，并且禁止外

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

Spark SQL在不同DB都可以显示临时表问题切换数据库之后，为什么还能看到之前数据库的临时表？创建一个DataSource的临时表，例如以下建表语句。 create temporary table ds_parquet using org.apache.spark.sql

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
使用ClickHouse客户端 - MapReduce服务 MRS

使用ClickHouse客户端 ClickHouse是面向联机分析处理的列式数据库，支持SQL查询，且查询性能好，特别是基于大宽表的聚合分析查询性能非常优异，比其他分析型数据库速度快一个数量级。前提条件已安装客户端，例如安装目录为“/opt/client”。以下操作的客户端目

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Geospatial函数 - MapReduce服务 MRS
Geospatial函数 - MapReduce服务 MRS

Geospatial函数以ST_前缀开头的HetuEngine Geospatial功能支持SQL、MM规范，并符合Open Geospatial Consortium（OGC）的OpenGIS规范。因此，许多HetuEngine Geospatial功能要求或更准确地说是假设

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
使用CDL从PgSQL同步数据到Hudi - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Hudi 操作场景本章节指导用户通过MRS 3.2.0版本开启Kerberos认证的集群的CDLService WebUI界面，从PgSQL导入数据到Hudi。前提条件集群已安装CDL、Hudi服务且运行正常。 PgSQL数据库需要开启前置要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
配置Spark应用安全认证 - MapReduce服务 MRS

配置Spark应用安全认证前提条件 MRS服务集群开启了Kerberos认证。场景说明在集群开启Kerberos认证的环境下，各个组件之间的相互通信不能够简单地互通，而需要在通信之前进行相互认证，以确保通信的安全性。用户在开发Spark应用程序时，某些场景下，需要Spar

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
使用CDL从PgSQL同步数据到Kafka - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Kafka 操作场景本章节指导用户通过MRS 3.2.0版本开启Kerberos认证的集群的CDLService WebUI界面，从PgSQL导入数据到Kafka。前提条件集群已安装CDL、Kafka服务且运行正常。 PostgreSQL数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python接口介绍 - MapReduce服务 MRS

Spark Python接口介绍由于Spark开源版本升级，为避免出现API兼容性或可靠性问题，建议用户使用配套版本的开源API。 Spark Core常用接口 Spark主要使用到如下这几个类： pyspark.SparkContext：是Spark的对外接口。负责向调用该类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
配置创建Hive内部表时不能指定Location - MapReduce服务 MRS

配置创建Hive内部表时不能指定Location 操作场景此功能在MRS 3.x之前版本适用于Hive，Spark。在MRS3.x及后续版本适用于Hive，Spark2x。开启此功能后，在创建Hive内部表时，不能指定location。即表创建成功之后，表的location路

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

Spark SQL在不同DB都可以显示临时表问题切换数据库之后，为什么还能看到之前数据库的临时表？创建一个DataSource的临时表，例如以下建表语句。 create temporary table ds_parquet using org.apache.spark.sql

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka）操作场景本章节指导用户通过开启Kerberos认证的集群的CDLService WebUI界面从ThirdKafka导入drs-avro-oracle数据库数据到Hudi。该章节内容适用于MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
使用CDL同步drs-oracle-json数据到Hudi（ThirdKafka） - MapReduce服务 MRS

使用CDL同步drs-oracle-json数据到Hudi（ThirdKafka）操作场景本章节指导用户通过开启Kerberos认证的集群的CDLService WebUI界面从ThirdKafka导入Oracle数据库数据到Hudi。该章节内容适用于MRS 3.3.0及之后版本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
文件块过大导致HBase数据导入失败 - MapReduce服务 MRS

文件块过大导致HBase数据导入失败问题现象导入数据到hbase报错：NotServingRegionException。原因分析当一个block size大于2G时，hdfs在seek的时候会出现读取异常，持续频繁写入regionserver时出现了full gc，且时

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HBase

总条数： 4211

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Hive读取关系型数据库数据 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置NameNode黑名单功能 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置用户在具有读和执行权限的目录中创建外表 - MapReduce服务 MRS

Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

使用ClickHouse客户端 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Geospatial函数 - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Hudi - MapReduce服务 MRS

配置Spark应用安全认证 - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Kafka - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python接口介绍 - MapReduce服务 MRS

配置创建Hive内部表时不能指定Location - MapReduce服务 MRS

Spark SQL在不同DB都可以显示临时表 - MapReduce服务 MRS

使用CDL同步drs-oracle-avro数据到Hudi（ThirdKafka） - MapReduce服务 MRS

使用CDL同步drs-oracle-json数据到Hudi（ThirdKafka） - MapReduce服务 MRS

文件块过大导致HBase数据导入失败 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线