搜索_华为云

Spark同步HBase数据到CarbonData（Java） - MapReduce服务 MRS

Spark同步HBase数据到CarbonData（Java）以下为Spark同步HBase数据到CarbonData的Java示例。下面代码片段仅为演示。具体代码参见：com.huawei.spark.examples.HBaseExternalHivetoCarbon。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark同步HBase数据到CarbonData样例程序
配置弹性伸缩规则 - MapReduce服务 MRS

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 弹性伸缩接口
Spark INSERT SELECT语句调优 - MapReduce服务 MRS

Spark INSERT SELECT语句调优操作场景在以下几种情况下，执行INSERT...SELECT操作可以进行一定的调优操作。查询的数据是大量的小文件。查询的数据是较多的大文件。在Beeline/JDBCServer模式下使用非Spark用户操作。操作步骤可对INSERT

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Hudi Compaction操作说明 - MapReduce服务 MRS

Hudi Compaction操作说明 Compaction用于合并mor表Base和Log文件。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

合并CBO优化操作场景 Spark SQL默认支持基于规则的优化，但仅仅基于规则优化不能保证Spark选择合适的查询计划。CBO（Cost-Bsed Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
配置Spark SQL防御规则 - MapReduce服务 MRS

配置Spark SQL防御规则配置Spark SQL防御操作场景用户可以在Manager界面配置Spark的SQL防御规则，根据业务调整对应SQL防御规则的参数。配置Spark SQL防御前提条件已安装包含Spark服务的集群客户端，安装目录如“/opt/hadoopclient”。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
Flink DataStream Java样例代码 - MapReduce服务 MRS

equals("female"); } }).keyBy( new UserRecordSelector() ).window( TumblingEventTimeWindows.of(Time

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > DataStream程序
创建Bucket索引表调优 - MapReduce服务 MRS

创建Bucket索引表调优 Bucket索引常用设置参数： Spark： hoodie.index.type=BUCKET hoodie.bucket.index.num.buckets=5 Flink index.type=BUCKET hoodie.bucket.index.num

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Scala）下面代码片段仅为演示，具体代码参见：com.huawei.bigdata.hudi.examples.HoodieDataSourceExample。插入数据： def insertData(spark: SparkSession

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
创建Phoenix表 - MapReduce服务 MRS
创建Phoenix表 - MapReduce服务 MRS

创建Phoenix表功能简介 Phoenix依赖HBase作为其后备存储，支持标准SQL和JDBC API的强大功能，使得SQL用户可以访问HBase集群。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“PhoenixSampl

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

session.timeout.ms之间。以上参数可以根据实际情况进行适当的调整，特别是max.poll.records，这个参数是为了控制每次poll数据的records量，保证每次的处理时长尽量保持稳定。目的是为了保证poll数据以后的处理时间不要超过session.timeout

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果 - MapReduce服务 MRS

日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果问题为什么日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果，匹配'2016-06-30'时有查询结果。如下图所示：“select count(*)from trxfintrx2012 a

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Hive性能调优 - MapReduce服务 MRS
Hive性能调优 - MapReduce服务 MRS

Hive性能调优建立Hive表分区提升查询效率 Hive Join数据优化 Hive Group By语句优化 Hive ORC数据存储优化 Hive SQL逻辑优化使用Hive CBO功能优化查询效率父主题：使用Hive

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
SQL语法兼容TIMESTAMP/DATE特殊字符 - MapReduce服务 MRS

SQL语法兼容TIMESTAMP/DATE特殊字符问题在Spark 3.2.0社区版本之后，将不再支持TIMESTAMP(*)或DATE(*)的语法，其中*代表如下特殊时间字符： epoch today yesterday tomorrow now 默认只支持timestamp

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark故障排除
Hive同步 - MapReduce服务 MRS
Hive同步 - MapReduce服务 MRS

Hive同步 Hive同步数据报错SQLException Hive同步数据报错HoodieHiveSyncException Hive同步数据报错SemanticException 父主题： Hudi常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题
开发Spark应用 - MapReduce服务 MRS
开发Spark应用 - MapReduce服务 MRS

开发Spark应用 Spark Core样例程序 Spark SQL样例程序通过JDBC访问Spark SQL样例程序 Spark读取HBase表样例程序 Spark从HBase读取数据再写入HBase样例程序 Spark从Hive读取数据再写入HBase样例程序 Spark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
插入ClickHouse数据 - MapReduce服务 MRS

插入ClickHouse数据本章节介绍插入ClickHouse数据样例代码。创建ClickHouse表创建的表具有三个字段，分别是String、UInt8和Date类型。示例代片段参考如下： String insertSql = "insert into " + databaseName

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（安全模式） > 开发ClickHouse应用
为什么创建Hive表失败？ - MapReduce服务 MRS

为什么创建Hive表失败？问题为什么创建Hive表失败？回答当源表或子查询具有大数据量的Partition时，创建Hive表失败。执行查询需要很多的task，此时输出的文件数就会很多，从而导致driver OOM。可以在创建Hive表的语句中增加distribute b

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData常见问题
使用Spark/Spark2x - MapReduce服务 MRS

使用Spark/Spark2x Spark使用说明 Spark用户权限管理 Spark客户端使用实践访问Spark WebUI界面使用代理用户提交Spark作业配置Spark读取HBase表数据配置Spark任务不获取HBase Token信息 Spark Core企业级能力增强

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）

总条数： 2402

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark同步HBase数据到CarbonData（Java） - MapReduce服务 MRS

配置弹性伸缩规则 - MapReduce服务 MRS

Spark INSERT SELECT语句调优 - MapReduce服务 MRS

Hudi Compaction操作说明 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

配置Spark SQL防御规则 - MapReduce服务 MRS

Flink DataStream Java样例代码 - MapReduce服务 MRS

创建Bucket索引表调优 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Scala） - MapReduce服务 MRS

创建Phoenix表 - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

日期类型的字段作为过滤条件时匹配'2016-6-30'时没有查询结果 - MapReduce服务 MRS

Hive性能调优 - MapReduce服务 MRS

SQL语法兼容TIMESTAMP/DATE特殊字符 - MapReduce服务 MRS

Hive同步 - MapReduce服务 MRS

开发Spark应用 - MapReduce服务 MRS

插入ClickHouse数据 - MapReduce服务 MRS

为什么创建Hive表失败？ - MapReduce服务 MRS

使用Spark/Spark2x - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线