搜索_华为云

Flink Kafka样例程序（Java） - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
Python样例代码 - MapReduce服务 MRS

print "Usage: CollectFemaleInfo <file>" exit(-1) # 创建SparkContext，设置AppName sc = SparkContext(appName = "CollectFemaleInfo")? """ 以下程序主要实现以下几步功能：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Core程序
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取HIVE分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取Hive分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Spark Distinct聚合优化 - MapReduce服务 MRS

配置参数在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”配置文件中进行设置，修改如下参数：参数说明默认值 spark.sql.keep.distinct.expandThreshold 由cube等引起的数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
ALM-14010 NameService服务异常 - MapReduce服务 MRS

Manager首页，选择“运维 > 日志 > 下载”。在“服务”中勾选待操作集群的如下节点信息。 ZooKeeper HDFS 单击右上角的设置日志收集的“开始时间”和“结束时间”分别为告警产生时间的前后10分钟，单击“下载”。请联系运维人员，并发送已收集的故障日志信息。告警清除

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase Phoenix API接口介绍 - MapReduce服务 MRS

kerberos.principal 当前集群regionserver的principal 未设置 hbase.master.kerberos.principal 当前集群hmaster的principal 未设置 hbase.security.authentication 初始化Phoenix连接时所采用的认证方式

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发常见问题 > HBase接口介绍
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults.conf”配置文件中进行设置。表1 参数介绍参数描述默认值 spark.sql.files.maxPartitionBytes 在读取文件时，将单个分区打包的最大字节数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
YARN Command介绍 - MapReduce服务 MRS

获取或者设置服务LOG级别。 CLASSNAME 运行一个名字为CLASSNAME的类。 top 运行集群利用率监控工具。 -Dmapreduce.job.hdfs-servers 如果对接了OBS，而服务端依然使用HDFS，那么需要显式在命令行使用该参数指定HDFS的地址。格式为

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > YARN开发指南（安全模式） > YARN接口介绍
使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

Channel和HDFS Sink，如图3所示。图3 Flume配置工具示例双击对应的Source、Channel以及Sink，根据实际环境并参考表1设置对应的配置参数。如果想在之前的“properties.propretites”文件上进行修改后继续使用，则登录FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume非加密传输数据采集任务
配置Spark动态脱敏 - MapReduce服务 MRS

ine空间的脱敏策略，需要将参数“spark.dynamic.masked.hetu.policy.sync.update.enable”设置为“true”，且需将内置用户Spark2x的Ranger用户类型调整为Admin用户类型。保存配置，重启Spark服务。登录Spark客户端节点，执行如下命令：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
ALM-12055 证书文件即将过期（2.x及以前版本） - MapReduce服务 MRS

警信息，查看系统在定时检查时是否会再次产生此告警。是，执行8。否，处理完毕。收集故障信息。在MRS Manager界面，单击“系统设置 > 日志导出”。请联系运维人员，并发送已收集的故障日志信息。参考信息 OBS证书过期请参考如何处理集群内部OBS证书过期。父主题：

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Hudi数据表Compaction规范 - MapReduce服务 MRS

paction执行合并的过程必须和实时任务解耦，通过周期调度Spark任务来完成异步Compaction，这个方案的关键之处在于如何合理的设置这个周期，周期如果太短意味着Spark任务可能会空跑，周期如果太长可能会积压太多的Compaction Plan没有去执行而导致Spark

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Kafka Old Consumer API使用样例 - MapReduce服务 MRS

kafka.example.Old_Consumer类中，作用在于订阅指定Topic的消息。（注意：旧Consumer API仅支持访问未设置ACL的Topic，安全接口说明见Kafka安全接口介绍）样例代码 Old Consumer API线程run方法中的消费逻辑。 /**

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
SELECT查询表数据 - MapReduce服务 MRS

format] 使用示例 --查看ClickHouse集群信息 select * from system.clusters; --显示当前节点设置的宏 select * from system.macros; --查看数据库容量 select sum(rows) as "总行数",

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse常用SQL语法
Hudi数据表Archive规范 - MapReduce服务 MRS

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

JavaStreamingContext jssc = new JavaStreamingContext(sparkConf, batchDuration); // 设置Streaming的CheckPoint目录 if (!"nocp".equals(checkPointDir)) {

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Streaming从Kafka读取数据再写入HBase
Flink向Kafka生产并消费数据Java样例代码 - MapReduce服务 MRS

env = StreamExecutionEnvironment.getExecutionEnvironment(); // 设置并发度 env.setParallelism(1); // 解析运行参数 ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > 向Kafka生产并消费数据程序
Flink DataStream样例程序（Java） - MapReduce服务 MRS

split(","); assert filePaths.length > 0; // windowTime设置窗口时间大小，默认2分钟一个窗口足够读取文本内的所有数据了 final int windowTime = ParameterTool

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序

总条数： 3223

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink Kafka样例程序（Java） - MapReduce服务 MRS

Python样例代码 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

Spark Distinct聚合优化 - MapReduce服务 MRS

ALM-14010 NameService服务异常 - MapReduce服务 MRS

HBase Phoenix API接口介绍 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

YARN Command介绍 - MapReduce服务 MRS

使用Flume服务端从本地采集动态日志保存到HDFS - MapReduce服务 MRS

配置Spark动态脱敏 - MapReduce服务 MRS

ALM-12055 证书文件即将过期（2.x及以前版本） - MapReduce服务 MRS

Hudi数据表Compaction规范 - MapReduce服务 MRS

Kafka Old Consumer API使用样例 - MapReduce服务 MRS

SELECT查询表数据 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Flink向Kafka生产并消费数据Java样例代码 - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线