搜索_华为云

Spark Distinct聚合优化 - MapReduce服务 MRS

配置参数在Spark客户端的“{客户端安装目录}/Spark/spark/conf/spark-defaults.conf”配置文件中进行设置，修改如下参数：参数说明默认值 spark.sql.keep.distinct.expandThreshold 由cube等引起的数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

可以通过以下两种方式配置是否过滤掉分区表分区路径不存在的分区。在Spark Driver端的“spark-defaults.conf”配置文件中进行设置。表1 参数说明参数说明默认值 spark.sql.hive.verifyPartitionPath 配置读取Hive分区表时，是否过滤掉分区表分区路径不存在的分区。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
KrbServer及LdapServer开源增强特性 - MapReduce服务 MRS

api提供的UserGroupInformation类，该类提供了多个安全认证API接口： setConfiguration()主要是获取对应的配置，设置全局变量等参数。 loginUserFromKeytab()获取TGT接口。跨系统互信特性 MRS提供两个Manager之间的互信功能，用于实现系统之间的数据读、写等操作。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > KrbServer及LdapServer
配置HetuEngine资源组 - MapReduce服务 MRS

选择器属性的配置数据源名称（source）可设置如下： CLI：使用--source选项。 JDBC：在Connection实例上设置ApplicationName客户端信息属性。客户端标签（clientTags）的设置方式如下： CLI：使用--client-tags选项。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 管理HetuEngine计算实例
Loader日志介绍 - MapReduce服务 MRS

Loader中提供了如表2所示的日志级别，日志级别优先级从高到低分别是ERROR、WARN、INFO、DEBUG，程序会打印高于或等于所设置级别的日志，设置的日志等级越高，打印出来的日志就越少。表2 日志级别级别描述 ERROR ERROR表示错误日志输出。 WARN WARN表示当前事件处理存在异常信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader运维管理
Kafka Old Consumer API使用样例 - MapReduce服务 MRS

kafka.example.Old_Consumer类中，作用在于订阅指定Topic的消息。（注意：旧Consumer API仅支持访问未设置ACL的Topic，安全接口说明见Kafka安全接口介绍）样例代码 Old Consumer API线程run方法中的消费逻辑。 /**

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用
Impala常见配置参数 - MapReduce服务 MRS

例如：cn=%s,ou=People,dc=huawei,dc=com - - --ldap_passwords_in_clear_ok 如果设置为true，将允许ldap密码在网络上明文发送(不含TLS/SSL)。 false true或false --ldap_uri-ip ldap

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Impala
Flink作业引擎概述 - MapReduce服务 MRS

数据连接管理，配置Kafka、HDFS等服务信息。数据表管理，定义Sql访问的数据表信息，用于生成DDL语句。 FlinkSQL作业定义，根据用户输入的Sql，校验、解析、优化、转换成Flink作业并提交运行。 Flink作业可视化管理支持可视化定义流作业和批作业。支持作业资源、故障恢复策略、Checkpoint策略可视化配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
Flink作业引擎概述 - MapReduce服务 MRS

数据连接管理，配置Kafka、HDFS等服务信息。数据表管理，定义Sql访问的数据表信息，用于生成DDL语句。 FlinkSQL作业定义，根据用户输入的Sql，校验、解析、优化、转换成Flink作业并提交运行。 Flink作业可视化管理支持可视化定义流作业和批作业。支持作业资源、故障恢复策略、Checkpoint策略可视化配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
Storm应用开发环境简介 - MapReduce服务 MRS

JDK默认TLS只支持1.0，若使用IBM JDK，请配置启动参数“com.ibm.jsse2.overrideDefaultTLS”为“true”，设置后可以同时支持TLS1.0/1.1/1.2。详情请参见：https://www.ibm.com/support/knowledgecenter/zh/SSYKE2_8

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Storm开发指南 > 准备Storm应用开发环境
使用Sasl Plaintext认证 - MapReduce服务 MRS

单击“概览”，选择“更多 > 重启服务”使配置生效。 Kafka客户端配置Sasl Plain认证。 Kafka客户端只需要配置动态jaas.conf并设置相关认证属性即可。详情可参考样例工程com.huawei.bigdata.kafka.example.security包的Producer中认证样例代码。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境 > 配置Kafka应用安全认证
Hudi数据表Archive规范 - MapReduce服务 MRS

automatic默认为true)。 Archive操作并不是每次写数据时都会触发，至少需要满足以下两个条件： Hudi表满足hoodie.keep.max.commits设置的阈值。如果是Flink写hudi至少提交的checkpoint要超过这个阈值；如果是Spark写hudi，写Hudi的次数要超过这个阈值。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
ResourceManager进行主备切换后，任务中断后运行时间过长 - MapReduce服务 MRS

全部配置”界面，在搜索框中“yarn.resourcemanager.work-preserving-recovery.enabled”，设置参数值为“true”。保存配置后，在业务低峰期重启Yarn配置过期的实例。父主题： MapReduce常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce常见问题
ResourceManager进行主备切换后，任务中断后运行时间过长 - MapReduce服务 MRS

全部配置”界面，在搜索框中“yarn.resourcemanager.work-preserving-recovery.enabled”，设置参数值为“true”。保存配置后，在业务低峰期重启Yarn配置过期的实例。父主题： MapReduce常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce常见问题
Ranger日志介绍 - MapReduce服务 MRS

HDFS中提供了如表2所示的日志级别，日志级别优先级从高到低分别是FATAL、ERROR、WARN、INFO、DEBUG，程序会打印高于或等于所设置级别的日志，设置的日志等级越高，打印出来的日志就越少。表2 日志级别级别描述 FATAL FATAL表示当前事件处理出现严重错误信息，可能导致系统崩溃。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x）
通过JDBC访问Spark SQL样例程序（Java） - MapReduce服务 MRS

连接字符串中的“zk.quorum”也可以使用配置文件中的配置项“spark.deploy.zookeeper.url”来代替。在网络拥塞的情况下，您还可以设置客户端与JDBCServer连接的超时时间，可以避免客户端由于无限等待服务端的返回而产生异常。使用方式如下：在执行“DriverManager

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序
ALM-38018 Kafka消息积压 - MapReduce服务 MRS

导致数据丢失。可能原因新创建的消费者组，从头开始消费Topic中的消息，导致消息积压。用户配置的消息积压告警规则不合理，积压告警阈值设置过低，导致上报告警。 Kafka Topic流量激增，短时间内产生大量消息，导致消息积压。下游处理Kafka Topic中消息过慢，导致消息积压。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink应用开发常用概念 - MapReduce服务 MRS

SavePoint Savepoint是指允许用户在持久化存储中保存某个checkpoint，以便用户可以暂停自己的任务进行升级。升级完后将任务状态设置为savepoint存储的状态开始恢复运行，保证数据处理的延续性。父主题： Flink应用开发概述

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
Storm-HDFS开发指引 - MapReduce服务 MRS

票据方式：从管理员处获取一个“人机”用户，用于后续的安全登录，开启Kerberos服务的renewable和forwardable开关并且设置票据刷新周期，开启成功后重启kerberos及相关组件。获取的用户需要属于storm组。默认情况下，用户的密码有效期是90天，所以获取

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
SELECT查询表数据 - MapReduce服务 MRS

format] 使用示例 --查看ClickHouse集群信息 select * from system.clusters; --显示当前节点设置的宏 select * from system.macros; --查看数据库容量 select sum(rows) as "总行数",

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse常用SQL语法

总条数： 3256

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Distinct聚合优化 - MapReduce服务 MRS

配置过滤掉分区表中路径不存在的分区 - MapReduce服务 MRS

KrbServer及LdapServer开源增强特性 - MapReduce服务 MRS

配置HetuEngine资源组 - MapReduce服务 MRS

Loader日志介绍 - MapReduce服务 MRS

Kafka Old Consumer API使用样例 - MapReduce服务 MRS

Impala常见配置参数 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Storm应用开发环境简介 - MapReduce服务 MRS

使用Sasl Plaintext认证 - MapReduce服务 MRS

Hudi数据表Archive规范 - MapReduce服务 MRS

ResourceManager进行主备切换后，任务中断后运行时间过长 - MapReduce服务 MRS

ResourceManager进行主备切换后，任务中断后运行时间过长 - MapReduce服务 MRS

Ranger日志介绍 - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Java） - MapReduce服务 MRS

ALM-38018 Kafka消息积压 - MapReduce服务 MRS

Flink应用开发常用概念 - MapReduce服务 MRS

Storm-HDFS开发指引 - MapReduce服务 MRS

SELECT查询表数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线