搜索_华为云

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

通过如下配置项可开启自动进行数据倾斜处理功能，通过将Hash分桶后数据量很大的、且超过数据倾斜阈值的分桶拆散，变成多个task处理一个桶的数据机制，提高CPU资源利用率，提高系统性能。未产生倾斜的数据，将采用原有方式进行分桶并运行。使用约束：只支持两表Join的场景。不支持FULL OUTER JOIN的数据倾斜处理。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
修改集群服务配置参数 - MapReduce服务 MRS

示参数分类。（下图以HDFS组件为例）在导航树选择指定的参数分类，并在右侧修改参数值。不确定参数的具体位置时，支持在右上角输入参数名，系统将实时进行搜索并显示结果。（下图以HDFS组件为例）单击“保存配置”，并在确认对话框中单击“是”。等待界面提示“操作成功”，单击“完成”，配置已修改。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作
配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

在权限管理中，为了方便用户使用，授予数据库下表的任意权限将自动关联该数据库目录的HDFS权限。为了避免产生性能问题，取消表的任意权限，系统不会自动取消数据库目录的HDFS权限，但对应的用户只能登录数据库和查看表名。如果为角色添加或删除数据库的查询权限，数据库中的表也将自动添

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
Spark Scala API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path: String): Unit 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path: String, codec:

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path: String): Unit 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path: String, codec:

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
配置ClickHouse通过Kerberos认证对接Kafka - MapReduce服务 MRS

登录Kafka服务所在集群的Manager页面，选择“系统 > 权限 > 用户 > 添加用户”，创建一个具有Kafka权限的用户，例如创建机机用户ck_user1。Kafka用户权限介绍请参考Kafka用户权限说明。选择“系统 > 权限 > 用户”，在用户名中选择ck_user1，单击操作列的“更多

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
策略及授权项说明 - MapReduce服务 MRS

AM用户被授予的策略中必须包含允许“mrs:cluster:list”的授权项，该接口才能调用成功。支持的授权项策略包含系统策略和自定义策略，如果系统策略不满足授权要求，MRS集群管理员可以创建自定义策略，并通过给用户组授予自定义策略来进行精细的访问控制。策略支持的操作与API相对应，授权项列表说明如下：

帮助中心 > MapReduce服务 MRS > API参考 > 权限策略和授权项
ClickHouse参数调优实践 - MapReduce服务 MRS

后台用于merge的线程池大小。 16 64 否 log_queries system.query_log表的开关。默认值为0，不存在该表。修改为1，系统会自动创建system.query_log表，并记录每次query的日志信息。 0 1 否 skip_unavailable_shards

帮助中心 > MapReduce服务 MRS > 最佳实践 > ClickHouse数据库设计规范 > ClickHouse数据库调优
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

通过如下配置项可开启自动进行数据倾斜处理功能，通过将Hash分桶后数据量很大的、且超过数据倾斜阈值的分桶拆散，变成多个task处理一个桶的数据机制，提高CPU资源利用率，提高系统性能。未产生倾斜的数据，将采用原有方式进行分桶并运行。使用约束：只支持两表Join的场景。不支持FULL OUTER JOIN的数据倾斜处理。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Mapreduce应用开发规则 - MapReduce服务 MRS

并调用context.write(key, value)输出到指定目录。 * 其reduce的输出的key，value由Outputformat写入文件系统。 * 默认使用TextOutputFormat写入HDFS。 */ public void reduce(Text key, Iterable<IntWritable>

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Mapreduce应用开发规范
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

Records处理：为了使数据处理应用程序为用户增值，不可避免地需要对数据进行某种程度的集成。在大多数情况下，数据质量问题源于生成源数据的上游（主要）系统。有两种完全不同的方式处理Bad Data：按照原始数据加载所有数据，之后进行除错处理。在进入数据源的过程中，可以清理或擦除Bad Data，或者在发现Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
Spark scala API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path: String): Unit 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path: String, codec:

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

saveAsTextFile(path: String): Unit 把dataset写到一个text file、HDFS或者HDFS支持的文件系统中，spark把每条记录都转换为一行记录，然后写到file中。 saveAsSequenceFile(path: String, codec:

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
典型场景：从关系型数据库导入数据到Hive - MapReduce服务 MRS

Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Loader > 更多 > 重启服务”，输入管理员密码重启Loader服务。操作步骤设置作业基本信息登录“Loader WebUI”界面。登录FusionInsight Manager系统，具体请参见访问FusionInsight

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

台，创建一个新的弹性云服务器。弹性云服务器的“可用区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个Windows系统的公共镜像。例如，选择一个标准镜像“Windows Server 2012 R2 Standard 64bit(40GB)”。其他配置参数详细信息，请参见购买弹性云服务器。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
使用Loader从关系型数据库导入数据到Hive - MapReduce服务 MRS

登录FusionInsight Manager系统，选择“集群 > 服务 > Loader > 更多 > 重启服务”，输入管理员密码重启Loader服务。操作步骤设置作业基本信息登录“Loader WebUI”界面。登录FusionInsight Manager系统，具体请参见访问集群Manager。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
index相关配置 - MapReduce服务 MRS
index相关配置 - MapReduce服务 MRS

[BLOOM | HBASE | GLOBAL_BLOOM | SIMPLE | GLOBAL_SIMPLE] 。布隆过滤器消除了对外部系统的依赖，并存储在Parquet数据文件的页脚中。 BLOOM hoodie.index.bloom.num_entries 存储在布隆过滤器中的条目数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
配置Spark Web UI ACL - MapReduce服务 MRS

view.acls.groups”配置指定修改Web UI任务明细的访问者列表和组列表。配置描述登录FusionInsight Manager系统，选择“集群 > 服务 > Spark2x > 配置”，单击“全部配置”，搜索acl，在对应的JobHistory，JDBCServer，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
在Spark应用执行过程中NodeManager出现OOM异常 - MapReduce服务 MRS

用户可登录FusionInsight Manager，单击“集群 > 服务 > Yarn > 配置”，单击“全部配置”，单击“NodeManager > 系统”，在“GC_OPTS”参数中修改配置。表1 参数说明参数描述默认值 GC_OPTS Yarn NodeManager的GC参数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > Spark Core
配置ClickHouse SQL防御规则 - MapReduce服务 MRS

Distributed DDL ALTER UPDATE queries are undesirable. ... 如果防御规则设置的是拦截，则命令执行失败，系统回显信息如下： ... DB::Exception: Distributed DDL ALTER TABLE UPDATE queries

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则

总条数： 3372

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

修改集群服务配置参数 - MapReduce服务 MRS

配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

配置ClickHouse通过Kerberos认证对接Kafka - MapReduce服务 MRS

策略及授权项说明 - MapReduce服务 MRS

ClickHouse参数调优实践 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

Mapreduce应用开发规则 - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

Spark scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到Hive - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到Hive - MapReduce服务 MRS

index相关配置 - MapReduce服务 MRS

配置Spark Web UI ACL - MapReduce服务 MRS

在Spark应用执行过程中NodeManager出现OOM异常 - MapReduce服务 MRS

配置ClickHouse SQL防御规则 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线