搜索_华为云

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

开启时，SparkSQL任务执行中会优先执行DPP特性，从而使得AQE特性不生效。集群中DPP特性是默认开启的，因此开启AQE特性的同时，需要将DPP特性关闭。 false spark.sql.optimizer.dynamicPartitionPruning.enabled 动态分区裁剪功能的开关。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
删除CarbonData表Segments - MapReduce服务 MRS

Taken、Partition、Data Size、Index Size、File Format。最新的加载信息在输出中第一行显示。获取到需要删除的Segment的Segment ID后，执行如下命令删除对应Segment：命令： DELETE FROM TABLE tableName

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
分析Impala数据 - MapReduce服务 MRS

Connection connection = null; try { // 获取JDBC连接 // 第二个参数需要填写正确的用户名，否则会以匿名用户(anonymous)登录 connection = DriverManager.getConnection(url

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

以root用户登录告警所在主机，用户密码为安装前用户自定义，请咨询系统管理员。执行命令ethtool 网口名称，查看当前网口速率最大值Speed。对于虚拟机环境，通过命令可能无法查询到网口速率，建议直接联系系统管理确认网口速率是否满足需求。若网络写吞吐率超过阈值，直接联系网络管理员，提升网口速率。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HBase应用开发常用概念 - MapReduce服务 MRS

HBase应用开发常用概念过滤器过滤器提供了非常强大的特性来帮助用户提高HBase处理表中数据的效率。用户不仅可以使用HBase中预定义好的过滤器，而且可以实现自定义的过滤器。协处理器允许用户执行region级的操作，并且可以使用与RDBMS中触发器类似的功能。 Client

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
Spark Scala API接口介绍 - MapReduce服务 MRS

Streaming中常见的类有： StreamingContext：是Spark Streaming功能的主入口，负责提供创建DStreams的方法，入参中需要设置批次的时间间隔。 dstream.DStream：是一种代表RDDs连续序列的数据类型，代表连续数据流。 dstream.PariDS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark scala API接口介绍 - MapReduce服务 MRS

Streaming中常见的类有： StreamingContext：是Spark Streaming功能的主入口，负责提供创建DStreams的方法，入参中需要设置批次的时间间隔。 dstream.DStream：是一种代表RDDs连续序列的数据类型，代表连续数据流。 dstream.PariDS

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
查询特定标签的集群列表 - MapReduce服务 MRS

1-1000 默认取值：不涉及 offset 否 Integer 参数解释：索引位置，从offset指定的下一条数据开始查询。查询第一页数据时，不需要传入此参数，查询后续页码数据时，将查询前一页数据时响应体中的值带入此参数。约束限制： action为count时无此参数。如果action为filter默认为0。

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 标签管理接口
Spark Scala API接口介绍 - MapReduce服务 MRS

Streaming中常见的类有： StreamingContext：是Spark Streaming功能的主入口，负责提供创建DStreams的方法，入参中需要设置批次的时间间隔。 dstream.DStream：是一种代表RDDs连续序列的数据类型，代表连续数据流。 dstream.PariDS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark接口介绍
ClickHouse表创建 - MapReduce服务 MRS

┴─────────── ┴──────────┘ 6 rows in set. Elapsed: 0.115 sec. Distributed引擎需要以下几个参数： default_cluster_1为查看ClickHouse服务cluster等环境参数信息中2查询到的cluster集群标识符。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
删除CarbonData表Segments - MapReduce服务 MRS

Taken、Partition、Data Size、Index Size、File Format。最新的加载信息在输出中第一行显示。获取到需要删除的Segment的Segment ID后，执行如下命令删除对应Segment：命令： DELETE FROM TABLE tableName

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
配置BulkloadTool工具支持解析自定义分隔符 - MapReduce服务 MRS

执行以下命令配置环境变量。 source bigdata_env 如果当前集群已启用Kerberos认证，执行以下命令认证当前用户，当前用户需要具有创建HBase表的权限和HDFS的操作权限： kinit 组件业务用户如果当前集群未启用Kerberos认证，则执行以下命令设置Hadoop用户名：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
Yarn-client模式提交Spark任务时ApplicationMaster尝试启动两次失败 - MapReduce服务 MRS

'^]'类似打印则说明可以连通，如果出现connection refused则表示失败，无法连接到相关端口。如果相关端口打开，但是从别的节点无法连通到该端口，则需要排查下相关网络配置。 23662这个端口每次都是随机的，所以要根据自己启动任务打开的端口来测试。父主题：使用Spark

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Impala样例程序指导 - MapReduce服务 MRS

Connection connection = null; try { // 获取JDBC连接 // 第二个参数需要填写正确的用户名，否则会以匿名用户(anonymous)登录 connection = DriverManager.getConnection(url

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
HBase样例程序开发思路 - MapReduce服务 MRS

“hbase”命名空间为系统表命名空间，请不要对该系统表命名空间进行业务建表或数据读写等操作。功能分解根据上述的业务场景进行功能分解，需要开发的功能点如表2所示。表2 在HBase中开发的功能序号步骤代码实现 1 根据表1中的信息创建表。请参见创建HBase表。 2

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
导入并配置HBase样例工程 - MapReduce服务 MRS

项目配置文件放置及样例代码执行注意事项指导，请参考对应样例项目“README.md”文档。安装IntelliJ IDEA和JDK工具后，需要在IntelliJ IDEA配置JDK。打开IntelliJ IDEA，选择“Configure”。图1 Quick Start 在下拉框中选择“Structure

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 准备HBase应用开发环境
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

开启时，SparkSQL任务执行中会优先执行DPP特性，从而使得AQE特性不生效。集群中DPP特性是默认开启的，因此开启AQE特性的同时，需要将DPP特性关闭。 false spark.sql.optimizer.dynamicPartitionPruning.enabled 动态分区裁剪功能的开关。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark Scala API接口介绍 - MapReduce服务 MRS

Streaming中常见的类有： StreamingContext：是Spark Streaming功能的主入口，负责提供创建DStreams的方法，入参中需要设置批次的时间间隔。 dstream.DStream：是一种代表RDDs连续序列的数据类型，代表连续数据流。 dstream.PariDS

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Scala API接口介绍 - MapReduce服务 MRS

Streaming中常见的类有： StreamingContext：是Spark Streaming功能的主入口，负责提供创建DStreams的方法，入参中需要设置批次的时间间隔。 dstream.DStream：是一种代表RDDs连续序列的数据类型，代表连续数据流。 dstream.PariDS

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
快速开发ClickHouse应用 - MapReduce服务 MRS

自动加载相关依赖包。在本示例工程中，程序通过配置文件中的IP地址信息及用户信息与ClickHouse服务端进行连接。因此工程导入完成后，需要修改样例工程的“conf”目录下的“clickhouse-example.properties”文件，根据实际环境信息修改相关参数。 lo

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用

总条数： 3136

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

分析Impala数据 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

HBase应用开发常用概念 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark scala API接口介绍 - MapReduce服务 MRS

查询特定标签的集群列表 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

ClickHouse表创建 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

配置BulkloadTool工具支持解析自定义分隔符 - MapReduce服务 MRS

Yarn-client模式提交Spark任务时ApplicationMaster尝试启动两次失败 - MapReduce服务 MRS

Impala样例程序指导 - MapReduce服务 MRS

HBase样例程序开发思路 - MapReduce服务 MRS

导入并配置HBase样例工程 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

快速开发ClickHouse应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线