搜索_华为云

Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： object

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： object

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
DBService配置文件丢失导致启动失败 - MapReduce服务 MRS

把主节点/srv/BigData/dbdata_service/data的内容拷贝到备节点，保持文件权限和属组与主节点一样。修改postgresql.conf配置信息，localhost修改成本节点IP，remotehost修改成对端节点IP。登录Manager页面重启备DBServer节点。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用DBservice
执行join操作时localtask启动失败 - MapReduce服务 MRS

执行join操作时localtask启动失败问题背景与现象执行join等操作，数据量较小时，会启动localtask执行，执行过程会报错： jdbc:hive2://10.*.*.*:21066/> select a.name ,b.gender from student a

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
创建Hue操作任务 - MapReduce服务 MRS

创建Hue操作任务通过Hue执行HiveQL 通过Hue执行SparkSQL 通过Hue查看Hive元数据通过Hue管理HDFS文件通过Hue管理Oozie作业通过Hue管理HBase表通过Hue执行HetuEngine SQL 父主题：使用Hue

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue
CarbonData Segment API语法说明 - MapReduce服务 MRS

getFilteredSegments("select * from table where age='12'", sparkSession) 传入数据库名和表名，获取会被合并的segment列表，得到的segment列表可以当做getMergedLoadName函数的参数传入： /** *

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考
Spark On Hudi性能调优 - MapReduce服务 MRS

Spark On Hudi性能调优优化Spark Shuffle参数提升Hudi写入效率开启spark.shuffle.readHostLocalDisk=true，本地磁盘读取shuffle数据，减少网络传输的开销。开启spark.io.encryption.enable

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
通过JDBC访问Spark SQL样例程序（Java） - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Java）功能简介使用自定义客户端的JDBC接口提交数据分析任务，并返回结果。样例代码定义SQL语句。SQL语句必须为单条语句，注意其中不能包含“;”。示例： ArrayList<String> sqlList = new ArrayList<String>();

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序
配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

配置流式读取Spark Driver执行结果配置场景在执行查询语句时，返回结果有可能会很大（10万数量以上），此时很容易导致JDBCServer OOM（Out of Memory）。因此，提供数据汇聚功能特性，在基本不牺牲性能的情况下尽力避免OOM。配置描述提供两种不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
开发Impala用户自定义函数 - MapReduce服务 MRS

能上比Java UDF更好。使用示例以下为复用lower()函数的示例。 [localhost:21000] > create database udfs; [localhost:21000] > use udfs; [localhost:21000] > create function

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
开发Impala用户自定义函数 - MapReduce服务 MRS

能上比Java UDF更好。使用示例以下为复用lower()函数的示例。 [localhost:21000] > create database udfs; [localhost:21000] > use udfs; [localhost:21000] > create function

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用
收集ClickHouse系统表转储日志 - MapReduce服务 MRS

mutations system.processes system.metrics system.part_moves_between_shards system.replicas system.replicated_fetches system.replication_queue 一键转储系统表日志

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark JDBCServer接口介绍简介 JDBCServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 JDBCServer是一个JDBC接口，用户可以通过JDBC连接JDBCServ

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark SQL样例程序（Java） - MapReduce服务 MRS

Spark SQL样例程序（Java）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： public

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

session.timeout.ms之间。以上参数可以根据实际情况进行适当的调整，特别是max.poll.records，这个参数是为了控制每次poll数据的records量，保证每次的处理时长尽量保持稳定。目的是为了保证poll数据以后的处理时间不要超过session.timeout

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
创建MRS IAM自定义权限策略 - MapReduce服务 MRS

k:list”。创建集群时开启告警功能，需增加权限“mrs:alarm:subscribe”。创建集群时使用外置数据源，需增加权限“rds:instance:list”。 { "Version": "1.1", "Statement": [ {

帮助中心 > MapReduce服务 MRS > 用户指南 > 准备工作
快速使用Flume采集节点日志 - MapReduce服务 MRS

n ./flume-manage.sh restart 根据实际业务场景配置作业。 MRS 3.x及之后版本部分参数可直接在Manager界面配置，可参考非加密传输或加密传输。在“properties.properties”文件中配置，以配置SpoolDir Source+File

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

Scala样例代码功能简介使用自定义客户端的JDBC接口提交数据分析任务，并返回结果。样例代码定义SQL语句。SQL语句必须为单条语句，注意其中不能包含“;”。示例： val sqlList = new ArrayBuffer[String] sqlList += "CREATE

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 通过JDBC访问Spark SQL的程序

总条数： 4450

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala） - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

DBService配置文件丢失导致启动失败 - MapReduce服务 MRS

执行join操作时localtask启动失败 - MapReduce服务 MRS

创建Hue操作任务 - MapReduce服务 MRS

CarbonData Segment API语法说明 - MapReduce服务 MRS

Spark On Hudi性能调优 - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序（Java） - MapReduce服务 MRS

配置流式读取Spark Driver执行结果 - MapReduce服务 MRS

开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数 - MapReduce服务 MRS

收集ClickHouse系统表转储日志 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

Consumer消费数据时存在重复消费现象 - MapReduce服务 MRS

创建MRS IAM自定义权限策略 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线