搜索_华为云

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
ClickHouse SQL调优 - MapReduce服务 MRS

ClickHouse SQL调优规则合理使用数据表的分区字段和索引字段。 MergeTree引擎，数据是以分区目录的形式进行组织存储的，在进行的数据查询时，使用分区可以有效跳过无用的数据文件，减少数据的读取。 MergeTree引擎会根据索引字段进行数据排序，并且根据inde

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库调优
窗口函数 - MapReduce服务 MRS
窗口函数 - MapReduce服务 MRS

0 | 1 d2 | user4 | 4000.0 | 2 Aggregate Functions 所有的聚合函数都能通过添加over子句来当做窗口函数使用。聚合函数将在当前窗口框架下的每行记录进行运算。下面的查询生成每个职员按天计算的订单价格的滚动总和。 select

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Flink Scala API接口介绍 - MapReduce服务 MRS

SourceFunction[T]): DataStream[T] 用户自定义SourceFunction，addSource方法可以添加Kafka等数据源，主要实现方法为SourceFunction的run。 function指的是用户自定义的SourceFunction函数。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > Flink应用开发常见问题 > Flink常用API介绍
在集群外节点运行PrestoJDBCExample缺少证书 - MapReduce服务 MRS

在集群外节点运行PrestoJDBCExample缺少证书问题 presto-examples-1.0-SNAPSHOT-jar-with-dependencies.jar在集群内节点运行时正常，但在集群外节点运行PrestoJDBCExample连接开启Kerberos认证的集群缺少证书，报错如下:

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > Presto应用开发常见问题
Flink Scala API接口介绍 - MapReduce服务 MRS

SourceFunction[T]): DataStream[T] 用户自定义SourceFunction，addSource方法可以添加Kafka等数据源，主要实现方法为SourceFunction的run。 function指的是用户自定义的SourceFunction函数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > Flink应用开发常见问题 > Flink常用API介绍
Flink Scala API接口介绍 - MapReduce服务 MRS

SourceFunction[T]): DataStream[T] 用户自定义SourceFunction，addSource方法可以添加Kafka等数据源，主要实现方法为SourceFunction的run。 function指的是用户自定义的SourceFunction函数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
Flink Scala API接口介绍 - MapReduce服务 MRS

SourceFunction[T]): DataStream[T] 用户自定义SourceFunction，addSource方法可以添加Kafka等数据源，主要实现方法为SourceFunction的run。 function指的是用户自定义的SourceFunction函数。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
数学函数和运算符 - MapReduce服务 MRS

数学函数和运算符数学运算符运算符描述 + 加 - 减 * 乘 / 除 % 取余数学函数 abs(x) → [same as input] 返回x的绝对值 SELECT abs(-17.4);-- 17.4 bin(bigint x) -> string 返回x的二进制格式

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Spark应用开发建议 - MapReduce服务 MRS

Spark应用开发建议 RDD多次使用时，建议将RDD持久化 RDD在默认情况下的存储级别是StorageLevel.NONE，即既不存磁盘也不放在内存中，如果某个RDD需要多次使用，可以考虑将该RDD持久化，方法如下：调用spark.RDD中的cache()、persist(

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Spark应用开发规范
聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
调整HetuEngine集群节点资源配置 - MapReduce服务 MRS

调整HetuEngine集群节点资源配置 HetuEngine默认的内存大小参数和硬盘溢出路径参数默认并非最佳，需要根据实际业务和集群的服务器配置情况调整集群节点资源配置，以获得最佳的性能效果。调整HetuEngine集群节点资源步骤登录FusionInsight Manager页面。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
BulkDelete接口使用 - MapReduce服务 MRS

BulkDelete接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要删除的数据的rowKey构造成rdd，然后通过HBaseContext的bulkDelete接口对HBase表上这些rowKey对应的数据进行删除。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkDelete接口使用 - MapReduce服务 MRS

BulkDelete接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要删除的数据的rowKey构造成rdd，然后通过HBaseContext的bulkDelete接口对HBase表上这些rowKey对应的数据进行删除。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkGet接口使用 - MapReduce服务 MRS

BulkGet接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要获取的数据的rowKey构造成rdd，然后通过HBaseContext的bulkGet接口获取对HBase表上这些rowKey对应的数据。数据规划基于Bul

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkGet接口使用 - MapReduce服务 MRS

BulkGet接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要获取的数据的rowKey构造成rdd，然后通过HBaseContext的bulkGet接口获取对HBase表上这些rowKey对应的数据。数据规划基于Bul

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
foreachPartition接口使用 - MapReduce服务 MRS

foreachPartition接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的mapPartition接口将rdd并发写入HBase表中。数据规划

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
ClickHouse本地表设计 - MapReduce服务 MRS

ClickHouse本地表设计规则单表（分布式表）的记录数不要超过万亿，对于万亿以上表的查询，性能较差，且集群维护难度变大。单表（本地表）不超过百亿。表的设计都要考虑到数据的生命周期管理，需要进行TTL表属性设置或定期老化清理表分区数据。单表的字段建议不要超过5000列。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序

总条数： 2846

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

ClickHouse SQL调优 - MapReduce服务 MRS

窗口函数 - MapReduce服务 MRS

Flink Scala API接口介绍 - MapReduce服务 MRS

在集群外节点运行PrestoJDBCExample缺少证书 - MapReduce服务 MRS

Flink Scala API接口介绍 - MapReduce服务 MRS

Flink Scala API接口介绍 - MapReduce服务 MRS

Flink Scala API接口介绍 - MapReduce服务 MRS

数学函数和运算符 - MapReduce服务 MRS

Spark应用开发建议 - MapReduce服务 MRS

聚合函数 - MapReduce服务 MRS

调整HetuEngine集群节点资源配置 - MapReduce服务 MRS

BulkDelete接口使用 - MapReduce服务 MRS

BulkDelete接口使用 - MapReduce服务 MRS

BulkGet接口使用 - MapReduce服务 MRS

BulkGet接口使用 - MapReduce服务 MRS

foreachPartition接口使用 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线