搜索_华为云

Hive Group By语句优化 - MapReduce服务 MRS

distinct完成去重计数时，处理值为空的情况会使Reduce产生很严重的数据倾斜，可以将空值单独处理，如果是计算count distinct，可以通过where子句将该值排除掉，并在最后的count distinct结果中加1。如果还有其他计算，可以先将值为空的记录单独处理，再和其他计算结果合并。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
REGISTER INDEX TABLE - MapReduce服务 MRS

productdb2.productSalesTable where c = 'aaa'; //可以发现该查询命令使用了索引表系统响应通过运行该命令，索引表会被注册到主表。父主题： DDL

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DDL
管理Storm拓扑 - MapReduce服务 MRS
管理Storm拓扑 - MapReduce服务 MRS

操作步骤访问Storm的WebUI，请参考访问Storm的WebUI。在“Topology summary”区域，单击指定的拓扑名称。通过“Topology actions”管理Storm拓扑。激活拓扑单击“Activate”，转化当前拓扑为激活状态。去激活拓扑单击“

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

retainedJobs”和“spark.ui.retainedStages”参数。详细信息请参考常用参数中的表13。如果需要保留的Job和Stage的UI数据个数较多，可通过配置“spark.driver.memory”参数，适当增大Driver的内存。详细信息请参考常用参数中的表10。父主题： SQL和DataFrame

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Spark SQL样例程序（Java） - MapReduce服务 MRS

some.config.option", "some-value") .getOrCreate(); // 通过隐式转换，将RDD转换成DataFrame JavaRDD<FemaleInfo> femaleInfoJavaRDD =

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
IoTDB应用开发流程介绍 - MapReduce服务 MRS

elliJ IDEA工具，同时完成JDK、Maven等初始配置。准备本地应用开发环境准备连接集群配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息连接MRS集群，配置文件通常包括集群组件信息文件以及用于安全认证的用户文件，可从已创建好的MRS集群中获取相关内容。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（普通模式）
Flink应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。编译并调测Flink应用查看程序运行结果程序运行结果会写在用户指定的路径下，用户还可以通过UI查看应用运行情况。查看Flink应用调测结果调优程序您可以根据程序运行情况，对程序进行调优，使其性能满足业务场景需求。调优完成后，请重新进行编译和运行。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式）
Flink应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。编译并运行Flink应用查看程序运行结果程序运行结果会写在用户指定的路径下，用户还可以通过UI查看应用运行情况。查看Flink应用运行结果调优程序您可以根据程序运行情况，对程序进行调优，使其性能满足业务场景需求。调优完成后，请重新进行编译和运行。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > Flink应用开发概述
Flink应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。编译并调测Flink应用查看程序运行结果程序运行结果会写在用户指定的路径下，用户还可以通过UI查看应用运行情况。查看Flink应用调测结果调优程序您可以根据程序运行情况，对程序进行调优，使其性能满足业务场景需求。调优完成后，请重新进行编译和运行。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）
HBase应用开发流程 - MapReduce服务 MRS

elliJ IDEA工具，同时完成JDK、Maven等初始配置。准备本地应用开发环境准备连接集群配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息连接MRS集群，配置文件通常包括集群组件信息文件，可从已创建好的MRS集群中获取相关内容。用于程序调测或运行的节点，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发概述
ClickHouse数据分布设计 - MapReduce服务 MRS

hard-3的3个分片节点中，以充分发挥MPP查询时并行计算能力，避免数据在shard间倾斜计算出现木桶效应，导致SQL查询性能较差。可通过弹性负载均衡（Elastic Load Balance，简称ELB）访问ClickHouse，来实现数据均匀。 Shard内数据副本高可靠存储

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse集群规划
ALTER COLUMN - MapReduce服务 MRS
ALTER COLUMN - MapReduce服务 MRS

table1 ALTER COLUMN a.b.c AFTER x a.b.c表示嵌套列全路径，嵌套列具体规则见ADD COLUMNS。系统响应通过运行DESCRIBE命令，可显示修改的列。父主题： Hudi Schema演进及语法说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi Schema演进 > Hudi Schema演进及语法说明
TRUNCATE TABLE - MapReduce服务 MRS
TRUNCATE TABLE - MapReduce服务 MRS

partition_col_value, partition_column = partition_col_value, ...) 描述从表或分区中移除所有行。用户可以通过partition_spec一次性删除分区表的多个分区，如果不指定就一次清除分区表的所有分区。当表属性“auto.purge”采用默认值“

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
Spark2x无法访问Spark1.5创建的DataSource表 - MapReduce服务 MRS

与Spark1.5的存储方式一致，所以Spark2x可以直接读取Spark1.5创建的表，不存在上述问题。规避措施： Spark2x可以通过创建外表的方式来创建一张指向Spark1.5表实际数据的表，这样可以实现在Spark2x中读取Spark1.5创建的DataSource表。同时，Spark1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
MapReduce应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。调测MapReduce应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。调测MapReduce应用父主题： MapReduce开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式）
HBase应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。调测HBase应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。父主题： HBase开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式）
compaction&cleaning配置 - MapReduce服务 MRS

该值应小于maxFileSize，如果将其设置为0，会关闭此功能。由于批处理中分区中插入记录的数量众多，总会出现小文件。Hudi提供了一个选项，可以通过将对该分区中的插入作为对现有小文件的更新来解决小文件的问题。此处的大小是被视为“小文件大小”的最小文件大小。 104857600 byte

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
Hive应用开发开发流程 - MapReduce服务 MRS

elliJ IDEA工具，同时完成JDK、Maven等初始配置。准备本地应用开发环境准备连接集群配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息连接MRS集群，配置文件通常包括集群组件信息文件以及用于安全认证的用户文件，可从已创建好的MRS集群中获取相关内容。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > Hive应用开发概述
MapReduce应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。调测MapReduce应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。调测MapReduce应用父主题： MapReduce开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（安全模式）
Hive Group By语句优化 - MapReduce服务 MRS

distinct完成去重计数时，处理值为空的情况会使Reduce产生很严重的数据倾斜，可以将空值单独处理，如果是计算count distinct，可以通过where子句将该值排除掉，并在最后的count distinct结果中加1。如果还有其他计算，可以先将值为空的记录单独处理，再和其他计算结果合并。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优

总条数： 4159

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hive Group By语句优化 - MapReduce服务 MRS

REGISTER INDEX TABLE - MapReduce服务 MRS

管理Storm拓扑 - MapReduce服务 MRS

在Beeline/JDBCServer模式下连续运行10T的TPCDS测试套会出现内存不足的现象 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

IoTDB应用开发流程介绍 - MapReduce服务 MRS

Flink应用开发流程介绍 - MapReduce服务 MRS

Flink应用开发流程介绍 - MapReduce服务 MRS

Flink应用开发流程介绍 - MapReduce服务 MRS

HBase应用开发流程 - MapReduce服务 MRS

ClickHouse数据分布设计 - MapReduce服务 MRS

ALTER COLUMN - MapReduce服务 MRS

TRUNCATE TABLE - MapReduce服务 MRS

Spark2x无法访问Spark1.5创建的DataSource表 - MapReduce服务 MRS

MapReduce应用开发流程介绍 - MapReduce服务 MRS

HBase应用开发流程介绍 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

Hive应用开发开发流程 - MapReduce服务 MRS

MapReduce应用开发流程介绍 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线