搜索_华为云

Impala应用开发规则 - MapReduce服务 MRS

Impalad（Coordinator）角色的jvm内存要大于或等于Catalog角色的jvm内存 Impala的元数据存放在内存中，Impalad需要从Catalog同步全量元数据，要保证Impala的jvm内存大于Catalog的jvm内存，才可以容纳下这些元数据。建表时分

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
HetuEngine物化视图SQL示例 - MapReduce服务 MRS

查询物化视图的创建语句查询mv.default.mv1的物化视图创建语句 show create materialized view mv.default.mv1; mv1是物化视图的名称查询物化视图查询mv.default.mv1的数据 select * from mv.default

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
读取Hudi cow表视图 - MapReduce服务 MRS

取Hive里面存储的Hudi表即可，${table_name}表示表名称。 select count(*) from ${table_name}; 实时视图读取（Spark dataSource API为例）：和读普通的dataSource表类似。必须指定查询类型QUERY_T

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi读操作
MapReduce Java API接口介绍 - MapReduce服务 MRS

e应用中，不同的键值对应的region不同，这就需要设定特殊的partitioner类分配map的输出结果。 setSortComparatorClass(Class<extends RawComparator> cls) 指定MapReduce作业的map任务的输出结果压缩类，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > MapReduce应用开发常见问题 > MapReduce接口介绍
Datasource表优化 - MapReduce服务 MRS

将datasource表的分区消息存储到Metastore中，并在Metastore中对分区消息进行处理。优化datasource表，支持对表中分区执行增加、删除和修改等语法，从而增加与Hive的兼容性。支持在查询语句中，把分区裁剪并下压到Metastore上，从而过滤掉不匹配的分区。示例如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Datasource表优化 - MapReduce服务 MRS

将datasource表的分区消息存储到Metastore中，并在Metastore中对分区消息进行处理。优化datasource表，支持对表中分区执行增加、删除和修改等语法，从而增加与Hive的兼容性。支持在查询语句中，把分区裁剪并下压到Metastore上，从而过滤掉不匹配的分区。示例如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
调整HetuEngine元数据缓存 - MapReduce服务 MRS

提供了元数据缓存的功能，当首次访问Hive数据源的库或表时，会将该库或表的元数据信息（数据库名、表名、表字段、分区信息、权限信息等）缓存起来，后续访问时不需要再次访问Hive metastore，在Hive数据源的表数据变化不频繁的场景下，可以一定程度上提升查询的性能。调整HetuEngine元数据缓存步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
CarbonData Segment API语法说明 - MapReduce服务 MRS

"table_test","default") 传入数据库名、表名和自定义的segment列表，获取自定义合并操作会被合并的segment列表，得到的segment列表可以当做getMergedLoadName函数的参数传入： /** * Identifies all segments

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
配置HBase冷热数据分离存储 - MapReduce服务 MRS

0及之后版本支持。 OBS读IOPS的能力降低，因此只适用于低频查询的场景。 OBS不适合并发大量读请求的场景，并发大量读请求可能会导致请求异常。原理介绍 HBase支持对同一张表的数据进行冷热分离存储。用户在表上配置数据冷热时间分界点后，HBase会依赖用户写入数据的时间戳（毫秒）和时间分

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase冷热分离
通过Spark-sql创建Hudi表或者Hive表，未插入数据前，查询表统计信息为空 - MapReduce服务 MRS

通过Spark-sql创建Hudi表或者Hive表，未插入数据前，查询表统计信息为空问题通过spark-sql创建Hudi表或者Hive表，未插入数据之前，查询表统计信息都为空。回答可以通过以下两种方式生成：手动通过analyze命令，触发统计信息收集。如果没有插入数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark故障排除
ClickHouse普通物化视图设计 - MapReduce服务 MRS

BY (device, day); AggregateFunction类型的字段使用二进制存储，在写入数据时，需要调用*State函数；而在查询数据时，则需要调用相应的*Merge函数。其中，*表示定义时使用的聚合函数。物化视图创建 CREATE MATERIALIZED VIEW

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse物化视图设计
ClickHouse本地表设计 - MapReduce服务 MRS

MergeTree引擎在建表的时候支持列字段和表级的TTL。当列字段中的值过期时，ClickHouse会将其替换成数据类型的默认值。如果分区内，某一列的所有值均已过期，则ClickHouse会从文件系统中删除这个分区目录下的列文件。当表内的数据过期时，ClickHouse会删除所有对应的行。在列上配置TTL：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
使用Get读取HBase数据 - MapReduce服务 MRS

要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HB

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
使用Get API读取HBase表数据 - MapReduce服务 MRS

要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HB

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
使用Get API读取HBase表数据 - MapReduce服务 MRS

要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HB

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
写入更新数据时报错Parquet/Avro schema - MapReduce服务 MRS

向后兼容的方式演进。此错误通常发生在使用向后不兼容的演进方式删除某些列如“col1”后，更新parquet文件中以旧的schema写入的列“col1”，在这种情况下，parquet尝试在传入记录中查找所有当前字段，当发现“col1”不存在时，发生上述异常。解决这个问题的办法是使

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi常见问题
开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数当Impala的内置函数不能满足需要时，可以通过编写用户自定义函数UDF（User-Defined Functions）插入自己的处理代码并在查询中使用它们。按实现方式，UDF有如下分类：普通的UDF，用于操作单个数据行，且产生一个数据行作为输出。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数当Impala的内置函数不能满足需要时，可以通过编写用户自定义函数UDF（User-Defined Functions）插入自己的处理代码并在查询中使用它们。按实现方式，UDF有如下分类：普通的UDF，用于操作单个数据行，且产生一个数据行作为输出。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用
转换函数 - MapReduce服务 MRS
转换函数 - MapReduce服务 MRS

cast转换函数 HetuEngine会将数字和字符值隐式转换成正确的类型。HetuEngine不会把字符和数字类型相互转换。例如，一个查询期望得到一个varchar类型的值，HetuEngine不会自动将bigint类型的值转换为varchar类型。如果有必要，可以将值显式转换为指定类型。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Hive Group By语句优化 - MapReduce服务 MRS

By也同样存在数据倾斜的问题，设置“hive.groupby.skewindata”为“true”，生成的查询计划会有两个MapReduce Job，第一个Job的Map输出结果会随机的分布到Reduce中，每个Reduce做聚合操作，并输出结果，这样的处理会使相同的Group By

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优

总条数： 5001

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Impala应用开发规则 - MapReduce服务 MRS

HetuEngine物化视图SQL示例 - MapReduce服务 MRS

读取Hudi cow表视图 - MapReduce服务 MRS

MapReduce Java API接口介绍 - MapReduce服务 MRS

Datasource表优化 - MapReduce服务 MRS

Datasource表优化 - MapReduce服务 MRS

调整HetuEngine元数据缓存 - MapReduce服务 MRS

CarbonData Segment API语法说明 - MapReduce服务 MRS

配置HBase冷热数据分离存储 - MapReduce服务 MRS

通过Spark-sql创建Hudi表或者Hive表，未插入数据前，查询表统计信息为空 - MapReduce服务 MRS

ClickHouse普通物化视图设计 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

使用Get读取HBase数据 - MapReduce服务 MRS

使用Get API读取HBase表数据 - MapReduce服务 MRS

使用Get API读取HBase表数据 - MapReduce服务 MRS

写入更新数据时报错Parquet/Avro schema - MapReduce服务 MRS

开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数 - MapReduce服务 MRS

转换函数 - MapReduce服务 MRS

Hive Group By语句优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线