搜索_华为云

Datasource表优化 - MapReduce服务 MRS

将datasource表的分区消息存储到Metastore中，并在Metastore中对分区消息进行处理。优化datasource表，支持对表中分区执行增加、删除和修改等语法，从而增加与Hive的兼容性。支持在查询语句中，把分区裁剪并下压到Metastore上，从而过滤掉不匹配的分区。示例如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Datasource表优化 - MapReduce服务 MRS

将datasource表的分区消息存储到Metastore中，并在Metastore中对分区消息进行处理。优化datasource表，支持对表中分区执行增加、删除和修改等语法，从而增加与Hive的兼容性。支持在查询语句中，把分区裁剪并下压到Metastore上，从而过滤掉不匹配的分区。示例如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Spark Core内存调优 - MapReduce服务 MRS

），如果频繁出现Full GC，需要优化GC。把RDD做Cache操作，通过日志查看RDD在内存中的大小，如果数据太大，需要改变RDD的存储级别来优化。操作步骤优化GC，调整老年代和新生代的大小和比例。在客户端的“conf/spark-default.conf”配置文件中，在spark

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
CLEANARCHIVE - MapReduce服务 MRS
CLEANARCHIVE - MapReduce服务 MRS

表1 参数描述参数描述 tableIdentifier Hudi表的名称。 tablelocation Hudi表的存储路径。 hoodie.archive.file.cleaner.policy 清理归档文件的策略：目前仅支持KEEP_ARCHIVED_FILES_BY_SIZ

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
ClickHouse应用程序开发思路 - MapReduce服务 MRS

use的开发过程，并且对关键的接口函数有所了解。开发思路 ClickHouse作为一款独立的DBMS系统，使用SQL语言就可以进行常见的操作。开发程序示例中，全部通过clickhouse-jdbc API接口来进行描述。设置属性建立连接创建库创建表插入数据查询数据删除表

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > ClickHouse开发指南（普通模式） > 开发ClickHouse应用
配置Spark Native引擎 - MapReduce服务 MRS

Native引擎是通过使用向量化的C++加速库，实现对Spark算子性能加速的一种技术方案。传统的SparkSQL是基于行式数据，通过JVM的codegen来实现查询加速的，由于JVM对生成的java代码存在各种约束，比如方法长度，参数个数等，以及行式数据对内存带宽的利用率不足，因此存在性

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
使用Get读取HBase数据 - MapReduce服务 MRS

要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HB

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
使用Get API读取HBase表数据 - MapReduce服务 MRS

要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HB

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
使用Get API读取HBase表数据 - MapReduce服务 MRS

要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HB

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
写入更新数据时报错Parquet/Avro schema - MapReduce服务 MRS

向后兼容的方式演进。此错误通常发生在使用向后不兼容的演进方式删除某些列如“col1”后，更新parquet文件中以旧的schema写入的列“col1”，在这种情况下，parquet尝试在传入记录中查找所有当前字段，当发现“col1”不存在时，发生上述异常。解决这个问题的办法是使

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi故障处理
Doris数据变更规范 - MapReduce服务 MRS

峰期，停止相关表的写入和修改业务后，通过重建表方式实现以上操作：新建一个表，该表结构和需进行增删改字段的表结构相同。在新建表中增加需要添加的新字段、删除不需要的字段、或修改需改变类型的字段。选取指定字段数据插入到新创建的表中： INSERT INTO 新创建的表 SELECT

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数当Impala的内置函数不能满足需要时，可以通过编写用户自定义函数UDF（User-Defined Functions）插入自己的处理代码并在查询中使用它们。按实现方式，UDF有如下分类：普通的UDF，用于操作单个数据行，且产生一个数据行作为输出。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数当Impala的内置函数不能满足需要时，可以通过编写用户自定义函数UDF（User-Defined Functions）插入自己的处理代码并在查询中使用它们。按实现方式，UDF有如下分类：普通的UDF，用于操作单个数据行，且产生一个数据行作为输出。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用
CLEAN_FILE - MapReduce服务 MRS
CLEAN_FILE - MapReduce服务 MRS

需要清理无效数据文件的Hudi表的表名，必选。 op_type 命令运行模式，可选，默认值为dry_run，取值：dry_run、repair、undo、query。 dry_run：显示需要清理的无效数据文件。 repair：显示并清理无效的数据文件。 undo：恢复已清理的数据文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Storm-HBase开发指引 - MapReduce服务 MRS

builder.createTopology()); } 部署运行及结果查看导出本地jar包，请参见打包Strom样例工程应用。将1中导出的本地Jar包，4中获取的配置文件和5中获取的jar包合并统一打出完整的业务jar包，请参见打包Strom应用业务。执行命令提交拓扑。 storm

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
ClickHouse应用开发规则 - MapReduce服务 MRS

不允许使用字符类型存放时间、日期或数值类型的数据特别是需要对该时间、日期或数值类型字段进行运算或者比较的时候。单表(分布式表)的记录数不要超过万亿，单表(本地表)不超过百亿对于万亿以上表的查询，性能较差，且集群维护难度变大。表的设计都要考虑到数据的生命周期管理磁盘的空间是有限的，需要考虑数据的生命周期管

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范
通过Java API提交Oozie作业开发思路 - MapReduce服务 MRS

通过典型场景，用户可以快速学习和掌握Oozie的开发过程，并且对关键的接口函数有所了解。本示例演示了如何通过Java API提交MapReduce作业和查询作业状态，代码示例只涉及了MapReduce作业，其他作业的API调用代码是一样的，仅job配置“job.properties”与工作流配置“workflow

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 开发Oozie应用 > 通过Java API提交Oozie作业
创建CarbonData表 - MapReduce服务 MRS

中加载数据和查询数据。使用自定义列创建表可通过指定各列及其数据类型来创建表。启用Kerberos认证的分析集群创建CarbonData表时，如果用户需要在默认数据库“default”以外的数据库创建新表，则需要在Hive角色管理中为用户绑定的角色添加指定数据库的“Create”权限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）
HetuEngine样例程序开发思路 - MapReduce服务 MRS

通过典型场景，用户可以快速学习和掌握HetuEngine的开发过程，并且对关键的接口函数有所了解。场景说明假定用户开发一个应用程序，需要对Hive数据源的A表和MPPDB数据源的B表进行join运算，则可以用HetuEngine来实现Hive数据源数据查询，流程如下：连接HetuEngine

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 开发HetuEngine应用
普通集群修改Ranger数据源为Ldap - MapReduce服务 MRS

在Ranger实例页面，勾选“UserSync”实例，选择“更多 > 重启实例”。在Ranger服务“概览”页面，单击“RangerAdmin”，查看“Settings > Users/Groups/Roles”页面是否有ldap用户。父主题：使用Ranger（MRS 3.x）

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Ranger（MRS 3.x）

总条数： 4012

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Datasource表优化 - MapReduce服务 MRS

Datasource表优化 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

CLEANARCHIVE - MapReduce服务 MRS

ClickHouse应用程序开发思路 - MapReduce服务 MRS

配置Spark Native引擎 - MapReduce服务 MRS

使用Get读取HBase数据 - MapReduce服务 MRS

使用Get API读取HBase表数据 - MapReduce服务 MRS

使用Get API读取HBase表数据 - MapReduce服务 MRS

写入更新数据时报错Parquet/Avro schema - MapReduce服务 MRS

Doris数据变更规范 - MapReduce服务 MRS

开发Impala用户自定义函数 - MapReduce服务 MRS

开发Impala用户自定义函数 - MapReduce服务 MRS

CLEAN_FILE - MapReduce服务 MRS

Storm-HBase开发指引 - MapReduce服务 MRS

ClickHouse应用开发规则 - MapReduce服务 MRS

通过Java API提交Oozie作业开发思路 - MapReduce服务 MRS

创建CarbonData表 - MapReduce服务 MRS

HetuEngine样例程序开发思路 - MapReduce服务 MRS

普通集群修改Ranger数据源为Ldap - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线