搜索_华为云

使用Filter过滤器读取HBase表数据 - MapReduce服务 MRS

使用Filter过滤器读取HBase表数据功能简介 HBase Filter主要在Scan和Get过程中进行数据过滤，通过设置一些过滤条件来实现，如设置RowKey、列名或者列值的过滤条件。代码样例以下代码片段在com.huawei.bigdata.hbase.exampl

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
基于全局二级索引查询HBase表数据 - MapReduce服务 MRS

基于全局二级索引查询HBase表数据功能简介添加了全局二级索引的用户表，在使用索引条件进行查询时，可以转换为对索引表的范围查询，性能高于针对无二级索引用户表的数据查询。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“Globa

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用 > HBase全局二级索引样例程序
基于全局二级索引查询HBase表数据 - MapReduce服务 MRS

基于全局二级索引查询HBase表数据功能简介添加了全局二级索引的用户表，在使用索引条件进行查询时，可以转换为对索引表的范围查询，性能高于针对无二级索引用户表的数据查询。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“Globa

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase全局二级索引样例程序
添加Hive服务后，提交hivesql/hivescript作业失败如何处理？ - MapReduce服务 MRS

添加Hive服务后，提交hivesql/hivescript作业失败如何处理？该问题是由于提交作业的用户所在用户组绑定的MRS CommonOperations策略权限在同步到Manager中后没有Hive相关权限，处理方法如下：添加Hive服务完成。登录IAM服务控制台，

帮助中心 > MapReduce服务 MRS > 常见问题 > 作业管理类
创建CDL数据比较任务作业 - MapReduce服务 MRS

创建CDL数据比较任务作业操作场景数据比对即是对源端数据库中的数据和目标端Hive中的数据作数据一致性校验，如果数据不一致，CDL可以尝试修复不一致的数据。当前数据对比任务支持手动全量任务比对。数据比对任务采用On Yarn的运行形态，比对结果会上传到HDFS目录。数据比对目前仅支持基本数据类型比对，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
动态分区插入场景内存优化 - MapReduce服务 MRS

动态分区插入场景内存优化操作场景 SparkSQL在往动态分区表中插入数据时，分区数越多，单个Task生成的HDFS文件越多，则元数据占用的内存也越多。这就导致程序GC（Gabage Collection）严重，甚至发生OOM（Out of Memory）。经测试证明：102

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路场景说明假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
使用Scan读取HBase数据 - MapReduce服务 MRS

使用Scan读取HBase数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，最好指定StartRow和StopRow。查询结果的多行数据保存在ResultScanner对象

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
使用Scan API读取HBase表数据 - MapReduce服务 MRS

使用Scan API读取HBase表数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，最好指定StartRow和StopRow。查询结果的多行数据保存在ResultScan

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
配置Hudi通过IAM委托访问OBS - MapReduce服务 MRS

配置Hudi通过IAM委托访问OBS 参考配置MRS集群通过IAM委托对接OBS完成存算分离集群配置后，即可在spark-shell中创建Hudi COW表存储到OBS中。 Hudi对接OBS 使用安装客户端用户登录客户端安装节点。配置环境变量。 source 客户端安装目录/bigdata_env

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
使用Filter过滤器读取HBase表数据 - MapReduce服务 MRS

使用Filter过滤器读取HBase表数据功能简介 HBase Filter主要在Scan和Get过程中进行数据过滤，通过设置一些过滤条件来实现，如设置RowKey、列名或者列值的过滤条件。代码样例以下代码片段在com.huawei.bigdata.hbase.exampl

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
使用Get API读取HBase表数据 - MapReduce服务 MRS

使用Get API读取HBase表数据功能简介要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
使用Get API读取HBase表数据 - MapReduce服务 MRS

使用Get API读取HBase表数据功能简介要从表中读取一条数据，首先需要实例化该表对应的Table实例，然后创建一个Get对象。也可以为Get对象设定参数值，如列族的名称和列的名称。查询到的行数据存储在Result对象中，Result中可以存储多个Cell。代码样例以下代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化操作场景 Spark SQL中，当对两个表进行join操作时，利用Broadcast特性（见“使用广播变量”章节），将被广播的表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
ClickHouse分布式表设计 - MapReduce服务 MRS

ClickHouse分布式表设计建议分布式表建表参考： CREATE TABLE default.my_table_dis ON CLUSTER default_cluster AS mybase.my_table_local ENGINE = Distributed(default_cluster

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
新建Spark应用开发工程（可选） - MapReduce服务 MRS

新建Spark应用开发工程（可选）操作场景除了导入Spark样例工程，您还可以使用IDEA新建一个Spark工程。如下步骤以创建一个Scala工程为例进行说明。操作步骤打开IDEA工具，选择“Create New Project”。图1 创建工程在“New Proje

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” 问题背景与现象在使用Producer向Kafka发送数据功能时，发现客户端发送失败。图1 Producer发送数据失败可能原因 Kafka服务异常。网络异常。 Kafka

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
在spark-beeline中创建或删除表失败 - MapReduce服务 MRS

在spark-beeline中创建或删除表失败用户问题客户在spark-beeline频繁创建和删除大量用户的场景下，个别用户偶现创建/删除表失败。问题现象创建表过程： CREATE TABLE wlg_test001 (start_time STRING,value INT);

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
使用BulkLoad工具批量更新HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量更新HBase数据操作场景 HBase BulkLoad工具支持根据RowKey的命名规则、RowKey的范围、字段名以及字段值进行批量更新数据。使用BulkLoad工具批量更新HBase数据执行如下命令更新从“row_start”到“row_s

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
在Linux中调测Hive JDBC应用 - MapReduce服务 MRS

在Linux中调测Hive JDBC应用执行mvn package生成jar包，在工程目录target目录下获取，比如:hive-examples-1.0.jar。在运行调测环境上创建一个目录作为运行目录，如“/opt/hive_examples”(Linux环境)，并在该目录下创建子目录“conf”。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 调测Hive应用

总条数： 2441

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Filter过滤器读取HBase表数据 - MapReduce服务 MRS

基于全局二级索引查询HBase表数据 - MapReduce服务 MRS

基于全局二级索引查询HBase表数据 - MapReduce服务 MRS

添加Hive服务后，提交hivesql/hivescript作业失败如何处理？ - MapReduce服务 MRS

创建CDL数据比较任务作业 - MapReduce服务 MRS

动态分区插入场景内存优化 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

使用Scan读取HBase数据 - MapReduce服务 MRS

使用Scan API读取HBase表数据 - MapReduce服务 MRS

配置Hudi通过IAM委托访问OBS - MapReduce服务 MRS

使用Filter过滤器读取HBase表数据 - MapReduce服务 MRS

使用Get API读取HBase表数据 - MapReduce服务 MRS

使用Get API读取HBase表数据 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

ClickHouse分布式表设计 - MapReduce服务 MRS

新建Spark应用开发工程（可选） - MapReduce服务 MRS

Producer偶现发送数据失败，日志提示“Too many open files in system” - MapReduce服务 MRS

在spark-beeline中创建或删除表失败 - MapReduce服务 MRS

使用BulkLoad工具批量更新HBase数据 - MapReduce服务 MRS

在Linux中调测Hive JDBC应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线