搜索_华为云

添加Hive数据源 - MapReduce服务 MRS

添加Hive数据源 Hive数据源介绍 HetuEngine服务在安装时已经将共部署（与HetuEngine在同一个Hadoop集群）的Hive数据源默认实现对接，数据源名称为“hive”，不可删除。部分默认配置不可修改，如数据源名称，数据源类型，服务端Principal，客户端

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Hive Join数据优化 - MapReduce服务 MRS

注意事项 Join数据倾斜问题。执行任务的时候，任务进度长时间维持在99%，这种现象叫数据倾斜。数据倾斜是经常存在的，因为有少量的Reduce任务分配到的数据量和其他Reduce差异过大，导致大部分Reduce都已完成任务，但少量Reduce任务还没完成的情况。解决数据倾斜的问题，可通过设置“set

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
创建CDL数据同步任务作业 - MapReduce服务 MRS

Topic与表的映射关系。用于指定某个表的数据发送到指定的Topic中，开启多分区功能后需要配置Topic的分区数，分区数必须大于1。MRS 3.3.0及之后版本，数据过滤时间用于过滤数据，当源端数据的时间小于设定时间时，该数据将会被丢弃，当源端数据的时间大于设定时间时，该数据发送到下游。单击显示该参数。如果“Connect

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

引擎概述：添加Hive数据源添加Hudi数据源添加ClickHouse数据源添加GAUSSDB数据源添加HBase数据源添加跨集群HetuEngine数据源添加IoTDB数据源添加MySQL数据源添加Oracle数据源添加GBase数据源使用跨源协同分析流程

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
使用Scan API读取HBase表数据 - MapReduce服务 MRS

API读取HBase表数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，最好指定StartRow和StopRow。查询结果的多行数据保存在ResultScanner对象中，每行数据以Res

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写样例程序
删除HBase表数据 - MapReduce服务 MRS

删除HBase表数据功能简介 HBase通过Table实例的delete方法来Delete数据，可以是一行数据也可以是数据集。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseSample”类的testDelete方法中

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > 开发HBase应用 > HBase数据读写示例程序
添加GBase数据源 - MapReduce服务 MRS

添加GBase数据源本章节适用于MRS 3.5.0及之后的版本。 HetuEngine支持配置GBase数据源实现对GBase数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加GBase类型的JDBC数据源。前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
使用Loader导入数据 - MapReduce服务 MRS

表分区名，使用逗号分隔不同的分区。数据块分配方式指定数据切分后，如何分配。读取大小指定每次读取多大的数据量。 mysql-fastpath-connector 架构名称数据库模式名。表名数据库表名。查询条件指定表的查询条件。分区列名指定数据库表的一列，根据该列来划分要导入的数据，在map任务中用于分区。建议配置主键字段。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
提升HBase实时写数据效率 - MapReduce服务 MRS

的测试。写数据表设计调优在hbase shell中设置以下表相关参数，以提升HBase写数据性能。表2 影响实时写数据相关参数配置参数描述默认值 COMPRESSION 配置数据的压缩算法，这里的压缩是HFile中block级别的压缩。对于可以压缩的数据，配置压缩算法

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris 应用场景通过Doris创建Catalog成功读取Hive外表数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

均衡操作时间估算受两个因素影响：需要迁移的总数据量：每个DataNode节点的数据量应大于（平均使用率-阈值）*平均数据量，小于（平均使用率+阈值）*平均数据量。若实际数据量小于最小值或大于最大值即存在不平衡，系统选择所有DataNode节点中偏差最多的数据量作为迁移的总数据量。 Balancer的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群操作场景本入门提供从零开始创建ClickHouse集群并通过集群客户端进行ClickHouse表的创建与查询操作指导。 ClickHouse是一款开源的面向联机分析处理的列式数据库，独立于Hadoop大数据体系，具有压缩率和极速查询性能。

帮助中心 > MapReduce服务 MRS > 快速入门
使用Scan API读取HBase表数据 - MapReduce服务 MRS

API读取HBase表数据功能简介要从表中读取数据，首先需要实例化该表对应的Table实例，然后创建一个Scan对象，并针对查询条件设置Scan对象的参数值，为了提高查询效率，建议指定StartRow和StopRow。查询结果的多行数据保存在ResultScanner对象中，每行数据以Res

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
算子数据处理规则 - MapReduce服务 MRS

列数，全部数据成为脏数据。配置转换字段类型，与原始数据实际类型不同，全部数据成为脏数据。例如将字符串类型转换为数值类型。 HBase输入原始数据包含NULL值，不做转换处理。配置HBase表名错误，全部数据成为脏数据。 “主键”没有配置主键列，全部数据成为脏数据。配置输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助
离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris 应用场景通过Broker Load将ORC格式的Hive表数据导入到Doris。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris 应用场景通过Doris创建Catalog成功读取RDS-MySQL数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
提升HBase实时写数据效率 - MapReduce服务 MRS

试。写数据表设计调优表2 影响实时写数据相关参数配置参数描述默认值 COMPRESSION 配置数据的压缩算法，这里的压缩是HFile中block级别的压缩。对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase性能调优
数据管理维护 - MapReduce服务 MRS

数据管理维护 Hudi Clustering操作说明 Hudi Cleaning操作说明 Hudi Compaction操作说明 Hudi Savepoint操作说明父主题：使用Hudi

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi
SQLServer全数据类型导入HDFS数据跳过 - MapReduce服务 MRS

SQLServer全数据类型导入HDFS数据跳过问题 SQLServer全数据类型导入HDFS，数据全部跳过。答案数据中包含SQLServer中特有的Timestamp类型，该数据类型与时间和日期无关，需要替换为Datetime类型。父主题： Loader常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader常见问题
ClickHouse数据导入 - MapReduce服务 MRS

0-LTS及之后版本）配置ClickHouse对接Kafka 同步Kafka数据至ClickHouse 导入DWS表数据至ClickHouse ClickHouse数据批量导入 ClickHouse数据导入导出父主题：使用ClickHouse

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse

总条数： 3381

上一页
1
...
10
11
12
...
170
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

添加Hive数据源 - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

创建CDL数据同步任务作业 - MapReduce服务 MRS

使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

使用Scan API读取HBase表数据 - MapReduce服务 MRS

删除HBase表数据 - MapReduce服务 MRS

添加GBase数据源 - MapReduce服务 MRS

使用Loader导入数据 - MapReduce服务 MRS

提升HBase实时写数据效率 - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

使用Scan API读取HBase表数据 - MapReduce服务 MRS

算子数据处理规则 - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

提升HBase实时写数据效率 - MapReduce服务 MRS

数据管理维护 - MapReduce服务 MRS

SQLServer全数据类型导入HDFS数据跳过 - MapReduce服务 MRS

ClickHouse数据导入 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线