搜索_华为云

离线数据加载：通过Spark视图读取Hive外表数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Spark视图读取Hive外表数据并写入Doris 应用场景通过Spark视图读取Hive外表数据写入到Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
恢复HDFS NameNode元数据 - MapReduce服务 MRS

建议一个恢复任务只恢复一个组件的元数据，避免因停止某个服务或实例影响其他组件的数据恢复。同时恢复多个组件数据，可能导致数据恢复失败。 HBase元数据不能与NameNode元数据同时恢复，会导致数据恢复失败。对系统的影响数据恢复后，会丢失从备份时刻到恢复时刻之间的数据。恢复数据后需要重启Name

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
读取Hudi数据概述 - MapReduce服务 MRS

读取Hudi数据概述 Hudi的读操作，作用于Hudi的三种视图之上，可以根据需求差异选择合适的视图进行查询。 Hudi支持多种查询引擎Spark、Hive、HetuEngine，具体支持矩阵见表1和表2。表1 cow表查询引擎实时视图/读优化视图增量视图 Hive Y Y

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi读操作
Flume基本原理 - MapReduce服务 MRS
Flume基本原理 - MapReduce服务 MRS

其中Source负责接收数据，Channel负责数据的传输，Sink则负责数据向下一端的发送。表1 模块说明名称说明 Source Source负责接收数据或通过特殊机制产生数据，并将数据批量放到一个或多个Channel。Source的类型有数据驱动和轮询两种。典型的Source类型如下：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flume
添加GAUSSDB数据源 - MapReduce服务 MRS

是否使用并行数据读取功能启用并行数据读取功能将基于节点分布和“max-splits”参数值来确定实际的split数。并行读取将与数据源创建多个连接，被依赖的数据源应当具备支持负载的能力。 false split-type 并行数据读取类型 NODE：基于GaussDB数据源DN节点划分并行度

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

批量导入本地数据，在首次数据加载时，能极大的提高写入效率，并降低对Region Server节点的写入压力。方案架构 Bulkload是HBase提供的一个数据导入工具，它可以将数据批量地导入到HBase表中，直接写入底层数据文件和‌WAL日志，从而显著提升了数据加载的速度和效率。‌

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
ClickHouse数据入库规范 - MapReduce服务 MRS

part过多，merge压力变大，甚至出现异常影响数据插入；数据的一致性问题：数据先在分布式表写入节点的主机落盘，然后数据被异步地发送到本地表所在主机进行存储，中间没有一致性的校验，如果分布式表写入数据的主机出现异常，会存在数据丢失风险；对于数据写分布式表和数据写本地表相比，分布式表数据写入性能也会变慢，单

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris 应用场景通过Doris创建Catalog成功读取RDS-MySQL数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
添加Hudi数据源 - MapReduce服务 MRS

添加Hudi数据源 HetuEngine支持查询COW/MOR类型表数据。本章节指导用户在HSConsole界面配置Hudi类型数据源。 HetuEngine不支持Hudi的bootstrap表的读取。添加Hudi数据源前提条件创建Hudi数据源的代理用户，该代理用户为人机用户且需拥有hive组。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
添加GBase数据源 - MapReduce服务 MRS

添加GBase数据源本章节适用于MRS 3.5.0及之后的版本。 HetuEngine支持配置GBase数据源实现对GBase数据源的接入与查询功能。本章节指导用户在集群的HSConsole界面添加GBase类型的JDBC数据源。前提条件数据源与HetuEngine集群节点网络互通。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
ClickHouse数据入库工具 - MapReduce服务 MRS

建议使用Hive/Spark进行数据批量加工，FilkSQL进行数据增量加工。数据入库建议使用CDL（增量实时同步）和Loader（批量同步）工具进行数据同步，也可选择HDFS外表（CK集群只支持X86平台）用户自己写调度程序进行数据导入。父主题： ClickHouse数据库开发

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
添加Hive数据源 - MapReduce服务 MRS

添加Hive数据源 Hive数据源介绍 HetuEngine服务在安装时已经将共部署（与HetuEngine在同一个Hadoop集群）的Hive数据源默认实现对接，数据源名称为“hive”，不可删除。部分默认配置不可修改，如数据源名称，数据源类型，服务端Principal，客户端

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

作导致ZooKeeper上的数据异常，致使ClickHouse启动失败。解决办法备份问题节点数据库下所有表数据到其他目录。备份表数据： MRS 3.0.5及之前版本 cd /srv/BigData/data1/clickhouse/data/数据库名 mkdir -p 备份目录/data1

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用ClickHouse
SQLServer全数据类型导入HDFS数据跳过 - MapReduce服务 MRS

SQLServer全数据类型导入HDFS数据跳过问题 SQLServer全数据类型导入HDFS，数据全部跳过。答案数据中包含SQLServer中特有的Timestamp类型，该数据类型与时间和日期无关，需要替换为Datetime类型。父主题： Loader常见问题

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader常见问题
离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris 应用场景通过Broker Load将ORC格式的Hive表数据导入到Doris。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析 > 实时OLAP数据分析
配置Spark读写Doris数据 - MapReduce服务 MRS

配置Spark读写Doris数据 Spark Doris Connector可以支持通过Spark读取Doris中存储的数据，也支持通过Spark写入数据到Doris中。支持从Doris中读取数据支持Spark DataFrame批量/流式写入Doris。可以将Doris表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
算子数据处理规则 - MapReduce服务 MRS

列数，全部数据成为脏数据。配置转换字段类型，与原始数据实际类型不同，全部数据成为脏数据。例如将字符串类型转换为数值类型。 HBase输入原始数据包含NULL值，不做转换处理。配置HBase表名错误，全部数据成为脏数据。 “主键”没有配置主键列，全部数据成为脏数据。配置输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助
使用Loader从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

HBASE_BULKLOAD 数据量大 HBase实例在HBase作业中，Loader支持从集群可添加的所有HBase服务实例中选择任意一个。如果选定的HBase服务实例在集群中未添加，则此作业无法正常运行。 HBase 导入前清理数据导入前清空原表的数据。“True”为执行清空，

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
配置HDFS冷热数据迁移 - MapReduce服务 MRS

配置HDFS冷热数据迁移配置场景冷热数据迁移工具根据配置的策略移动HDFS文件。配置策略是条件或非条件规则的集合。如果规则匹配文件集，则该工具将对该文件执行一组行为操作。冷热数据迁移工具支持以下规则和行为。迁移规则：根据文件的最后访问时间迁移数据根据年龄时间迁移数据（修改时间）

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hue
调整HetuEngine元数据缓存 - MapReduce服务 MRS

调整HetuEngine元数据缓存 HetuEngine元数据缓存介绍当HetuEngine访问Hive数据源时，需要访问Hive metastore获取元数据信息。HetuEngine提供了元数据缓存的功能，当首次访问Hive数据源的库或表时，会将该库或表的元数据信息（数据库名、表名、表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优

总条数： 3424

上一页
1
...
9
10
11
...
172
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

离线数据加载：通过Spark视图读取Hive外表数据并写入Doris - MapReduce服务 MRS

恢复HDFS NameNode元数据 - MapReduce服务 MRS

读取Hudi数据概述 - MapReduce服务 MRS

Flume基本原理 - MapReduce服务 MRS

添加GAUSSDB数据源 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

ClickHouse数据入库规范 - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取RDS-MySQL数据并写入Doris - MapReduce服务 MRS

添加Hudi数据源 - MapReduce服务 MRS

添加GBase数据源 - MapReduce服务 MRS

ClickHouse数据入库工具 - MapReduce服务 MRS

添加Hive数据源 - MapReduce服务 MRS

ZooKeeper上数据错乱导致ClickHouse启动失败问题 - MapReduce服务 MRS

SQLServer全数据类型导入HDFS数据跳过 - MapReduce服务 MRS

离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris - MapReduce服务 MRS

配置Spark读写Doris数据 - MapReduce服务 MRS

算子数据处理规则 - MapReduce服务 MRS

使用Loader从HDFS/OBS导入数据到HBase - MapReduce服务 MRS

配置HDFS冷热数据迁移 - MapReduce服务 MRS

调整HetuEngine元数据缓存 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线