搜索_华为云

数据导入 - MapReduce服务 MRS
数据导入 - MapReduce服务 MRS

数据导入概述使用Loader导入数据典型场景：从SFTP服务器导入数据到HDFS/OBS 典型场景：从SFTP服务器导入数据到HBase 典型场景：从SFTP服务器导入数据到Hive 典型场景：从FTP服务器导入数据到HBase 典型场景：从关系型数据库导入数据到HDFS/OBS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
数据写入 - MapReduce服务 MRS
数据写入 - MapReduce服务 MRS

数据写入写入更新数据时报错 Parquet/Avro schema 写入更新数据时报错UnsupportedOperationException 写入更新数据时报错SchemaCompatabilityException Hudi在upsert时占用了临时文件夹中大量空间 Hudi写入小精度Decimal数据失败

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见问题
数据保护技术 - MapReduce服务 MRS

数据保护技术数据完整性通过数据校验，保证数据在存储、传输过程中的数据完整性。 MRS的用户数据保存在HDFS中，HDFS默认采用CRC32C算法校验数据的正确性，同时也支持CRC32校验算法，CRC32C校验速度快于CRC32。HDFS的DataNode节点负责存储校验数据，

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
数据分析 - MapReduce服务 MRS
数据分析 - MapReduce服务 MRS

数据分析使用Spark2x实现车联网车主驾驶行为分析使用Hive加载HDFS数据并分析图书评分情况使用Hive加载OBS数据并分析企业雇员信息通过Flink作业处理OBS数据通过Spark Streaming作业消费Kafka数据通过Flume采集指定目录日志系统文件至HDFS

帮助中心 > MapReduce服务 MRS > 最佳实践
数据导出 - MapReduce服务 MRS
数据导出 - MapReduce服务 MRS

数据导出概述使用Loader导出数据典型场景：从HDFS/OBS导出数据到SFTP服务器典型场景：从HBase导出数据到SFTP服务器典型场景：从Hive导出数据到SFTP服务器典型场景：从HDFS/OBS导出数据到关系型数据库典型场景：从HBase导出数据到关系型数据库

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader
如何重置MRS Kafka数据？ - MapReduce服务 MRS

如何重置MRS Kafka数据？删除Kafka topic信息即重置Kafka数据，具体命令请参考：删除topic：kafka-topics.sh --delete --zookeeper ZooKeeper集群业务IP:2181/kafka --topic topicname

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
如何查看MRS Hive元数据？ - MapReduce服务 MRS

ervice数据库默认用户及初始密码。 Hive元数据存放在外部的关系型数据库存储时，请通过如下步骤获取信息：集群详情页的“数据连接”右侧单击“单击管理”。在弹出页面中查看“数据连接ID”。在MRS控制台，单击“数据连接”。在数据连接列表中根据集群所关联的数据连接ID查找对应数据连接。

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
典型场景：从Hive导出数据到关系型数据库 - MapReduce服务 MRS

单击“下一步”，进入“输出设置”界面，设置数据保存方式。表4 输出设置参数参数名说明示例架构名称数据库模式名。 dbo 表名数据库表名，用于最终保存传输的数据。说明：表名可以使用宏定义，具体请参考配置项中使用宏定义。 test 临时表数据库临时表表名，用于临时保存传输过程中的数据，字段需要和“表名”配置的表一致。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
配置Hive分区元数据冷热存储 - MapReduce服务 MRS

配置Hive分区元数据冷热存储分区元数据冷热存储介绍为了减轻集群元数据库压力，将长时间未使用过的指定范围的分区相关元数据移动到备份表，这一过程称为分区数据冻结，冻结的分区数据称为冷分区，未冻结的分区称为热分区，存在冷分区的表称为冻结表。将被冻结的数据重新移回原元数据表中，这一过程称为分区数据解冻。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
添加HetuEngine数据源 - MapReduce服务 MRS

添加HetuEngine数据源使用HetuEngine跨源跨域访问数据源添加Hive数据源添加Hudi数据源添加ClickHouse数据源添加GAUSSDB数据源添加HBase数据源添加跨集群HetuEngine数据源添加IoTDB数据源添加MySQL数据源添加Oracle数据源

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
MRS存算分离配置流程说明 - MapReduce服务 MRS

MRS存算分离配置流程说明 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅作数据计算处理的存算分离模式，从而实现按需灵活扩展资源、低成本的海量数据分析方案。大数据存算分离场景，请务必使用OBS并行文件系统（并行文件系统

 帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

图4 源端集群数据记录图5 目的端集群数据记录（可选）如果源端集群中有新增数据需要定期将新增数据迁移至目的端集群，则根据数据新增方式进行不同方式的迁移。配置定期任务增量迁移数据，直到所有业务迁移至目的端集群。 Hive表数据修改、未新增删除表、未修改已有表的数据结构：此时Hi

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Hive ORC数据存储优化 - MapReduce服务 MRS

Hive ORC数据存储优化操作场景 “ORC”是一种高效的列存储格式，在压缩比和读取效率上优于其他文件格式。建议使用“ORC”作为Hive表默认的存储格式。前提条件已登录Hive客户端，具体操作请参见Hive客户端使用实践。操作步骤推荐：使用“SNAPPY”压缩，适用于压缩比和读取效率要求均衡场景。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Flume数据采集慢 - MapReduce服务 MRS

Flume数据采集慢问题现象 Flume启动后，Flume数据采集慢。原因分析 Flume堆内存设置不合理，导致Flume进程一直处于频繁GC。查看Flume运行日志： 2019-02-26T13:06:20.666+0800: 1085673.512: [Full GC:[CMS:

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
Loader数据导入导出概述 - MapReduce服务 MRS

从关系型数据库导入数据到HDFS/OBS 从关系型数据库导入数据到HBase 从关系型数据库导入数据到Phoenix表从关系型数据库导入数据到Hive表从SFTP服务器导入数据到HDFS/OBS 从SFTP服务器导入数据到HBase 从SFTP服务器导入数据到Phoenix表从SFTP服务器导入数据到Hive表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader
插入HBase数据 - MapReduce服务 MRS
插入HBase数据 - MapReduce服务 MRS

插入HBase数据功能简介 HBase是一个面向列的数据库，一行数据，可能对应多个列族，而一个列族又可以对应多个列。通常，写入数据的时候，需要指定要写入的列（含列族名称和列名称）。HBase通过HTable的put方法来Put数据，可以是一行数据也可以是数据集。代码样例以下代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
加载Hive数据 - MapReduce服务 MRS
加载Hive数据 - MapReduce服务 MRS

加载Hive数据功能介绍本小节介绍了如何使用HQL向已有的表employees_info中加载数据。从本节中可以掌握如何从集群中加载数据。样例代码 -- 从本地文件系统/opt/hive_examples_data/目录下将employee_info.txt加载进employees_info表中

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 开发Hive应用
配置Hive元数据存储至RDS - MapReduce服务 MRS

在集群详情页的“概览”页签，单击“数据连接”右侧的“单击管理”。在“数据连接”页面显示集群已关联的数据连接，单击“解绑”可对已关联的数据连接进行删除。若“数据连接”页面没有关联连接，单击“配置数据连接”进行增加。一种模块类型只能配置一个数据连接，如在Hive元数据上配置了数据连接后，不能再配

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据
删除HBase数据 - MapReduce服务 MRS
删除HBase数据 - MapReduce服务 MRS

删除HBase数据功能简介 HBase通过Table实例的delete方法来Delete数据，可以是一行数据也可以是数据集。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseExample”类的testDelete方法中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
通过Flink作业处理OBS数据 - MapReduce服务 MRS

通过Flink作业处理OBS数据应用场景 MRS支持在大数据存储容量大、计算资源需要弹性扩展的场景下，用户将数据存储在OBS服务中，使用MRS集群仅做数据计算处理的存算分离模式。本文将向您介绍如何在MRS集群中运行Flink作业来处理OBS中存储的数据。方案架构 Flink是一个

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析

总条数： 3778

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据导入 - MapReduce服务 MRS

数据写入 - MapReduce服务 MRS

数据保护技术 - MapReduce服务 MRS

数据分析 - MapReduce服务 MRS

数据导出 - MapReduce服务 MRS

如何重置MRS Kafka数据？ - MapReduce服务 MRS

如何查看MRS Hive元数据？ - MapReduce服务 MRS

典型场景：从Hive导出数据到关系型数据库 - MapReduce服务 MRS

配置Hive分区元数据冷热存储 - MapReduce服务 MRS

添加HetuEngine数据源 - MapReduce服务 MRS

MRS存算分离配置流程说明 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

Hive ORC数据存储优化 - MapReduce服务 MRS

Flume数据采集慢 - MapReduce服务 MRS

Loader数据导入导出概述 - MapReduce服务 MRS

插入HBase数据 - MapReduce服务 MRS

加载Hive数据 - MapReduce服务 MRS

配置Hive元数据存储至RDS - MapReduce服务 MRS

删除HBase数据 - MapReduce服务 MRS

通过Flink作业处理OBS数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线