搜索_华为云

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群应用场景本章节适用于将线下IDC机房或者公有云Hadoop集群中的数据（支持数据量在几十TB级别或以下的数据量级）迁移到华为云MRS服务。本章节以通过华为云CDM服务 2.9.1.200版本进行数据迁移为例介绍。不同版本操作可能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
Flink DataStream应用开发思路 - MapReduce服务 MRS

Flink DataStream应用开发思路假定用户有某个网站网民周末网购停留时间的日志文本，基于某些业务要求，要求开发Flink的DataStream应用程序实现如下功能： DataStream应用程序可以在Windows环境和Linux环境中运行。实时统计总计网购时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 开发Flink应用 > DataStream程序
设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

设置HBase和HDFS的句柄数限制操作场景当打开一个HDFS文件时，句柄数限制导出，出现如下错误： IOException (Too many open files) 此时可以参考该章节设置HBase和HDFS的句柄数。设置HBase和HDFS的句柄数限制联系集群管理员

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程操作场景为了运行MRS产品Hive组件的Python接口样例代码，需要完成下面的操作。 MRS 3.1.2及之后版本默认仅支持Python3。该样例仅支持在Linux节点上运行。操作步骤客户端机器必须安装有Python，其版本不低于2.6

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 Hive介绍 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式）
配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程操作场景为了运行MRS产品Hive组件的Python接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python，其版本不低于2.6.6，最高不能超过2.7.13。在客户端机器的命令行终端输入python可查看Python版本号。如下显示Python版本为2

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程操作场景为了运行MRS产品Hive组件的Python接口样例代码，需要完成下面的操作。操作步骤客户端机器必须安装有Python，其版本不低于2.6.6，最高不能超过2.7.13。在客户端机器的命令行终端输入python可查看Python版本号。如下显示Python版本为2

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程操作场景为了运行MRS产品Hive组件的Python接口样例代码，需要完成下面的操作。 MRS 3.1.2及之后版本默认仅支持Python3。该样例仅支持在Linux节点上运行。操作步骤客户端机器必须安装有Python，其版本不低于2.6

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 准备Hive应用开发环境 > 导入并配置Hive样例工程
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤以root用户登录已安装Hive客户端的节点。执行以下命令，进入客

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
配置HDFS多路读 - MapReduce服务 MRS

配置HDFS多路读该章节仅适用于MRS 3.3.1及之后版本。操作场景在传统的HDFS中，当客户端请求读取数据时，它会与NameNode交互以确定数据块所在的DataNodes，并选择其中一个进行连接和数据传输。如果所选DataNode的响应速度较慢或者发生故障，客户端必须

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志安装Flume客户端。进入Flume客户端日志目录，默认为“/var/log/Bigdata”。执行如下命令查看日志文件列表。 ls -lR flume-client-* 日志文件示例如下： flume-client-1/flume: total 7672

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志安装Flume客户端。进入Flume客户端日志目录，默认为“/var/log/Bigdata”。执行如下命令查看日志文件列表。 ls -lR flume-client-* 日志文件示例如下： flume-client-1/flume: total 7672

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume运维管理
建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤 MRS 3.x之前版本：登录MRS控制台，在左侧导航栏选择“现有集群”，单击集群名称。选择“节点管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
数据保护技术 - MapReduce服务 MRS

数据保护技术数据完整性通过数据校验，保证数据在存储、传输过程中的数据完整性。 MRS的用户数据保存在HDFS中，HDFS默认采用CRC32C算法校验数据的正确性，同时也支持CRC32校验算法，CRC32C校验速度快于CRC32。HDFS的DataNode节点负责存储校验数据，

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
导入并配置HDFS样例工程 - MapReduce服务 MRS

导入并配置HDFS样例工程操作场景 HDFS针对多个场景提供样例工程，帮助客户快速学习HDFS工程。以下操作步骤以导入HDFS样例代码为例。操作流程如图1所示。图1 导入样例工程流程操作步骤参考获取MRS应用开发样例工程，获取样例代码解压目录中“src”目录下的样例工程

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
HDFS支持集群掉电自动恢复 - MapReduce服务 MRS

HDFS支持集群掉电自动恢复操作场景 HDFS数据写入磁盘时会先写入操作系统缓存，当操作系统缓存写入完成后则认为数据写入完成，缓存数据写入磁盘工作交由操作系统完成。如果此时集群断电，则缓存的数据就会丢失，造成HDFS丢块现象。在HDFS启动时如果有丢块，那么HDFS会进入安全模式，无法自动恢复。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
OpenTSDB HTTP API接口介绍 - MapReduce服务 MRS

OpenTSDB HTTP API接口介绍 OpenTSDB提供了基于HTTP或HTTPS的应用程序接口。请求方式是通过向资源对应的路径发送标准的HTTP请求，请求包含GET、POST方法。它的接口与开源OpenTSDB保持一致，请参见https://opentsdb.net/d

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发常见问题
HDFS应用开发常用概念 - MapReduce服务 MRS

HDFS应用开发常用概念 DataNode 将文件切分成大小相同的块（称为“数据块”），存储在不同的DataNode上，并且周期性地向NameNode报告该DataNode的数据存放情况。 NameNode 用于管理文件系统的命名空间、目录结构、元数据信息以及提供备份机制等。 Active

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发概述
导入并配置HDFS样例工程 - MapReduce服务 MRS

导入并配置HDFS样例工程操作场景 HDFS针对多个场景提供样例工程，帮助客户快速学习HDFS工程。以下操作步骤以导入HDFS样例代码为例。操作流程如图1所示。图1 导入样例工程流程导入样例工程参考获取MRS应用开发样例工程，获取样例代码解压目录中“src”目录下的样例

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
配置Kafka后进先出 - MapReduce服务 MRS

配置Kafka后进先出配置场景当Spark Streaming应用与Kafka对接，Spark Streaming应用异常终止并从checkpoint恢复重启后，对于进入Kafka数据的任务，系统默认优先处理应用终止前（A段时间）未完成的任务和应用终止到重启完成这段时间内（B

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Streaming企业级能力增强

总条数： 5385

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

Flink DataStream应用开发思路 - MapReduce服务 MRS

设置HBase和HDFS的句柄数限制 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

配置Hive Python样例工程 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

配置HDFS多路读 - MapReduce服务 MRS

查看Flume客户端日志 - MapReduce服务 MRS

查看Flume客户端日志 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

数据保护技术 - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

HDFS支持集群掉电自动恢复 - MapReduce服务 MRS

OpenTSDB HTTP API接口介绍 - MapReduce服务 MRS

HDFS应用开发常用概念 - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

配置Kafka后进先出 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线