搜索_华为云

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

进入hbase shell，创建表ImportTable并创建“configuration.xml”文件（该文件可以参考模板文件进行编辑，模板文件获取路径为：“/opt/client/HBase/hbase/conf/import.xml.template”）。例如执行以下命令建表： create

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
Flume业务模型配置说明 - MapReduce服务 MRS

高可靠性场景。 Load Balancing：表示在Sink Group中所有Sink都处于活跃状态，每个Sink都会从Channel中去获取数据并进行处理，并且保证在运行过程中该Sink Group的所有Sink的负载是均衡的，多用于性能提升场景。 Load Balancing配置样例：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
CarbonData调优思路 - MapReduce服务 MRS

效率较低。内存调优 CarbonData为内存调优提供了一个机制，其中数据加载会依赖于查询中需要的列。不论何时，接收到一个查询命令，将会获取到该查询中的列，并确保内存中这些列有数据加载。在该操作期间，如果达到内存的阈值，为了给查询需要的列提供内存空间，最少使用加载级别的文件将会被删除。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置Kafka数据均衡工具 - MapReduce服务 MRS

管理IP地址以及对应的“broker.id”，该值可通过单击角色名称，在“实例配置”页面中选择“全部配置”，搜索“broker.id”参数获取。以root用户登录记录的管理IP地址，并执行df -lh命令，查看磁盘占用率为100%的挂载目录，例如“${BIGDATA_DATA_HOME}/kafka/data1”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka企业级能力增强
Flume业务配置指南 - MapReduce服务 MRS

排除的协议列表，用空格分开。默认排除SSLv3协议。 ipFilter false 是否开启ip过滤。 ipFilter.rules - 定义N网络的ipFilters，多个主机或IP地址用逗号分隔。ipFilter设置为“true”时，配置规则有允许和禁止两种，配置格式如下： ipF

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
MRS集群数据备份恢复简介 - MapReduce服务 MRS

MS、DBService和NameNode等的数据保存到外部集群。集群数据的备份任务运行时长可根据要备份的数据量除以集群与备份设备之间的网络带宽来计算得出，在实际场景中，建议将计算得出的时长乘以1.5作为任务执行时长参考值。执行数据备份任务会对集群的最大IO性能产生影响，建议备份任务运行时间与集群业务高峰错开。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据
使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

进入hbase shell，创建表ImportTable并创建“configuration.xml”文件（该文件可以参考模板文件进行编辑，模板文件获取路径为：“/opt/client/HBase/hbase/conf/import.xml.template”）。例如执行以下命令建表： create

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
在集群外节点连接开启Kerberos认证的集群，HTTP在Kerberos数据库中无法找到相应的记录 - MapReduce服务 MRS

java:239) ... 3 more 回答客户端拼接出的HTTP的principal与Kerberos数据库中的不一致（报错1）或获取的token无法链接Presto。在集群上执行cat /etc/hosts，将Presto coordinator的IP和hostnam

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > Presto应用开发常见问题
Spark Python API接口介绍 - MapReduce服务 MRS

SQL功能和DataFrame的主入口。 pyspark.sql.DataFrame：是一个以命名列方式组织的分布式数据集。 pyspark.sql.HiveContext：获取存储在Hive中数据的主入口。 pyspark.sql.DataFrameStatFunctions：统计功能中一些函数。 pyspark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
更新客户端（3.x之前版本） - MapReduce服务 MRS

cp /tmp/MRS-client/MRS_Services_Client.tar /opt 在“/opt”目录执行以下命令，解压压缩包获取校验文件与客户端配置包。 tar -xvf MRS_Services_Client.tar 执行以下命令，校验文件包。 sha256sum

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

<kafkaProtocol> <kafkaService> <kafkaDomain>。 <kafkaBootstrapServers>指获取元数据的Kafka地址。 <maxEventDelay>指数据从生成到被流处理引擎的最大延迟时间。 <reqTopic>指请求事件的topic名称。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
配置Hive业务使用其他组件的用户权限 - MapReduce服务 MRS

具体操作可参考添加Hive的Ranger访问权限策略。前提条件完成Hive客户端的安装。例如安装目录为“/opt/client”。获取一个拥有管理员权限的用户，例如“admin”。操作步骤 MRS 3.x之前版本，Hive关联Yarn 用户如果执行insert，count，distinct，group

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive用户权限管理
Spark Scala API接口介绍 - MapReduce服务 MRS

SQLContext：是Spark SQL功能和DataFrame的主入口。 DataFrame：是一个以命名列方式组织的分布式数据集。 HiveContext：获取存储在Hive中数据的主入口。表6 常用的Actions方法方法说明 collect(): Array[Row] 返回一个数组，包含DataFrame的所有列。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark scala API接口介绍 - MapReduce服务 MRS

SQLContext：是Spark SQL功能和DataFrame的主入口。 DataFrame：是一个以命名列方式组织的分布式数据集。 HiveContext：获取存储在Hive中数据的主入口。表6 常用的Actions方法方法说明 collect(): Array[Row] 返回一个数组，包含DataFrame的所有列。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

<kafkaProtocol> <kafkaService> <kafkaDomain>，其中<kafkaBootstrapServers>指获取元数据的Kafka地址（需使用21007端口），<maxEventDelay>指数据从生成到被流处理引擎的最大延迟时间，<reqTopic

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
HBase基本原理 - MapReduce服务 MRS
HBase基本原理 - MapReduce服务 MRS

Client会在内存中缓存“hbase:meta”和用户表Region的信息，当应用程序发起下一次数据操作时，HBase Client会首先从内存中获取这些信息；当未在内存缓存中找到对应数据信息时，HBase Client会重复上述操作。父主题： HBase

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HBase
配置Kafka数据均衡工具 - MapReduce服务 MRS

管理IP地址以及对应的“broker.id”，该值可通过单击角色名称，在“实例配置”页面中选择“全部配置”，搜索“broker.id”参数获取。以root用户登录记录的管理IP地址，并执行df -lh命令，查看磁盘占用率为100%的挂载目录，例如“${BIGDATA_DATA_HOME}/kafka/data1”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka企业级能力增强
在Linux环境中调测HBase应用 - MapReduce服务 MRS

查看Linux调测结果 HBase应用程序运行完成后可通过如下方式查看应用程序的运行情况。通过运行结果查看应用程序运行情况。通过HBase日志获取应用程序运行情况。登录HBase WebUI查看应用程序运行情况。可参见“更多信息 > 对外接口 > Web UI ”。通过HBase

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 调测HBase应用

总条数： 2018

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

Flume业务模型配置说明 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

配置Kafka数据均衡工具 - MapReduce服务 MRS

Flume业务配置指南 - MapReduce服务 MRS

MRS集群数据备份恢复简介 - MapReduce服务 MRS

使用BulkLoad工具批量导入HBase数据 - MapReduce服务 MRS

在集群外节点连接开启Kerberos认证的集群，HTTP在Kerberos数据库中无法找到相应的记录 - MapReduce服务 MRS

Spark Python API接口介绍 - MapReduce服务 MRS

更新客户端（3.x之前版本） - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

配置Hive业务使用其他组件的用户权限 - MapReduce服务 MRS

Spark Scala API接口介绍 - MapReduce服务 MRS

Spark scala API接口介绍 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

HBase基本原理 - MapReduce服务 MRS

配置Kafka数据均衡工具 - MapReduce服务 MRS

在Linux环境中调测HBase应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线