搜索_华为云

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。本章节提供从零开始使用HBase的操作指导，通过客户端实现创建表，往表中插入数据，修改表，读取表数据，删除表中数据以及删除表的功能。背景信息假定用户开发一个应用程序，用于管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
ALM-14007 HDFS NameNode内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-14007 HDFS NameNode内存使用率超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测HDFS NameNode内存使用率，并把实际的HDFS NameNode内存使用率和阈值相比较。HDFS NameNode内存使用率指标默认提供一个阈值范围。当HDFS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-14008 HDFS DataNode内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-14008 HDFS DataNode内存使用率超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测HDFS DataNode内存使用率，并把实际的HDFS DataNode内存使用率和阈值相比较。HDFS DataNode内存使用率指标默认提供一个阈值范围。当HDFS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
查看Flink应用调测结果 - MapReduce服务 MRS

查看Flink应用调测结果操作场景 Flink应用程序运行完成后，您可以查看运行结果数据，也可以通过Flink WebUI查看应用程序运行情况。操作步骤查看Flink应用运行结果数据。当用户查看执行结果时，需要在Flink的web页面上查看Task Manager的Stdout日志。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 调测Flink应用
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率操作场景在Hive中执行多表Join时，Hive支持开启CBO（Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 Structured Streaming支持的功能支持对流式数据的ETL操作。支持流式DataFrames或Datasets的schema推断和分区。流式DataFrames或Datasets上的操作：包括无类型，类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 Structured Streaming支持的功能支持对流式数据的ETL操作。支持流式DataFrames或Datasets的schema推断和分区。流式DataFrames或Datasets上的操作：包括无类型，类

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 Structured Streaming支持的功能支持对流式数据的ETL操作。支持流式DataFrames或Datasets的schema推断和分区。流式DataFrames或Datasets上的操作：包括无类型，类

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
HDFS客户端常见命令说明 - MapReduce服务 MRS

HDFS客户端常见命令说明操作场景您可以使用HDFS Shell命令对HDFS文件系统进行操作，例如读文件、写文件等操作。执行HDFS Shell命令安装客户端，具体请参考使用MRS客户端章节。以客户端安装用户，登录安装客户端的节点。执行以下命令，切换到客户端安装目录

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
Ranger基本原理 - MapReduce服务 MRS

Ranger基本原理 Apache Ranger提供一个集中式安全管理框架，提供统一授权和统一审计能力。它可以对整个Hadoop生态中如HDFS、Hive、HBase、Kafka、Storm等进行细粒度的数据访问控制。用户可以利用Ranger提供的前端WebUI控制台通过配置相关策略来控制用户对这些组件的访问权限

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Ranger
ALM-14025 租户文件对象使用率超过阈值 - MapReduce服务 MRS

ALM-14025 租户文件对象使用率超过阈值告警解释系统每小时周期性检测租户所关联的每个目录的文件对象使用率（每个目录已使用的文件对象个数/每个目录分配的文件对象个数），并把每个目录实际的文件对象使用率和该目录设置的阈值相比较。当检测到租户所关联的目录文件对象使用率高于该目录的阈值时，产生该告警。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Flink Kafka样例程序开发思路 - MapReduce服务 MRS

Flink Kafka样例程序开发思路场景说明假定某个Flink业务每秒就会收到1个消息记录。基于某些业务要求，开发的Flink应用程序实现功能：实时输出带有前缀的消息内容。数据规划 Flink样例工程的数据存储在Kafka组件中。向Kafka组件发送数据（需要有Kafk

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink Kafka样例程序
快速使用Flume采集节点日志 - MapReduce服务 MRS

快速使用Flume采集节点日志 Flume支持将采集的日志信息导入到Kafka。前提条件已创建开启Kerberos认证的包含Flume、Kafka等组件的流式集群。可参考购买自定义集群。已配置网络，使日志生成节点与流集群互通。使用Flume客户端普通集群不需要执行2-6。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用场景说明用户可以在Spark应用程序中使用HBaseContext的方式去使用HBase，将要插入的数据的rowKey构造成rdd，然后通过HBaseContext的bulkLoad接口将rdd写入HFile中。将生成的HFile导入HBase表的操作

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Oozie on Hue - MapReduce服务 MRS
Oozie on Hue - MapReduce服务 MRS

Oozie on Hue Hue提供了Oozie作业管理器功能，使用户可以通过界面图形化的方式使用Oozie。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本） > 使用Hue WebUI典型场景
使用Hadoop客户端删除OBS上数据时报.Trash目录没有权限错误 - MapReduce服务 MRS

使用Hadoop客户端删除OBS上数据时报.Trash目录没有权限错误问题描述执行hadoop fs -rm obs://<obs_path>出现如下报错： exception [java.nio.file.AccessDeniedException: user/root/.Trash/Current/:

帮助中心 > MapReduce服务 MRS > 故障排除 > 存算分离类
配置NameNode内存参数 - MapReduce服务 MRS

配置NameNode内存参数配置场景在HDFS中，每个文件对象都需要在NameNode中注册相应的信息，并占用一定的存储空间。随着文件数的增加，当原有的内存空间无法存储相应的信息时，需要修改内存大小的设置。配置描述参数入口：请参考修改集群服务配置参数，进入HDFS“全部配置”页面。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS

总条数： 1931

上一页
1
...
83
84
85
...
97
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

ALM-14007 HDFS NameNode内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-14008 HDFS DataNode内存使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

查看Flink应用调测结果 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

HDFS客户端常见命令说明 - MapReduce服务 MRS

Ranger基本原理 - MapReduce服务 MRS

ALM-14025 租户文件对象使用率超过阈值 - MapReduce服务 MRS

Flink Kafka样例程序开发思路 - MapReduce服务 MRS

快速使用Flume采集节点日志 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

BulkLoad接口使用 - MapReduce服务 MRS

Oozie on Hue - MapReduce服务 MRS

使用Hadoop客户端删除OBS上数据时报.Trash目录没有权限错误 - MapReduce服务 MRS

配置NameNode内存参数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线