搜索_华为云

配置矢量化读取ORC数据 - MapReduce服务 MRS

ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每一个行组内按列进行存储，并且文件中的数据尽可能的压缩来降低存储空间的消耗

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每一个行组内按列进行存储，并且文件中的数据尽可能的压缩来降低存储空间的消耗

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
HDFS应用开发常用概念 - MapReduce服务 MRS

同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发概述
检测Yarn内存使用情况 - MapReduce服务 MRS

配置场景针对所提交应用的内存使用无法预估的情况，可以通过修改服务端的配置项控制是否对内存使用进行检测。若不检测内存使用，Container会占用内存直到内存溢出；若检测内存使用，当内存使用超过配置的内存大小时，相应的Container会被kill掉。配置描述参考修改集群服务配置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn运维管理
检测Yarn内存使用情况 - MapReduce服务 MRS

配置场景针对所提交应用的内存使用无法预估的情况，可以通过修改服务端的配置项控制是否对内存使用进行检测。如果不检测内存使用，Container会占用内存直到内存溢出；如果检测内存使用，当内存使用超过配置的内存大小时，相应的Container会被kill掉。配置描述参考修改集群服务配

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
迁移Kafka节点内数据 - MapReduce服务 MRS

于kafkaadmin组，普通模式不需要）。已安装Kafka客户端。 Kafka实例状态和磁盘状态均正常。根据待迁移分区当前的磁盘空间占用情况，评估迁移后，不会导致新迁移后的磁盘空间不足。使用Kafka客户端迁移数据以客户端安装用户，登录已安装Kafka客户端的节点。执

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
Yarn汇聚日志过大导致节点磁盘被占满 - MapReduce服务 MRS

Yarn WebUI界面上显示只有少量任务在运行。登录到集群的Master节点执行hdfs dfs -du -h / 命令发现如下文件占用大量磁盘空间。 Mapreduce服务的汇聚日志配置参数如下：原因分析客户提交任务的操作过于频繁，且聚合后的日志文件被删除的时间配置为

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Yarn
ALM-24009 Flume Server垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-24009 Flume Server垃圾回收(GC)时间超过阈值告警解释系统每60秒周期性检测Flume进程的垃圾回收（GC）占用时间，当连续5次检测到Flume进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
如何调整MRS集群manager-executor进程内存？ - MapReduce服务 MRS

告警信息上报、集群创扩缩等操作。当客户从MRS管控面提交作业，随着任务量的增大或者任务并发较高，有可能会导致Executor内存不足，导致占用CPU较高、Executor进程OOM等问题。解决步骤通过root用户登录Master1或Master2其中任意一节点，执行以下命令切换到omm用户。

帮助中心 > MapReduce服务 MRS > 常见问题 > 性能优化类
迁移Kafka节点内数据 - MapReduce服务 MRS

于kafkaadmin组，普通模式不需要）。已安装Kafka客户端。 Kafka实例状态和磁盘状态均正常。根据待迁移分区当前的磁盘空间占用情况，评估迁移后，不会导致新迁移后的磁盘空间不足。使用Kafka客户端迁移数据以客户端安装用户，登录已安装Kafka客户端的节点。执

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka运维管理
如何使用IDEA远程调试业务 - MapReduce服务 MRS

数Host和Port，如下图所示。其中Host为获取的Worker运行的主机IP地址，Port为调试的端口号（确保该端口在运行机器上没被占用）。图3 配置参数当改变Port端口号时，在WORKER_GC_OPTS中追加的调试参数也要跟着改变，比如Port设置为8011，对应的调试参数则变更为-Xdebug

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > Storm应用开发常见问题
ALM-45284 UserSync垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-45284 UserSync垃圾回收(GC)时间超过阈值告警解释系统每60秒周期性检测UserSync进程的垃圾回收（GC）占用时间，当连续5次检测到UserSync进程的垃圾回收（GC）时间超出阈值（默认12秒）时，产生该告警。垃圾回收（GC）时间小于阈值时，告警恢复。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-16009 Map数超过阈值 - MapReduce服务 MRS

产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响 Hive执行的HQL的Map数过高，将占用大量Yarn队列资源，可能导致任务耗时较长，并且影响其他使用此队列运行的任务。可能原因执行的HQL语句存在可以优化的可能。处理步骤检查HQL的Map个数。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
HDFS与其他组件的关系 - MapReduce服务 MRS

子项目，HBase利用Hadoop HDFS作为其文件存储系统。HBase位于结构化存储层，Hadoop HDFS为HBase提供了高可靠性的底层存储支持。除了HBase产生的一些日志文件，HBase中的所有数据文件都可以存储在Hadoop HDFS文件系统上。 HDFS和MapReduce的关系

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
CarbonData数据类型概述 - MapReduce服务 MRS

CarbonData数据类型概述简介 CarbonData中的数据存储在table实体中。CarbonData table与RDBMS中的表类似。RDBMS数据存储在由行和列构成的表中。CarbonData table存储的也是结构化的数据，拥有固定列和数据类型。支持数据类型 CarbonData支持以下数据类型：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
CarbonData数据类型概述 - MapReduce服务 MRS

CarbonData数据类型概述简介 CarbonData中的数据存储在table实体中。CarbonData table与RDBMS中的表类似。RDBMS数据存储在由行和列构成的表中。CarbonData table存储的也是结构化的数据，拥有固定列和数据类型。支持数据类型 CarbonData支持以下数据类型：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData
HDFS应用开发简介 - MapReduce服务 MRS

同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，大大降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式）
添加MRS子租户 - MapReduce服务 MRS

为当前租户选择存储资源。选择“HDFS”时，系统将自动在HDFS父租户目录中，以子租户名称创建文件夹。不选择“HDFS”时，系统不会在HDFS中创建存储目录。如果父租户未选择存储资源，子租户也无法使用存储资源。存储空间配额 (MB) 500MB 配置当前租户使用的HDFS存储空间配额。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户
通过HSBroker的用户名密码认证实现查询HetuEngine SQL任务 - MapReduce服务 MRS

void init() throws ClassNotFoundException { // 认证用的密码写入代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全; // 本示例以密码保存在环境变量中来实现身份

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 开发HetuEngine应用 > HetuEngine样例程序（Java）
通过HSFabric的用户名密码认证实现查询HetuEngine SQL任务 - MapReduce服务 MRS

void init() throws ClassNotFoundException { // 认证用的密码写入代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全; // 本示例以密码保存在环境变量中来实现身份

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 开发HetuEngine应用 > HetuEngine样例程序（Java）

总条数： 1188

上一页
1
...
10
11
12
...
60
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

HDFS应用开发常用概念 - MapReduce服务 MRS

检测Yarn内存使用情况 - MapReduce服务 MRS

检测Yarn内存使用情况 - MapReduce服务 MRS

迁移Kafka节点内数据 - MapReduce服务 MRS

Yarn汇聚日志过大导致节点磁盘被占满 - MapReduce服务 MRS

ALM-24009 Flume Server垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

如何调整MRS集群manager-executor进程内存？ - MapReduce服务 MRS

迁移Kafka节点内数据 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

ALM-45284 UserSync垃圾回收(GC)时间超过阈值 - MapReduce服务 MRS

ALM-16009 Map数超过阈值 - MapReduce服务 MRS

HDFS与其他组件的关系 - MapReduce服务 MRS

CarbonData数据类型概述 - MapReduce服务 MRS

CarbonData数据类型概述 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

添加MRS子租户 - MapReduce服务 MRS

通过HSBroker的用户名密码认证实现查询HetuEngine SQL任务 - MapReduce服务 MRS

通过HSFabric的用户名密码认证实现查询HetuEngine SQL任务 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线