搜索_华为云

配置HetuEngine对接MemArtsCC - MapReduce服务 MRS

到降低OBS服务端带宽的作用，利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升HetuEngine的数据读取效率。前提条件 Guardian服务正常，且已开启存算分离，具体请参考配置Guardian服务对接OBS。已完成HetuEngine对接OBS，具体请

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC
Flink作业大小表Join能力增强 - MapReduce服务 MRS

BROADCAST(smallTable1, smallTable2) */”方式使用该特性，兼容开源双流Join逻辑。不支持开源双流Join和该特性的切换，因为该特性会将数据广播到每个Join算子。不支持LEFT JOIN时小表为左表，RIGHT JOIN时小表为右表。 Flink作业大小表Join去重

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
快速使用HBase进行离线数据分析 - MapReduce服务 MRS

使用客户端。操作步骤在主管理节点使用客户端。安装客户端，具体请参考安装客户端章节。以客户端安装用户登录客户端安装节点，执行以下命令切换到客户端目录。 cd /opt/client 执行以下命令配置环境变量。 source bigdata_env 如果当前集群已启用Kerb

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase
Flink作业引擎概述 - MapReduce服务 MRS

务信息。数据表管理，定义Sql访问的数据表信息，用于生成DDL语句。 FlinkSQL作业定义，根据用户输入的Sql，校验、解析、优化、转换成Flink作业并提交运行。 Flink作业可视化管理支持可视化定义流作业和批作业。支持作业资源、故障恢复策略、Checkpoint策略可视化配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
Flink作业引擎概述 - MapReduce服务 MRS

务信息。数据表管理，定义Sql访问的数据表信息，用于生成DDL语句。 FlinkSQL作业定义，根据用户输入的Sql，校验、解析、优化、转换成Flink作业并提交运行。 Flink作业可视化管理支持可视化定义流作业和批作业。支持作业资源、故障恢复策略、Checkpoint策略可视化配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
CarbonData数据类型概述 - MapReduce服务 MRS

型。 String 100000字符说明：如果在CREATE TABLE中使用Char或Varchar数据类型，则这两种数据类型将自动转换为String数据类型。如果存在字符长度超过32000的列，需要在建表时，将该列加入到tblproperties的LONG_STRING_COLUMNS属性里。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData
HDFS客户端使用实践 - MapReduce服务 MRS

通模式不涉及）使用HDFS客户端安装客户端，详细操作请参考使用MRS客户端。以客户端安装用户，登录安装客户端的节点。执行以下命令，切换到客户端安装目录。 cd /opt/client 执行以下命令配置环境变量。 source bigdata_env 如果集群为安全模式，执

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
ALM-14002 DataNode磁盘空间使用率超过阈值 - MapReduce服务 MRS

数据倾斜，需要均衡集群中的数据。以root用户登录MRS客户端，用户密码为安装前用户自定义，请咨询系统管理员。如果集群为普通模式，执行su - omm切换到omm用户。执行cd命令进入客户端安装目录，然后执行source bigdata_env。如果集群采用安全版本，要进行安全认证。执行kinit

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Alluxio应用开发简介 - MapReduce服务 MRS

到许多存储系统。 Alluxio主要特点如下：提供内存级I/O 吞吐率，同时降低具有弹性扩张特性的数据驱动型应用的成本开销简化云存储和对象存储接入简化数据管理，提供对多数据源的单点访问应用程序部署简易 Alluxio 接口开发简介 Alluxio支持使用Java进行程序开

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Alluxio开发指南 > Alluxio应用开发概述
配置在Spark对接MemArtsCC - MapReduce服务 MRS

群，可以起到降低OBS服务端带宽的作用，利用MemArtsCC的本地存储，访问热点数据不必跨网络，可以提升Spark的数据读取效率。前提条件 Guardian服务正常，且已开启存算分离，具体请参考配置Guardian服务对接OBS。已完成Spark对接OBS，具体请参考配置S

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用MemArtsCC
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
配置Yarn大作业扫描 - MapReduce服务 MRS

park等作业的本地临时文件（例如shuffle文件是否过大）、监控Hive、HetuEngine、Spark的关键HDFS目录（不支持OBS）是否过大。对于占用存储资源（本地磁盘或者关键HDFS目录）过大的作业上报事件。本章节内容仅适用于MRS 3.5.0及之后版本。监控的HDFS目录请参见表1。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn运维管理
Hive客户端使用实践 - MapReduce服务 MRS

要下载keytab文件。“人机”用户第一次登录时需修改密码。使用Hive客户端以客户端安装用户，登录安装客户端的节点。执行以下命令，切换到客户端安装目录。 cd /opt/hadoopclient 执行以下命令配置环境变量。 source bigdata_env 根据集群认证模式，完成Hive客户端登录。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
查看MRS集群告警 - MapReduce服务 MRS

检查集群情况并恢复。严重指集群部分功能不可用的告警，包括进程故障、周期备份任务失败、关键文件权限异常等，需要根据告警及时检查报告告警的对象并恢复。一般指不影响当前集群主要功能的告警，包括证书文件即将过期、审计日志转储失败、License文件即将过期等告警。提示指级别最

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件
创建Impala表 - MapReduce服务 MRS
创建Impala表 - MapReduce服务 MRS

Impala使用OBS存储。需要在集群管理页面MRS Manager里面设置指定的参数到core-site.xml，AK/SK可登录“OBS控制台”，进入“我的凭证”页面获取。 fs.obs.access.key=AK; fs.obs.secret.key=SK; fs.obs.endpoint=endpoint;

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

@volatile private var endTime: Long = 0L @volatile private var numRecs: Long = 0L override def onQueryStarted(event: StreamingQueryListener

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
PMS进程占用内存高 - MapReduce服务 MRS

导致长连接占用大量的内存不释放。 PMS是MRS的监控进程，此进程会经常创建表分区或者新表，由于PostgreSQL会缓存当前会话访问过的对象的元数据，且PMS的数据库连接池连接会长时间存在，所以连接占用的内存会逐渐上升。处理步骤以root用户登录主Master节点。执行如下命令查询PMS进程号。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率操作场景 HBase BulkLoad批量加载功能采用了MapReduce jobs直接生成符合HBase内部数据格式的文件，然后把生成的StoreFiles文件加载到正在运行的集群。使用批量加载相比直接使用HBase的API会节约更多的CPU和网络资源。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优

总条数： 4073

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置HetuEngine对接MemArtsCC - MapReduce服务 MRS

Flink作业大小表Join能力增强 - MapReduce服务 MRS

快速使用HBase进行离线数据分析 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

CarbonData数据类型概述 - MapReduce服务 MRS

HDFS客户端使用实践 - MapReduce服务 MRS

ALM-14002 DataNode磁盘空间使用率超过阈值 - MapReduce服务 MRS

Alluxio应用开发简介 - MapReduce服务 MRS

配置在Spark对接MemArtsCC - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

配置Yarn大作业扫描 - MapReduce服务 MRS

Hive客户端使用实践 - MapReduce服务 MRS

查看MRS集群告警 - MapReduce服务 MRS

创建Impala表 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序（Scala） - MapReduce服务 MRS

PMS进程占用内存高 - MapReduce服务 MRS

提升HBase BulkLoad工具批量加载效率 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线