搜索_华为云

修改MRS集群组件运行用户密码 - MapReduce服务 MRS

用户类型为“人机”用户，密码修改完成，任务结束。登录FusionInsight Manager。单击主页上的或者“更多”，单击“重启”，重启集群。在弹出窗口中，输入当前登录的用户密码确认身份，单击“确定”。在确认重启的对话框中，单击“确定”。等待界面提示重启成功。修改MRS集群组件运行用户密码（MRS

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > 修改MRS集群系统用户密码
导入并配置HetuEngine Python3样例工程 - MapReduce服务 MRS

org/project/setuptools/#files。将下载的setuptools压缩文件复制到客户端机器上，解压后进入setuptools项目目录，在客户端机器的命令行终端执行python3 setup.py install。以47.3.1版本为例，如下内容表示安装setuptools的47

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（安全模式） > 准备HetuEngine应用开发环境
将Hudi表数据同步到Hive - MapReduce服务 MRS

将Hudi表数据同步到Hive 通过执行run_hive_sync_tool.sh可以将Hudi表数据同步到Hive中。例如：需要将HDFS上目录为hdfs://hacluster/tmp/huditest/hudimor1_deltastreamer_partition的Hudi表同步为Hive表，表名为table

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
将Hudi表数据同步到Hive - MapReduce服务 MRS

将Hudi表数据同步到Hive 通过执行run_hive_sync_tool.sh可以将Hudi表数据同步到Hive中。例如：需要将HDFS上目录为hdfs://hacluster/tmp/huditest/hudimor1_deltastreamer_partition的Hudi表同步为Hive表，表名为table

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
ALM-38001 Kafka磁盘容量不足（2.x及以前版本） - MapReduce服务 MRS

达到使用率上限。处理步骤登录MRS集群详情页面，选择“告警管理”。在告警列表中单击该告警，从“告警详情”的“定位信息”中获得HostName（主机名称）和PartitionName（磁盘分区名称）。在“主机管理”页面，单击2中获取的主机名称。检查“磁盘”区域中是否包含该告警中的磁盘分区名称。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
CarbonData表空间索引语法说明 - MapReduce服务 MRS

数据由二维空间中的点的集合组成。点可以存储为一对经纬度。区域数据：一个区域有空间范围，有位置和边界。位置可以看作是一个定点在区域内的位置，例如它的质心。在二维中，边界可以可视化为一条线（有限区域，闭环）。区域数据包含一系列区域。目前仅限于支持点数据，存储点数据。经纬度可以编

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
CarbonData表空间索引语法说明 - MapReduce服务 MRS

数据由二维空间中的点的集合组成。点可以存储为一对经纬度。区域数据：一个区域有空间范围，有位置和边界。位置可以看作是一个定点在区域内的位置，例如它的质心。在二维中，边界可以可视化为一条线（有限区域，闭环）。区域数据包含一系列区域。目前仅限于支持点数据，存储点数据。经纬度可以编

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考
HDFS文件系统目录简介 - MapReduce服务 MRS

System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件之后的添加操作。HDFS保证一个文件在一个时刻只被一个调用者执行写操作，而可以被多个调用者执行读操作。 HDFS文件系统中目录结构如下表所示。表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
数据表报错Too many parts解决方法 - MapReduce服务 MRS

Zookeeper异常导致merge无法正常执行。登录Manager页面，检查ZooKeeper是否存在服务不可用、ClickHouse服务在ZooKeeper的数量配额使用率超过阈值等相关告警，如果存在，请按照告警指导处理。执行如下SQL排查是否存在副本同步队列任务积压： select

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse性能调优
Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

根据table1表数据的key值去table2表做查询。把前两步相应的数据记录做相加操作。把上一步骤的结果写到table2表。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中编包并运行Spark程序。将打包生成的jar包上传到Spark客户端所在服务器的任意目录（例如“

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

问题解决YARN开源原生界面作业占用队列资源百分比不显示问题解决YARN开源原生界面查看作业日志时显示不全的问题解决Hive作业在HDFS上临时文件残留问题解决开源Sqoop 1.4.7版本对接MRS Hive服务兼容性问题解决Hive on MR查询Avro表失败问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
ClickHouse数据表分区过多调优 - MapReduce服务 MRS

Zookeeper异常导致merge无法正常执行。登录Manager页面，检查ZooKeeper是否存在服务不可用、ClickHouse服务在ZooKeeper的数量配额使用率超过阈值等相关告警，如果存在，请按照告警指导处理。执行如下SQL排查是否存在副本同步队列任务积压： select

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse性能调优
创建CarbonData Table的建议 - MapReduce服务 MRS

例如80%以上的场景使用此列过滤。针对此类场景，调优方法如下：将常用于过滤的列放在sort_columns第一列。例如，msname作为过滤条件在查询中使用的最多，则将其放在第一列。创建表的命令如下，其中采用msname作为过滤条件的查询性能将会很好。 create table carbondata_table(

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
配置MRS集群告警阈值 - MapReduce服务 MRS

集群配额 Clickhouse服务在ZooKeeper的数量配额使用率 ClickHouse服务在ZooKeeper上目录的数量配额使用百分比。 90% Clickhouse服务在ZooKeeper的容量配额使用率 ClickHouse服务在ZooKeeper上目录的容量配额使用百分比。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看与配置MRS告警事件
创建高查询性能的CarbonData表 - MapReduce服务 MRS

例如80%以上的场景使用此列过滤。针对此类场景，调优方法如下：将常用于过滤的列放在sort_columns第一列。例如，msname作为过滤条件在查询中使用的最多，则将其放在第一列。创建表的命令如下，其中采用msname作为过滤条件的查询性能将会很好。 create table carbondata_table(

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
Spark REST API接口介绍 - MapReduce服务 MRS

html#rest-api。准备运行环境安装客户端。在节点上安装客户端，如安装到“/opt/client”目录。 REST接口通过以下命令可跳过REST接口过滤器获取相应的应用信息。普通模式下，JobHistory仅支持http协议，故在如下命令的url中请使用http协议。获取JobHistory中所有应用信息：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Yarn节点配置调优 - MapReduce服务 MRS

高，可以配置为2倍的逻辑CPU。参数描述默认值 yarn.nodemanager.resource.cpu-vcores 表示该节点上YARN可使用的虚拟CPU个数，默认是8。目前推荐将该值设置为逻辑CPU核数的1.5～2倍之间。 8 物理CPU使用百分比建议预留适量的

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
FlinkServer作业对接Hive表 - MapReduce服务 MRS

WebUI界面。新建集群连接，如：flink_hive。选择“系统管理 > 集群连接管理”，进入集群连接管理页面。单击“创建集群连接”，在弹出的页面中参考表1填写信息，单击“测试”，测试连接成功后单击“确定”，完成集群连接创建。表1 创建集群连接信息参数名称参数描述取值样例

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
快速使用Hadoop - MapReduce服务 MRS

提交wordcount作业。在MRS控制台选择“作业管理”页签，单击“添加”，进入“添加作业”页面，具体请参见运行MapReduce作业。图4 wordcount作业作业类型选择“MapReduce”。作业名称为“mr_01”。执行程序路径配置为OBS上存放程序的地址。例如：o

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
创建CarbonData表 - MapReduce服务 MRS

复杂度，则需要排除掉字典编码，该参数为可选参数。说明：在非字典列中，只支持String和Timestamp数据类型。 DICTIONARY_INCLUDE 设置指定列生成字典，适用于数值复杂度低的列，可以提升字典列上的groupby性能，为可选参数。一般情况下，字典列的复杂度不应该高于5万。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x之前版本）

总条数： 2763

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

修改MRS集群组件运行用户密码 - MapReduce服务 MRS

导入并配置HetuEngine Python3样例工程 - MapReduce服务 MRS

将Hudi表数据同步到Hive - MapReduce服务 MRS

将Hudi表数据同步到Hive - MapReduce服务 MRS

ALM-38001 Kafka磁盘容量不足（2.x及以前版本） - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

HDFS文件系统目录简介 - MapReduce服务 MRS

数据表报错Too many parts解决方法 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

MRS 3.0.5.1补丁说明 - MapReduce服务 MRS

ClickHouse数据表分区过多调优 - MapReduce服务 MRS

创建CarbonData Table的建议 - MapReduce服务 MRS

配置MRS集群告警阈值 - MapReduce服务 MRS

创建高查询性能的CarbonData表 - MapReduce服务 MRS

Spark REST API接口介绍 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

FlinkServer作业对接Hive表 - MapReduce服务 MRS

快速使用Hadoop - MapReduce服务 MRS

创建CarbonData表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线