华为云用户手册

MapReduce服务 MRS-Loader连接配置说明:关系型数据库连接

关系型数据库连接关系型数据库连接是Loader与关系型数据库进行数据交换的通道，配置参数如表2所示。部分参数需要单击“显示高级属性”后展开，否则默认隐藏。表2 generic-jdbc-connector配置参数说明名称指定一个Loader连接的名称。数据库类型表示Loader连接支持的数据，可以选择“ORACLE”、“MYSQL”和“MPPDB”。数据库服务器表示数据库的访问地址，可以是IP地址或者域名。端口表示数据库的访问端口。数据库名称表示保存数据的具体数据库名。用户名表示连接数据库使用的用户名称。密码表示此用户对应的密码。需要与实际密码保持一致。

MapReduce服务 MRS
MapReduce服务 MRS-快速使用Hive进行数据分析:背景信息

背景信息假定用户开发一个应用程序，用于管理企业中的使用A业务的用户信息，使用Hive客户端实现A业务操作流程如下：普通表的操作：创建用户信息表user_info。在用户信息中新增用户的学历、职称信息。根据用户编号查询用户姓名和地址。 A业务结束后，删除用户信息表。表1 用户信息编号姓名性别年龄地址 12005000201 A 男 19 A城市 12005000202 B 女 23 B城市 12005000203 C 男 26 C城市 12005000204 D 男 18 D城市 12005000205 E 女 21 E城市 12005000206 F 男 32 F城市 12005000207 G 女 29 G城市 12005000208 H 女 30 H城市 12005000209 I 男 26 I城市 12005000210 J 女 25 J城市

MapReduce服务 MRS
MapReduce服务 MRS-基于binlog的MySQL数据同步到MRS集群中:配置Maxwell

配置Maxwell 在maxwell-XXX文件夹下若有conf目录则配置config.properties文件，配置项说明请参见表1。若没有conf目录，则是在maxwell-XXX文件夹下将config.properties.example修改成config.properties。表1 Maxwell配置项说明配置项是否必填说明默认值 user 是连接MySQL的用户名，即2中新创建的用户 - password 是连接MySQL的密码，配置文件中包含认证密码信息可能存在安全风险，建议当前场景执行完毕后删除相关配置文件或加强安全管理。 - host 否 MySQL地址 localhost port 否 MySQL端口 3306 log_level 否日志打印级别，可选值为 debug info warn error info output_ddl 否是否发送DDL(数据库与数据表的定义修改)事件 true：发送DDL事件 false：不发送DDL事件 false producer 是生产者类型，配置为kafka stdout：将生成的事件打印在日志中 kafka：将生成的事件发送到kafka stdout producer_partition_by 否分区策略，用来确保相同一类的数据写入到kafka同一分区 database：使用数据库名称做分区，保证同一个数据库的事件写入到kafka同一个分区中 table：使用表名称做分区，保证同一个表的事件写入到kafka同一个分区中 database ignore_producer_error 否是否忽略生产者发送数据失败的错误 true：在日志中打印错误信息并跳过错误的数据，程序继续运行 false：在日志中打印错误信息并终止程序 true metrics_slf4j_interval 否在日志中输出上传kafka成功与失败数据的数量统计的时间间隔，单位为秒 60 kafka.bootstrap.servers 是 kafka代理节点地址，配置形式为HOST:PORT[,HOST:PORT] - kafka_topic 否写入kafka的topic名称 maxwell dead_letter_topic 否当发送某条记录出错时，记录该条出错记录主键的kafka topic - kafka_version 否 Maxwell使用的kafka producer版本号，不能在config.properties中配置，需要在启动命令时用-- kafka_version xxx参数传入 - kafka_partition_hash 否划分kafka topic partition的算法，支持default或murmur3 default kafka_key_format 否 Kafka record的key生成方式，支持array或Hash Hash ddl_kafka_topic 否当output_ddl配置为true时，DDL操作写入的topic {kafka_topic} filter 否过滤数据库或表。若只想采集mydatabase的库，可以配置为 exclude: *.*,include: mydatabase.* 若只想采集mydatabase.mytable的表，可以配置为 exclude: *.*,include: mydatabase.mytable 若只想采集mydatabase库下的mytable，mydate_123, mydate_456表，可以配置为 exclude: *.*,include: mydatabase.mytable, include: mydatabase./mydate_\\d*/ -

MapReduce服务 MRS
MapReduce服务 MRS-基于binlog的MySQL数据同步到MRS集群中:验证Maxwell

验证Maxwell 登录Maxwell所在的服务器。查看日志。如果日志里面没有ERROR日志，且有打印如下日志，表示与MySQL连接正常。 BinlogConnectorLifecycleListener - Binlog connected. 登录MySQL数据库，对测试数据进行更新/创建/删除等操作。操作语句可以参考如下示例。 -- 创建库create database test;-- 创建表create table test.e ( id int(10) not null primary key auto_increment, m double, c timestamp(6), comment varchar(255) charset 'latin1');-- 增加记录insert into test.e set m = 4.2341, c = now(3), comment = 'I am a creature of light.';-- 更新记录update test.e set m = 5.444, c = now(3) where id = 1;-- 删除记录delete from test.e where id = 1;-- 修改表alter table test.e add column torvalds bigint unsigned after m;-- 删除表drop table test.e;-- 删除库drop database test; 观察Maxwell的日志输出，如果没有WARN/ERROR打印，则表示Maxwell安装配置正常。若要确定数据是否成功上传，可设置config.properties中的log_level为debug，则数据上传成功时会立刻打印如下JSON格式数据，具体字段含义请参考Maxwell生成的数据格式及常见字段含义。 {"database":"test","table":"e","type":"insert","ts":1541150929,"xid":60556,"commit":true,"data":{"id":1,"m":4.2341,"c":"2018-11-02 09:28:49.297000","comment":"I am a creature of light."}}…… 当整个流程调试通过之后，可以把config.properties文件中的配置项log_level修改为info，减少日志打印量，并重启Maxwell。 # log level [debug | info | warn | error]log_level=info

MapReduce服务 MRS
MapReduce服务 MRS-基于binlog的MySQL数据同步到MRS集群中:安装Maxwell

安装Maxwell 下载安装包，下载路径为https://github.com/zendesk/maxwell/releases，选择名为maxwell-XXX.tar.gz的二进制文件下载，其中XXX为版本号。将tar.gz包上传到任意目录下（本示例路径为Master节点的/opt）。登录部署Maxwell的服务器，并执行如下命令进入tar.gz包所在目录。 cd /opt 执行如下命令解压“maxwell-XXX.tar.gz”压缩包，并进入“maxwell-XXX”文件夹。 tar -zxvf maxwell-XXX.tar.gz cd maxwell-XXX

MapReduce服务 MRS
MapReduce服务 MRS-基于binlog的MySQL数据同步到MRS集群中:启动Maxwell

启动Maxwell 登录Maxwell所在的服务器。执行如下命令进入Maxwell安装目录。 cd /opt/maxwell-1.21.0/ 如果是初次使用Maxwell，建议将conf/config.properties中的log_level改为debug(调试级别)，以便观察启动之后是否能正常从MySQL获取数据并发送到kafka，当整个流程调试通过之后，再把log_level修改为info，然后先停止再启动Maxwell生效。 # log level [debug | info | warn | error] log_level=debug 执行如下命令启动Maxwell。 source /opt/client/bigdata_env bin/Maxwell bin/maxwell --user='maxwell' --password='XXXXXX' --host='127.0.0.1' \ --producer=kafka --kafka.bootstrap.servers=kafkahost:9092 --kafka_topic=Maxwell 其中，user，password和host分别表示MySQL的用户名，密码和IP地址，这三个参数可以通过修改配置项配置也可以通过上述命令配置，kafkahost为流式集群的Core节点的IP地址。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。显示类似如下信息，表示Maxwell启动成功。 Success to start Maxwell [78092].

MapReduce服务 MRS
MapReduce服务 MRS-基于binlog的MySQL数据同步到MRS集群中:Maxwell生成的数据格式及常见字段含义

Maxwell生成的数据格式及常见字段含义 Maxwell生成的数据格式为JSON，常见字段含义如下： type：操作类型，包含database-create，database-drop，table-create，table-drop，table-alter，insert，update，delete database：操作的数据库名称 ts：操作时间，13位时间戳 table：操作的表名 data：数据增加/删除/修改之后的内容 old：数据修改前的内容或者表修改前的结构定义 sql：DDL操作的SQL语句 def：表创建与表修改的结构定义 xid：事务唯一ID commit：数据增加/删除/修改操作是否已提交

MapReduce服务 MRS
MapReduce服务 MRS-Kafka集群监控管理:查看Consumers信息

查看Consumers信息登录KafkaManager的WebUI界面。在集群列表页面单击对应集群名称进入集群Summary页面。单击“Consumers”查看当前集群的Consumers列表及每个Consumer的消费信息。图5 Consumers列表单击Consumer的名称查看消费的Topic列表。图6 Consumer消费的Topic列表单击Consumer下Topic列表中的Topic名称，查看该Consumer对Topic的具体消费情况。图7 Consumer对Topic的具体消费情况

MapReduce服务 MRS
MapReduce服务 MRS-配置ClickHouse对接OBS源文件:使用S3表函数

使用S3表函数登录主 OMS 节点。执行以下命令获取OBS内的存储数据。 select * from S3(path, [ak, sk,] format, structure, [compression]) path：访问域名/OBS文件路径，登录OBS管理控制台，在左侧导航栏单击“并行文件系统”，在“并行文件系统”页面单击对应的文件系统名称，在“文件”页面单击文件名称，文件“链接”即path路径，如图1所示。图1 文件路径 ak：参数可选，具备访问OBS权限的ak。 sk：参数可选，具备访问OBS权限的sk。 format ：文件的格式。 structure：表的结构。 compression：参数可选，压缩类型。

MapReduce服务 MRS ClickHouse数据导入
MapReduce服务 MRS-读取Hudi数据概述

读取Hudi数据概述 Hudi的读操作，作用于Hudi的三种视图之上，可以根据需求差异选择合适的视图进行查询。 Hudi 支持多种查询引擎Spark和Hive，具体支持矩阵见表1和表2。表1 cow表查询引擎实时视图/读优化视图增量视图 Hive Y Y Spark（SparkSQL） Y Y Spark（SparkDataSource API） Y Y 表2 mor表查询引擎实时视图增量视图读优化视图 Hive Y Y Y Spark（SparkSQL） Y Y Y Spark（SparkDataSource API） Y Y Y 当前Hudi使用Spark datasource接口读取时，不支持分区推断能力。比如bootstrap表使用datasource接口查询时，可能出现分区字段不显示，或者显示为null的情况。增量视图，需设置set hoodie.hudicow.consume.mode = INCREMENTAL;，但该参数仅限于增量视图查询，不能用于Hudi表的其他类型查询，和其他表的查询。恢复配置可设置set hoodie.hudicow.consume.mode = SNAPSHOT;或任意值。父主题： Hudi读操作

MapReduce服务 MRS Hudi读操作
MapReduce服务 MRS-修改Kafka Topic配置:操作场景

操作场景用户可以根据业务需要，使用集群客户端创建Kafka Topic。启用Kerberos认证的集群，需要拥有管理Kafka主题的权限。也可以通过KafkaUI修改Topic Configs。安全模式下，KafkaUI对修改Topic Configs场景，需保证KafkaUI登录用户属于“kafkaadmin”用户组或者单独给用户授予对应操作权限，否则将会鉴权失败。非安全模式下，KafkaUI对所有操作不作鉴权处理。该章节仅适用 MRS 3.x及之后版本。

MapReduce服务 MRS 管理Kafka Topic
MapReduce服务 MRS-管理Storm拓扑:操作步骤

操作步骤访问Storm的WebUI，请参考访问Storm的WebUI。在“Topology summary”区域，单击指定的拓扑名称。通过“Topology actions”管理Storm拓扑。激活拓扑单击“Activate”，转化当前拓扑为激活状态。去激活拓扑单击“Deactivate”，转化当前拓扑为去激活状态。重部署拓扑单击“Rebalance”，将当前拓扑重新部署执行，需要输入执行重部署的等待时间，单位为秒。一般在集群中节点数发生变化时进行，以更好利用集群资源。删除拓扑单击“Kill”，将当前拓扑删除，需要输入执行操作的等待时间，单位为秒。采样、停止采样拓扑消息单击“Debug”，在弹出窗口输入流数据采样消息的数值，单位为百分比，表示从开始采样到停止采样这段时间内所有数据的采集比例。例如输入“10”，则采集比例为10%。如果需要停止采样，则单击“Stop Debug”。只有在提交拓扑时启用采样功能，才支持此功能。查看采样处理数据，请参见查看Storm拓扑日志。修改拓扑日志级别单击“Change Log Level”，可以为Storm日志指定新的日志信息级别。显示拓扑结构图。在“Topology Visualization”区域单击“Show Visualization”，执行拓扑可视化操作。

MapReduce服务 MRS
MapReduce服务 MRS-数据表报错Too many parts解决方法:问题排查步骤

问题排查步骤磁盘或其他存储介质问题导致merge过慢或者中止。登录Manager页面，检查是否存在磁盘容量不足或其他磁盘告警，如果存在，请按照告警指导处理。如果是磁盘容量不足，也可以联系客户删除部分过期数据，释放空间，快速恢复业务。 Zookeeper异常导致merge无法正常执行。登录Manager页面，检查ZooKeeper是否存在服务不可用、ClickHouse服务在ZooKeeper的数量配额使用率超过阈值等相关告警，如果存在，请按照告警指导处理。执行如下SQL排查是否存在副本同步队列任务积压： select FQDN() as node,type,count() from clusterAllReplicas(default_cluster, system.replication_queue) group by node,type; 如果存在积压，请查看副本队列中的任务是否报错，并根据报错信息处理。执行如下SQL排查是否存在节点间表结构不一致。 select FQDN(), create_table_query from clusterAllReplicas(default_cluster,system.tables) where name = '${table_name}' group by FQDN(),create_table_query; 如果存在，请将不一致的表结构修改一致。执行如下SQL排查是否存在mutation任务异常： select FQDN(), database, table, mutation_id, create_time, command from clusterAllReplicas(default_cluster, system.mutations) where is_done = '0' order by create_time asc; 如果mutation任务正常，等待mutation任务完成，如果mutation任务异常，清理异常的mutation任务。业务写入压力过大导致merge速度小于insert速度。可以用以下SQL语句检查报错节点最近一小时的写入条数和频次： select tables,written_rows,count() from system.query_log where type='QueryFinish' and query_start_time between (toUnixTimestamp(now()) - 3600) AND toUnixTimestamp(now()) and query_kind = 'Insert' group by tables,written_rows order by written_rows limit 10; 业务上建议一次写入一个分区，写入频率不要太快，不要小批量数据的插入，适当增大每次插入的时间间隔。如果没有触发Merge，或者Merge较慢，需要调整参数加快Merge。加速Merge，需要调整如下参数，请参考加速Merge操作：配置项参考值 max_threads CPU核数*2 background_pool_size CPU核数 merge_max_block_size 8192的整数倍，根据CPU内存资源大小调整 cleanup_delay_period 适当小于默认值 30

MapReduce服务 MRS ClickHouse性能调优
MapReduce服务 MRS-Oozie on Hue:编辑器使用介绍

编辑器使用介绍访问Hue WebUI，请参考访问Hue WebUI界面。在左侧导航栏单击，然后选择“Workflow”。支持创建Workflow、计划和Bundles的操作。支持提交运行、共享、复制和导出已创建的应用。每个Workflow可以包含一个或多个作业，形成完整的工作流，用于实现指定的业务。创建Workflow时，可直接在Hue的编辑器设计作业，并添加到Workflow中。每个计划可定义一个时间触发器，用于定时触发执行一个指定的Workflow。不支持多个Workflow。每个Bundles可定义一个集合，用于触发执行多个计划，使不同Workflow批量执行。

MapReduce服务 MRS
MapReduce服务 MRS-在Hue WebUI使用HiveQL编辑器:执行HiveQL语句

执行HiveQL语句在“Database”右侧下拉列表选择一个Hive中的数据库，默认数据库为“default”。系统将自动显示数据库中的所有表。可以输入表名关键字，系统会自动搜索包含此关键字的全部表。单击指定的表名，可以显示表中所有的列。光标移动到表或列所在的行，单击可以查看详细信息。在HiveQL语句编辑区输入查询语句。单击开始执行HiveQL语句。图1 执行语句如果希望下次继续使用已输入的HiveQL语句，请单击保存。高级查询配置：单击右上角的，对文件、功能、设置等信息进行配置。查看快捷键：单击右上角的，可查看语法和键盘快捷方式信息。删除已输入的HiveQL语句，请单击后的三角选择“清除”。查看历史：单击“查询历史记录”，可查看HiveQL运行情况，支持显示所有语句或只显示保存的语句的运行情况。历史记录存在多个结果时，可以在输入框使用关键字进行搜索。

MapReduce服务 MRS
MapReduce服务 MRS-在Hue WebUI使用HiveQL编辑器:修改在Hue使用编辑器的会话配置

修改在Hue使用编辑器的会话配置在编辑器页面，单击。在“文件”的右侧单击，然后单击选择文件。可以单击“文件”后的新增加一个文件资源。在“功能” ，输入用户自定义的名称和函数的类名称。可以单击“功能”后的新增加一个自定义函数。在“设置” ，在“设置”的“键”输入Hive的参数名，在“值”输入对应的参数值，则当前Hive会话会以用户定义的配置连接Hive。可以单击新增加一个参数。

MapReduce服务 MRS
MapReduce服务 MRS-HBase客户端使用实践:前提条件

前提条件已安装客户端。例如安装目录为“/opt/hadoopclient”，以下操作的客户端目录只是举例，请根据实际安装目录修改。各组件业务用户由MRS集群管理员根据业务需要创建。 “机机”用户需要下载keytab文件，“人机”用户第一次登录时需修改密码。非root用户使用HBase客户端，请确保该HBase客户端目录的属主为该用户，否则请参考如下命令修改属主。 chown user:group -R 客户端安装目录/HBase

MapReduce服务 MRS 使用HBase
MapReduce服务 MRS-HBase客户端使用实践:使用HBase客户端（MRS 3.x及之后版本）

使用HBase客户端（MRS 3.x及之后版本）安装客户端，具体请参考安装客户端章节。以客户端安装用户，登录安装客户端的节点。执行以下命令切换到客户端目录。 cd /opt/hadoopclient 执行以下命令配置环境变量。 source bigdata_env 如果当前集群已启用Kerberos认证，执行以下命令认证当前用户，当前用户需要具有创建HBase表的权限，具体请参见角色管理配置拥有对应权限的角色，参考创建用户章节，为用户绑定对应角色。如果当前集群未启用Kerberos认证，则无需执行此命令。 kinit 组件业务用户例如，kinit hbaseuser。直接执行HBase组件的客户端命令。 hbase shell

MapReduce服务 MRS 使用HBase
MapReduce服务 MRS-在Hue WebUI使用元数据浏览器:元数据管理器使用介绍

元数据管理器使用介绍访问Hue WebUI，请参考访问Hue WebUI界面。查看Hive表的元数据在左侧导航栏单击表，单击某一表名称，界面将显示Hive表的元数据信息。管理Hive表的元数据在Hive表的元数据信息界面：单击右上角的“导入”可导入数据。单击“概述”，在“属性”域可查看表文件的位置信息。可查看Hive表各列字段的信息，并手动添加描述信息，注意此处添加的描述信息并不是Hive表中的字段注释信息（comment）。单击“样本”可浏览数据。管理Hive元数据表单击左侧列表中的可在数据库中根据上传的文件创建一个新表，也可手动创建一个新表。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用HDFS客户端对HDFS文件进行操作，使用Hive客户端对Hive表进行操作。

MapReduce服务 MRS
MapReduce服务 MRS-HBase客户端使用实践:使用HBase客户端（MRS 3.x之前版本）

使用HBase客户端（MRS 3.x之前版本）安装客户端，具体请参考安装客户端章节。以客户端安装用户，登录安装客户端的节点。执行以下命令切换到客户端目录。 cd /opt/hadoopclient 执行以下命令配置环境变量。 source bigdata_env 如果当前集群已启用Kerberos认证，执行以下命令认证当前用户，当前用户需要具有创建HBase表的权限，具体请参见创建角色配置拥有对应权限的角色，参考创建用户章节，为用户绑定对应角色。如果当前集群未启用Kerberos认证，则无需执行此命令。 kinit 组件业务用户例如，kinit hbaseuser。直接执行HBase组件的客户端命令。 hbase shell

MapReduce服务 MRS 使用HBase
MapReduce服务 MRS-Hive on Hue:典型场景

典型场景通过Hue界面对Hive进行创建表的操作如下：单击Hue的WebUI界面左上角的，选择要操作的Hive实例，进入Hive命令的执行页面。在命令输入框内输入一条HQL语句，例如： create table hue_table(id int,name string,company string) row format delimited fields terminated by ',' stored as textfile; 单击执行HQL。图1 执行语句在命令输入框内输入： show tables; 单击，查看“结果”中有创建的表hue_table。图2 查看结果

MapReduce服务 MRS 使用Hue WebUI典型场景
MapReduce服务 MRS-Hive on Hue:元数据浏览器使用介绍

元数据浏览器使用介绍访问Hue WebUI。查看Hive表的元数据在左侧导航栏单击表，单击某一表名称，界面将显示Hive表的元数据信息。管理Hive表的元数据在Hive表的元数据信息界面：单击右上角的“导入”可导入数据。单击“概述”，在“属性”域可查看表文件的位置信息。可查看Hive表各列字段的信息，并手动添加描述信息，注意此处添加的描述信息并不是Hive表中的字段注释信息（comment）。单击“样本”可浏览数据。管理Hive元数据表单击左侧列表中的可在数据库中根据上传的文件创建一个新表，也可手动创建一个新表。 Hue界面主要用于文件、表等数据的查看与分析，禁止通过Hue界面对操作对象进行删除等高危管理操作。如需操作，建议在确认对业务没有影响后通过各组件的相应操作方法进行处理，例如使用HDFS客户端对HDFS文件进行操作，使用Hive客户端对Hive表进行操作。

MapReduce服务 MRS 使用Hue WebUI典型场景
MapReduce服务 MRS-使用Hue WebUI操作Hive表:操作步骤

操作步骤访问Hue WebUI，请参考访问Hue WebUI界面。在左侧导航栏单击编辑器，然后选择“Hive”。在“Database”右侧下拉列表选择一个Hive中的数据库，默认数据库为“default”。系统将自动显示数据库中的所有表。可以输入表名关键字，系统会自动搜索包含此关键字的全部表。单击指定的表名，可以显示表中所有的列。在HiveQL语句编辑区输入HiveQL语句。 create table hue_table(id int,name string,company string) row format delimited fields terminated by ',' stored as textfile; 单击开始执行HiveQL语句。图1 执行语句在命令输入框内输入show tables;，单击按钮，查看“结果”中有5创建的表hue_table。

MapReduce服务 MRS
MapReduce服务 MRS-在Hue WebUI使用HiveQL编辑器:修改在Hue使用“Query Editors”的会话配置

修改在Hue使用“Query Editors”的会话配置在“Hive”页签，单击。在“Files”的右侧单击，然后单击指定该文件的存储目录。可以单击新增加一个文件资源。在“Functions”的右侧单击，输入用户自定义的名称和函数的类名称。可以单击新增加一个自定义函数。在“Settings”的右侧单击，在“Key”输入Hive的参数名，在“Value”输入对应的参数值，则当前Hive会话会以用户定义的配置连接Hive。可以单击新增加一个参数。

MapReduce服务 MRS
MapReduce服务 MRS-在Hue WebUI使用文件浏览器:访问文件浏览器

访问文件浏览器访问Hue WebUI，请参考访问Hue WebUI界面。在左侧导航栏单击文件。进入“文件浏览器”页面。 “文件浏览器”的“主页”默认进入当前登录用户的主目录。界面将显示目录中的子目录或文件的以下信息：表1 HDFS文件属性介绍属性名描述名称表示目录或文件的名称。大小表示文件的大小。用户表示目录或文件的属主。组表示目录或文件的属组。权限表示目录或文件的权限设置。日期表示目录或文件创建时间。在搜索框输入关键字，系统会在当前目录自动搜索目录或文件。清空搜索框的内容，系统会重新显示所有目录和文件。

MapReduce服务 MRS
MapReduce服务 MRS-在Hue WebUI使用文件浏览器:执行动作

执行动作在“文件浏览器”界面，勾选一个或多个目录或文件。单击“操作”，在弹出菜单选择一个操作。重命名：表示重新命名一个目录或文件。移动：表示移动文件，在“移至”页面选择新的目录并单击“移动”完成移动。复制：表示复制选中的文件或目录。更改权限：表示修改选中目录或文件的访问权限。可以为属主、属组和其他用户设置“读取”、“写”和“执行”权限。 “易贴”表示禁止HDFS的管理员、目录属主或文件属主以外的用户在目录中移动文件。 “递归”表示递归设置权限到子目录。存储策略：表示设置目录或文件在HDFS中的存储策略。摘要：表示查看选中的文件或目录的HDFS存储信息。

MapReduce服务 MRS
MapReduce服务 MRS-Hue常用配置参数:参数说明

参数说明 Hue常用参数请参见表1。表1 Hue常用参数配置参数说明缺省值范围 HANDLER_AC CES S LOG _LEVEL Hue的访问日志级别。 DEBUG ERROR WARN INFO DEBUG HANDLER_AUDITSLOG_LEVEL Hue的审计日志级别。 DEBUG ERROR WARN INFO DEBUG HANDLER_ERRORLOG_LEVEL Hue的错误日志级别。 ERROR ERROR WARN INFO DEBUG HANDLER_LOGFILE_LEVEL Hue的运行日志级别。 INFO ERROR WARN INFO DEBUG HANDLER_LOGFILE_MAXBACKUPINDEX Hue日志文件最大个数。 20 1～999 HANDLER_LOGFILE_SIZE Hue日志文件最大大小。 5MB - Hue自定义参数请参见表2。以下自定义参数仅MRS 3.1.2及之后版本适用。

MapReduce服务 MRS
MapReduce服务 MRS-在Hue WebUI使用作业浏览器:访问作业浏览器

访问作业浏览器访问Hue WebUI，请参考访问Hue WebUI界面。单击作业。默认显示当前集群的所有作业。作业浏览器显示的数字表示集群中所有作业的总数。 “作业浏览器”将显示作业以下信息：表1 MRS作业属性介绍属性名描述名称表示作业的名称。用户表示启动该作业的用户。类型表示作业的类型。状态表示作业的状态，包含“成功”、“正在运行”、“失败”。进度表示作业运行进度。组表示作业所属组。开始表示作业开始时间。持续时间表示作业运行使用的时间。 Id 表示作业的编号，由系统自动生成。如果MRS集群安装了Spark组件，则默认会启动一个作业“Spark-JD BCS erver”，用于执行任务。

MapReduce服务 MRS 创建Hue操作任务
MapReduce服务 MRS-样例：通过Loader将数据从OBS导入HDFS:操作步骤

操作步骤将业务数据上传到用户的OBS文件系统。获取用户的AK/SK信息，然后创建一个OBS连接和一个HDFS连接。具体可参见Loader连接配置说明。访问Loader页面。如果是启用了Kerberos认证的分析集群，可参见访问Hue WebUI界面。单击“新建作业”。在“基本信息”填写参数。在“名称”填写一个作业的名称。例如“obs2hdfs”。在“源连接”选择已创建的OBS连接。 “目的连接”选择已创建的HDFS连接。在“自”填写源连接参数。在“桶名”填写业务数据所保存的OBS文件系统名称。在“源目录或文件”填写业务数据在文件系统的具体位置。如果是单个文件，需要填写包含文件名的完整路径。如果是目录，填写目录的完整路径 “文件格式”填写业务数据文件的类型。可参见obs-connector。在“至”填写目的连接参数。在“定入目录”填写业务数据在HDFS要保存的目录名称。如果是启用Kerberos认证的集群，当前访问Loader的用户对保存数据的目录需要有写入权限。在“文件格式”填写业务数据文件的类型。需要与6.c的类型对应。在“压缩格式”填写一种压缩的算法。例如选择不压缩“NONE”。在“是否覆盖”选择已有文件的处理方式，选择“True”。单击“显示高级属性”，在“换行符”填写业务数据保存时，系统填充的换行字符。在“字段分割符”填写业务数据保存时，系统填充的分割字符。可参见hdfs-connector。在“任务配置”填写作业的运行参数。在“抽取并发数”填写map任务的个数。在“加载(写入)并发数”填写reduce任务的个数。目的连接为HDFS连接时，不显示“加载(写入)并发数”参数。 “单个分片的最大错误记录数”填写错误记录阈值。在“脏数据目录”填写一个脏数据的保存位置，例如“/user/sqoop/obs2hdfs-dd”。单击“保存并运行”。在“管理作业界面”，查看作业运行结果。可以单击“刷新列表”获取作业的最新状态。

MapReduce服务 MRS
MapReduce服务 MRS-KafkaManager介绍

KafkaManager介绍 KafkaManager是Apache Kafka的管理工具，提供Kafka集群界面化的Metric监控和集群管理。通过KafkaManager可以：支持管理多个Kafka集群支持界面检查集群状态（主题，消费者，偏移量，分区，副本，节点）支持界面执行副本的leader选举使用选择生成分区分配以选择要使用的分区方案支持界面执行分区重新分配（基于生成的分区方案）支持界面选择配置创建主题（支持多种Kafka版本集群）支持界面删除主题（仅支持0.8.2+并设置了delete.topic.enable = true）支持批量生成多个主题的分区分配，并可选择要使用的分区方案支持批量运行重新分配多个主题的分区支持为已有主题增加分区支持更新现有主题的配置可以为分区级别和主题级别度量标准启用JMX查询可以过滤掉zookeeper中没有ids / owner /＆offsets /目录的使用者。父主题：使用KafkaManager

MapReduce服务 MRS 使用KafkaManager

共100000条

undefined

意见反馈

0/200

提交取消

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！