搜索_华为云

基于Python的Hive样例程序 - MapReduce服务 MRS

基于Python的Hive样例程序功能介绍本章节介绍如何使用Python连接Hive执行数据分析任务。样例代码使用Python方式提交数据分析任务，参考样例程序中的“hive-examples/python-examples/pyCLI_sec.py”。该样例程序连接的集

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > 开发Hive应用
批量写入Hudi表 - MapReduce服务 MRS

批量写入Hudi表操作场景 Hudi提供多种写入方式，具体见hoodie.datasource.write.operation配置项，这里主要介绍UPSERT、INSERT和BULK_INSERT。 INSERT（插入）：该操作流程和UPSERT基本一致，但是不需要通过索引去查询具

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
通过数据文件备份恢复ClickHouse数据 - MapReduce服务 MRS

通过数据文件备份恢复ClickHouse数据操作场景本章节主要介绍通过把ClickHouse中的表数据导出到CSV文件进行备份，后续可以通过备份的CSV文件数据再进行恢复操作。前提条件已安装ClickHouse客户端。在Manager已创建具有ClickHouse相关表权限的用户。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
基于Python的Hive样例程序 - MapReduce服务 MRS

基于Python的Hive样例程序功能介绍本章节介绍如何使用Python连接Hive执行数据分析任务。样例代码使用Python方式提交数据分析任务，参考样例程序中的“hive-examples/python-examples/pyCLI_sec.py”。该样例程序连接的集

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 开发Hive应用
多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优操作场景本章节介绍在多级嵌套以及混合Join SQL查询的调优建议。前提条件例如有一个复杂的查询样例如下： select s_name, count(1) as numwait from ( select s_name from (

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列本章节适用于MRS 3.1.2及之后的版本。操作场景本章节介绍Kafka作为source表或者sink表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在FlinkServer作业管理页面操作。本示例以安全模式Kafka为例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
通过数据文件备份恢复ClickHouse数据 - MapReduce服务 MRS

通过数据文件备份恢复ClickHouse数据操作场景本章节主要介绍通过把ClickHouse中的表数据导出到CSV文件进行备份，后续可以通过备份的CSV文件数据再进行恢复操作。前提条件已安装ClickHouse客户端。在Manager已创建具有ClickHouse相关表权限的用户。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
查看HBase慢请求和超大请求信息 - MapReduce服务 MRS

查看HBase慢请求和超大请求信息操作场景该章节主要介绍如何在HBase Shell命令行查询慢请求或超大请求信息。慢请求是指通过hbase shell命令查询服务端时，RPC请求响应时长超过阈值（即HBase服务端配置参数“hbase.ipc.warn.response.t

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强
开发和部署HetuEngine Function Plugin - MapReduce服务 MRS

开发和部署HetuEngine Function Plugin 用户可以自定义一些函数，用于扩展SQL以满足个性化的需求，这类函数称为UDF。本章节主要介绍开发和应用HetuEngine Function Plugin的具体步骤。 MRS 3.2.1及以后版本，需要基于JDK17.0.4及以上版本开发。本章节以MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 开发和部署HetuEngine UDF
MySQL链路任务启动时如何从指定位置抓取数据 - MapReduce服务 MRS

MySQL链路任务启动时如何从指定位置抓取数据现象描述 MySQL链路任务启动时，可以从指定位置抓取数据，本章节主要介绍如何获取指定位置参数。图1 启动任务处理步骤使用工具或者命令行连接MySQL数据库（本示例使用Navicat工具连接）。执行以下命令。 SHOW MASTER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > CDL常见问题
配置ClickHouse通过用户密码对接Kafka - MapReduce服务 MRS

配置ClickHouse通过用户密码对接Kafka 本章节适用于MRS 3.3.0-LTS及之后版本。操作场景本章节主要介绍ClickHouse通过用户名和密码的方式连接Kafka，消费Kafka的数据。前提条件已创建Kafka集群，且为安全模式（开启Kerberos认证）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

配置DataNode预留磁盘百分比配置场景当Yarn本地目录和DataNode目录配置在同一个磁盘时，具有较大容量的磁盘可以运行更多的任务，因此将有更多的中间数据存储在Yarn本地目录。目前DataNode支持通过配置“dfs.datanode.du.reserved”来配

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
数据表报错Too many parts解决方法 - MapReduce服务 MRS

数据表报错Too many parts解决方法问题排查步骤磁盘或其他存储介质问题导致merge过慢或者中止。登录Manager页面，检查是否存在磁盘容量不足或其他磁盘告警，如果存在，请按照告警指导处理。如果是磁盘容量不足，也可以联系客户删除部分过期数据，释放空间，快速恢复业务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse性能调优
Hudi数据表Clean规范 - MapReduce服务 MRS

Hudi数据表Clean规范 Clean也是Hudi表的维护操作之一，该操作对于MOR表和COW表都需要执行。Clean操作的目的是为了清理旧版本文件（Hudi不再使用的数据文件），这不但可以节省Hudi表List过程的时间，也可以缓解存储压力。规则 Hudi表必须执行Clean。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表管理操作规范
ClickHouse数据表分区过多调优 - MapReduce服务 MRS

ClickHouse数据表分区过多调优问题排查步骤磁盘或其他存储介质问题导致merge过慢或者中止。登录Manager页面，检查是否存在磁盘容量不足或其他磁盘告警，如果存在，请按照告警指导处理。如果是磁盘容量不足，也可以联系客户删除部分过期数据，释放空间，快速恢复业务。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse性能调优
MRS集群组件如何管理和使用第三方jar包 - MapReduce服务 MRS

放置目录为：组件安装节点的“<集群安装目录>/third_lib/<组件名>”目录。例如：将使用HBase服务要用到的jar包文件放入HBase节点的“${BIGDATA_HOME}/third_lib/HBase”内。将使用Hive服务要用到的jar包文件放入每一个HiveServer实例节点的“${BIGD

帮助中心 > MapReduce服务 MRS > 常见问题 > 应用开发类
如何配置Flume定制脚本 - MapReduce服务 MRS

登录FusionInsight Manager，选择“集群 > 待操作集群的名称 > 服务 > Flume”进入Flume服务界面，在右上角选择“更多 > 下载客户端”，选择“选择客户端类型”为“完整客户端”，下载Flume服务客户端文件。客户端文件名称为“FusionInsight_Clust

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume常见问题
配置HDFS token的最大存活时间 - MapReduce服务 MRS

配置描述参数入口：请参考修改集群服务配置参数，进入HDFS的“全部配置”页面，在搜索框中输入参数名称。表1 参数说明参数描述默认值 dfs.namenode.delegation.token.max-lifetime 该参数为服务器端参数，设置Token的最大存活时间

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
配置MapReduce集群管理员列表 - MapReduce服务 MRS

administrators”指定，集群管理员admin具有所有可以操作的权限。配置描述进入Mapreduce服务参数“全部配置”界面，在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。表1 参数描述参数描述默认值 mapreduce.cluster.acls.enabled

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
配置AM自动调整分配内存 - MapReduce服务 MRS

分配的内存会根据任务总数的浮动自动调整，资源利用更加灵活，提高了客户端应用运行的容错性。配置描述参数入口：参考修改集群服务配置参数进入Yarn服务参数“全部配置”界面，在搜索框中输入参数名称“mapreduce.job.am.memory.policy”。配置说明：配

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn企业级能力增强

总条数： 4472

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

基于Python的Hive样例程序 - MapReduce服务 MRS

批量写入Hudi表 - MapReduce服务 MRS

通过数据文件备份恢复ClickHouse数据 - MapReduce服务 MRS

基于Python的Hive样例程序 - MapReduce服务 MRS

多级嵌套子查询以及混合Join的SQL调优 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

通过数据文件备份恢复ClickHouse数据 - MapReduce服务 MRS

查看HBase慢请求和超大请求信息 - MapReduce服务 MRS

开发和部署HetuEngine Function Plugin - MapReduce服务 MRS

MySQL链路任务启动时如何从指定位置抓取数据 - MapReduce服务 MRS

配置ClickHouse通过用户密码对接Kafka - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

数据表报错Too many parts解决方法 - MapReduce服务 MRS

Hudi数据表Clean规范 - MapReduce服务 MRS

ClickHouse数据表分区过多调优 - MapReduce服务 MRS

MRS集群组件如何管理和使用第三方jar包 - MapReduce服务 MRS

如何配置Flume定制脚本 - MapReduce服务 MRS

配置HDFS token的最大存活时间 - MapReduce服务 MRS

配置MapReduce集群管理员列表 - MapReduce服务 MRS

配置AM自动调整分配内存 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线