搜索_华为云

调测Hive Python样例程序 - MapReduce服务 MRS

如果出现如下异常： importError: libsasl2.so.2: cannot open shared object file: No such file or directory 请按照以下方式处理：首先执行如下命令，查询所装操作系统中LibSASL的版本 ldconfig

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 调测Hive应用
Spark读写Hudi开发规范 - MapReduce服务 MRS

Spark读写Hudi开发规范 Spark写Hudi各种写入模式参数规范说明类型说明开启参数场景选择特点 upsert update + insert Hudi默认写入类型，写入具有更新能力。默认，无需参数开启。 SparkSQL: set hoodie.datasource

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境准备Spark本地应用开发环境准备Spark连接集群配置文件导入并配置Spark样例工程新建Spark样例工程（可选）配置Spark应用安全认证配置Spark Python3样例工程父主题： Spark2x开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
使用KafkaStreams统计数据 - MapReduce服务 MRS

String[] words = line.toLowerCase(Locale.getDefault()).split(REGEX_STRING); for (String word : words) {

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > 开发Kafka应用
Spark SQL性能调优 - MapReduce服务 MRS

Spark SQL性能调优 Spark SQL join优化优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化合并CBO优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
有大量分区时执行drop partition操作失败 - MapReduce服务 MRS

有大量分区时执行drop partition操作失败问题背景与现象执行drop partitions操作，执行异常： MetaStoreClient lost connection. Attempting to reconnect. | org.apache.hadoop.hive

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HetuEngine物化视图SQL示例 - MapReduce服务 MRS

HetuEngine物化视图SQL示例物化视图SQL示例请参考表1。表1 物化视图的操作操作功能物化视图SQL样例备注创建物化视图（创建物化视图时，只创建了物化视图的定义，数据填充需要使用refresh materialized view name刷新物化视图数据）

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
添加MRS节点引导操作安装第三方软件 - MapReduce服务 MRS

说明：同一集群内，不允许配置相同的名称。不同集群之间，可以配置相同的名称。脚本路径脚本的路径。路径可以是OBS文件系统的路径或虚拟机本地的路径。 OBS文件系统的路径，必须以obs://开头，以.sh结尾。例如：obs://mrs-samples/xxx.sh 虚拟机本地的

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点 > 配置MRS集群节点引导操作
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

则可以使用MapPartitions，按每个分区计算结果，如： rdd.mapPartitions(records => conn.getDBConn;for(item <- records) write(item.toString); conn.close) 使用mapPartition

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
HDFS企业级能力增强 - MapReduce服务 MRS

HDFS企业级能力增强配置HDFS快速关闭文件功能配置DataNode节点容量不一致时的副本放置策略配置DataNode预留磁盘百分比配置从NameNode支持读操作配置NameNode黑名单功能配置Hadoop数据传输加密父主题：使用HDFS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
创建CDL作业 - MapReduce服务 MRS
创建CDL作业 - MapReduce服务 MRS

创建CDL作业创建CDL数据同步任务作业创建CDL数据比较任务作业使用CDL从PgSQL同步数据到Kafka 使用CDL从PgSQL同步数据到Hudi 使用CDL从Opengauss同步数据到Hudi 使用CDL从Hudi同步数据到DWS 使用CDL从Hudi同步数据到ClickHouse

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL
创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列本章节适用于MRS 3.1.2及之后的版本。操作场景本章节介绍Kafka作为source表或者sink表的DDL定义，以及创建表时使用的WITH参数和代码示例，并指导如何在FlinkServer作业管理页面操作。本示例以安全模式Kafka为例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 创建FlinkServer作业
配置HBase主备集群容灾 - MapReduce服务 MRS

配置HBase主备集群容灾操作场景 HBase集群容灾作为提高HBase集群系统高可用性的一个关键特性，为HBase提供了实时的异地数据容灾功能。它对外提供了基础的运维工具，包含灾备关系维护，重建，数据校验，数据同步进展查看等功能。为了实现数据的实时容灾，可以把本HBase集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase运维管理 > HBase集群容灾高可用
SHOW_TIME_LINE - MapReduce服务 MRS
SHOW_TIME_LINE - MapReduce服务 MRS

instant => '[instant]'); 参数描述表1 参数描述参数描述 table_name 需要查询的表名，支持database.tablename格式 instant 需要查询的instant time时间戳示例 call show_active_instant_detail(table

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： object

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala）功能简介统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。代码样例下面代码片段仅为演示，具体代码参见com.huawei.bigdata.spark.examples.FemaleInfoCollection： object

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark SQL样例程序
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
Impala用开发规则 - MapReduce服务 MRS

建表时分区不要超过10万个，分区太多会影响元数据加载速度，阻塞查询 Impala元数据和分区、文件数量正相关，太多分区会导致Impala元数据占用内存过大，刷新元数据时需要扫描的分区文件就越多，极大地降低查询效率。建表时整数类型的分区键不补前置0，例如'hour=01'等分区

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
HBase客户端连接服务端时，长时间无法连接成功 - MapReduce服务 MRS

e/conf/hbase-site.xml”配置文件中配置如下参数。表1 HBase客户端操作重试超时相关配置配置参数描述默认值 hbase.client.operation.timeout 客户端操作超时时间。需在配置文件中手动添加。 2147483647 ms hbase

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase故障排除
更新域 - MapReduce服务 MRS
更新域 - MapReduce服务 MRS

新。当更新字段为数值类型时，更新值需要为数值。当更新字段为字符串类型时，更新操作不能为“-”。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下：配置“更新域”算子，当发现值为test时，更新值，在test后面加上good。转换后，输出A和B，结果如下：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 转换算子

总条数： 2809

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

调测Hive Python样例程序 - MapReduce服务 MRS

Spark读写Hudi开发规范 - MapReduce服务 MRS

准备Spark应用开发环境 - MapReduce服务 MRS

使用KafkaStreams统计数据 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

有大量分区时执行drop partition操作失败 - MapReduce服务 MRS

HetuEngine物化视图SQL示例 - MapReduce服务 MRS

添加MRS节点引导操作安装第三方软件 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

HDFS企业级能力增强 - MapReduce服务 MRS

创建CDL作业 - MapReduce服务 MRS

创建FlinkServer作业写入数据至Kafka消息队列 - MapReduce服务 MRS

配置HBase主备集群容灾 - MapReduce服务 MRS

SHOW_TIME_LINE - MapReduce服务 MRS

Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark SQL样例程序（Scala） - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Impala用开发规则 - MapReduce服务 MRS

HBase客户端连接服务端时，长时间无法连接成功 - MapReduce服务 MRS

更新域 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线