搜索_华为云

使用Spark小文件合并工具说明 - MapReduce服务 MRS

meNode大量内存，还会大幅降低读写性能，延长作业运行时间。因此，小文件问题是制约Hadoop集群规模扩展的关键问题。本工具主要有如下两个功能：扫描表中有多少低于用户设定阈值的小文件，返回该表目录中所有数据文件的平均大小。对表文件提供合并功能，用户可设置合并后的平均文件大小。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Streaming对接Kafka样例程序开发思路场景说明假定一个广告业务，存在广告请求事件、广告展示事件、广告点击事件，广告主需要实时统计有效的广告展示和广告点击数据。已知：终端用户每次请求一个广告后，会生成广告请求事件，保存到kafka的adRequest topic中。请求一个广告后，可能用于多次展示，

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Streaming对接Kafka样例程序开发思路场景说明假定一个广告业务，存在广告请求事件、广告展示事件、广告点击事件，广告主需要实时统计有效的广告展示和广告点击数据。已知：终端用户每次请求一个广告后，会生成广告请求事件，保存到kafka的adRequest topic中。请求一个广告后，可能用于多次展示，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming对接Kafka样例程序
查看Oozie应用调测结果 - MapReduce服务 MRS

------------------- 同时在HDFS上生成目录“/user/developuser/examples/output-data/map-reduce”，包括如下两个文件： _SUCCESS part-00000 可以通过Hue的文件浏览器或者通过HDFS如下命令行查看： hdfs dfs -ls /u

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > 调测Oozie应用
Phoenix SQL查询样例介绍 - MapReduce服务 MRS

SQL查询样例介绍功能简介 Phoenix是构建在HBase之上的一个SQL中间层，提供一个客户端可嵌入的JDBC驱动，Phoenix查询引擎将SQL输入转换为一个或多个HBase scan，编译并执行扫描任务以产生一个标准的JDBC结果集。代码样例客户端“hbase-example/conf/hbase-site

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发常见问题
Phoenix SQL查询样例介绍 - MapReduce服务 MRS

SQL查询样例介绍功能简介 Phoenix是构建在HBase之上的一个SQL中间层，提供一个客户端可嵌入的JDBC驱动，Phoenix查询引擎将SQL输入转换为一个或多个HBase scan，编译并执行扫描任务以产生一个标准的JDBC结果集。代码样例客户端“hbase-example/conf/hbase-site

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发常见问题
快速开发Kafka应用 - MapReduce服务 MRS

使用Kafka客户端创建两个Topic，用于输入Topic和输出Topic。开发一个Kafka Streams完成单词统计功能，通过读取输入Topic中的消息，统计每条消息中的单词个数，从输出Topic消费数据，将统计结果以Key-Value的形式输出。创建MRS集群购买一个包含有Kaf

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
ClickHouse宽表设计原则 - MapReduce服务 MRS

kHouse可支持上万列的宽表横向扩展。在大部分场景下，有大表两表join以及多表join的场景，且多个join的表数据变化更新频率较低，这种情况，建议对多个表join查询逻辑提前进行加工处理，将处理后的数据写入到一个宽表中，宽表中包含所有要查询的数据字段，以供后续应用完全自助OLAP的高性能查询。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
配置Spark多租户模式 - MapReduce服务 MRS

配置Spark多租户模式配置场景多租户模式是将JDBCServer和租户绑定，每一个租户对应一个或多个JDBCServer，一个JDBCServer只给一个租户提供服务。不同的租户可以配置不同的Yarn队列，从而达到资源隔离。 Yarn资源不足情况下，不建议开启多租户模式。配置描述

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强 > 配置Spark HA增强高可用
新建Spark应用开发工程（可选） - MapReduce服务 MRS

新建Spark应用开发工程（可选）操作场景除了导入Spark样例工程，您还可以使用IDEA新建一个Spark工程。如下步骤以创建一个Scala工程为例进行说明。操作步骤打开IDEA工具，选择“Create New Project”。图1 创建工程在“New Proje

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
使用Spark小文件合并工具说明 - MapReduce服务 MRS

meNode大量内存，还会大幅降低读写性能，延长作业运行时间。因此，小文件问题是制约Hadoop集群规模扩展的关键问题。本工具主要有如下两个功能：扫描表中有多少低于用户设定阈值的小文件，返回该表目录中所有数据文件的平均大小。对表文件提供合并功能，用户可设置合并后的平均文件大小。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
如何删除所有HiveServer中的永久函数 - MapReduce服务 MRS

UDF），如何在多个HiveServer之间同步删除？回答因为多个HiveServer之间共用一个MetaStore存储数据库，所以MetaStore存储数据库和HiveServer的内存之间数据同步有延迟。如果在单个HiveServer上删除永久函数，操作结果将无法同步到其他HiveServer上。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见问题
如何删除所有HiveServer中的永久函数 - MapReduce服务 MRS

UDF），如何在多个HiveServer之间同步删除？回答因为多个HiveServer之间共用一个MetaStore存储数据库，所以MetaStore存储数据库和HiveServer的内存之间数据同步有延迟。如果在单个HiveServer上删除永久函数，操作结果将无法同步到其他HiveServer上。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
Spark WebUI页面上stderr和stdout无法跳转到日志页面 - MapReduce服务 MRS

ut或者stderr访问到executor日志页面。不修改配置项查看日志处理步骤查看运行完成任务日志在Spark2x原生页面最上方有一个按钮，可以查看汇聚后任务日志：AggregatedLogs 图2 AggregatedLogs 查看运行中的任务日志在Spark2x原生页面，通过“Jobs

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
补丁基本信息说明 - MapReduce服务 MRS

drop partition权限管理_user有库的read,write权限时，删除库内表分区时，报错提示需要EXECUTE权限，但是表分区却删除成功。 alter table add partions set location指定为一个已有库的路径时，执行成功，有数据丢失风险。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明 > MRS 3.3.0-LTS.1.1补丁说明
用户认证及权限类 - MapReduce服务 MRS

Hue WebUI有配置账号权限的功能吗？为什么IAM子账号添加了MRS权限却无法在控制台提交作业？用户A如何查看用户B创建的Hive表？如何避免Kerberos认证过期？已创建的MRS集群如何修改Kerberos状态？ Kerberos认证服务的端口有哪些？

帮助中心 > MapReduce服务 MRS > 常见问题
Hive是否支持对同一张表或分区进行并发写数据 - MapReduce服务 MRS

导致数据不一致？回答 Hive不支持对同一张表或同一个分区进行并发数据插入，这样会导致多个任务操作同一个数据临时目录，一个任务将另一个任务的数据移走，导致任务数据异常。解决方法是修改业务逻辑，单线程插入数据到同一张表或同一个分区。 MRS 3.1.3及之后版本Hive支持对同一张表或分区进行并发写数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见问题
访问Storm的WebUI - MapReduce服务 MRS

Web UI”，单击任意一个UI链接，打开Storm的WebUI。第一次访问Storm WebUI，需要在浏览器中添加站点信任以继续打开页面。 MRS 3.x及后续版本：选择“Storm > 概览”，在“基本信息”的“Storm Web UI”，单击任意一个UI链接，打开Storm的WebUI。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Storm
查看Oozie应用调测结果 - MapReduce服务 MRS

------------------- 同时在HDFS上生成目录“/user/developuser/examples/output-data/map-reduce”，包括如下两个文件： _SUCCESS part-00000 可以通过Hue的文件浏览器或者通过HDFS如下命令行查看： hdfs dfs -ls /u

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > 调测Oozie应用
查看Oozie应用调测结果 - MapReduce服务 MRS

------------------- 同时在HDFS上生成目录“/user/developuser/examples/output-data/map-reduce”，包括如下两个文件： _SUCCESS part-00000 可以通过Hue的文件浏览器或者通过HDFS如下命令行查看： hdfs dfs -ls /u

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Oozie开发指南（普通模式） > 调测Oozie应用

总条数： 3763

上一页
1
...
14
15
16
...
189
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark小文件合并工具说明 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming对接Kafka样例程序开发思路 - MapReduce服务 MRS

查看Oozie应用调测结果 - MapReduce服务 MRS

Phoenix SQL查询样例介绍 - MapReduce服务 MRS

Phoenix SQL查询样例介绍 - MapReduce服务 MRS

快速开发Kafka应用 - MapReduce服务 MRS

ClickHouse宽表设计原则 - MapReduce服务 MRS

配置Spark多租户模式 - MapReduce服务 MRS

新建Spark应用开发工程（可选） - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

如何删除所有HiveServer中的永久函数 - MapReduce服务 MRS

如何删除所有HiveServer中的永久函数 - MapReduce服务 MRS

Spark WebUI页面上stderr和stdout无法跳转到日志页面 - MapReduce服务 MRS

补丁基本信息说明 - MapReduce服务 MRS

用户认证及权限类 - MapReduce服务 MRS

Hive是否支持对同一张表或分区进行并发写数据 - MapReduce服务 MRS

访问Storm的WebUI - MapReduce服务 MRS

查看Oozie应用调测结果 - MapReduce服务 MRS

查看Oozie应用调测结果 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线