搜索_华为云

建立Hive表分区提升查询效率 - MapReduce服务 MRS

建立Hive表分区提升查询效率操作场景 Hive在做Select查询时，一般会扫描整个表内容，会消耗较多时间去扫描不关注的数据。此时，可根据业务需求及其查询维度，建立合理的表分区，从而提高查询效率。操作步骤 MRS 3.x之前版本：登录MRS控制台，在左侧导航栏选择“现有集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
Spark输入 - MapReduce服务 MRS
Spark输入 - MapReduce服务 MRS

Spark输入概述 “Spark输入”算子，将SparkSQL表的指定列转换成同等数量的输入字段。输入与输出输入：SparkSQL表列输出：字段参数说明表1 算子参数说明参数含义类型是否必填默认值 Spark数据库 SparkSQL的数据库名称。 String

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
如何使用IDEA远程调试业务 - MapReduce服务 MRS

如何使用IDEA远程调试业务问题使用Storm客户端提交了业务之后，如何使用IDEA远程调试业务？回答以调试WordCount程序为例，演示如何进行IDEA的远程调试：登录FusionInsight Manager系统，选择“集群 > 待操作集群的名称 > 服务 > Storm

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（普通模式） > Storm应用开发常见问题
执行load data inpath命令报错 - MapReduce服务 MRS

执行load data inpath命令报错问题现象执行load data inpath报如下错误：错误1： HiveAccessControlException Permission denied. Principal [name=user1, type=USER] does

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
调整Hudi数据源性能 - MapReduce服务 MRS

调整Hudi数据源性能本章节适用于MRS 3.3.1及以后版本。 HetuEngine具备高速访问Hive、Hudi等数据源的能力。对于Hudi数据源调优，可以分为对Hudi表本身和对集群环境的调优。 Hudi表调优可参考如下建议优化表和数据设计：建表时尽量按照频繁使用的过滤条件字段进行分区

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine性能调优
配置ClickHouse对接HDFS源文件（MRS 3.2.0-LTS） - MapReduce服务 MRS

配置ClickHouse对接HDFS源文件（MRS 3.2.0-LTS）本章节仅适用于MRS 3.2.0-LTS版本。操作场景本章节主要介绍使用ClickHouse对接HDFS组件进行文件读写。前提条件已安装ClickHouse客户端，例如客户端安装目录为“/opt/client

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
同步MRS集群配置 - MapReduce服务 MRS

同步MRS集群配置某个新的配置需要同时下发到集群所有服务，或修改某项配置后导致多个不同服务的“配置状态”为“配置过期”或“失败”时，表示这些服务的配置参数值未同步且未生效，集群管理员可以对集群执行同步配置功能，并在同步配置后重启相关服务实例，使所有服务启用新的配置参数。前提条件

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
ClickHouse本地表设计 - MapReduce服务 MRS

ClickHouse本地表设计规则单表（分布式表）的记录数不要超过万亿，对于万亿以上表的查询，性能较差，且集群维护难度变大。单表（本地表）不超过百亿。表的设计都要考虑到数据的生命周期管理，需要进行TTL表属性设置或定期老化清理表分区数据。单表的字段建议不要超过5000列。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
Spark2x如何访问外部集群组件 - MapReduce服务 MRS

Spark2x如何访问外部集群组件问题存在两个集群：cluster1 和cluster2，如何使用cluster1中的Spark2x访问cluster2中的HDFS、Hive、HBase和Kafka组件。回答可以有条件的实现两个集群间组件互相访问，但是存在以下限制：仅允许访问一个

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题
Spark Streaming对接Kafka0-10样例程序（Java） - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Java）功能介绍在Spark应用中，通过使用Streaming调用Kafka接口来获取单词记录，然后把单词记录分类统计，得到每个单词记录数，或将数据写入Kafka0-10。 Streaming读取Kafka0-10

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
HDFS Java API接口介绍 - MapReduce服务 MRS

HDFS Java API接口介绍 HDFS完整和详细的接口可以直接参考官方网站上的描述：http://hadoop.apache.org/docs/r3.1.1/api/index.html。 HDFS常用接口 HDFS常用的Java类有以下几个： FileSystem：是客户端应用的核心类

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > HDFS应用开发常见问题 > HDFS常用API介绍
Spark Streaming对接Kafka0-10样例程序（Java） - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Java）功能介绍在Spark应用中，通过使用Streaming调用Kafka接口来获取单词记录，然后把单词记录分类统计，得到每个单词记录数，或将数据写入Kafka0-10。 Streaming读取Kafka0-10

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
快速使用Doris - MapReduce服务 MRS
快速使用Doris - MapReduce服务 MRS

快速使用Doris Doris是一个基于MPP架构的高性能、实时的分析型数据库，不仅可以支持高并发的点查询场景，也能支持高吞吐的复杂分析场景。本文主要通过示例介绍如何快速使用MRS Doris集群进行基本的建表和查询操作。 Doris数据库名和表名区分大小写。前提条件已创建包含

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接该章节指导用户在创建MRS 3.3.0-LTS集群时配置LakeFormation数据连接，并在创建完成后配置MRS集群相关参数完成与LakeFormation的对接。创建集群时配置LakeFormation数据连接进入购买MRS

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS DataNode数据均衡操作场景本章节适用于MRS 3.x及后续版本。 HDFS集群可能出现DataNode节点间磁盘利用率不平衡的情况，比如集群中添加新数据节点的场景。如果HDFS出现数据不平衡的状况，可能导致多种问题，比如MapReduce应用程序无法很好地利用本地计算的优势

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS DataNode数据均衡操作场景本章节适用于MRS 3.x及后续版本。 HDFS集群可能出现DataNode节点间磁盘利用率不平衡的情况，比如集群中添加新数据节点的场景。如果HDFS出现数据不平衡的状况，可能导致多种问题，比如MapReduce应用程序无法很好地利用本地计算的优势

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS
快速配置参数 - MapReduce服务 MRS

快速配置参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”文件中配置

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
快速配置Spark参数 - MapReduce服务 MRS

快速配置Spark参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
HDFS Java API接口介绍 - MapReduce服务 MRS

HDFS Java API接口介绍 HDFS完整和详细的接口可以直接参考官方网站上的描述： http://hadoop.apache.org/docs/r3.1.1/api/index.html HDFS常用接口 HDFS常用的Java类有以下几个： FileSystem：是客户端应用的核心类

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > HDFS应用开发常见问题 > HDFS常用API介绍

总条数： 2309

上一页
1
...
95
96
97
...
116
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

建立Hive表分区提升查询效率 - MapReduce服务 MRS

Spark输入 - MapReduce服务 MRS

如何使用IDEA远程调试业务 - MapReduce服务 MRS

执行load data inpath命令报错 - MapReduce服务 MRS

调整Hudi数据源性能 - MapReduce服务 MRS

配置ClickHouse对接HDFS源文件（MRS 3.2.0-LTS） - MapReduce服务 MRS

同步MRS集群配置 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

Spark2x如何访问外部集群组件 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Java） - MapReduce服务 MRS

HDFS Java API接口介绍 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Java） - MapReduce服务 MRS

快速使用Doris - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

配置HDFS DataNode数据均衡 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

快速配置Spark参数 - MapReduce服务 MRS

HDFS Java API接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线