搜索_华为云

Hudi常见配置参数 - MapReduce服务 MRS

Hudi是否应该基于最后24个提交的元数据动态计算insertSplitSize，默认关闭。 true hoodie.copyonwrite.record.size.estimate 平均记录大小。如果指定，Hudi将使用它，并且不会基于最后24个提交的元数据动态地计算。没有默认值设置。这对于计算插入并行度以及将插入打包到小文件中至关重要。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
成本管理 - MapReduce服务 MRS
成本管理 - MapReduce服务 MRS

业务项目来划分。在购买云资源时选择指定企业项目，新购云资源将按此企业项目进行成本分配。详细介绍请参见通过企业项目维度查看成本分配。图1 为MRS集群选择企业项目通过成本标签进行成本分配标签是华为云为了标识云资源，按各种维度（例如用途、所有者或环境）对云资源进行分类的标记。推

 帮助中心 > MapReduce服务 MRS > 计费说明
Spark Java API接口介绍 - MapReduce服务 MRS

void start() 启动Spark Streaming计算。 void awaitTermination() 当前进程等待终止，如Ctrl+C等。 void stop() 终止Spark Streaming计算。 <T> JavaDStream<T> transform(java

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
配置NameNode内存参数 - MapReduce服务 MRS

GC_PROFILE NameNode所占内存主要由FsImage大小决定。FsImage Size = 文件数 * 900 Bytes，根据计算结果可估算hdfs的NameNode应设内存大小。该参数项的内存大小取值如下： high：4G medium：2G low：256M c

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
Flink常用配置参数 - MapReduce服务 MRS

pool-size-factor 【说明】计算线程池大小的因子，计算公式：ceil（可用处理器*因子），计算结果限制在pool-size-min和pool-size-max之间。 1.0 否 akka.server-socket-worker-pool.pool-size-max 基于因子计算的线程数上限。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink > Flink运维管理
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

datanode.du.reserved.percentage DataNode预留空间占总磁盘空间大小的百分比。DataNode会永久预留由此百分比计算得出的磁盘空间大小。整数值，取值范围是0～100。 10 父主题： HDFS企业级能力增强

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
Yarn节点配置调优 - MapReduce服务 MRS

程，请降低此参数值给该进程预留足够运行资源。 16384 CPU虚拟核数建议将此配置设定在逻辑核数的1.5～2倍之间。如果上层计算应用对CPU的计算能力要求不高，可以配置为2倍的逻辑CPU。参数描述默认值 yarn.nodemanager.resource.cpu-vcores

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
Impala应用开发规则 - MapReduce服务 MRS

套拆分成多个查询执行。分区表select * 必须带上分区键分区表查询select * 不带分区键，会Impala触发全表，极大地占用计算资源，非必要场景下请按分区查询。父主题： Impala应用开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
HDFS应用开发简介 - MapReduce服务 MRS

能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，大大降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA API、C

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式）
Spark Java API接口介绍 - MapReduce服务 MRS

void start() 启动Spark Streaming计算。 void awaitTermination() 当前进程等待终止，如Ctrl+C等。 void stop() 终止Spark Streaming计算。 <T> JavaDStream<T> transform(java

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Spark Java API接口介绍 - MapReduce服务 MRS

void start() 启动Spark Streaming计算。 void awaitTermination() 当前进程等待终止，如Ctrl+C等。 void stop() 终止Spark Streaming计算。 <T> JavaDStream<T> transform(java

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
常见概念 - MapReduce服务 MRS
常见概念 - MapReduce服务 MRS

以使用一个数据库表中的一列或多列，提供了快速随机查找和有效访问有序记录的基础。协处理器 HBase提供的在RegionServer执行的计算逻辑的接口。协处理器分两种类型，系统协处理器可以全局导入RegionServer上的所有数据表，表协处理器即是用户可以指定一张表使用协处理器。

帮助中心 > MapReduce服务 MRS > 产品介绍
MRS Hive对接外部LDAP配置说明 - MapReduce服务 MRS

提供用户和用户组数据保存能力。方案架构 Hive是建立在Hadoop上的数据仓库框架，提供大数据平台批处理计算能力，能够对结构化/半结构化数据进行批量分析汇总完成数据计算。提供类似SQL的Hive Query Language语言操作结构化数据，其基本原理是将HQL语言自动转换

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

在“现有集群”列表中，单击指定的集群名称。记录集群的“可用区”、“虚拟私有云”、“集群管理页面”、“安全组”。在管理控制台首页服务列表中选择“弹性云服务器”，进入ECS管理控制台，创建一个新的弹性云服务器。弹性云服务器的“可用区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
Spark Java API接口介绍 - MapReduce服务 MRS

void start() 启动Spark Streaming计算。 void awaitTermination() 当前进程等待终止，如Ctrl+C等。 void stop() 终止Spark Streaming计算。 <T> JavaDStream<T> transform(java

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
Upsert数据写入 - MapReduce服务 MRS

by字段作为去重唯一键。如果未指定主键，只指定了order by建表属性，去重键以order by字段为准。数据去重的key需要提前在应用中进行sharding计算，保证相同的key会sharding到同一个shard，才能保证后续相同的key字段数据sharding到同一个shard进行数据的精确去重。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse常用SQL语法
配置DataNode预留磁盘百分比 - MapReduce服务 MRS

datanode.du.reserved.percentage DataNode预留空间占总磁盘空间大小的百分比。DataNode会永久预留由此百分比计算得出的磁盘空间大小。整数值，取值范围是0～100。 10 父主题： HDFS企业级能力增强

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
ClickHouse开源增强特性 - MapReduce服务 MRS

Replica模式，数据双副本高可靠。图2 ClickHouse的cluster结构平滑的弹性扩容能力随着业务的快速增长，面对集群存储容量或者CPU计算资源接近极限等场景，MRS服务提供了ClickHouse数据迁移工具，该工具可以将某几个ClickHouseServer实例节点上的一个或

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
ClickHouse索引设计 - MapReduce服务 MRS

对于*MergeTree引擎，支持配置跳数索引，即一种数据局部聚合的粗糙索引，对数据块创建索引，选择性的保留一部分原始数据（minmax、set），或者是保留计算后的中间数据（bloomfilter）。在查询时，选择忽略加载不会包含结果的数据块，从而达到加速查询的效果。索引定义 INDEX index_name

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
使用HDFS Colocation存储Hive表 - MapReduce服务 MRS

息，当使用insert语句向该表中插入数据时会将该表的数据文件存放在相同的存储节点上（不支持其他数据导入方式），从而使后续的多表关联的数据计算更加方便和高效。支持HDFS的Colocation功能的Hive表格式只有TextFile和RCFile。操作步骤使用客户端安装用户登录客户端所在节点。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置

总条数： 1796

上一页
1
...
19
20
21
...
90
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi常见配置参数 - MapReduce服务 MRS

成本管理 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

配置NameNode内存参数 - MapReduce服务 MRS

Flink常用配置参数 - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

Yarn节点配置调优 - MapReduce服务 MRS

Impala应用开发规则 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

常见概念 - MapReduce服务 MRS

MRS Hive对接外部LDAP配置说明 - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

Spark Java API接口介绍 - MapReduce服务 MRS

Upsert数据写入 - MapReduce服务 MRS

配置DataNode预留磁盘百分比 - MapReduce服务 MRS

ClickHouse开源增强特性 - MapReduce服务 MRS

ClickHouse索引设计 - MapReduce服务 MRS

使用HDFS Colocation存储Hive表 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线