搜索_华为云

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略操作场景默认情况下，NameNode会随机选择DataNode节点写文件。当集群内某些数据节点的磁盘容量不一致（某些节点的磁盘总容量大，某些总容量小），会导致磁盘总容量小的节点先写满。通过修改集群默认的DataNode写数据时的磁盘选择策略为

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS企业级能力增强
配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略操作场景默认情况下，NameNode会随机选择DataNode节点写文件。当集群内某些数据节点的磁盘容量不一致（某些节点的磁盘总容量大，某些总容量小），会导致磁盘总容量小的节点先写满。通过修改集群默认的DataNode写数据时的磁盘选择策略为

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS企业级能力增强
配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息配置场景 YARN Restart特性包含两部分内容：ResourceManager Restart和NodeManager Restart。当启用ResourceManager Restart时，升主后的ResourceManager

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn企业级能力增强
ClickHouse表引擎适用场景说明 - MapReduce服务 MRS

ClickHouse表引擎适用场景说明 ClickHouse中最强大的表引擎当属MergeTree（合并树）引擎及该系列其他引擎，根据业务场景选择合适的引擎。表引擎选择建议自助报表分析、行为数据分析，在不涉及重复数据聚合的情况下，建议使用ReplicatedMergeTree表引擎

 帮助中心 > MapReduce服务 MRS > 最佳实践 > ClickHouse设计开发规范 > ClickHouse数据库设计
Flink Client CLI介绍 - MapReduce服务 MRS

Flink Client CLI介绍常用CLI Flink常用的CLI如下所示： yarn-session.sh 可以使用yarn-session.sh启动一个常驻的Flink集群，接受来自客户端提交的任务。启动一个有3个TaskManager实例的Flink集群示例如下： bin

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > Flink应用开发常见问题 > Flink常用API介绍
HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

HBase访问多ZooKeeper场景安全认证场景说明在同一个客户端进程内同时访问FusionInsight ZooKeeper和第三方的ZooKeeper时，为了避免访问连接ZooKeeper认证冲突，提供了样例代码使HBase客户端访问FusionInsight ZooKeeper

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境 > 配置HBase应用安全认证
Spark SQL join优化 - MapReduce服务 MRS

Spark SQL join优化操作场景 Spark SQL中，当对两个表进行join操作时，利用Broadcast特性（请参见使用广播变量），将小表BroadCast到各个节点上，从而转变成非shuffle操作，提高任务执行性能。这里join操作，只指inner join。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
ZooKeeper与其他组件的关系 - MapReduce服务 MRS

ZooKeeper与其他组件的关系 ZooKeeper和HDFS的关系 ZooKeeper与HDFS的关系如图1所示。图1 ZooKeeper和HDFS的关系 ZKFC（ZKFailoverController）作为一个ZooKeeper集群的客户端，用来监控NameNode的状态信息

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ZooKeeper
实时任务接入 - MapReduce服务 MRS

实时任务接入实时作业一般由Flink Sql或Sparkstreaming来完成，流式实时任务通常配置同步生成compaction计划，异步执行计划。 Flink SQL作业中sink端Hudi表相关配置如下： create table denza_hudi_sink ( $HUDI_SINK_SQL_REPLACEABLE

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
快速开发Hive JDBC应用 - MapReduce服务 MRS

快速开发Hive JDBC应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
PyFlink样例程序代码说明 - MapReduce服务 MRS

PyFlink样例程序代码说明通过Python API的方式提交Flink读写Kafka作业到Yarn上代码样例下面列出pyflink-kafka.py的主要逻辑代码作为演示，在提交之前需要确保“file_path” 为要运行的SQL的路径，建议写全路径。完整代码参见“flink-examples

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > PyFlink样例程序
CarbonData调优思路 - MapReduce服务 MRS

CarbonData调优思路查询性能调优 CarbonData可以通过调整各种参数来提高查询性能。大部分参数聚焦于增加并行性处理和更好地使用系统资源。 Spark Executor数量：Executor是Spark并行性的基础实体。通过增加Executor数量，集群中的并行数量也会增加

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

应用场景大数据在人们的生活中无处不在，在IoT、电子商务、金融、制造、医疗、能源和政府部门等行业均可以使用华为云MRS服务进行大数据处理。海量数据分析场景海量数据分析是现代大数据系统中的主要场景。通常企业会包含多种数据源，接入后需要对数据进行ETL（Extract-Transform-Load

帮助中心 > MapReduce服务 MRS > 产品介绍
LakeFormation概述 - MapReduce服务 MRS

LakeFormation概述 LakeFormation是企业级一站式湖仓构建服务，提供元数据统一管理的可视化界面及API，兼容Hive元数据模型以及Ranger权限模型，支持无缝对接多种计算引擎及大数据云服务，使客户便捷高效地构建数据湖和运营相关业务，加速释放业务数据价值。您可以创建一个

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
比较函数和运算符 - MapReduce服务 MRS

比较函数和运算符比较操作操作描述 < 小于 > 大于 <= 小于等于 >= 大于等于 = 等于 <> 不等于 != 不等于范围比较：between between适用于值在一个特定的范围内，如：value BETWEEN min AND max Not between适用于值不在某个特定范围内

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
ClickHouse SQL调优 - MapReduce服务 MRS

ClickHouse SQL调优规则合理使用数据表的分区字段和索引字段。 MergeTree引擎，数据是以分区目录的形式进行组织存储的，在进行的数据查询时，使用分区可以有效跳过无用的数据文件，减少数据的读取。 MergeTree引擎会根据索引字段进行数据排序，并且根据index_granularity

帮助中心 > MapReduce服务 MRS > 最佳实践 > ClickHouse设计开发规范 > ClickHouse数据库调优
PyFlink样例程序代码说明 - MapReduce服务 MRS

PyFlink样例程序代码说明通过Python API的方式提交Flink读写Kafka作业到Yarn上代码样例下面列出pyflink-kafka.py的主要逻辑代码作为演示，在提交之前需要确保“file_path” 为要运行的SQL的路径，建议写全路径。完整代码参见“flink-examples

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > PyFlink样例程序
CarbonData调优思路 - MapReduce服务 MRS

CarbonData调优思路查询性能调优 CarbonData可以通过调整各种参数来提高查询性能。大部分参数聚焦于增加并行性处理和更好地使用系统资源。 Spark Executor数量：Executor是Spark并行性的基础实体。通过增加Executor数量，集群中的并行数量也会增加

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据应用场景本文介绍如何使用MRS集群运行Spark Streaming作业以消费Kafka数据。假定某个业务Kafka每1秒就会收到1个单词记录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
运行MapReduce作业 - MapReduce服务 MRS

运行MapReduce作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个MapReduce作业。 MapReduce作业用于提交Hadoop jar程序快速并行处理大量数据，是一种分布式数据处理模式。用户可以在MRS管理控制台在线创建一个作业并提交运行

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业

总条数： 1553

上一页
1
...
63
64
65
...
78
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置DataNode节点容量不一致时的副本放置策略 - MapReduce服务 MRS

配置ResourceManager重启后自动加载Container信息 - MapReduce服务 MRS

ClickHouse表引擎适用场景说明 - MapReduce服务 MRS

Flink Client CLI介绍 - MapReduce服务 MRS

HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

ZooKeeper与其他组件的关系 - MapReduce服务 MRS

实时任务接入 - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

PyFlink样例程序代码说明 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

应用场景 - MapReduce服务 MRS

LakeFormation概述 - MapReduce服务 MRS

比较函数和运算符 - MapReduce服务 MRS

ClickHouse SQL调优 - MapReduce服务 MRS

PyFlink样例程序代码说明 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

运行MapReduce作业 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线