搜索_华为云

ClickHouse分区设计 - MapReduce服务 MRS

ClickHouse分区设计合理设置分区键，控制分区数在一千以内，分区字段使用整型。分区part数与查询性能关系图1 分区part数与查询性能关系图分区建议建议使用toYYYYMMDD（pt_d）作为分区键，pt_d是date类型。如果业务场景需要做小时分区，使用pt

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

创建表示来自kafka的input lines stream的DataFrame # 安全模式要修改spark/conf/jaas.conf和jaas-zk.conf为KafkaClient lines = spark.readStream.format("kafka")\

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

创建表示来自kafka的input lines stream的DataFrame # 安全模式要修改spark/conf/jaas.conf和jaas-zk.conf为KafkaClient lines = spark.readStream.format("kafka")\

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
执行Kafka Topic创建操作时发现无法创建提示“NoAuthException” - MapReduce服务 MRS

admin.AdminUtils$.writeTopicConfig(AdminUtils.scala:247) 通过客户端命令klist查询当前认证用户： [root@10-10-144-2 client]# klist Ticket cache: FILE:/tmp/krb5cc_0

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
MapReduce大任务的AM调优 - MapReduce服务 MRS

MapReduce大任务的AM调优操作场景当运行一个大任务（map总数达到了10万的规模），但是一直没有运行成功。经过查询发现是ApplicationMaster（以下简称AM）反应缓慢，最终超时失败。此任务的问题是，task数量变多时，AM管理的对象也线性增长，因此就需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce > MapReduce性能调优
配置Hive支持创建超过32个角色 - MapReduce服务 MRS

过32个角色，开启此功能后，Hive将支持创建超过32个角色。开启本功能并对表库等授权后，对表库目录具有相同权限的角色将会用“|”合并。查询acl权限时，将显示合并后的结果，与开启该功能前的显示会有区别。此操作不可逆，请充分考虑实际应用场景，再决定是否做出调整。 MRS3.x及

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
MapReduce大任务的AM调优 - MapReduce服务 MRS

MapReduce大任务的AM调优操作场景当运行一个大任务（map总数达到了10万的规模），但是一直没有运行成功。经过查询发现是ApplicationMaster（以下简称AM）反应缓慢，最终超时失败。此任务的问题是，task数量变多时，AM管理的对象也线性增长，因此就需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce > MapReduce性能调优
ORDER BY - MapReduce服务 MRS
ORDER BY - MapReduce服务 MRS

BY或HAVING子句之后，在OFFSET、LIMIT或FETCH FIRST子句之前进行计算。按照SQL规范，ORDER BY子句只影响包含该子句的查询结果的行顺序。HetuEngine遵循该规范，并删除该子句的冗余用法，以避免对性能造成负面影响。例如在执行INSERT语句时，ORDER

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
ClickHouse表引擎适用场景说明 - MapReduce服务 MRS

MergeTree ClickHouse中最重要的引擎，基于分区键（partitioning key）的数据分区分块存储、前缀稀疏索引（order by和primary key）。 ReplacingMergeTree 相对于MergeTree，它会用最新的数据覆盖具有相同主键的重复项。删除

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库设计
自动弹性伸缩 - MapReduce服务 MRS

性伸缩。此外，如果数据量为周期有规律的变化，并且希望在数据量变化前提前完成集群的扩缩容，可以使用MRS的资源计划特性。 MRS服务支持规则和时间计划两种弹性伸缩的策略：弹性伸缩规则：根据集群实时负载对Task节点数量进行调整，数据量变化后触发扩缩容，有一定的延后性。资源计划：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
使用CDL从PgSQL同步数据到Hudi - MapReduce服务 MRS

在“作业管理”的作业列表中，找到创建的作业名称，单击操作列的“启动”，等待作业启动。观察数据传输是否生效，例如在PgSQL数据库中对表进行插入数据操作，查看Hudi导入的文件内容。父主题：创建CDL作业

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
表输入 - MapReduce服务 MRS
表输入 - MapReduce服务 MRS

置的第二步“输入设置”中指定，当配置了“表列名”时，就是配置的值；当没配置“表列名”时，默认该表的所有列或者是“SQL语句”配置项里配置的查询条件中指明的列。配置的输入字段个数不能大于实际指定的列数，否则全部数据成为脏数据。当字段的值与实际的类型不匹配时，该行数据会成为脏数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
使用Spark执行Hudi样例程序（Python） - MapReduce服务 MRS

options(**hudi_options). \ mode("overwrite"). \ save(basePath) 查询数据： tripsSnapshotDF = spark. \ read. \ format("hudi"). \ load(basePath

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
配置HBase冷热数据分离存储 - MapReduce服务 MRS

OBS读IOPS的能力降低，因此只适用于低频查询的场景。 OBS不适合并发大量读请求的场景，并发大量读请求可能会导致请求异常。原理介绍 HBase支持对同一张表的数据进行冷热分离存储。用户在表上配置数据冷热时间分界点后，HBase会依赖用户写入数据的时间戳（毫秒）和时间分界点来判断数据的冷热。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 配置HBase冷热分离
compaction&cleaning配置 - MapReduce服务 MRS

cleaner.policy 要使用的清理策略。Hudi将删除旧版本的parquet文件以回收空间。任何引用此版本文件的查询和计算都将失败。需要确保数据保留的时间超过最大查询执行时间。 KEEP_LATEST_COMMITS hoodie.cleaner.commits.retained

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
CarbonData常见问题 - MapReduce服务 MRS

CarbonData常见问题为什么对decimal数据类型进行带过滤条件的查询时会出现异常输出？如何避免对历史数据进行minor compaction？如何在CarbonData数据加载时修改默认的组名？为什么INSERT INTO CARBON TABLE失败？为什么含转义字符的输入数据记录到Bad

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本）
导入导出FlinkServer作业信息 - MapReduce服务 MRS

依赖数据。作业的应用信息不会导出。流表导出时，不解析处理流表的依赖，即流表依赖的应用信息不会导出。 UDF导出时，不解析处理UDF的依赖和被动依赖，即UDF依赖的应用信息和在哪些作业被使用的信息不会导出。支持不同应用之间的导入导出。根据安全需求，导入或导出FlinkSQL作

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > 管理FlinkServer作业
表输入 - MapReduce服务 MRS
表输入 - MapReduce服务 MRS

置的第二步“输入设置”中指定，当配置了“表列名”时，就是配置的值；当没配置“表列名”时，默认该表的所有列或者是“SQL语句”配置项里配置的查询条件中指明的列。配置的输入字段个数不能大于实际指定的列数，否则全部数据成为脏数据。当字段的值与实际的类型不匹配时，该行数据会成为脏数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
配置Hive支持创建超过32个角色 - MapReduce服务 MRS

过32个角色，开启此功能后，Hive将支持创建超过32个角色。开启本功能并对表库等授权后，对表库目录具有相同权限的角色将会用“|”合并。查询ACL权限时，将显示合并后的结果，与开启该功能前的显示会有区别。此操作不可逆，请充分考虑实际应用场景，再决定是否做出调整。如果当前组件使

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
IoTDB应用开发建议 - MapReduce服务 MRS

分布式在Session内部做了缓存，实现客户端时避免每次读写都新建Session，或者使用SessionPool进行复用连接。查询结果集ResultSet、SessionDataSet使用完成后注意关闭查询结果集ResultSet、SessionDataSet使用完成后需要关闭，否则会造成服务资源浪费。父主题：

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > IoTDB应用开发规范

总条数： 3815

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ClickHouse分区设计 - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

执行Kafka Topic创建操作时发现无法创建提示“NoAuthException” - MapReduce服务 MRS

MapReduce大任务的AM调优 - MapReduce服务 MRS

配置Hive支持创建超过32个角色 - MapReduce服务 MRS

MapReduce大任务的AM调优 - MapReduce服务 MRS

ORDER BY - MapReduce服务 MRS

ClickHouse表引擎适用场景说明 - MapReduce服务 MRS

自动弹性伸缩 - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Hudi - MapReduce服务 MRS

表输入 - MapReduce服务 MRS

使用Spark执行Hudi样例程序（Python） - MapReduce服务 MRS

配置HBase冷热数据分离存储 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

CarbonData常见问题 - MapReduce服务 MRS

导入导出FlinkServer作业信息 - MapReduce服务 MRS

表输入 - MapReduce服务 MRS

配置Hive支持创建超过32个角色 - MapReduce服务 MRS

IoTDB应用开发建议 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线