搜索_华为云

Flink SQL语法增强 - MapReduce服务 MRS

Flink SQL语法增强本章节适用于MRS 3.3.0及以后版本。 FlinkSQL DISTRIBUTEBY FlinkSQL新增DISTRIBUTEBY特性，根据指定的字段进行分区，支持单字段及多字段，解决数据仅需要分区的场景。示例如下： SELECT /*+ DISTRIBUTEBY('id')

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
成本管理 - MapReduce服务 MRS
成本管理 - MapReduce服务 MRS

硬盘、未绑定的EIP等。计费模式优化不同类型的业务对资源使用周期有不同的要求，为每一类业务确定合适的计费模式，灵活组合以达到最优效果。针对长期稳定的成熟业务，使用包年/包月计费模式。针对不能中断的短期、突增或不可预测的业务，使用按需计费模式。

帮助中心 > MapReduce服务 MRS > 计费说明
Impala用开发建议 - MapReduce服务 MRS

Impala用开发建议 Coordinator和Executor分离部署，Coordinator根据集群规模部署2-5个 Coordinator承担缓存元数据，解析SQL执行计划，和响应客户端请求的功能主要使用jvm内存，而Executor承担数据读写，算子计算等功能，主要使用o

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

则可以使用MapPartitions，按每个分区计算结果，如 rdd.mapPartitions(records => conn.getDBConn;for(item <- records) write(item.toString); conn.close) 使用mapPartition

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

则可以使用MapPartitions，按每个分区计算结果，如 rdd.mapPartitions(records => conn.getDBConn;for(item <- records) write(item.toString); conn.close) 使用mapPartition

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
在Kafka Topic中接入消息 - MapReduce服务 MRS

properties中的group.id与命令中--group的参数均配置为待查询的group。 Kafka集群IP端口号安全模式下是21007，普通模式下是9092。使用KafkaUI查看当前消费情况（MRS 3.1.2及之后版本）进入KafkaUI界面。使用具有Kafk

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka
配置HetuEngine查询容错执行能力 - MapReduce服务 MRS

用的内存更大，但会导致集群并发能力变小，可根据实际业务情况动态调整。添加完成后将“立即启动”置为“是”，单击“确定”。启用TASK容错模式后，会产生中间数据并缓存到文件系统中，过大的查询并发会对文件系统产生较大的磁盘压力。当前HetuEngine默认支持将中间数据缓冲至HDF

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 管理HetuEngine计算实例
ALM-19014 在ZooKeeper上的容量配额使用率严重超过阈值 - MapReduce服务 MRS

产生该告警表示HBase服务的znode的容量使用率已经严重超过规定的阈值，会导致HBase服务的写入请求失败。可能原因 HBase配置了容灾并且容灾存在数据同步失败或者同步速度慢。 HBase集群存在大量的WAL文件在进行split。处理步骤检查znode容量配置和使用量

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-19016 在ZooKeeper上的数量配额使用率严重超过阈值 - MapReduce服务 MRS

产生该告警表示HBase服务的znode的数量使用率已经严重超过规定的阈值，会导致HBase服务的写入请求失败。可能原因 HBase配置了容灾并且容灾存在数据同步失败或者同步速度慢； HBase集群存在大量的WAL文件在进行split。处理步骤检查znode数量配置和使用量

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
schedule-tool工具使用示例 - MapReduce服务 MRS

出的路径。通过以上过滤规则，拼凑到的字符串“*20160221.txt”，会作为文件过滤器的模糊匹配模式，在作业配置的输入路径下，所有符合“*20160221.txt”这个模式的文件都将被作业处理。父主题：客户端工具说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
schedule-tool工具使用示例 - MapReduce服务 MRS

出的路径。通过以上过滤规则，拼凑到的字符串“*20160221.txt”，会作为文件过滤器的模糊匹配模式，在作业配置的输入路径下，所有符合“*20160221.txt”这个模式的文件都将被作业处理。父主题：客户端工具说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

COM" useTicketCache=false storeKey=true debug=true; }; 在Spark on YARN模式下，jaas.conf和user.keytab通过YARN分发到Spark on YARN的container目录下，因此KafkaCli

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark Streaming对接kafka0-10程序
配置SparkSQL的分块个数 - MapReduce服务 MRS

配置SparkSQL的分块个数配置场景 SparkSQL在进行shuffle操作时默认的分块数为200。在数据量特别大的场景下，使用默认的分块数就会造成单个数据块过大。如果一个任务产生的单个shuffle数据块大于2G，该数据块在被fetch的时候还会报类似错误： Adjusted

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
ALM-45425 ClickHouse服务不可用 - MapReduce服务 MRS

集群已启用Kerberos认证（安全模式）： kinit 组件业务用户 clickhouse client --host 上报告警的ClickHouseServer实例IP --port 9440 --secure 集群未启用Kerberos认证（普通模式）： clickhouse client

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
查看与配置MRS告警事件 - MapReduce服务 MRS

配置MRS集群告警屏蔽状态配置MRS集群对接SNMP网管平台上报告警配置MRS集群对接Syslog服务器上报告警配置定时备份告警与审计信息开启MRS集群维护模式停止上报告警配置MRS集群告警事件消息通知父主题： MRS集群运维

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维
经验总结 - MapReduce服务 MRS
经验总结 - MapReduce服务 MRS

则可以使用MapPartitions，按每个分区计算结果，如： rdd.mapPartitions(records => conn.getDBConn;for(item <- records) write(item.toString); conn.close) 使用mapPartition

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
ALM-45276 RangerAdmin状态异常 - MapReduce服务 MRS

执行netstat -anp|grep pid | grep LISTEN查看RangerAdmin进程是否监测端口，安全模式集群监测21401端口，普通模式集群监测21400端口。是，执行4。否，重启RangerAdmin故障实例或Ranger服务，执行3。重启服务期间服

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Repartition时有部分Partition没数据 - MapReduce服务 MRS

Repartition时有部分Partition没数据问题在repartition操作时，分块数“spark.sql.shuffle.partitions”设置为4500，repartition用到的key列中有超过4000个的不同key值。期望不同key对应的数据能分到不同

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame

总条数： 3793

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink SQL语法增强 - MapReduce服务 MRS

成本管理 - MapReduce服务 MRS

Impala用开发建议 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

在Kafka Topic中接入消息 - MapReduce服务 MRS

配置HetuEngine查询容错执行能力 - MapReduce服务 MRS

ALM-19014 在ZooKeeper上的容量配额使用率严重超过阈值 - MapReduce服务 MRS

ALM-19016 在ZooKeeper上的数量配额使用率严重超过阈值 - MapReduce服务 MRS

schedule-tool工具使用示例 - MapReduce服务 MRS

schedule-tool工具使用示例 - MapReduce服务 MRS

场景说明 - MapReduce服务 MRS

配置SparkSQL的分块个数 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

ALM-45425 ClickHouse服务不可用 - MapReduce服务 MRS

查看与配置MRS告警事件 - MapReduce服务 MRS

经验总结 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

ALM-45276 RangerAdmin状态异常 - MapReduce服务 MRS

Repartition时有部分Partition没数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线