搜索_华为云

Spark2x开源新特性说明 - MapReduce服务 MRS

1.5版本新增了一些开源特性。具体特性或相关概念如下： DataSet，详见SparkSQL和DataSet原理。 Spark SQL Native DDL/DML，详见SparkSQL和DataSet原理。 SparkSession，详见SparkSession原理。 Structured

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x
配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

由于MapReduce的作业日志和任务日志（聚合功能开启的情况下）都保存在HDFS上。对于计算任务量大的集群，如果不进行合理的配置对日志文件进行定期归档和删除，日志文件将占用HDFS大量内存空间，增加集群负载。日志归档是通过Hadoop Archives功能实现的，Hadoop A

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用MapReduce
配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

由于MapReduce的作业日志和任务日志（聚合功能开启的情况下）都保存在HDFS上。对于计算任务量大的集群，如果不进行合理的配置对日志文件进行定期归档和删除，日志文件将占用HDFS大量内存空间，增加集群负载。日志归档是通过Hadoop Archives功能实现的，Hadoop A

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Mapreduce
Spark SQL性能调优 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优配置多并发客户端连接JDBCServer 配置SparkSQL的分块个数 Spark动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Spark SQL性能调优 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能优化小文件场景下的Spark SQL性能 Spark INSERT SELECT语句调优动态分区插入场景内存优化小文件优化聚合算法优化 Datasource表优化合并CBO优化多级嵌套子查询以及混合Join的SQL调优父主题：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
HetuEngine SQL函数和操作符说明 - MapReduce服务 MRS

HetuEngine SQL函数和操作符说明逻辑运算符比较函数和运算符条件表达式 Lambda表达式转换函数数学函数和运算符 Bitwise函数十进制函数和操作符字符串函数和运算符正则表达式函数二进制函数和运算符 Json函数和运算符日期、时间函数及运算符聚合函数窗口函数数组函数和运算符

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明
Spark Core企业级能力增强 - MapReduce服务 MRS

配置parquet表的压缩格式使用Ranger时适配第三方JDK 配置Spark小文件自动合并使用Spark小文件合并工具说明配置流式读取Spark Driver执行结果配置Spark Executor退出时执行自定义代码配置Spark动态脱敏 Spark Distinct聚合优化配置Spark作业失败时清理残留文件

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
实时OLAP数据分析 - MapReduce服务 MRS

s 离线数据加载：通过Broker Load将ORC格式的Hive数据导入Doris 实时数据加载：通过FlinkSQL将订单表Kafka数据实时同步到Doris 实时OLAP数据查询：基于Unique表的单表检索查询和聚合查询父主题：数据分析

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用KafkaStreams统计数据 - MapReduce服务 MRS

level KafkaStreams API代码样例，通过Kafka Streams读取输入Topic中的消息，统计每条消息中的单词个数，从输出Topic消费数据，将统计结果以Key-Value的形式输出，完成单词统计功能。 High Level KafkaStreams API代码样例下面代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > 开发Kafka应用
重启MRS集群组件 - MapReduce服务 MRS

只重启配置过期的实例 - 是否只重启集群内修改过配置的实例。部分版本该参数名称为“仅重启配置过期的实例”，请以实际显示为准。启用机架策略 - 是否启用机架并发滚动重启策略，只对满足机架策略滚动重启的角色（角色支持机架感知功能，且角色下的实例归属于2个或2个以上的机架）生效。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
使用Spark小文件合并工具说明 - MapReduce服务 MRS

zlib, lzo, snappy）来选择Parquet和Orc表的压缩格式；由于Hive和Spark表在可选的压缩格式上有区别，除以上列出的压缩格式外，其他的压缩格式不支持。合并桶表数据，需要先在Spark2x客户端的hive-site.xml里加上配置： <property>

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
Oozie应用开发应用开发简介 - MapReduce服务 MRS

Oozie是一个用来管理Hadoop任务的工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。 Oozie流程的三种类型： Workflow

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（安全模式） > Oozie应用开发概述
OpenTSDB - MapReduce服务 MRS
OpenTSDB - MapReduce服务 MRS

OpenTSDB是一个基于HBase的分布式、可伸缩的时间序列数据库。OpenTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性。 OpenTSDB由时间序列守护进程（TSD）和一组命令行实用程序组成。与OpenTSDB的交互主要通

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
使用KafkaStreams统计数据 - MapReduce服务 MRS

level KafkaStreams API代码样例，通过Kafka Streams读取输入Topic中的消息，统计每条消息中的单词个数，从输出Topic消费数据，将统计结果以Key-Value的形式输出，完成单词统计功能。 High Level KafkaStreams API代码样例下面代码片段在com

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 开发Kafka应用
Flink常见SQL语法说明 - MapReduce服务 MRS

FROM orders_with_total GROUP BY order_id; 窗口聚合语句通过窗口聚合进行分组的查询将计算每个组的单个结果行。该语句适用于MRS 3.1.2-LTS及以上版本集群中的Flink。语法： SELECT ... FROM <windowed_table>

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink
Oozie应用开发简介 - MapReduce服务 MRS

Oozie是一个用来管理Hadoop任务的工作流引擎，Oozie流程基于有向无环图（Directed Acyclical Graph）来定义和描述，支持多种工作流模式及流程定时触发机制。易扩展、易维护、可靠性高，与Hadoop生态系统各组件紧密结合。 Oozie流程的三种类型： Workflow

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Oozie开发指南（普通模式） > Oozie应用开发概述
ClickHouse设计规范概述 - MapReduce服务 MRS

库规划、建模设计、开发、调优、运维的规则建议和指导。通过这些约束和建议，指导开发者在ClickHouse数据库开发使用过程中能够最大化发挥数据库的优势，保障ClickHouse数据库高性能、稳定可靠运行。用户可更专注于上层业务，释放数据更大的价值。表1 ClickHouse设计规范说明

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范
UPDATE CARBON TABLE - MapReduce服务 MRS

在其中执行更新操作的CarbonData表的名称。 column_name 待更新的目标列。 sourceColumn 需在目标表中更新的源表的列值。 sourceTable 将其记录更新到目标CarbonData表中的表。注意事项以下是使用UPDATE命令的条件：如果源表中的多个输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
UPDATE CARBON TABLE - MapReduce服务 MRS

在其中执行更新操作的CarbonData表的名称。 column_name 待更新的目标列。 sourceColumn 需在目标表中更新的源表的列值。 sourceTable 将其记录更新到目标CarbonData表中的表。注意事项以下是使用UPDATE命令的条件：如果源表中的多个输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）

总条数： 3742

上一页
1
...
7
8
9
...
188
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark2x开源新特性说明 - MapReduce服务 MRS

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

配置MapReduce任务日志归档和清理机制 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

Spark SQL性能调优 - MapReduce服务 MRS

HetuEngine SQL函数和操作符说明 - MapReduce服务 MRS

Spark Core企业级能力增强 - MapReduce服务 MRS

实时OLAP数据分析 - MapReduce服务 MRS

使用KafkaStreams统计数据 - MapReduce服务 MRS

重启MRS集群组件 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

Oozie应用开发应用开发简介 - MapReduce服务 MRS

OpenTSDB - MapReduce服务 MRS

使用KafkaStreams统计数据 - MapReduce服务 MRS

Flink常见SQL语法说明 - MapReduce服务 MRS

Oozie应用开发简介 - MapReduce服务 MRS

ClickHouse设计规范概述 - MapReduce服务 MRS

UPDATE CARBON TABLE - MapReduce服务 MRS

UPDATE CARBON TABLE - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线