搜索_华为云

Flink SQL逻辑开发建议 - MapReduce服务 MRS

enabled: true table.optimizer.distinct-agg.split.bucket-num: 1024 查询今天有多少唯一用户登录： SELECT day, COUNT(DISTINCT user_id) FROM T GROUP BY day 自动改写查询： SELECT

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink SQL逻辑开发规范
创建Impala表 - MapReduce服务 MRS
创建Impala表 - MapReduce服务 MRS

外部表，如果数据要被多种工具共同处理，则应该使用外部表，可避免对该数据的误操作。删除外部表时，只删除掉元数据。根据已有表创建新表，使用CREATE LIKE句式，完全复制原有的表结构，包括表的存储格式。根据查询结果创建新表，使用CREATE AS SELECT句式。这种方式比较灵活，可以在复制原表表结构的同时

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
MapReduce基本原理 - MapReduce服务 MRS

MapReduce基本原理如需使用MapReduce，请确保MRS集群内已安装Hadoop服务。 MapReduce是Hadoop的核心，是Google提出的一个软件架构，用于大规模数据集（大于1TB）的并行运算。概念“Map（映射）”和“Reduce（化简）”及其主要思想，均取自于函数式编程语言及矢量编程语言。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > MapReduce
Flink流式读Hudi表规则 - MapReduce服务 MRS

keygenerator.type 选填上游表主键生成类型。 COMPLEX read.streaming.check-interval 选填流读检测上游新提交的周期，默认值为1分钟。 5（流量大建议使用默认值） read.end-commit 选填 Stream增量消费，通过参数read.streaming

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范
Spark Structured Streaming样例程序（Scala） - MapReduce服务 MRS

spark.examples.SecurityKafkaWordCount。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。 object SecurityKafkaWordCount {

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Spark Structured Streaming样例程序（Scala） - MapReduce服务 MRS

spark.examples.SecurityKafkaWordCount。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。 object SecurityKafkaWordCount {

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
创建Impala表 - MapReduce服务 MRS
创建Impala表 - MapReduce服务 MRS

外部表，如果数据要被多种工具共同处理，则应该使用外部表，可避免对该数据的误操作。删除外部表时，只删除掉元数据。根据已有表创建新表，使用CREATE LIKE句式，完全复制原有的表结构，包括表的存储格式。根据查询结果创建新表，使用CREATE AS SELECT句式。这种方式比较灵活，可以在复制原表表结构的同时

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（安全模式） > 开发Impala应用
创建Impala表 - MapReduce服务 MRS
创建Impala表 - MapReduce服务 MRS

外部表，如果数据要被多种工具共同处理，则应该使用外部表，可避免对该数据的误操作。删除外部表时，只删除掉元数据。根据已有表创建新表，使用CREATE LIKE句式，完全复制原有的表结构，包括表的存储格式。根据查询结果创建新表，使用CREATE AS SELECT句式。这种方式比较灵活，可以在复制原表表结构的同时

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 开发Impala应用
Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

spark.examples.DstreamKafkaWriter。建议使用新的API createDirectStream代替原有API createStream进行应用程序开发。原有API仍然可以使用，但新的API性能和稳定性更好。 /** * 参数解析: * <checkP

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

spark.examples.DstreamKafkaWriter。建议使用新的API createDirectStream代替原有API createStream进行应用程序开发。原有API仍然可以使用，但新的API性能和稳定性更好。 /** * 参数解析: * <checkP

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

spark.examples.SecurityKafkaWordCount。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。 public class SecurityKafkaWordCount

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Hive表中增加分区列后再插入数据显示为NULL - MapReduce服务 MRS

table时默认选项为RESTRICT，RESTRICT只会更改元数据，不会修改此操作之前创建的partition的表结构，而只会修改之后创建的新的partition，所以查询时旧的partition中的值全为NULL。处理步骤 add column时加入cascade关键字即可，例如：

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
HDFS日志介绍 - MapReduce服务 MRS
HDFS日志介绍 - MapReduce服务 MRS

WARN表示当前事件处理存在异常信息。 INFO INFO表示系统及各事件正常运行状态信息。 DEBUG DEBUG表示系统及系统调试信息。如果您需要修改日志级别，请执行如下操作：请参考修改集群服务配置参数，进入HDFS的“全部配置”页面。左边菜单栏中选择所需修改的角色所对应的日志菜单。选择所需修改的日志级别。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
数组函数和运算符 - MapReduce服务 MRS

unction。除了获取元素之外，inputFunction还获取当前状态，最初为initialState，然后返回新状态。将调用outputFunction将最终状态转换为结果值。它可能是恒等函数（i-> i）。 SELECT reduce(ARRAY [], 0, (s, x)

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

SQL性能配置场景在Spark SQL多表Join的场景下，会存在关联键严重倾斜的情况，导致Hash分桶后，部分桶中的数据远高于其他分桶。最终导致部分Task过重，运行很慢；其他Task过轻，运行很快。一方面，数据量大Task运行慢，使得计算性能低；另一方面，数据量少的Task在

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

option("kafka.security.protocol", protocol)”注释掉。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。其默认值为“append”。 object SecurityKafkaWordCount

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Structured Streaming程序
CHANGE DATA TYPE - MapReduce服务 MRS
CHANGE DATA TYPE - MapReduce服务 MRS

table_name 表名。 col_name 表中的列名称。列名称包含字母，数字和下划线（_）。 changed_column_type 所要更改为的新数据类型。注意事项仅在没有数据丢失的情况下支持将Decimal数据类型从较低精度更改为较高精度例如：无效场景：将Decimal数据精度从（10

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考
CHANGE DATA TYPE - MapReduce服务 MRS
CHANGE DATA TYPE - MapReduce服务 MRS

table_name 表名。 col_name 表中的列名称。列名称包含字母，数字和下划线（_）。 changed_column_type 所要更改为的新数据类型。注意事项仅在没有数据丢失的情况下支持将Decimal数据类型从较低精度更改为较高精度例如：无效场景：将Decimal数据精度从（10

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DDL
Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

spark.examples.SecurityKafkaWordCount。当Streaming DataFrame/Dataset中有新的可用数据时，outputMode用于配置写入Streaming接收器的数据。 public class SecurityKafkaWordCount

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

SQL性能配置场景在Spark SQL多表Join的场景下，会存在关联键严重倾斜的情况，导致Hash分桶后，部分桶中的数据远高于其它分桶。最终导致部分Task过重，跑得很慢；其它Task过轻，跑得很快。一方面，数据量大Task运行慢，使得计算性能低；另一方面，数据量少的Task在

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优

总条数： 5345

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink SQL逻辑开发建议 - MapReduce服务 MRS

创建Impala表 - MapReduce服务 MRS

MapReduce基本原理 - MapReduce服务 MRS

Flink流式读Hudi表规则 - MapReduce服务 MRS

Spark Structured Streaming样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Scala） - MapReduce服务 MRS

创建Impala表 - MapReduce服务 MRS

创建Impala表 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序（Scala） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

Hive表中增加分区列后再插入数据显示为NULL - MapReduce服务 MRS

HDFS日志介绍 - MapReduce服务 MRS

数组函数和运算符 - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

CHANGE DATA TYPE - MapReduce服务 MRS

CHANGE DATA TYPE - MapReduce服务 MRS

Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

优化数据倾斜场景下的Spark SQL性能 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线