搜索_华为云

Spark Structured Streaming样例程序（Scala） - MapReduce服务 MRS

flatMap(_.split(" ")).groupBy("value").count() //开始运行将运行计数打印到控制台的查询。 val query = wordCounts.writeStream .outputMode("complete")

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
SHOW STATS - MapReduce服务 MRS
SHOW STATS - MapReduce服务 MRS

(3 rows) 在Analyze nation表之后： Analyze nation; ANALYZE: 6 rows --查询分析后的结果 SHOW STATS FOR nation; column_name | data_size | distinct_values_count

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
CREATE TABLE AS SELECT - MapReduce服务 MRS

HDFS路径，指定该路径Hudi表会创建为外表。 options_list Hudi table属性列表。 query_statement select查询表达式示例创建分区表 create table h2 using hudi options (type = 'cow', primaryKey

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DDL语法说明
Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

Encoders.STRING()).groupBy("value").count(); //开始运行将运行计数打印到控制台的查询。 StreamingQuery query = wordCounts.writeStream() .outputMode("complete")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

wordCounts = words.groupBy("word").count() # 开始运行将running counts打印到控制台的查询 query = wordCounts.writeStream\ .outputMode("complete")\

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

Encoders.STRING()).groupBy("value").count(); //开始运行将运行计数打印到控制台的查询。 StreamingQuery query = wordCounts.writeStream() .outputMode("complete")

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
使用spark-sql操作Hudi表 - MapReduce服务 MRS

hudi_table2 set name=3 where id=1; 删除数据： delete from hudi_table2 where id=2; 查询数据： select * from hudi_table2; 父主题：使用Hudi

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
Doris UDF开发规范 - MapReduce服务 MRS

避免程序出现未知异常。可以使用try-catch块来处理异常，并在必要时记录异常信息。 UDF中应避免定义静态集合类用于临时数据的存储，或查询外部数据存在较大对象，否则会导致内存占用过高。应该避免类中import的包和服务侧包冲突，可通过grep -lr "完全限定类名"命令来

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
同步Hive表配置 - MapReduce服务 MRS

timestamp类型到hive元数据中。该值默认为false，默认将timestamp类型同步为bigInt，默认情况可能导致使用sql查询包含timestamp类型字段的hudi表出现错误。 true 父主题： Hudi常见配置参数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

schemaFemaleInfo.registerTempTable("FemaleInfoTable"); // 执行SQL查询 DataFrame femaleTimeInfo = sqlContext.sql("select * from " +

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > Spark SQL程序
Spark SQL样例程序（Java） - MapReduce服务 MRS

schemaFemaleInfo.registerTempTable("FemaleInfoTable"); // 执行SQL查询 Dataset<ROW> femaleTimeInfo = spark.sql("select * from " +

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark SQL样例程序
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

wordCounts = words.groupBy("word").count() # 开始运行将running counts打印到控制台的查询 query = wordCounts.writeStream\ .outputMode("complete")\

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Hue中的输入框输入中文会出现混乱 - MapReduce服务 MRS

行修正。处理步骤该方案仅适用于MRS 2.x及之前版本集群。登录MRS Manager页面，选择“服务管理 > Hue > 实例”，查询Hue实例所在的节点的IP。使用root用户远程连接工具登录Hue实例所在节点的机器，并执行如下命令切换到omm用户。 su - omm

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hue
SparkSQL建表参数规范 - MapReduce服务 MRS

hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Metastore中。由于缺失新写入的分区信息，查询引擎读取该时会丢数。禁止指定Hudi的索引类型为INMEMORY类型。该索引仅是为了测试使用。生产环境上使用该索引将导致数据重复。建表示例

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
compaction&cleaning配置 - MapReduce服务 MRS

cleaner.policy 要使用的清理策略。Hudi将删除旧版本的parquet文件以回收空间。任何引用此版本文件的查询和计算都将失败。需要确保数据保留的时间超过最大查询执行时间。 KEEP_LATEST_COMMITS hoodie.cleaner.commits.retained

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi常见配置参数
退订MRS包周期集群指定节点 - MapReduce服务 MRS

当集群中分析Core节点个数小于等于HDFS副本数时，为了保证数据的可靠性MRS不支持退订节点。HDFS副本数可通过HDFS参数配置中的“dfs.replication”参数查询。 MRS不支持退订部署了ZooKeeper、Kudu、Kafka及ClickHouse服务的节点。 MRS 3.1.2之前版本ClickHouse服务的节点不支持退订。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
structured streaming功能与可靠性介绍 - MapReduce服务 MRS

只有当output mode为complete时才支持排序操作。有条件地支持流和静态数据集之间的外连接。不支持部分DataSet上立即运行查询并返回结果的操作： count()：无法从流式Dataset返回单个计数，而是使用ds.groupBy().count()返回一个包含运行计数的streaming

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
自动弹性伸缩 - MapReduce服务 MRS

MRS提供的弹性伸缩能力，可以帮助用户在进行批量分析操作时，将分析节点扩容到指定规模，而计算完毕后，则自动释放计算节点，尽可能的降低使用成本。平衡突发查询大数据集群上，由于有大量的数据，企业会经常面临临时的分析任务，例如支撑企业决策的临时数据报表等，都会导致对于资源的消耗在极短时间内剧增。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能 > 集群管理
配置Spark动态脱敏 - MapReduce服务 MRS

t、timestamp 、tinyint、smallint、double类型配置脱敏策略后，spark-beeline查询结果存在与策略预期不一致的现象，但查询结果非原始值，如需要与策略结果保持一致，则推荐使用“Nullify”脱敏策略。对于不支持的数据类型，如果配置了脱敏策略

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
CarbonData表空间索引语法说明 - MapReduce服务 MRS

polygon连接查询 IN_POLYGON_JOIN(GEO_HASH_INDEX_COLUMN, POLYGON_COLUMN) 两张表做join查询，一张表为空间数据表（有经纬度列和GeoHashIndex列），另一张表为维度表，保存polygon数据。查询使用IN_POLYGON_JOIN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData语法参考

总条数： 3625

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Structured Streaming样例程序（Scala） - MapReduce服务 MRS

SHOW STATS - MapReduce服务 MRS

CREATE TABLE AS SELECT - MapReduce服务 MRS

Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Java） - MapReduce服务 MRS

使用spark-sql操作Hudi表 - MapReduce服务 MRS

Doris UDF开发规范 - MapReduce服务 MRS

同步Hive表配置 - MapReduce服务 MRS

Java样例代码 - MapReduce服务 MRS

Spark SQL样例程序（Java） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

Hue中的输入框输入中文会出现混乱 - MapReduce服务 MRS

SparkSQL建表参数规范 - MapReduce服务 MRS

compaction&cleaning配置 - MapReduce服务 MRS

退订MRS包周期集群指定节点 - MapReduce服务 MRS

structured streaming功能与可靠性介绍 - MapReduce服务 MRS

自动弹性伸缩 - MapReduce服务 MRS

配置Spark动态脱敏 - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线