搜索_华为云

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败问题使用默认配置时，16T的文本数据转成4T Parquet数据失败，报如下错误信息。 Job aborted due to stage failure: Task 2866 in stage 11.0 failed 4 times

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Hive SQL扩展语法说明 - MapReduce服务 MRS

Hive SQL扩展语法说明 Hive SQL支持Hive-3.1.0版本中的所有特性，详情请参见https://cwiki.apache.org/confluence/display/hive/languagemanual。系统提供的扩展Hive语句如表1所示。表1 扩展Hive语句

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive常见SQL语法说明
运行HiveSql作业 - MapReduce服务 MRS

运行HiveSql作业用户可将自己开发的程序提交到MRS中，执行程序并获取结果，本章节指导您如何在MRS集群中提交一个HiveSql作业。 HiveSql作业用于提交Hive SQL语句和SQL脚本文件查询和分析数据，包括SQL语句和Script脚本两种形式，如果SQL语句中涉及敏感信息，也可使用脚本文件方式提交。

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践本章节提供从零开始使用Spark2x提交spark应用程序，包括Spark Core及Spark SQL。其中，Spark Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
配置Structured Streaming使用RocksDB做状态存储 - MapReduce服务 MRS

配置Structured Streaming使用RocksDB做状态存储本章节仅适用于MRS 3.3.0及之后版本。配置场景当大量的状态信息存储在默认的HDFS BackedStateStore，导致JVM GC占用大量时间时，可以通过如下配置，选择RocksDB作为状态后端。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Streaming企业级能力增强
Hue常见问题 - MapReduce服务 MRS
Hue常见问题 - MapReduce服务 MRS

Hue常见问题使用Hive输入use database语句失效使用Hue WebUI访问HDFS文件失败在Hue页面上传大文件失败 Hue WebUI中Oozie编辑器的时区设置问题访问Hue原生页面时间长，文件浏览器报错Read timed out 父主题：使用Hue（MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hue（MRS 3.x及之后版本）
Hudi Cleaning操作说明 - MapReduce服务 MRS

Hudi Cleaning操作说明 Cleaning用于清理不再需要的版本数据。 Hudi使用Cleaner后台作业，不断清除不需要的旧版本数据。通过配置hoodie.cleaner.policy和hoodie.cleaner.commits.retained可以使用不同的清理策略和保存的commit数量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能配置场景 Spark SQL的表中，经常会存在很多小文件（大小远小于HDFS块大小），每个小文件默认对应Spark中的一个Partition，也就是一个Task。在很多小文件场景下，Spark会起很多Task。当SQL逻辑中存在Shuff

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
使用Spark/Spark2x - MapReduce服务 MRS

使用Spark/Spark2x Spark使用说明 Spark用户权限管理 Spark客户端使用实践访问Spark WebUI界面使用代理用户提交Spark作业配置Spark读取HBase表数据配置Spark任务不获取HBase Token信息 Spark Core企业级能力增强

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版）
CarbonData语法参考 - MapReduce服务 MRS

TABLE REGISTER INDEX TABLE LOAD DATA UPDATE CARBON TABLE DELETE RECORDS from CARBON TABLE INSERT INTO CARBON TABLE DELETE SEGMENT by ID DELETE

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData
编译并调测Flink应用 - MapReduce服务 MRS

编译并调测Flink应用操作场景在程序代码完成开发后，建议您上传至Linux客户端环境中运行应用。使用Scala或Java语言开发的应用程序在Flink客户端的运行步骤是一样的。基于YARN集群的Flink应用程序不支持在Windows环境下运行，只支持在Linux环境下运行。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 调测Flink应用
配置Spark读取HBase表数据 - MapReduce服务 MRS

配置Spark读取HBase表数据 Spark On HBase Spark on HBase为用户提供了在Spark SQL中查询HBase表，通过Beeline工具为HBase表进行存数据等操作。通过HBase接口可实现创建表、读取表、往表中插入数据等操作。登录Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
HetuEngine物化视图概述 - MapReduce服务 MRS

HetuEngine物化视图概述 HetuEngine物化视图功能适用于MRS 3.2.0及以后版本。 HetuEngine物化视图背景介绍 HetuEngine具备物化视图能力。在实际运用中，将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
配置Spark小文件自动合并 - MapReduce服务 MRS

配置Spark小文件自动合并配置场景小文件自动合并特性开启后，Spark将数据先写入临时目录，再去检测每个分区的平均文件大小是否小于16MB（默认值）。如果发现平均文件大小小于16MB，则认为分区下有小文件，Spark会启动一个Job合并这些小文件，并将合并后的大文件写入到最终的表目录下。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
MRS 3.1.5版本说明 - MapReduce服务 MRS

MRS 3.1.5版本说明发布日期 MRS 3.1.5 2023年3月28日更新内容服务模块主要变更点 CarbonData 升级到2.2.0版本。 ClickHouse 支持通过FusionInsight Manager备份恢复元数据及业务数据。 Flink 升级到1.12

帮助中心 > MapReduce服务 MRS > 产品介绍 > 发行版本 > 版本说明
IoTDB Kafka样例程序 - MapReduce服务 MRS

public void doWork() { ConsumerRecords<String, String> records = consumer.poll(Duration.ofMillis(waitTime));

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（普通模式） > 开发IoTDB应用
配置Spark读取HBase表数据 - MapReduce服务 MRS

配置Spark读取HBase表数据操作场景 Spark on HBase为用户提供了在Spark SQL中查询HBase表，通过Beeline工具为HBase表进行存数据等操作。通过HBase接口可实现创建表、读取表、往表中插入数据等操作。 Spark On HBase 登录Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
SHOW_HOODIE_PROPERTIES - MapReduce服务 MRS

table => '[table_name]'); 参数描述表1 参数描述参数描述 table_name 需要查询的表名，支持database.tablename格式。示例 call show_hoodie_properties(table => "hudi_table5");

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Spark客户端使用实践 - MapReduce服务 MRS

Spark客户端使用实践本章节提供从零开始使用Spark，提交Spark应用程序，包括Spark Core及Spark SQL。其中，Spark Core为Spark的内核模块，主要负责任务的执行，用于编写Spark应用程序；Spark SQL为执行SQL的模块。场景说明假

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序

总条数： 1382

上一页
1
...
51
52
53
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

Hive SQL扩展语法说明 - MapReduce服务 MRS

运行HiveSql作业 - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

配置Structured Streaming使用RocksDB做状态存储 - MapReduce服务 MRS

Hue常见问题 - MapReduce服务 MRS

Hudi Cleaning操作说明 - MapReduce服务 MRS

优化小文件场景下的Spark SQL性能 - MapReduce服务 MRS

使用Spark/Spark2x - MapReduce服务 MRS

CarbonData语法参考 - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

配置Spark读取HBase表数据 - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

配置Spark小文件自动合并 - MapReduce服务 MRS

MRS 3.1.5版本说明 - MapReduce服务 MRS

IoTDB Kafka样例程序 - MapReduce服务 MRS

配置Spark读取HBase表数据 - MapReduce服务 MRS

SHOW_HOODIE_PROPERTIES - MapReduce服务 MRS

Spark客户端使用实践 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线