搜索_华为云

Spark Distinct聚合优化 - MapReduce服务 MRS

Spark Distinct聚合优化本章节仅适用于MRS 3.3.1-LTS及之后版本。配置场景当SQL中存在多个count(distinct)聚合函数，且存在cube，rollup等导致数据膨胀的算子时，使用该特性可以有效减少数据的膨胀倍数，且减少shuffle落盘的数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
MRS作业类型介绍 - MapReduce服务 MRS

MRS作业类型介绍 MRS作业分类 MRS作业是MRS为用户提供的程序执行平台，用于处理和分析用户数据。用户可以在MRS管理控制台中在线创建作业任务，也可以通过集群客户端后台方式提交作业。 MRS作业处理的数据通常来源于OBS或HDFS，用户创建作业前需要将待分析数据上传至OBS

帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性配置场景 Spark SQL Adaptive Execution特性用于使Spark SQL在运行过程中，根据中间结果优化后续执行流程，提高整体执行效率。当前已实现的特性如下：自动设置shuffle partition数

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性配置场景 Spark SQL Adaptive Execution特性用于使Spark SQL在运行过程中，根据中间结果优化后续执行流程，提高整体执行效率。当前已实现的特性如下：自动设置shuffle partition数。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
查询集群节点列表 - MapReduce服务 MRS

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 集群管理接口
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

将lines切分为word words = lines.select(explode(split(lines.value, " ")).alias("word")) # 生成正在运行的word count wordCounts = words.groupBy("word")

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

将lines切分为word words = lines.select(explode(split(lines.value, " ")).alias("word")) # 生成正在运行的word count wordCounts = words.groupBy("word")

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming样例程序
FlinkSQL Function增强 - MapReduce服务 MRS

FlinkSQL Function增强本章节适用于MRS 3.5.0及以后版本。 DATE_ADD函数 DATE_ADD函数用于返回指定日期增加目标天数后的日期。参数说明指定日期：数据类型为TIMESTAMP或者STRING（格式为：yyyy-MM-dd HH:mm:ss），支持参数为NULL的特殊情况。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
创建集群并执行作业 - MapReduce服务 MRS

environment variables CLOUD_SDK_AK and CLOUD_SDK_SK in the local environment ak = os.environ["CLOUD_SDK_AK"] sk = os.environ["CLOUD_SDK_SK"]

帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 集群管理接口
升级MRS集群Master节点规格 - MapReduce服务 MRS

角色后，告警将自动恢复。 ALM-12006 节点故障 ALM-12010 Manager主备节点间心跳中断 ALM-12039 OMS数据库主备不同步 ALM-14000 HDFS服务不可用 ALM-14010 NameService服务异常 ALM-14012 Journalnode数据不同步

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点
在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

Reduce input records=6 Reduce output records=2 Spilled Records=12 Shuffled Maps

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > MapReduce开发指南（普通模式） > 调测MapReduce应用
Hive SQL扩展语法说明 - MapReduce服务 MRS

Hive SQL扩展语法说明 Hive SQL支持Hive-3.1.0版本中的所有特性，详情请参见https://cwiki.apache.org/confluence/display/hive/languagemanual。 MRS系统提供的扩展Hive语句如表1所示。表1 扩展Hive语句

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive常见SQL语法说明
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
Hudi Cleaning操作说明 - MapReduce服务 MRS

Hudi Cleaning操作说明 Cleaning用于清理不再需要的版本数据。 Hudi使用Cleaner后台作业，不断清除不需要的旧版本数据。通过配置hoodie.cleaner.policy和hoodie.cleaner.commits.retained可以使用不同的清理策略和保存的commit数量。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
通过HSFabric的用户名密码认证实现查询HetuEngine SQL任务 - MapReduce服务 MRS

通过HSFabric的用户名密码认证实现查询HetuEngine SQL任务功能简介通过HSFabric方式连接到HetuServer，组装对应的SQL发送到HetuServer执行，完成对Hive数据源的增删改查操作。 public class JDBCExampleFabric

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HetuEngine开发指南（普通模式） > 开发HetuEngine应用 > HetuEngine样例程序（Java）
Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

Hive SQL运行变慢阶段如何排查场景说明对于一个Hive SQL任务，如果运行时间突然变长，可能有多种原因造成，如HiveServer编译变慢、访问HDFS变慢、访问Yarn变慢或访问元数据变慢。操作步骤以下为Hive SQL在哪个阶段执行变慢的排查方法： HiveServer编译变慢

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive故障排除
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，将dataFrame写入HBase中，并从HBase读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
SHOW CREATE TABLE - MapReduce服务 MRS
SHOW CREATE TABLE - MapReduce服务 MRS

SHOW CREATE TABLE 语法 SHOW CREATE TABLE table_name 描述显示指定数据表的SQL创建语句。示例显示能够创建orders表的SQL语句： CREATE TABLE orders ( orderkey bigint, orderstatus

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DDL SQL语法说明
16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败问题使用默认配置时，16T的文本数据转成4T Parquet数据失败，报如下错误信息。 Job aborted due to stage failure: Task 2866 in stage 11.0 failed 4 times

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame

总条数： 1382

上一页
1
...
50
51
52
...
70
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Distinct聚合优化 - MapReduce服务 MRS

MRS作业类型介绍 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

配置Spark SQL开启Adaptive Execution特性 - MapReduce服务 MRS

查询集群节点列表 - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

Spark Structured Streaming样例程序（Python） - MapReduce服务 MRS

FlinkSQL Function增强 - MapReduce服务 MRS

创建集群并执行作业 - MapReduce服务 MRS

升级MRS集群Master节点规格 - MapReduce服务 MRS

在Linux环境中调测MapReduce应用 - MapReduce服务 MRS

Hive SQL扩展语法说明 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

Hudi Cleaning操作说明 - MapReduce服务 MRS

通过HSFabric的用户名密码认证实现查询HetuEngine SQL任务 - MapReduce服务 MRS

Hive SQL运行变慢阶段如何排查 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

操作HBase数据源 - MapReduce服务 MRS

SHOW CREATE TABLE - MapReduce服务 MRS

16T的文本数据转成4T Parquet数据失败 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线