搜索_华为云

Spark SQL join优化 - MapReduce服务 MRS

当进行join操作时，配置广播的最大值。当SQL语句中涉及的表中相应字段的大小小于该值时，进行广播。配置为-1时，将不进行广播。配置自动广播阈值的方法：在Spark的配置文件“spark-defaults.conf”中，设置“spark.sql.autoBroadcastJoinThreshold”的值。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Flink DataStream样例程序（Java） - MapReduce服务 MRS

Integer.parseInt(elems[2])); } // UserRecord数据结构的定义，并重写了toString打印方法 public static class UserRecord { private String name;

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink DataStream样例程序
Flink DataStream样例程序（Java） - MapReduce服务 MRS

Integer.parseInt(elems[2])); } // UserRecord数据结构的定义，并重写了toString打印方法 public static class UserRecord { private String name;

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink DataStream样例程序
准备OpenTSDB应用开发环境 - MapReduce服务 MRS

配置安全组出入规则。下载客户端程序。登录MRS Manager系统。选择“服务管理 > 下载客户端 ”，下载“完整客户端”到“远端主机”上，即下载客户端程序到新申请的弹性云服务器上。登录存放下载的客户端的节点，再安装客户端。执行以下命令解压客户端包： cd /opt tar

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > 准备OpenTSDB应用开发环境
Spark SQL join优化 - MapReduce服务 MRS

当进行join操作时，配置广播的最大值。当SQL语句中涉及的表中相应字段的大小小于该值时，进行广播。配置为-1时，将不进行广播。配置自动广播阈值的方法：在Spark的配置文件“spark-defaults.conf”中，设置“spark.sql.autoBroadcastJoinThreshold”的值。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
INSERT - MapReduce服务 MRS
INSERT - MapReduce服务 MRS

概览”，单击“HSConsole WebUI”的HSConsole链接进入计算实例界面。然后选择“数据源 > hive > 编辑 > 自定义配置 > 增加”来新增一条用户自定义配置项，名称为“hive.non-managed-table-writes-enabled”，值为“true”。独立部署Hive情况

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DML SQL语法说明
调整Yarn任务抢占机制 - MapReduce服务 MRS

抢占来保证在queue policy承诺的队列minimum资源。队列资源信息如下（其中，minimum为最小资源，share为权重）：用户A，提交作业1到queue1，AM使用<vcore 1, memory 2GB>，8个任务，每个任务使用<vcore 2, memory 4

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
YARN应用开发简介 - MapReduce服务 MRS

（Scheduler）和应用程序管理器（Applications Manager，ASM）。 ApplicationMaster（AM）用户提交的每个应用程序均包含一个AM，主要功能包括：与RM调度器协商以获取资源（用Container表示）。将得到的资源进一步分配给内部任务。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > YARN开发指南（安全模式）
CSV文件输入 - MapReduce服务 MRS
CSV文件输入 - MapReduce服务 MRS

表1 算子参数说明参数含义类型是否必填默认值分隔符 CSV文件的列分隔符，用于分隔每行的数据。 string 是 , 换行符用户根据数据实际情况，填写字符串作为换行符。支持任何字符串。默认使用操作系统的换行符。 string 否 \n 文件名是否作为字段自定义一个

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
合并CBO优化 - MapReduce服务 MRS
合并CBO优化 - MapReduce服务 MRS

Optimizer）是一种为SQL智能选择查询计划的技术。通过配置开启CBO后，CBO优化器可以基于表和列的统计信息，进行一系列的估算，最终选择出合适的查询计划。操作步骤要使用CBO优化，可以按照以下步骤进行优化。需要先执行特定的SQL语句来收集所需的表和列的统计信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
准备本地应用开发环境 - MapReduce服务 MRS

开发和运行环境的基本配置。版本要求如下：服务端和客户端仅支持自带的OpenJDK，版本为1.8.0_272，不允许替换。对于客户应用需引用SDK类的Jar包运行在客户应用进程中的。 X86客户端：Oracle JDK：支持1.8版本；IBM JDK：支持1.8.5.11版本。 TaiShan客户端：OpenJDK：支持1

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
Spark Core内存调优 - MapReduce服务 MRS

C（Garbage Collection），评估内存中RDD的大小来判断内存是否变成性能瓶颈，并根据情况优化。监控节点进程的GC情况（在客户端的conf/spark-default.conf配置文件中，在spark.driver.extraJavaOptions和spark.executor

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
导入并配置HDFS样例工程 - MapReduce服务 MRS

参考获取MRS应用开发样例工程，获取样例代码解压目录中“src”目录下的样例工程“hdfs-example-security”。将准备MRS应用开发用户时得到的keytab文件“user.keytab”和“krb5.conf”文件放到样例工程的“conf”目录下。安装IntelliJ I

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
准备ClickHouse应用开发环境 - MapReduce服务 MRS

命周期。华为提供开源镜像站，各服务样例工程依赖的Jar包通过华为开源镜像站下载，剩余所依赖的开源Jar包请直接从Maven中央库或者其他用户自定义的仓库地址下载，详情请参考配置华为开源镜像仓。 7-zip 用于解压“*.zip”和“*.rar”文件，支持7-Zip 16.04版本。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > ClickHouse开发指南（安全模式） > 准备ClickHouse应用开发环境
IoTDB应用开发建议 - MapReduce服务 MRS

insertRecord（单设备一行）避免并发使用同一个客户端连接 IoTDB客户端只能连接一个IoTDBServer，大量并发使用同一个客户端会对该客户端连接的IoTDBServer造成压力，可以根据业务需求连接多个不同的客户端来达到负载均衡。使用SessionPool复用连接

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > IoTDB应用开发规范
导入并配置MapReduce样例工程 - MapReduce服务 MRS

导入并配置MapReduce样例工程操作场景 MapReduce针对多个场景提供样例工程，帮助客户快速学习MapReduce工程。以下操作步骤以导入MapReduce样例代码为例。操作流程如图1所示。图1 导入样例工程流程操作步骤参考获取MRS应用开发样例工程，获取样例

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（普通模式） > 准备MapReduce应用开发环境
Spark on OBS性能调优 - MapReduce服务 MRS

OBS性能调优配置场景 Spark on OBS在小批量频繁请求OBS的场景下，可以通过关闭OBS监控提升性能。配置描述在Spark客户端的“core-site.xml”配置文件中修改配置。表1 参数介绍参数描述默认值 fs.obs.metrics.switch 上报OBS监控指标开关：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x
Hive支持ZSTD压缩格式 - MapReduce服务 MRS

TD压缩的存储格式有常见的ORC、RCFile、TextFile、JsonFile、Parquet、Squence和CSV。可在Hive客户端创建ZSTD压缩格式的表，命令如下： ORC存储格式建表时可指定TBLPROPERTIES("orc.compress"="zstd")：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
准备Impala开发和运行环境 - MapReduce服务 MRS

如果使用Linux环境调测程序，需准备安装集群客户端的Linux节点并获取相关配置文件。集群的Master节点或者Core节点使用客户端可参考集群内节点使用MRS客户端，MRS集群外客户端的安装操作可参考集群外节点使用MRS客户端。父主题：准备Impala应用开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Impala开发指南（普通模式） > 准备Impala应用开发环境
聚合函数 - MapReduce服务 MRS
聚合函数 - MapReduce服务 MRS

聚合函数聚合函数对一组值进行运算，最终获得一个单值。除count()、count_if()、max_by()、min_by()和approx_distinct()外，其他聚合函数都忽略空值，并在没有输入行或所有值都为空时返回空值。例如sum()返回null而不是零，并且avg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明

总条数： 5480

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark SQL join优化 - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

Flink DataStream样例程序（Java） - MapReduce服务 MRS

准备OpenTSDB应用开发环境 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

INSERT - MapReduce服务 MRS

调整Yarn任务抢占机制 - MapReduce服务 MRS

YARN应用开发简介 - MapReduce服务 MRS

CSV文件输入 - MapReduce服务 MRS

合并CBO优化 - MapReduce服务 MRS

准备本地应用开发环境 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

准备ClickHouse应用开发环境 - MapReduce服务 MRS

IoTDB应用开发建议 - MapReduce服务 MRS

导入并配置MapReduce样例工程 - MapReduce服务 MRS

Spark on OBS性能调优 - MapReduce服务 MRS

Hive支持ZSTD压缩格式 - MapReduce服务 MRS

准备Impala开发和运行环境 - MapReduce服务 MRS

聚合函数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线