搜索_华为云

Hudi Clustering操作说明 - MapReduce服务 MRS

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
HBase输入 - MapReduce服务 MRS
HBase输入 - MapReduce服务 MRS

name text, value text); 配置“HBase输入”算子，生成三个字段A、B和C：设置了数据连接器后，可以单击“自动识别”，系统将自动读取数据库中的字段，可根据需要选择添加，然后根据业务场景手动进行完善或者修正即可，无需逐一手动添加。此操作会覆盖表格内已有数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
OpenTSDB HTTP API接口介绍 - MapReduce服务 MRS

<tsd_ip>：所需访问Opentsdb服务的TSD实例IP或主机名。 <start=3y-ago\&m=sum:testdata>：在请求中可能无法识别“&”符号，需对其进行转义。 <python -m json.tool>（可选）: 把响应的请求转换为json格式。 [ {

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > OpenTSDB应用开发常见问题
HBase输入 - MapReduce服务 MRS
HBase输入 - MapReduce服务 MRS

name text, value text); 配置“HBase输入”算子，生成三个字段A、B和C：设置了数据连接器后，可以单击“自动识别”，系统将自动读取数据库中的字段，可根据需要选择添加，然后根据业务场景手动进行完善或者修正即可，无需逐一手动添加。此操作会覆盖表格内已有数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输入算子
Spark Core内存调优 - MapReduce服务 MRS

节点。增加任务的并行度，充分利用集群机器的计算能力，一般并行度设置为集群CPU总和的2-3倍。操作步骤并行度可以通过如下三种方式来设置，用户可以根据实际的内存、CPU、数据以及应用程序逻辑的情况调整并行度参数。在会产生shuffle的操作函数内设置并行度参数，优先级最高。 testRDD

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
转换函数 - MapReduce服务 MRS
转换函数 - MapReduce服务 MRS

); select cast(186 as varchar); try_cast(value AS type) → type 与cast()相似，区别是转换失败返回null。 select try_cast(1860 as tinyint); _col0 ------- NULL

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Flink性能调优规则 - MapReduce服务 MRS

合理设置并行度任务运行的速度和并行度相关，一般来说提升并行度能有效提升读取的速度，但是过大的并行度可能导致部分节点资源的浪费，过小的并行度可能导致部分节点运行缓慢。对于SQL当前不能手动指定每个Task的并行度，指定的是所有Task统一的并行度。推荐Source的并行度由上游组件

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
Flink性能调优建议 - MapReduce服务 MRS

通过调整对应算子并行度提升性能读写Hudi可以通过配置读写并发提升读写性能。读算子的并行度调整参数：read.tasks 写算子的并行度调整参数：write.tasks 采用状态索引在作业重启的时候（非Checkpoint重启），需要读目标表重建索引，可以增大该算子并行度提升性能。加载索引的并行度调整参数：write

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
CarbonData调优思路 - MapReduce服务 MRS

压缩算法来压缩数据。虽然这些算法可处理任何类型的数据，但如果数据经过排序，相似值在一起出现时，就会获得更好的压缩率。 CarbonData数据加载过程中，数据基于Table中的列顺序进行排序，从而确保相似值在一起出现，以获得更好的压缩率。由于CarbonData按照Table中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData性能调优
CarbonData调优思路 - MapReduce服务 MRS

压缩算法来压缩数据。虽然这些算法可处理任何类型的数据，但如果数据经过排序，相似值在一起出现时，就会获得更好的压缩率。 CarbonData数据加载过程中，数据基于Table中的列顺序进行排序，从而确保相似值在一起出现，以获得更好的压缩率。由于CarbonData按照Table中

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData性能调优
应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

海量数据存储：利用HBase实现海量数据存储，并实现毫秒级数据查询。分布式数据查询：利用Spark实现海量数据的分析查询。实时数据处理实时数据处理通常用于异常检测、欺诈识别、基于规则告警、业务流程监控等场景，在数据输入系统的过程中，对数据进行处理。例如在梯联网行业，智能电梯的数据，实时传入到MRS的流式集群中进行实时告警。

帮助中心 > MapReduce服务 MRS > 产品介绍
使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

compress"="ZSTD_JNI", 'orc.global.compress.level'='3'); 用户可以对特定的数据格式列指定压缩，对业务数据进一步压缩。当前识别的特定格式数据包括：JSON数据列、BASE64数据列、时间戳数据列和UUID数据列。建表时设置表属性参数“orc.column.compress”即可。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
导入并配置Spark样例工程 - MapReduce服务 MRS

> Scala”。图17 选择Scala语言当IDEA可以识别出Scala SDK时，在设置界面，选择编译的依赖jar包，然后单击“OK”应用设置。图18 Add Scala Support 当系统无法识别出Scala SDK时，需要自行创建。单击“Create...”。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置HBase样例工程 - MapReduce服务 MRS

xml”图标如图9所示，可直接进行下一步骤操作。图9 样例项目已作为maven项目导入图10 Add as Maven Project 此时IDEA可将该项目识别为Maven项目。图11 样例项目作为maven项目在IDEA中显示设置项目使用的Maven版本。在IntelliJ IDEA的菜单栏中，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 准备HBase应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

> Scala”。图17 选择Scala语言当IDEA可以识别出Scala SDK时，在设置界面，选择编译的依赖jar包，然后单击“OK”应用设置。图18 Add Scala Support 当系统无法识别出Scala SDK时，需要自行创建。单击“Create...”。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
导入并配置HBase样例工程 - MapReduce服务 MRS

xml”图标如图9所示，可直接进行下一步骤操作。图9 样例项目已作为maven项目导入图10 Add as Maven Project 此时IDEA可将该项目识别为Maven项目。图11 样例项目作为maven项目在IDEA中显示设置项目使用的Maven版本。在IntelliJ IDEA的菜单栏中，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 准备HBase应用开发环境
Hive CBO原理介绍 - MapReduce服务 MRS

Hive中实现CBO的总体过程如下： Hive使用开源组件Apache Calcite实现CBO。首先SQL语句转化成Hive的AST，然后转成Calcite可以识别的RelNodes。Calcite将RelNode中的Join顺序调整后，再由Hive将RelNode转成AST，继续Hive的逻辑优化和物理优化过程。流程图如图1所示：

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
导入并配置Spark样例工程 - MapReduce服务 MRS

> Scala”。图17 选择Scala语言当IDEA可以识别出Scala SDK时，在设置界面，选择编译的依赖jar包，然后单击“OK”应用设置。图18 Add Scala Support 当系统无法识别出Scala SDK时，需要自行创建。单击“Create...”。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
导入并配置Spark样例工程 - MapReduce服务 MRS

> Scala”。图17 选择Scala语言当IDEA可以识别出Scala SDK时，在设置界面，选择编译的依赖jar包，然后单击“OK”应用设置。图18 Add Scala Support 当系统无法识别出Scala SDK时，需要自行创建。单击“Create...”。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
配置Hive Beeline高可靠性 - MapReduce服务 MRS

hivevar:batchid=xxxx” 使用说明：其中“xxxx”表示每一次通过beeline提交任务的批次号，通过该批次号，可以识别出先提交的任务。如果提交任务时不带批次号，该特性功能不会启用。“xxxx”的值是执行任务时指定的，如下所示，“xxxx”值为“012345678901”：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强

总条数： 280

上一页
1
2
3
4
5
...
14
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - MapReduce服务 MRS

HBase输入 - MapReduce服务 MRS

OpenTSDB HTTP API接口介绍 - MapReduce服务 MRS

HBase输入 - MapReduce服务 MRS

Spark Core内存调优 - MapReduce服务 MRS

转换函数 - MapReduce服务 MRS

Flink性能调优规则 - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

CarbonData调优思路 - MapReduce服务 MRS

应用场景 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置HBase样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置HBase样例工程 - MapReduce服务 MRS

Hive CBO原理介绍 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

配置Hive Beeline高可靠性 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线