搜索_华为云

Spark Distinct聚合优化 - MapReduce服务 MRS

Spark Distinct聚合优化本章节仅适用于MRS 3.3.1-LTS及之后版本。配置场景当SQL中存在多个count(distinct)聚合函数，且存在cube，rollup等导致数据膨胀的算子时，使用该特性可以有效减少数据的膨胀倍数，且减少shuffle落盘的数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据应用场景经常面临向HBase中导入大量数据的情景，向HBase中批量加载数据的方式有很多种，最直接方式是调用HBase的API使用put方法插入数据；另外一种是用MapReduce的方式从HDFS上加载数据。但是这两种方式效率

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
ClickHouse开源增强特性 - MapReduce服务 MRS

ClickHouse开源增强特性 MRS ClickHouse具备“手动挡”集群模式升级、平滑弹性扩容、高可用HA部署架构等优势能力，具体详情如下：手动挡集群模式升级如图1所示，多个ClickHouse节点组成的集群，没有中心节点，更多的是一个静态资源池的概念，业务要使用Cl

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > ClickHouse
Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 Sqoop是专为Apache Hadoop和结构化数据库（如关系型数据库）设计的高效传输大量数据的工具。客户需要在MRS中使用sqoop进行数据迁移，MRS旧版本中未自带Sqoop，客户可参考此文档自行安装使用。MRS 3.1.0及之后

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Sqoop
字符串函数和运算符 - MapReduce服务 MRS

字符串函数和运算符字符串运算符 ||表示字符连接 SELECT 'he'||'llo'; –hello 字符串函数这些函数假定输入字符串包含有效的UTF-8编码的Unicode代码点。不会显式检查UTF-8数据是否有效，对于无效的UTF-8数据，函数可能会返回错误的结果。可以

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
配置Doris SQL防御 - MapReduce服务 MRS

配置Doris SQL防御操作场景用户可以在Manager界面配置Doris的SQL防御规则，根据业务调整对应SQL防御规则的参数。该功能仅MRS 3.5.0及之后版本支持。前提条件待连接Doris数据库的节点与MRS集群网络互通。 FE和BE实例状态正常。已安装MySQL客户端。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
实时任务接入 - MapReduce服务 MRS

实时任务接入实时作业一般由Flink Sql或Sparkstreaming来完成，流式实时任务通常配置同步生成compaction计划，异步执行计划。 Flink SQL作业中sink端Hudi表相关配置如下： create table denza_hudi_sink ( $H

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表场景说明用户可以在Spark应用程序中使用HBaseContext的方式去操作HBase，使用hbaseRDD方法以特定的规则扫描HBase表。数据规划使用操作Avro格式数据章节中创建的HBase数据表。开发思路设置scan的规则，例如：setCaching。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
删除CarbonData表Segments - MapReduce服务 MRS

删除CarbonData表Segments 操作场景如果用户将错误数据加载到表中，或者数据加载后出现许多错误记录，用户希望修改并重新加载数据时，可删除对应的segment。可使用segment ID来删除segment，也可以使用加载数据的时间来删除segment。删除seg

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
Flink Hudi样例程序（Java） - MapReduce服务 MRS

Flink Hudi样例程序（Java）功能介绍通过调用Flink API读写Hudi数据。代码样例下面列出WriteIntoHudi和ReadFromHudi主要逻辑代码作为演示。完整代码参见com.huawei.bigdata.flink.examples.WriteIntoHudi和com

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 开发Flink应用 > Flink读取Hudi表样例程序
使用BulkLoad工具批量删除HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量删除HBase数据操作场景 BulkLoad工具支持根据rowkey的取值模式、范围、字段名、字段值对HBase数据做批量删除。使用BulkLoad工具批量删除HBase数据执行如下命令删除从“row_start”到“row_stop”的行，并且

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
使用BulkLoad工具批量删除HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量删除HBase数据操作场景 BulkLoad工具支持根据rowkey的取值模式、范围、字段名、字段值对HBase做批量删除。使用BulkLoad工具批量删除HBase数据执行如下命令删除从“row_start”到“row_stop”的行，并且把输

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HBase > HBase企业级能力增强 > 增强HBase BulkLoad工具数据迁移能力
删除CarbonData表Segments - MapReduce服务 MRS

删除CarbonData表Segments 操作场景如果用户将错误数据加载到表中，或者数据加载后出现许多错误记录，用户希望修改并重新加载数据时，可删除对应的segment。可使用segment ID来删除segment，也可以使用加载数据的时间来删除segment。删除seg

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
Flink Hudi样例程序（Java） - MapReduce服务 MRS

Flink Hudi样例程序（Java）功能介绍通过调用Flink API读写Hudi数据。代码样例下面列出WriteIntoHudi和ReadFromHudi主要逻辑代码作为演示。完整代码参见com.huawei.bigdata.flink.examples.WriteIntoHudi和com

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 开发Flink应用 > Flink读取Hudi表样例程序
LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
使用CDL从PgSQL同步数据到Kafka - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Kafka 操作场景本章节指导用户通过MRS 3.2.0版本开启Kerberos认证的集群的CDLService WebUI界面，从PgSQL导入数据到Kafka。前提条件集群已安装CDL、Kafka服务且运行正常。 PostgreSQL数据

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
在本地Windows环境中调测IoTDB应用 - MapReduce服务 MRS

在本地Windows环境中调测IoTDB应用操作场景在程序代码完成开发后，您可以在Windows开发环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。如果Windows开发环境中使用IBM JDK，不支持在Windows环境中直接运行应用程序。需要在

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式） > 调测IoTDB应用
执行balance失败报错“Source and target differ in block-size” - MapReduce服务 MRS

执行balance失败报错“Source and target differ in block-size” 问题背景与现象执行distcp跨集群拷贝文件时，出现部分文件拷贝失败“ Source and target differ in block-size. Use -pb to

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用HDFS
HyperLogLog函数 - MapReduce服务 MRS
HyperLogLog函数 - MapReduce服务 MRS

HyperLogLog函数 HetuEngine使用HyperLogLog数据结构实现rox_distinct（）函数。数据结构 HyperLogLog（hll）是一种统计基数的算法。它实际上不会存储每个元素出现的次数，它使用的是概率算法，通过存储元素的32位hash值的第一个

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明

总条数： 506

上一页
1
...
12
13
14
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark Distinct聚合优化 - MapReduce服务 MRS

使用BulkLoad工具向HBase中批量导入数据 - MapReduce服务 MRS

ClickHouse开源增强特性 - MapReduce服务 MRS

Sqoop1.4.7适配MRS 3.x集群 - MapReduce服务 MRS

字符串函数和运算符 - MapReduce服务 MRS

配置Doris SQL防御 - MapReduce服务 MRS

实时任务接入 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

分布式Scan HBase表 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

Flink Hudi样例程序（Java） - MapReduce服务 MRS

使用BulkLoad工具批量删除HBase数据 - MapReduce服务 MRS

使用BulkLoad工具批量删除HBase数据 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

Flink Hudi样例程序（Java） - MapReduce服务 MRS

LOAD DATA - MapReduce服务 MRS

使用CDL从PgSQL同步数据到Kafka - MapReduce服务 MRS

在本地Windows环境中调测IoTDB应用 - MapReduce服务 MRS

执行balance失败报错“Source and target differ in block-size” - MapReduce服务 MRS

HyperLogLog函数 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线