搜索_华为云

Quantile digest函数 - MapReduce服务 MRS

Quantile digest（分位数摘要）是存储近似百分位信息的数据草图。HetuEngine中用qdigest表示这种数据结构。函数 merge(qdigest) → qdigest 描述：将所有输入的qdigest数据合并成一个qdigest。 value_at_quantile(qdigest(T)

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
Doris基本原理 - MapReduce服务 MRS
Doris基本原理 - MapReduce服务 MRS

需要用索引过滤大量数据的查询中。在开启了写时合并选项的Unique表中，数据在导入阶段就会去将被覆盖和被更新的数据进行标记删除，同时将新的数据写入新的文件。在查询时，所有被标记删除的数据都会在文件级别被过滤，读取出的数据就都是最新的数据，消除了读时合并中的数据聚合过程，并且能够

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Doris
配置Sqoop通过IAM委托访问OBS - MapReduce服务 MRS

--connect 指定JDBC连接的URL，格式为：jdbc:mysql://MySQL数据库IP地址:MySQL的端口/数据库名称。 --username 连接MySQL数据库的用户名。 -password 连接MySQL数据库的用户密码。命令中如果携带认证密码信息可能存在安全风险，

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > MRS集群服务对接OBS示例
Hive开源增强特性 - MapReduce服务 MRS

Colocation（同分布）是HDFS提供的数据分布控制功能，利用HDFS Colocation接口，可以将存在关联关系或者可能进行关联操作的数据存放在相同的存储节点上。 Hive支持HDFS的Colocation功能，即在创建Hive表时，通过设置表文件分布的locator信息，可以将相关表的数据文件存放在相

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
数据迁移 - MapReduce服务 MRS
数据迁移 - MapReduce服务 MRS

数据迁移数据迁移方案介绍数据迁移到MRS前信息收集数据迁移到MRS前网络准备使用CDM服务迁移Hadoop数据至MRS集群使用CDM服务迁移HBase数据至MRS集群使用CDM服务迁移Hive数据至MRS集群使用BulkLoad工具向HBase中批量导入数据使用CDM服务迁移MySQL数据至MRS

帮助中心 > MapReduce服务 MRS > 最佳实践
删除CarbonData表Segments - MapReduce服务 MRS

如果用户将错误数据加载到表中，或者数据加载后出现许多错误记录，用户希望修改并重新加载数据时，可删除对应的segment。可使用segment ID来删除segment，也可以使用加载数据的时间来删除segment。删除segment操作只能删除未合并的segment，已合并的segment可以通过CLEAN

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
小文件优化 - MapReduce服务 MRS
小文件优化 - MapReduce服务 MRS

ile，再将这些PartitionedFile进行合并。即将多个PartitionedFile组成一个partition，从而减少partition数量，避免在Shuffle操作时生成过多的hash分桶，如图1所示。图1 小文件合并操作步骤要启动小文件优化，在Spark客户端的“spark-defaults

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
删除CarbonData表Segments - MapReduce服务 MRS

如果用户将错误数据加载到表中，或者数据加载后出现许多错误记录，用户希望修改并重新加载数据时，可删除对应的segment。可使用segment ID来删除segment，也可以使用加载数据的时间来删除segment。删除segment操作只能删除未合并的segment，已合并的segment可以通过CLEAN

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
T-Digest函数 - MapReduce服务 MRS
T-Digest函数 - MapReduce服务 MRS

T-digest是存储近似百分位信息的数据草图。HetuEngine中用tdigest表示这种数据结构。T-digest可以合并，在存储时可以强转为VARBINARY，检索时再由VARBINARY转换为T-digest 函数 merge(tdigest)→tdigest 描述：将所有输入的tdigest数据合并成一个tdigest。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
创建CDL数据同步任务作业 - MapReduce服务 MRS

TableName 数据写入目标数据库的表名称。 - Table Info-Enable Sink Precombine 目标数据库是否启用预合并，当前仅支持目标库为DWS时启用预合并功能。该功能用于当新值预合并字段比目标端预合并字段大时，则覆盖目标端已有数据；当新值预合并字段比目标端预合并字段小时，则丢弃新数据。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CDL > 创建CDL作业
将Hudi表数据同步到Hive - MapReduce服务 MRS

将Hudi表数据同步到Hive 通过执行run_hive_sync_tool.sh可以将Hudi表数据同步到Hive中。例如：需要将HDFS上目录为hdfs://hacluster/tmp/huditest/hudimor1_deltastreamer_partition的Hu

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Coloc

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Coloc

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Coloc

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式） > 开发HDFS应用
配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Coloc

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 开发HDFS应用
典型场景：从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到HDFS/OBS 操作场景该任务指导用户使用Loader将数据从关系型数据库导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取关系型数据库使用的用户和密码。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
数据迁移到MRS前信息收集 - MapReduce服务 MRS

数据迁移到MRS前信息收集由于离线大数据搬迁有一定的灵活性，迁移前需要掌握现有集群的详细信息，以能够更好的进行迁移决策。业务信息调研大数据平台及业务的架构图。大数据平台和业务的数据流图（包括峰值和均值流量等）。识别平台数据接入源、大数据平台数据流入方式（实时数据上报、批量数据抽取）、分析平台数据流向。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
配置Hive支持创建超过32个角色 - MapReduce服务 MRS

Hive将支持创建超过32个角色。开启本功能并对表库等授权后，对表库目录具有相同权限的角色将会用“|”合并。查询ACL权限时，将显示合并后的结果，与开启该功能前的显示会有区别。此操作不可逆，请充分考虑实际应用场景，再决定是否做出调整。如果当前组件使用了Ranger进行权限控制

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
典型场景：从HDFS/OBS导出数据到关系型数据库 - MapReduce服务 MRS

典型场景：从HDFS/OBS导出数据到关系型数据库操作场景该任务指导用户使用Loader将数据从HDFS/OBS导出到关系型数据库。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取关系型数据库使用的用户和密码。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
HDFS Colocation - MapReduce服务 MRS
HDFS Colocation - MapReduce服务 MRS

功能简介同分布（Colocation）功能是将存在关联关系的数据或可能要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性，将那些需进行关联操作的文件存放在相同数据节点上，在进行关联操作计算时避免了到别的数据节点上获取数据，大大降低网络带宽的占用。在使用Coloc

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用

总条数： 4660

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Quantile digest函数 - MapReduce服务 MRS

Doris基本原理 - MapReduce服务 MRS

配置Sqoop通过IAM委托访问OBS - MapReduce服务 MRS

Hive开源增强特性 - MapReduce服务 MRS

数据迁移 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

小文件优化 - MapReduce服务 MRS

删除CarbonData表Segments - MapReduce服务 MRS

T-Digest函数 - MapReduce服务 MRS

创建CDL数据同步任务作业 - MapReduce服务 MRS

将Hudi表数据同步到Hive - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

配置HDFS同分布策略（Colocation） - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

数据迁移到MRS前信息收集 - MapReduce服务 MRS

配置Hive支持创建超过32个角色 - MapReduce服务 MRS

典型场景：从HDFS/OBS导出数据到关系型数据库 - MapReduce服务 MRS

HDFS Colocation - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线