搜索_华为云

HetuEngine样例表数据准备 - MapReduce服务 MRS

HetuEngine样例表数据准备创建具有TINYINT类型数据的表： --创建具有TINYINT类型数据的表。 CREATE TABLE int_type_t1 (IT_COL1 TINYINT) ; --插入TINYINT类型数据 insert into

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明
HetuEngine数据类型说明 - MapReduce服务 MRS

分布式查询使用高性能硬件指令进行单精度或者双精度运算时，由于每次执行的顺序不一样，在调用聚合函数，比如SUM()，AVG()，特别是当数据规模非常大时，达到数千万甚至数十亿，其运算结果可能会略有不同。这种情况下，建议使用DECIMAL数据类型来运算。可以使用别名来指定数据类型。示例： --创建具有float类型数据的表

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明
MRS集群版本如何进行升级？ - MapReduce服务 MRS

MRS集群版本如何进行升级？ MRS普通版本集群 MRS普通版本集群无法实现低版本到高版本的平滑升级。如需体验新版本集群相关能力，建议重新创建一个新版本的集群，然后将老版本集群的数据迁移到新的集群。 MRS LTS版本集群 MRS LTS版本集群支持版本升级能力，可从历史版本升级

 帮助中心 > MapReduce服务 MRS > 常见问题 > 升级补丁类
Hive Join数据优化 - MapReduce服务 MRS

注意事项 Join数据倾斜问题。执行任务的时候，任务进度长时间维持在99%，这种现象叫数据倾斜。数据倾斜是经常存在的，因为有少量的Reduce任务分配到的数据量和其他Reduce差异过大，导致大部分Reduce都已完成任务，但少量Reduce任务还没完成的情况。解决数据倾斜的问题，可通过设置“set

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark读取HBase表样例程序
Hive查询数据是否支持导出？ - MapReduce服务 MRS

Hive查询数据是否支持导出？问： MRS集群Hive组件的查询数据是否支持导出？答： Hive查询数据支持导出，请参考如下语句进行导出： insert overwrite local directory "/tmp/out/" row format delimited fields

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据场景说明用户可以在Spark应用程序中以数据源的方式去使用HBase，本例中将数据以Avro格式存储在HBase中，并从中读取数据以及对读取的数据进行过滤等操作。数据规划在客户端执行hbase shell，进入HBase命令行，使用下面的命令创建样例代码中要使用的HBase表：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Loader开源增强特性 - MapReduce服务 MRS

支持从关系型数据库导入数据到HBase表支持从关系型数据库导入数据到Phoenix表支持从关系型数据库导入数据到Hive表支持从HBase表导出数据到关系型数据库支持从Phoenix表导出数据到关系型数据库支持从Oracle分区表导入数据到HDFS/OBS 支持从Oracle分区表导入数据到HBase表

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Loader
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。如需使用Hudi，请确保MRS集群内已安装Spark/Spark2x服务。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
删除HBase数据 - MapReduce服务 MRS
删除HBase数据 - MapReduce服务 MRS

删除HBase数据功能简介 HBase通过Table实例的delete方法来Delete数据，可以是一行数据也可以是数据集。代码样例以下代码片段在com.huawei.bigdata.hbase.examples包的“HBaseExample”类的testDelete方法中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > 开发HBase应用
均衡Kafka扩容节点后数据 - MapReduce服务 MRS

--throttle 50000000 --throttle 50000000：限制网络带宽为50MB。带宽可根据数据量大小及客户对均衡时间的要求进行调整，5TB数据量，使用50MB带宽，均衡时长约8小时。执行以下命令查看迁移状态。 ./kafka-reassign-partitions

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
Hudi表分区设计规范 - MapReduce服务 MRS

度表，也可以采用非分区表。如果维度表的总数据量很大或者增量也很大，可以考虑采用某个业务ID进行分区，在大部分数据处理逻辑中针对大维度表，会有一定的业务条件进行过滤来提升处理性能，这类表要结合一定的业务场景来进行优化，无法从单纯的日期分区进行优化。事实表读取方式都会按照时间段切分，

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
恢复Manager数据（MRS 3.x及之后版本） - MapReduce服务 MRS

操作。检查恢复数据时集群主机拓扑结构与备份数据时是否相同。如果不相同，不能执行恢复操作，必须重新备份。检查恢复数据时集群中已添加的服务与备份数据时是否相同。如果不相同，不能执行恢复操作，必须重新备份。停止依赖集群运行的上层业务应用。恢复Manager数据在FusionInsight

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 备份恢复MRS集群数据 > 恢复MRS集群组件数据
数据迁移到MRS前网络准备 - MapReduce服务 MRS

数据迁移到MRS前网络准备数据迁移网络方案说明进行大数据迁移时，需要保证源端集群和目的端集群之间的网络互通，例如使用hadoop distcp命令跨集群复制数据时需要所有DataNode节点网络互通。根据不同的迁移场景需要使用不同的方式先打通两套集群之间网络连接。客户线下数

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris 应用场景通过Doris创建Catalog成功读取Hive外表数据并写入Doris，并按照Unique指定字段自动去重。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > 实时OLAP
Loader算子数据处理规则 - MapReduce服务 MRS

列数，全部数据成为脏数据。配置转换字段类型，与原始数据实际类型不同，全部数据成为脏数据。例如将字符串类型转换为数值类型。 HBase输入原始数据包含NULL值，不做转换处理。配置HBase表名错误，全部数据成为脏数据。 “主键”没有配置主键列，全部数据成为脏数据。配置输入

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助
提升HBase Put和Scan数据性能 - MapReduce服务 MRS

提升HBase Put和Scan数据性能操作场景 HBase有很多与读写性能相关的配置参数。读写请求负载不同的情况下，配置参数需要进行相应的调整，本章节旨在指导用户通过修改RegionServer配置参数进行读写性能调优。操作步骤登录FusionInsight Manager界面，选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
典型场景：从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

OdDt/yn...etM 配置多个SFTP服务器时，HDFS/OBS的数据将分为多份随机导出到各个SFTP服务器。设置数据源信息单击“下一步”，进入“输入设置”界面，在“源文件类型”中选择“HDFS”，设置数据源信息。表2 数据来源配置参数参数名解释说明示例输入目录从HDFS/OBS导出时的输入路径。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出
应用场景 - MapReduce服务 MRS
应用场景 - MapReduce服务 MRS

现毫秒级数据查询。分布式数据查询：利用Spark实现海量数据的分析查询。实时数据处理实时数据处理通常用于异常检测、欺诈识别、基于规则告警、业务流程监控等场景，在数据输入系统的过程中，对数据进行处理。例如在梯联网行业，智能电梯的数据，实时传入到MRS的流式集群中进行实时告警。

帮助中心 > MapReduce服务 MRS > 产品介绍

总条数： 4660

上一页
1
...
15
16
17
...
233
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

HetuEngine样例表数据准备 - MapReduce服务 MRS

HetuEngine数据类型说明 - MapReduce服务 MRS

MRS集群版本如何进行升级？ - MapReduce服务 MRS

Hive Join数据优化 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

Hive查询数据是否支持导出？ - MapReduce服务 MRS

操作Avro格式数据 - MapReduce服务 MRS

Loader开源增强特性 - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

删除HBase数据 - MapReduce服务 MRS

均衡Kafka扩容节点后数据 - MapReduce服务 MRS

Hudi表分区设计规范 - MapReduce服务 MRS

恢复Manager数据（MRS 3.x及之后版本） - MapReduce服务 MRS

数据迁移到MRS前网络准备 - MapReduce服务 MRS

离线数据加载：通过Doris Catalog读取Hive外表数据并写入Doris - MapReduce服务 MRS

Loader算子数据处理规则 - MapReduce服务 MRS

提升HBase Put和Scan数据性能 - MapReduce服务 MRS

典型场景：从HDFS/OBS导出数据到SFTP服务器 - MapReduce服务 MRS

应用场景 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线