搜索_华为云

随机值转换 - MapReduce服务 MRS
随机值转换 - MapReduce服务 MRS

配置字段的类型，可选值为“VARCHAR”，“INTEGER”和“BIGINT”。 enum 是 VARCHAR 数据处理规则生成指定类型的随机值。样例通过“CSV文件输入”算子，生成两个字段A和B。源文件如下图：配置“随机值转换”算子，生成C、D、E三个字段：转换后，按顺序输入这五个字段：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 转换算子
在本地Windows环境中编包并运行Spark程序 - MapReduce服务 MRS

在程序代码完成开发后，您可以在Windows环境中运行应用。使用Scala或Java语言开发的应用程序在IDEA端的运行步骤是一样的。 Windows环境中目前只提供通过JDBC访问Spark SQL的程序样例代码的运行，其他样例代码暂不提供。用户需保证Maven已配置华为镜像站中SDK的Maven镜像仓库，具体可参考配置华为开源镜像仓。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 调测Spark应用 > 在本地Windows环境中调测Spark应用
HDFS样例程序开发思路 - MapReduce服务 MRS

HDFS样例程序开发思路场景说明通过典型场景，可以快速学习和掌握HDFS的开发过程，并对关键的接口函数有所了解。 HDFS的业务操作对象是文件，代码样例中所涉及的文件操作主要包括创建文件夹、写文件、追加文件内容、读文件和删除文件/文件夹；HDFS还有其他的业务处理，例如设置文

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > 开发HDFS应用
导入并配置Kafka样例工程 - MapReduce服务 MRS

IDEA开始样例学习及应用程序开发。前提条件确保本地环境的时间与MRS集群的时间差要小于5分钟，若无法确定，请联系系统管理员。MRS集群的时间可通过FusionInsight Manager页面右下角查看。已准备开发环境及MRS集群相关配置文件，详情请参考准备连接Kafka集群配置文件。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境
Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据问题为什么通过Spark SQL无法查询到存储类型为Parquet的Hive表的新插入数据？主要有以下两种场景存在这个问题：对于分区表和非分区表，在Hive客户端中执行插入数据的操作后，会出现Spark SQL无法查询到最新插入的数据的问题。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
ClickHouse设计规范概述 - MapReduce服务 MRS

ClickHouse设计规范概述内容介绍本文主要描述ClickHouse数据管理全生命周期过程中，数据库规划、建模设计、开发、调优、运维的规则建议和指导。通过这些约束和建议，指导开发者在ClickHouse数据库开发使用过程中能够最大化发挥数据库的优势，保障ClickHouse数据库高性能、稳定

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范
Hudi支持Partial Update - MapReduce服务 MRS

当前开源社区提供了PartialUpdateAvroPayload机制实现部分列更新，但该功能在多流更新，每条流更新不同列场景下会出现数据相互覆盖的问题。通过引入sequence组的概念，Hudi可以很好的解决该问题，实现真正的部分更新。按建表时按需求，将表中的列切分成不同的sequence组

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

信息，提供全局管理。全局权限控制：数据源的权限均可通过HetuEngine开放给Ranger集中管理，统一控制。跨源功能使用指导 HetuEngine能够支持多种数据源的快速联合查询并提供可视化的数据源配置、管理页面，可通过HSConsole界面快速添加如下数据源，配置数据源

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
HetuEngine物化视图概述 - MapReduce服务 MRS

HetuEngine物化视图背景介绍 HetuEngine具备物化视图能力。在实际运用中，将高频访问的SQL查询和有高耗时的算子（连接，聚合等算子）的SQL通过建立物化视图进行预计算，然后在查询的SQL中将能匹配到物化视图的查询或者子查询转换为物化视图，避免了数据的重复计算，这种情况下往往能较大地提高查询的响应效率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 配置HetuEngine物化视图
Join-To-Live - MapReduce服务 MRS
Join-To-Live - MapReduce服务 MRS

确定数据是否过期，其可以通过如下两种方式配置：仅支持Flink Regular Joins中的inner join语句。不支持与作业级TTL、表级TTL、小表广播特性同时使用。使用JTL特性的表需要指定主键，否则可能导致结果不准确。方式一：可通过SQL Hint使用 eliminate-state

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Flink Savepoints CLI介绍 - MapReduce服务 MRS

并将快照的元数据（meta-data）写入到一个额外的持久化文件系统中。如果需要使用savepoints的功能，强烈推荐用户为每个算子通过uid(String)分配一个固定的ID，以便将来升级恢复使用，示例代码如下： DataStream<String> stream = env

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > Flink应用开发常见问题 > Flink常用API介绍
Alluxio常用操作 - MapReduce服务 MRS

11-28-2019 17:43:07:743 0% /mnt/obs/test_input.txt 新挂载的文件和目录也可以通过Alluxio WebUI查看。挂载完成后，通过Alluxio统一命名空间，可以无缝地从不同存储系统中交互数据。例如，使用ls -R命令，递归地列举出一个目录下的所有文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Alluxio
删除CarbonData Table - MapReduce服务 MRS

TABLE productdb.productSalesTable; 通过上述命令，删除数据库“productdb”下的表“productSalesTable”。操作结果从系统中删除命令中指定的表。删除完成后，可通过SHOW TABLES命令进行查询，确认所需删除的表是否成功被删除，详见SHOW

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData数据分析
删除CarbonData表 - MapReduce服务 MRS

TABLE productdb.productSalesTable; 通过上述命令，删除数据库“productdb”下的表“productSalesTable”。操作结果从系统中删除命令中指定的表。删除完成后，可通过SHOW TABLES命令进行查询，确认所需删除的表是否成功被删除，详见SHOW

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用CarbonData > CarbonData数据分析
配置MRS集群弹性伸缩 - MapReduce服务 MRS

节点数量进行调整，数据量变化后触发扩缩容，有一定的延后性。资源计划（按时间段设置Task节点数量范围）：若数据量变化存在周期性规律，则可通过资源计划在数据量变化前提前完成集群的扩缩容，避免出现增加或减少资源的延后。弹性伸缩规则与资源计划均可触发弹性伸缩，两者至少配置其中一种，也可以叠加使用。

帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
建立Hive表分区提升查询效率 - MapReduce服务 MRS

LOAD DATA INTO PARTITON语句将数据加载到分区时，只能加载到静态分区。动态分区：通过查询命令，将结果插入到某个表的分区时，可以使用动态分区。动态分区通过在客户端工具执行如下命令开启： set hive.exec.dynamic.partition=true;

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
MRS 1.9.3.9及之后版本补丁说明 - MapReduce服务 MRS

建议补丁完成后对于没有单副本诉求时手动修改为false后滚动重启HDFS服务，保证HDFS数据的高可靠；对于确定存在单副本诉求的文件也可通过dfs.single.replication.exclude.pattern配置项设置单副本的数据文件和目录。 MRS 1.9.3.9及其

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
开发和部署对接HetuEngine的Hive UDF - MapReduce服务 MRS

-0.0.1-SNAPSHOT.jar文件即为Hive UDF函数包。需要将所有依赖文件都打包到jar包里。配置Hive UDF 用户通过在配置文件“udf.properties”中添加注册信息来注册Hive UDF，需按“函数名称类路径”格式添加每一行内容：以“udf.properties”

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 开发和部署HetuEngine UDF
向HBase表中插入数据 - MapReduce服务 MRS

HBase是一个面向列的数据库，一行数据，可能对应多个列族，而一个列族又可以对应多个列。通常，写入数据的时候，需要指定要写入的列（含列族名称和列名称）。HBase通过HTable的put方法来Put数据，可以是一行数据也可以是数据集。代码样例以下代码片段在com.huawei.bigdata.hbase

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用 > HBase数据读写样例程序
Load数据到Hive表失败 - MapReduce服务 MRS

Load数据到Hive表失败问题背景与现象用户在建表成功后，通过Load命令往此表导入数据，但导入操作中遇到如下问题： ....... > LOAD DATA INPATH '/user/tester1/hive-data/data.txt' INTO TABLE employees_info;

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive

总条数： 3859

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

随机值转换 - MapReduce服务 MRS

在本地Windows环境中编包并运行Spark程序 - MapReduce服务 MRS

HDFS样例程序开发思路 - MapReduce服务 MRS

导入并配置Kafka样例工程 - MapReduce服务 MRS

Spark SQL无法查询到Parquet类型的Hive表的新插入数据 - MapReduce服务 MRS

ClickHouse设计规范概述 - MapReduce服务 MRS

Hudi支持Partial Update - MapReduce服务 MRS

使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

HetuEngine物化视图概述 - MapReduce服务 MRS

Join-To-Live - MapReduce服务 MRS

Flink Savepoints CLI介绍 - MapReduce服务 MRS

Alluxio常用操作 - MapReduce服务 MRS

删除CarbonData Table - MapReduce服务 MRS

删除CarbonData表 - MapReduce服务 MRS

配置MRS集群弹性伸缩 - MapReduce服务 MRS

建立Hive表分区提升查询效率 - MapReduce服务 MRS

MRS 1.9.3.9及之后版本补丁说明 - MapReduce服务 MRS

开发和部署对接HetuEngine的Hive UDF - MapReduce服务 MRS

向HBase表中插入数据 - MapReduce服务 MRS

Load数据到Hive表失败 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线