搜索_华为云

Hudi数据表设计规范 - MapReduce服务 MRS

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： Hudi应用开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范
在本地Windows环境中调测MapReduce应用 - MapReduce服务 MRS

在本地Windows环境中调测MapReduce应用操作场景在程序代码完成开发后，您可以在Windows环境中运行应用。本地和集群业务平面网络互通时，您可以直接在本地进行调测。 MapReduce应用程序运行完成后，可通过如下方式查看应用程序的运行情况。在IntelliJ IDEA中查看应用程序运行情况。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 调测MapReduce应用
查询Hive数据 - MapReduce服务 MRS
查询Hive数据 - MapReduce服务 MRS

查询Hive数据功能介绍本小节介绍了如何使用HQL对数据进行查询分析。从本节中可以掌握如下查询分析方法。 SELECT查询的常用特性，如JOIN等。加载数据进指定分区。如何使用Hive自带函数。如何使用自定义函数进行查询分析，如何创建、定义自定义函数请见开发Hive用户自定义函数。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 开发Hive应用
执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

用户尝试收集大量数据到Driver端，如果Driver端的内存不足以存放这些数据，那么就会抛出OOM(OutOfMemory)的异常，然后Driver端一直在进行GC，尝试回收垃圾来存放返回的数据，导致应用长时间挂起。解决措施：如果用户需要在OOM场景下强制将应用退出，那么可以在启动Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
HDFS应用开发建议 - MapReduce服务 MRS

不适用HDFS场景可以考虑使用其他方式来存储数据，如HBase。 HDFS不适用于存储大量小文件 HDFS不适用于存储大量的小文件，因为大量小文件的元数据会占用NameNode的大量内存。 HDFS中数据的备份数量3份即可 DataNode数据备份数量3份即可，增加备份数量不能提升系统效率，只会提升系统数据的安全系数

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > HDFS应用开发规范
分析Hive数据 - MapReduce服务 MRS
分析Hive数据 - MapReduce服务 MRS

使用HCatalog接口提交数据分析任务，参考样例程序中的HCatalogExample.java。编写Map类，从Hive的表中获取数据。 public static class Map extends Mapper<LongWritable,

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Hive开发指南 > 开发Hive应用
HDFS应用开发简介 - MapReduce服务 MRS

行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，大大降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA API、C

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式）
HDFS应用开发简介 - MapReduce服务 MRS

行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，大大降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA API、C

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式）
HDFS应用开发简介 - MapReduce服务 MRS

要进行关联操作的数据存储在相同的存储节点上。HDFS文件同分布的特性是，将那些需进行关联操作的文件存放在相同的数据节点上，在进行关联操作计算时，避免了到别的数据节点上获取数据的动作，大大降低了网络带宽的占用。 Client HDFS Client主要包括五种方式：JAVA API、C

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式）
HBase应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 HBase简介 HBase是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统。HBase设计目标是用来解决关系型数据库在处理海量数据时的局限性。 HBase使用场景有如下几个特点：处理海量数据（TB或PB级别以上）。具有高吞吐量。在海量数据中实现高效的随机读取。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HBase开发指南 > HBase应用开发概述
Spark on Hudi表数据维护规范 - MapReduce服务 MRS

tblproperties('hoodie.index.type'='xx'); Hive/Presto等引擎可以直接修改表属性，但是这种修改会导致整个Hudi表出现数据重复，甚至数据损坏；因此禁止修改上述属性。父主题： Spark on Hudi开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Spark on Hudi开发规范
分析Impala数据 - MapReduce服务 MRS

分析Impala数据功能简介本小节介绍了如何使用样例程序完成分析任务。本章节以使用JDBC接口提交数据分析任务为例。样例代码使用Impala JDBC接口提交数据分析任务，参考样例程序中的JDBCExample.java。修改以下变量为false，标识连接集群的认证模式为普通模式。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > 开发Impala应用
ClickHouse数据库调优 - MapReduce服务 MRS

ClickHouse数据库调优 ClickHouse调优思路 ClickHouse系统调优 ClickHouse SQL调优 ClickHouse参数调优实践父主题： ClickHouse应用开发规范

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范
Impala应用开发简介 - MapReduce服务 MRS

SQL），ODBC驱动程序和用户界面（Hue中的Impala查询UI）。这为实时或面向批处理的查询提供了一个熟悉且统一的平台。作为查询大数据的工具补充，Impala不会替代基于MapReduce构建的批处理框架，例如Hive。基于MapReduce构建的Hive和其他框架最适合长时间运行的批处理作业。 Impala主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Impala开发指南 > Impala应用开发概述
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

通知Driver（绿色箭头）接收块中的元数据（Metadata）被发送到Driver的StreamingContext。这个元数据包括：定位其在Executor内存中数据位置的块Reference ID。若启用了WAL，还包括块数据在日志中的偏移信息。处理数据（红色箭头）对每个批次的数据，Stre

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败问题执行超过50T数据的shuffle过程时，出现部分Executor注册shuffle service超时然后丢失从而导致任务失败的问题。错误日志如下所示： 2016-10-19 01:33:34

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > Spark Core
查询OpenTSDB数据 - MapReduce服务 MRS

查询OpenTSDB数据功能简介使用OpenTSDB的查询接口(/api/query)读取数据。函数genQueryReq()生成查询请求，函数queryData()把查询请求发送到OpenTSDB服务端。样例代码以下代码片段在com.huawei.bigdata.opentsdb

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > OpenTSDB开发指南 > 开发OpenTSDB应用
向Doris表中插入数据 - MapReduce服务 MRS

向Doris表中插入数据本章节介绍向Doris表中插入数据样例代码。以下代码片段在“JDBCExample”类中。以Java JDBC方式执行SQL语句在集群的dbName.tableName表中插入数据。 String insertTableSql = "insert into

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（普通模式） > Doris JDBC接口调用样例程序
在Linux环境中调测Kafka应用 - MapReduce服务 MRS

在Linux环境中调测Kafka应用操作场景在程序代码完成开发后，可以在Linux环境中运行IoTDB-Kafka样例程序。前提条件已安装IoTDB和Kafka客户端。当客户端所在主机不是集群中的节点时，需要在客户端所在节点的hosts文件中设置主机名和IP地址映射。主机名和IP地址请保持一一对应。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > IoTDB开发指南（安全模式） > 调测IoTDB应用
Hive应用开发简介 - MapReduce服务 MRS

多种客户端连接方式，支持JDBC接口。 Hive的主要应用于海量数据的离线分析（如日志分析，集群状态分析）、大规模的数据挖掘（用户行为分析，兴趣分区，区域展示）等场景下。为保证Hive服务的高可用性、用户数据的安全及访问服务的可控制，在开源社区的Hive-3.1.0版本基础上，Hive新增如下特性：数据文件加密机

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发概述

总条数： 5184

上一页
1
...
8
9
10
...
260
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi数据表设计规范 - MapReduce服务 MRS

在本地Windows环境中调测MapReduce应用 - MapReduce服务 MRS

查询Hive数据 - MapReduce服务 MRS

执行Spark Core应用，尝试收集大量数据到Driver端，当Driver端内存不足时，应用挂起不退出 - MapReduce服务 MRS

HDFS应用开发建议 - MapReduce服务 MRS

分析Hive数据 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

HBase应用开发简介 - MapReduce服务 MRS

Spark on Hudi表数据维护规范 - MapReduce服务 MRS

分析Impala数据 - MapReduce服务 MRS

ClickHouse数据库调优 - MapReduce服务 MRS

Impala应用开发简介 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

执行大数据量的shuffle过程时Executor注册shuffle service失败 - MapReduce服务 MRS

查询OpenTSDB数据 - MapReduce服务 MRS

向Doris表中插入数据 - MapReduce服务 MRS

在Linux环境中调测Kafka应用 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线