搜索_华为云

LOAD DATA - MapReduce服务 MRS
LOAD DATA - MapReduce服务 MRS

LOAD DATA 命令功能 LOAD DATA命令以CarbonData特定的数据存储类型加载原始的用户数据，这样，CarbonData可以在查询数据时提供良好的性能。仅支持加载位于HDFS上的原始数据。命令格式 LOAD DATA INPATH 'folder_path'

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考 > DML
基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例应用场景 Kafka是一个分布式的消息发布-订阅系统。它采用独特的设计提供了类似JMS的特性，主要用于处理活跃的流式数据。 Kafka有很多适用的场景：消息队列、行为跟踪、运维数据监控、日志收集、流处理、事件溯源、持久化日志等。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Yarn-cluster模式下提交Spark任务报“Can't get the Kerberos realm”异常 - MapReduce服务 MRS

Yarn-cluster模式下提交Spark任务报“Can't get the Kerberos realm”异常问题背景与现象认证异常导致提交Spark任务失败，报“Can't get the Kerberos realm”异常。原因分析在Driver端打印异常找不到连接HDFS的Token信息，报错如下：

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Spark
Hive应用开发简介 - MapReduce服务 MRS

Hive应用开发简介 Hive介绍 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式）
Doris建表规范 - MapReduce服务 MRS
Doris建表规范 - MapReduce服务 MRS

Doris建表规范该章节主要介绍创建Doris表时需遵循的规则和建议。 Doris建表规则在创建Doris表指定分桶buckets时，每个桶的数据大小应保持在100MB~3GB之间，单分区中最大分桶数量不超过5000。表数据超过5亿条以上必须设置分区分桶策略。表的分桶列不

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
缩容ClickHouseServer节点 - MapReduce服务 MRS

缩容ClickHouseServer节点 MRS集群中部署了ClickHouse服务时，如果需要缩容ClickHouseServer节点，需参考本章节进行缩容前的数据检查，避免在删除节点过程中造成数据丢失。缩容ClickHouseServer约束限制表1 ClickHouseServer缩容约束

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
Flume数据采集慢 - MapReduce服务 MRS

立即删除（immediate）。解决办法适当调大堆内存（xmx）的值。将Spooldir source的deletePolicy策略更改为永不删除（never）。父主题：使用Flume

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
Doris数据模型概述 - MapReduce服务 MRS

Aggregate、Unique模型：这两种聚合类型的表，Key列是兼顾排序列和唯一标识列，是真正意义上的Key列。数据模型的选择建议因为数据模型在建表时就已经确定，且无法修改。所以，选择一个合适的数据模型非常重要。 Aggregate模型可以通过预聚合，极大地降低聚合查询时所需扫描的数据量和查询的计算量，适合有

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris
配置ClickHouse对接普通模式Kafka - MapReduce服务 MRS

r页面，选择“集群 > 服务 > ClickHouse > 配置 > 全部配置 > ClickHouseServer（角色） > 引擎”，修改如下参数：参数参数说明 kafka_auth_mode ClickHouse连接Kafka的认证方式，参数值选择NoAuth。选择“集群

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入 > 配置ClickHouse对接Kafka
Doris应用开发简介 - MapReduce服务 MRS

而在建表语句中指定的DUPLICATE KEY，只是用来指明底层数据按照哪些列进行排序。数据模型的选择建议因为数据模型在建表时就已经确定，且无法修改。所以，选择一个合适的数据模型非常重要。 Aggregate模型可以通过预聚合，极大地降低聚合查询时所需扫描的数据量和查询的计算量，非常适

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（普通模式）
API概览 - MapReduce服务 MRS
API概览 - MapReduce服务 MRS

表3。表1 V2接口接口功能 API URI 集群管理接口创建集群 POST /v2/{project_id}/clusters 修改集群名称 PUT /v2/{project_id}/clusters/{cluster_id}/cluster-name 创建集群并提交作业

 帮助中心 > MapReduce服务 MRS > API参考
准备MRS应用开发用户 - MapReduce服务 MRS

keytab”文件与“krb5.conf”文件。Keytab文件用于在样例工程中进行安全认证，具体使用请参考各服务的开发指南指导。如果用户类型是人机，需要先修改初始密码后再下载认证凭据文件，否则在使用时会提示“Password has expired - change password to reset”，导致安全认证失败。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MRS应用开发安全认证说明
在本地Windows中调测HDFS程序 - MapReduce服务 MRS

（可选）在开发环境中（例如IntelliJ IDEA中），运行此样例代码需要设置运行用户，设置运行用户有两种方式，添加环境变量HADOOP_USER_NAME或者修改代码。设置环境变量方法具体如下：选中需要运行的样例程序HdfsExample.java或者ColocationExample.java，右键工程，选择“Run

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式） > 调测HDFS应用
Doris应用开发简介 - MapReduce服务 MRS

而在建表语句中指定的DUPLICATE KEY，只是用来指明底层数据按照哪些列进行排序。数据模型的选择建议因为数据模型在建表时就已经确定，且无法修改。所以，选择一个合适的数据模型非常重要。 Aggregate模型可以通过预聚合，极大地降低聚合查询时所需扫描的数据量和查询的计算量，非常适

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Doris开发指南（安全模式）
使用MRS客户端操作OpenTSDB指标数据 - MapReduce服务 MRS

创建MRS集群时由用户指定。已安装集群客户端，例如安装目录为“/opt/client”，以下操作的客户端目录只是举例，请根据实际安装目录修改。更新客户端，具体请参见更新客户端（3.x之前版本）。使用客户端如果当前集群已启用Kerberos认证，登录MRS Manager页面

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用OpenTSDB
Spark应用开发简介 - MapReduce服务 MRS

Spark应用开发简介 Spark简介 Spark是分布式批处理框架，提供分析挖掘与迭代式内存计算能力，支持多种语言（Scala/Java/Python）的应用开发。适用以下场景：数据处理（Data Processing）：可以用来快速处理数据，兼具容错性和可扩展性。迭代计算（Iterative

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
新增作业并执行（废弃） - MapReduce服务 MRS

新增作业并执行（废弃）功能介绍在MRS集群中新增一个作业，并执行作业。该接口不兼容Sahara。集群ID可参考查询集群列表接口获取。 MRS 3.x版本镜像，不支持MRS V1.1作业管理接口，需要使用V2作业管理接口。接口约束 DistCp作业需要配置文件操作类型(file_action)。

帮助中心 > MapReduce服务 MRS > API参考 > 历史API > V1.1 作业管理接口（废弃）
Flink作业引擎概述 - MapReduce服务 MRS

Flink作业引擎概述 Flink WebUI提供基于Web的可视化开发平台，用户只需要编写SQL即可开发作业，极大降低作业开发门槛。同时通过作业平台能力开放，支持业务人员自行编写SQL开发作业来快速应对需求，大大减少Flink作业开发工作量。 Flink WebUI功能仅支持MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flink
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume
Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简单处理，并写到各种数据接受方（可定制）的能力。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume

总条数： 2650

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LOAD DATA - MapReduce服务 MRS

基于Kafka的Word Count数据流统计案例 - MapReduce服务 MRS

Yarn-cluster模式下提交Spark任务报“Can't get the Kerberos realm”异常 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

Doris建表规范 - MapReduce服务 MRS

缩容ClickHouseServer节点 - MapReduce服务 MRS

Flume数据采集慢 - MapReduce服务 MRS

Doris数据模型概述 - MapReduce服务 MRS

配置ClickHouse对接普通模式Kafka - MapReduce服务 MRS

Doris应用开发简介 - MapReduce服务 MRS

API概览 - MapReduce服务 MRS

准备MRS应用开发用户 - MapReduce服务 MRS

在本地Windows中调测HDFS程序 - MapReduce服务 MRS

Doris应用开发简介 - MapReduce服务 MRS

使用MRS客户端操作OpenTSDB指标数据 - MapReduce服务 MRS

Spark应用开发简介 - MapReduce服务 MRS

新增作业并执行（废弃） - MapReduce服务 MRS

Flink作业引擎概述 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

Flume日志采集概述 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线