搜索_华为云

Hudi Clustering操作说明 - MapReduce服务 MRS

即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

LogSize Top10、Topic Capacity Top10、Lag挤压、CPU/Memory监控等。 Eagle新版本中改名为EFAK。方案架构 Kafka是一个分布式的、分区的、多副本的消息发布-订阅系统，它提供了类似于JMS的特性，但在设计上完全不同，它具有消息持久化、高吞吐、

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Impala - MapReduce服务 MRS
Impala - MapReduce服务 MRS

支持Hive查询语言（HQL）中大多数的SQL-92功能，包括SELECT，JOIN和聚合函数。 HDFS，HBase和对象存储服务（OBS）存储，包括： HDFS文件格式：基于分隔符的Text file，Parquet，Avro，SequenceFile和RCFile。压缩编解码器：Snappy，GZIP，Deflate，BZIP。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
Hudi Clustering操作说明 - MapReduce服务 MRS

即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

选择“作业管理”的“表/文件迁移”页签，单击“新建作业”。进入作业参数配置界面，配置作业名称，并分别为源连接和目的连接选择步骤 5中创建的对应数据连接并选择要迁移的数据库和表名，单击“下一步”。图3 Hive作业配置配置源字段和目的字段的映射关系，并单击“下一步”。进入任务配置页面，不做修改，直接单击“保存”。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
典型场景：从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

据库导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取关系型数据库使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。如果设置的作业需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入
提交Spark任务到新增Task节点 - MapReduce服务 MRS

并提交Spark任务到新增的Task节点。方案架构租户是MRS大数据平台的核心概念，使传统的以用户为核心的大数据平台向以多租户为核心的大数据平台转变，更好的适应现代企业多租户应用环境，如图1所示。图1 以用户为核心的平台和以多租户为核心的平台对于以用户为核心的大数据平台，用户直接访问并使用全部的资源和服务。

帮助中心 > MapReduce服务 MRS > 最佳实践 > MRS集群管理
安装客户端（2.x及之前版本） - MapReduce服务 MRS

操作系统参考列表 CPU架构操作系统支持的版本号 x86计算 Euler 可用：Euler OS 2.2 可用：Euler OS 2.3 可用：Euler OS 2.5 鲲鹏计算(ARM) Euler 可用：Euler OS 2.8 弹性云服务器的CPU架构需和MRS集群节点保持一致。

帮助中心 > MapReduce服务 MRS > 用户指南 > 安装MRS集群客户端
使用DBeaver访问MRS HetuEngine - MapReduce服务 MRS

专有数据库驱动程序。本章节以DBeaver 7.2.0版本为例，讲解如何使用DBeaver访问MRS HetuEngine。方案架构出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

选择需要创建集群的VPC，单击“查看虚拟私有云”进入VPC服务查看已创建的VPC名称和ID。如果没有VPC，需要创建一个新的VPC。子网 subnet-default 选择需要创建集群的子网，可进入VPC服务查看VPC下已创建的子网名称和ID。如果VPC下未创建子网，请单击“创建子网”进行创建。集群节点

 帮助中心 > MapReduce服务 MRS > 快速入门
编译并调测Flink应用 - MapReduce服务 MRS

临时数据无法清空。请确保Jar包和配置文件的用户权限与Flink客户端一致，例如都是omm用户，且权限为755。 MRS 3.2.1及以后版本使用-tm指定taskmanager内存不能小于4096MB。运行DataStream（Scala和Java）样例程序。在终端另开一

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 调测Flink应用
安装客户端（3.x及之后版本） - MapReduce服务 MRS

统用户进行操作，要求该用户对客户端文件存放目录和安装目录具有操作权限，两个目录的权限为“755”。本章节以使用操作系统用户“user_client”安装客户端进行举例，安装目录为“/opt/hadoopclient”。使用omm和root以外的用户安装客户端时，若“/var/

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 使用MRS客户端
使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

X、3.1.X，请执行搬迁前务必确认是否支持搬迁。方案架构 CDM围绕大数据迁移上云和智能数据湖解决方案，提供了简单易用的迁移能力和多种数据源到数据湖的集成能力，降低了客户数据源迁移和集成的复杂性，有效的提高您数据迁移和集成的效率。 CDM服务迁移Hadoop数据至MRS集群方案如图1所示。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据迁移
使用FineBI访问MRS HetuEngine - MapReduce服务 MRS

能解决方案。本章节以FineBI 5.1.9版本为例，讲解如何使用FineBI访问安全模式MRS集群的HetuEngine。方案架构出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用Loader导出MRS集群内数据 - MapReduce服务 MRS

户端进行配置。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的目录、HBase表和数据。获取外部数据源（SFTP服务器或关系型数据库）使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

Optimizer：优化器，分为逻辑优化器和物理优化器，分别对HQL生成的执行计划和MapReduce任务进行优化。 Executor：按照任务的依赖关系分别执行Map/Reduce任务。 ThriftServer：提供thrift接口，作为JDBC的服务端，并将Hive和其他应用程序集成起来。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

据库导入到HDFS/OBS。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的HDFS/OBS目录和数据。获取关系型数据库使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。如果设置的作业需要

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
成本管理 - MapReduce服务 MRS
成本管理 - MapReduce服务 MRS

企业只有了解组织中哪些方面产生了成本，才能正确地控制和优化成本。成本中心支持使用“成本分析”的汇总和过滤机制可视化企业的原始成本和摊销成本，从而通过各种角度、范围分析成本和用量的趋势及驱动因素。企业还可以通过成本中心的“成本监控”，及时发现计划外费用，做到成本的可监控、可分析和可追溯。详细介绍请参见通

 帮助中心 > MapReduce服务 MRS > 计费说明
使用DBeaver访问Phoenix - MapReduce服务 MRS

5版本为例，讲解如何使用DBeaver访问MRS 3.1.0未开启Kerberos认证的集群，且该集群的HBase服务未开启Ranger鉴权。方案架构 HBase以表的形式存储数据，数据模型如图 HBase数据模型所示。表中的数据划分为多个Region，并由Master分配给对应的RegionServer进行管理。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
使用Loader导出数据 - MapReduce服务 MRS

户端进行配置。前提条件创建或获取该任务中创建Loader作业的业务用户和密码。确保用户已授权访问作业执行时操作的目录、HBase表和数据。获取外部数据源（SFTP服务器或关系型数据库）使用的用户和密码。检查磁盘空间，确保没有出现告警且余量满足导入、导出数据的大小。使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导出

总条数： 227

上一页
1
...
5
6
7
...
12
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - MapReduce服务 MRS

使用Kafka Eagle对接MRS Kafka - MapReduce服务 MRS

Impala - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

使用CDM服务迁移Hive数据至MRS集群 - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

提交Spark任务到新增Task节点 - MapReduce服务 MRS

安装客户端（2.x及之前版本） - MapReduce服务 MRS

使用DBeaver访问MRS HetuEngine - MapReduce服务 MRS

快速创建和使用Hadoop离线数据分析集群 - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

安装客户端（3.x及之后版本） - MapReduce服务 MRS

使用CDM服务迁移Hadoop数据至MRS集群 - MapReduce服务 MRS

使用FineBI访问MRS HetuEngine - MapReduce服务 MRS

使用Loader导出MRS集群内数据 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到HDFS/OBS - MapReduce服务 MRS

成本管理 - MapReduce服务 MRS

使用DBeaver访问Phoenix - MapReduce服务 MRS

使用Loader导出数据 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线