搜索_华为云

ClickHouse客户端使用实践 - MapReduce服务 MRS

ClickHouse依靠ReplicatedMergeTree引擎与ZooKeeper实现了复制表机制，用户在创建表时可以通过指定引擎选择该表是否高可用，每张表的分片与副本都是互相独立的。同时ClickHouse依靠Distributed引擎实现了分布式表机制，在所有分片（本地表）上建立视图进行分布式查询

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
HDFS基本原理 - MapReduce服务 MRS
HDFS基本原理 - MapReduce服务 MRS

HDFS基本原理 HDFS是Hadoop的分布式文件系统（Hadoop Distributed File System），实现大规模数据可靠的分布式读写。HDFS针对的使用场景是数据读写具有“一次写，多次读”的特征，而数据“写”操作是顺序写，也就是在文件创建时的写入或者在现有文件

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HDFS
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

离线处理对处理时间要求不高，但是所处理数据量较大，占用计算存储资源较多，通常通过Hive/SparkSQL引擎或者MapReduce/Spark2x实现。本实践基于华为云MapReduce服务，用于指导您创建MRS集群后，使用Hive对原始数据进行导入、分析等操作，展示了如何构建弹性、低成本的离线大数据分析。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
配置MRS租户队列 - MapReduce服务 MRS

配置MRS租户队列用户可以根据业务需求，在MRS修改指定租户的队列配置，对队列进行扩容或缩容。Yarn任务队列和资源池关联，可实现资源的分配和调度。前提条件如果通过MRS管理控制台操作，需要已完成IAM用户同步（在集群详情页的“概览”页签，单击“IAM用户同步”右侧的“同步”进行IAM用户同步）。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群租户 > 配置MRS租户
Impala客户端使用实践 - MapReduce服务 MRS

与其他Hadoop的SQL引擎相比，它拥有高性能和低延迟的特点。背景信息假定用户开发一个应用程序，用于管理企业中的使用A业务的用户信息，使用Impala客户端实现A业务操作流程如下：普通表的操作：创建用户信息表user_info。在用户信息中新增用户的学历、职称信息。根据用户编号查询用户姓名和地址。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Impala
调整Yarn任务抢占机制 - MapReduce服务 MRS

调整Yarn任务抢占机制操作场景抢占任务可精简队列中的job运行并提高资源利用率，由ResourceManager的capacity scheduler实现，其简易流程如下：假设存在两个队列A和B。其中队列A的capacity为25%，队列B的capacity为75%。初始状态下，任务1发

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Yarn > Yarn性能调优
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路使用Linux客户端创建一个Topic。开发一个Producer向该Topic生产数据。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 开发Kafka应用
Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark JDBCServer接口介绍简介 JDBCServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 JDBCServer是一个JDBC接口，用户可以通过JDBC连接JDBCServ

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍
YARN基本原理 - MapReduce服务 MRS
YARN基本原理 - MapReduce服务 MRS

YARN基本原理为了实现一个Hadoop集群的集群共享、可伸缩性和可靠性，并消除早期MapReduce框架中的JobTracker性能瓶颈，开源社区引入了统一的资源管理框架YARN。 YARN是将JobTracker的两个主要功能（资源管理和作业调度/监控）分离，主要方法是创建

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > YARN
审计与日志 - MapReduce服务 MRS
审计与日志 - MapReduce服务 MRS

审计 MRS服务在管理控制台上的操作日志，例如创建或删除MRS集群的日志记录，通过云审计服务（Cloud Trace Service，CTS）实现。CTS是华为云安全解决方案中专业的日志审计服务，提供对各种云资源操作记录的收集、存储和查询功能，可用于支撑安全分析、合规审计、资源跟踪和问题定位等常见应用场景。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

配置Spark表、列和数据库的用户权限操作场景使用SparkSQL操作表或者数据库时，如果用户访问别人创建的表或数据库，需要授予对应的权限。为了实现更严格权限控制，SparkSQL也支持列级别的权限控制。如果要访问别人创建的表上某些列，需要授予列权限。以下介绍使用Manager角色管理

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark用户权限管理
Hudi支持Partial Update - MapReduce服务 MRS

当前开源社区提供了PartialUpdateAvroPayload机制实现部分列更新，但该功能在多流更新，每条流更新不同列场景下会出现数据相互覆盖的问题。通过引入sequence组的概念，Hudi可以很好的解决该问题，实现真正的部分更新。按建表时按需求，将表中的列切分成不同的sequ

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

HetuEngine跨域功能简介 HetuEngine提供统一标准SQL对分布于多个地域（或数据中心）的多种数据源实现高效访问，屏蔽数据在结构、存储及地域上的差异，实现数据与应用的解耦。图2 HetuEngine跨域功能示意跨域关键技术和优势无单点瓶颈：HSFabric可进行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Doris UDF开发规范 - MapReduce服务 MRS

UDF开发规范本章节主要介绍开发Doris UDF程序时应遵循的规则和建议。 Doris UDF开发规则 UDF中方法调用必须是线程安全的。 UDF实现中禁止读取外部大文件到内存中，如果文件过大可能会导致内存耗尽。需避免大量递归调用，否则容易造成栈溢出或oom。需避免不断创建对象或数组，否则容易造成内存耗尽。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Doris应用开发规范
修改MRS角色实例参数 - MapReduce服务 MRS

修改MRS角色实例参数每个单独的角色实例可以修改配置参数在迁移实例到新集群场景或者重新部署相同服务的场景下，集群管理员可以将某服务所有配置数据导入或者导出，实现配置结果的快速复制。修改配置参数、导出实例配置或导入实例配置时不影响其他实例。修改MRS角色实例参数对系统的影响修改角色实例配置后，

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群组件
配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

在弹出的提示框中单击“知道了”，开始授权。界面提示“授权成功。”，单击“完成”，委托成功创建。创建存算分离集群配置存算分离支持在新建集群中配置委托实现，也可以通过为已有集群绑定委托实现。本示例以开启Kerberos认证的集群为例介绍。新创建存算分离集群：进入购买MRS集群页面。单击“购买集群”，进入“购买集群”页面。

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS
配置Hive列加密功能 - MapReduce服务 MRS

操作场景 Hive支持对表的某一列或者多列进行加密；在创建Hive表时，可以指定要加密的列和加密算法。当使用insert语句向表中插入数据时，即可实现将对应列加密。列加密只支持存储在HDFS上的TextFile和SequenceFile文件格式的表。Hive列加密不支持视图以及Hive over

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive数据存储及加密配置
Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark JDBCServer接口介绍简介 JDBCServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 JDBCServer是一个JDBC接口，用户可以通过JDBC连接JDBCServ

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题 > Spark常用API介绍
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka是一个分布式消息系统，在此系统上您可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路使用Linux客户端创建一个Topic。可参考Kafka Shell命令介绍。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 开发Kafka应用
Spark JDBCServer接口介绍 - MapReduce服务 MRS

Spark JDBCServer接口介绍简介 JDBCServer是Hive中的HiveServer2的另外一个实现，它底层使用了Spark SQL来处理SQL语句，从而比Hive拥有更高的性能。 JDBCServer是一个JDBC接口，用户可以通过JDBC连接JDBCServ

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题 > Spark常用API介绍

总条数： 848

上一页
1
...
14
15
16
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ClickHouse客户端使用实践 - MapReduce服务 MRS

HDFS基本原理 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

配置MRS租户队列 - MapReduce服务 MRS

Impala客户端使用实践 - MapReduce服务 MRS

调整Yarn任务抢占机制 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

YARN基本原理 - MapReduce服务 MRS

审计与日志 - MapReduce服务 MRS

配置Spark表、列和数据库的用户权限 - MapReduce服务 MRS

Hudi支持Partial Update - MapReduce服务 MRS

使用HetuEngine跨源跨域访问数据源 - MapReduce服务 MRS

Doris UDF开发规范 - MapReduce服务 MRS

修改MRS角色实例参数 - MapReduce服务 MRS

配置MRS集群通过IAM委托对接OBS - MapReduce服务 MRS

配置Hive列加密功能 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

Spark JDBCServer接口介绍 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线