搜索_华为云

使用External Shuffle Service提升Spark Core性能 - MapReduce服务 MRS

数据以及给其他Executor提供shuffle数据。当Executor进程任务过重，导致触发GC（Garbage Collection）而不能为其他Executor提供shuffle数据时，会影响任务运行。 External shuffle Service是长期存在于NodeM

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > 开发Kafka应用
ClickHouse本地表设计 - MapReduce服务 MRS

ClickHouse本地表设计规则单表（分布式表）的记录数不要超过万亿，对于万亿以上表的查询，性能较差，且集群维护难度变大。单表（本地表）不超过百亿。表的设计都要考虑到数据的生命周期管理，需要进行TTL表属性设置或定期老化清理表分区数据。单表的字段建议不要超过5000列。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
MRS集群Core节点扩容成功后状态异常如何处理 - MapReduce服务 MRS

Core节点已经扩容完成，节点管理页面可以看到新扩容的节点：任务管理中有添加节点的任务失败或部分成功：若IAM用户已同步，可在组件管理观察到存在未启动角色。若未同步，可在集群Manager页面观察到存在未启动角色。处理扩容后状态异常的Core节点场景一：添加节点任务在安装组件前失败如果MRS集群为按需购买集群：

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 存算分离常见问题
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上用户可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > 开发Kafka应用
快速开发HDFS应用 - MapReduce服务 MRS

HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
HDFS应用开发简介 - MapReduce服务 MRS

HDFS（Hadoop Distribute File System）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（普通模式）
HDFS应用开发简介 - MapReduce服务 MRS

HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，适合大规模数据集应用。 HDFS适用于如下场景。处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > HDFS开发指南 > HDFS应用开发概述
HDFS应用开发简介 - MapReduce服务 MRS

HDFS（Hadoop Distribute File System）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（普通模式）
HDFS应用开发简介 - MapReduce服务 MRS

HDFS（Hadoop Distribute FileSystem）是一个适合运行在通用硬件之上，具备高度容错特性，支持高吞吐量数据访问的分布式文件系统，非常适合大规模数据集应用。 HDFS适用于如下场景：处理海量数据（TB或PB级别以上）需要很高的吞吐量需要高可靠性需要很好的可扩展能力

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式）
通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS 应用场景 Flume是一个分布式、可靠和高可用的海量日志聚合的系统。它能够将不同数据源的海量日志数据进行高效收集、聚合、移动，最后存储到一个中心化数据存储系统中。支持在系统中定制各类数据发送方，用于收集数据。同时，提供对数据进行简

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Kafka相关特性说明 - MapReduce服务 MRS

据重复。需要注意的是，这个特性只能保证单分区上的幂等性，即一个幂等性Producer能够保证某个主题的一个分区内不出现重复消息；只能实现单会话上的幂等性，这里的会话指的是Producer进程的一次运行，即重启Producer进程后，幂等性不保证。开启方法：二次开发代码中添加“props

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka常见问题
Hive应用开发简介 - MapReduce服务 MRS

Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：通过HQL语言非常容易的完成数据提取、转换和加载（ETL）。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > Hive应用开发概述
MRS可靠性增强 - MapReduce服务 MRS

Hadoop开源软件的基础上，在主要业务部件的可靠性、性能调优等方面进行了优化和提升。系统可靠性管理节点均实现HA Hadoop开源版本的数据、计算节点已经是按照分布式系统进行设计的，单节点故障不影响系统整体运行；而以集中模式运作的管理节点可能出现的单点故障，就成为整个系统可靠性的短板。 MRS对所有业务

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 产品功能
使用External Shuffle Service提升性能 - MapReduce服务 MRS

还要负责写shuffle数据，给其他Executor提供shuffle数据。当Executor进程任务过重，导致GC而不能为其他Executor提供shuffle数据时，会影响任务运行。 External shuffle Service是长期存在于NodeManager进程中的一

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Python3访问Hive样例程序 - MapReduce服务 MRS

Python3访问Hive样例程序功能介绍本章节介绍如何使用Python3连接Hive执行数据分析任务。样例代码以下分析任务示例在“hive-examples/python3-examples/pyCLI_nosec.py”文件中。导入hive类 from pyhive

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用
MRS集群日志概述 - MapReduce服务 MRS

审计日志修改审计转储配置导出审计日志备份恢复创建备份任务执行备份任务批量执行备份任务停止备份任务删除备份任务修改备份任务锁定备份任务解锁备份任务创建恢复任务执行恢复任务停止恢复任务重试恢复任务删除恢复任务多租户保存静态配置添加租户删除租户关联租户服务

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群日志
创建Bucket索引表调优 - MapReduce服务 MRS

作业使用API方式来指定资源运行，防止占用jdbc资源长时间阻塞其他任务。 DataArts使用Spark API方式操作Hudi表，必须要添加参数--conf spark.support.hudi=true，并且通过执行调度来运行作业。使用DataArts创建Hudi表 DataArts支持通过Spark

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Bucket调优示例
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上您可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 开发Kafka应用
Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路场景说明 Kafka是一个分布式消息系统，在此系统上可以做一些消息的发布和订阅操作，假定用户要开发一个Producer，让其每秒向Kafka集群某Topic发送一条消息，另外，还需要实现一个Consumer，订阅该Topic，实时消费该类消息。开发思路

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Kafka开发指南 > 开发Kafka应用

总条数： 2227

上一页
1
...
30
31
32
...
112
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用External Shuffle Service提升Spark Core性能 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

MRS集群Core节点扩容成功后状态异常如何处理 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

快速开发HDFS应用 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

HDFS应用开发简介 - MapReduce服务 MRS

通过Flume采集指定目录日志系统文件至HDFS - MapReduce服务 MRS

Kafka相关特性说明 - MapReduce服务 MRS

Hive应用开发简介 - MapReduce服务 MRS

MRS可靠性增强 - MapReduce服务 MRS

使用External Shuffle Service提升性能 - MapReduce服务 MRS

Python3访问Hive样例程序 - MapReduce服务 MRS

MRS集群日志概述 - MapReduce服务 MRS

创建Bucket索引表调优 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

Kafka样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线