搜索_华为云

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。 table2表有记录key=1,cf:cid=1000，表示用户1的历史消息记录金额为1000元。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
ClickHouse索引设计 - MapReduce服务 MRS

在建表设计时指定主键字段的建议：按查询时最常使用且过滤性最高的字段作为主键。依次按照访问频度从高到低、维度基数从小到大来排列。数据是按照主键排序存储的，查询的时候，通过主键可以快速筛选数据，合理的主键设计，能够大大减少读取的数据量，提升查询性能。例如所有的分析，都需要指定业务的id，则可以将业务id字段作为主键的第一个字段顺序。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计
MRS 1.9.3 Ranger证书如何更新？ - MapReduce服务 MRS

Manager页面“服务管理 > Ranger > 实例”中查看主RangerAdmin节点IP。输入的证书密码为用户自定义密码。命令中如果携带认证密码信息可能存在安全风险，在执行命令前建议关闭系统的history命令记录功能，避免信息泄露。登录MRS管理控制台。选择“现有集群”，单击集群名称进入集群详情页面。

帮助中心 > MapReduce服务 MRS > 常见问题 > 组件配置类
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

keytab和krb5.conf文件为安全模式下的认证文件，需要在FusionInsight Manager中下载principal用户的认证凭证，样例代码中使用的用户为：sparkuser，需要修改为准备好的开发用户。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

keytab和krb5.conf文件为安全模式下的认证文件，需要在FusionInsight Manager中下载principal用户的认证凭证，样例代码中使用的用户为：sparkuser，需要修改为准备好的开发用户。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Structured Streaming状态操作样例程序
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

用程序结果备份到HDFS的路径，<brokers>指获取元数据的Kafka地址，<topic>指读取Kafka上的topic名称，<batchTime>指Streaming分批的处理间隔。由于Spark Streaming Kafka的依赖包在客户端的存放路径与其他依赖包不同，

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
配置Hive读取Hudi表 - MapReduce服务 MRS

timestamp”之后commit的次数。增量查询：提交次数，如设置为3时，代表增量查询从指定的起始时间之后commit 3次的数据，设为-1时，增量查询从指定的起始时间之后提交的所有数据。非增量查询：不设置。 Hudi表查询操作如下：以Hive客户端安装用户登录安装客户端的节点。执行以下

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
查看Flink应用调测结果 - MapReduce服务 MRS

out”文件中，用户可以进入Yarn的WebUI页面，选择“Jobs > Running Jobs”查看运行的作业如图10。选择“Task Managers ”查看提交的任务如图11。单击该任务进入该任务详细信息页面，单击“Stdout”查看该任务的输出结果如图12。图10 运行的作业图11 提交的任务图12

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（普通模式） > 调测Flink应用
CarbonData表空间索引语法说明 - MapReduce服务 MRS

UDF，参数GEO_HASH_INDEX_COLUMN和polygon表的POLYGON_COLUMN。Polygon_column列是一系列的点（经纬度列）。Polygon表的每一行的第一个点和最后一个点必须是相同的。Polygon表的每一行的所有点连接起来形成一个封闭的几何对象。 UDF输入参数：参数类型

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考
提交Storm拓扑后Worker日志为空 - MapReduce服务 MRS

launch.secs的值要大于等于supervisor.worker.start.timeout.secs的值（建议相等或略大，如果超出太多会影响任务重分配的效率）。 nimbus.task.launch.secs：nimbus在超过该参数配置的时间内没有收到拓扑的task发的心跳时，会将

 帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
配置Spark读写Doris数据 - MapReduce服务 MRS

该章节仅适用于MRS 3.5.0及之后版本。前提条件已创建包含Doris服务的集群，集群内各服务运行正常。待连接Doris数据库的节点与MRS集群网络互通。创建具有Doris管理权限的用户。集群已启用Kerberos认证（安全模式）在FusionInsight M

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris企业级能力增强 > 配置Doris支持多源数据
beeline客户端报错“OutOfMemoryError” - MapReduce服务 MRS

count(*) from table_name;前确认需要查询的数据量大小，确认是否需要在beeline中显示如此数量级的数据。如数量在一定范围内需要显示，请调整hive客户端的jvm参数，在hive客户端目录/Hive下的component_env中添加export HIVE_O

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Hive
执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

@bdpsit3ap03 ~]# MRS集群中的用户管理由LDAP服务管理提供，又依赖于操作系统的sssd或nscd服务，用户的建立到同步到sssd服务需要一定时间，如果此时用户没有生效，或者sssd版本存在bug的情况下，某些情况下在ZooKeeper节点会出现用户无效的情况，导致创建Topic异常。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
调整Yarn任务抢占机制 - MapReduce服务 MRS

初始状态下，任务1发送给队列A，此任务需要75%的集群资源。之后任务2发送到了队列B，此任务需要50%的集群资源。任务1将会使用队列A提供的25%的集群资源，并从队列B获取的50%的集群资源。队列B保留25%的集群资源。启用抢占任务特性，则任务1使用的资源将会被抢占。队列B会从队列A中获取25%的集群资源以满足任务2的执行。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Yarn > Yarn性能调优
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式）
Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介简介 Flink是一个批处理和流处理结合的统一计算框架，其核心是一个提供了数据分发以及并行化计算的流数据处理引擎。它的最大亮点是流处理，是业界最顶级的开源流处理引擎。 Flink最适合的应用场景是低时延的数据处理（Data Processing）场景：高并发pi

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式）
查看MRS集群节点运行状态 - MapReduce服务 MRS

磁盘状态区包含了该主机所有为集群配置的磁盘分区，并显示每个磁盘分区的使用情况。实例列表区实例列表区显示了该主机所有安装的角色实例，并显示每个角色实例的状态，单击角色实例名称后的日志文件，可在线查看该实例对应日志文件内容。告警和事件的历史记录告警和事件的历史记录区显示了当前主机上报的关键告警与事件记录，系统最多可显示20条历史记录。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群节点
手动恢复Doris数据 - MapReduce服务 MRS

一个DataBase内，只允许有一个正在执行的恢复作业。 Doris数据恢复支持最小分区（Partition）级别的操作，当表的数据量很大时，建议按分区分别执行，以降低失败重试的代价。因为备份恢复操作，操作的都是实际的数据文件。所以当一个表的分片过多，或者一个分片有过多的小版本时，可能即使总数据量很小，依然需要恢复很长时间。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris运维管理
配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

在权限管理中，为了方便用户使用，授予数据库下表的任意权限将自动关联该数据库目录的HDFS权限。为了避免产生性能问题，取消表的任意权限，系统不会自动取消数据库目录的HDFS权限，但对应的用户只能登录数据库和查看表名。如果为角色添加或删除数据库的查询权限，数据库中的表也将自动添加或删除查询权限。 MRS

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive用户权限管理
查看Flink应用调测结果 - MapReduce服务 MRS

out”文件中，用户可以进入Yarn的WebUI页面，选择“Jobs > Running Jobs”查看运行的作业如图10。选择“Task Managers ”查看提交的任务如图11。单击该任务进入该任务详细信息页面，单击“Stdout”查看该任务的输出结果如图12。图10 运行的作业图11 提交的任务图12

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 调测Flink应用

总条数： 3095

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

ClickHouse索引设计 - MapReduce服务 MRS

MRS 1.9.3 Ranger证书如何更新？ - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Structured Streaming状态操作样例程序开发思路 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

配置Hive读取Hudi表 - MapReduce服务 MRS

查看Flink应用调测结果 - MapReduce服务 MRS

CarbonData表空间索引语法说明 - MapReduce服务 MRS

提交Storm拓扑后Worker日志为空 - MapReduce服务 MRS

配置Spark读写Doris数据 - MapReduce服务 MRS

beeline客户端报错“OutOfMemoryError” - MapReduce服务 MRS

执行Kafka Topic创建操作时发现Partition的Leader显示为none - MapReduce服务 MRS

调整Yarn任务抢占机制 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

Flink应用开发简介 - MapReduce服务 MRS

查看MRS集群节点运行状态 - MapReduce服务 MRS

手动恢复Doris数据 - MapReduce服务 MRS

配置Hive表、列或数据库的用户权限 - MapReduce服务 MRS

查看Flink应用调测结果 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线