搜索_华为云

使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

本章节介绍如何使用Spark操作Hudi执行插入数据、查询数据、更新数据、增量查询、特定时间点查询、删除数据等操作。详细代码请参考样例代码。打包项目将user.keytab、krb5.conf 两个文件上传客户端所在服务器上。通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

本章节介绍如何使用Spark操作Hudi执行插入数据、查询数据、更新数据、增量查询、特定时间点查询、删除数据等操作。详细代码请参考样例代码。打包项目将user.keytab、krb5.conf 两个文件上传客户端所在服务器上。通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
Hive基本原理 - MapReduce服务 MRS
Hive基本原理 - MapReduce服务 MRS

Hive是建立在Hadoop上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。Hive定义了简单的类SQL查询语言，称为HQL，它允许熟悉SQL的用户查询数据。Hive的数据计算依赖于MapReduce、Spark、Tez。

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Hive
配置ZooKeeper ZNode ACL - MapReduce服务 MRS

test3, test4, test5, test6, zookeeper] 查看ZooKeeper znode ACL信息启动ZooKeeper客户端。使用getAcl命令，可以查看znode。如下命令，可以查看到之前创建的名为test的znode的ACL权限。 getAcl /znode名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ZooKeeper
配置ZooKeeper ZNode ACL - MapReduce服务 MRS

test3, test4, test5, test6, zookeeper] 查看ZooKeeper znode ACL信息启动ZooKeeper客户端。使用getAcl命令，可以查看znode。如下命令，可以查看到之前创建的名为test的znode的ACL权限。 getAcl /znode名称

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ZooKeeper
配置Hive SQL防御规则 - MapReduce服务 MRS

动态规则dynamic_0001（SQL语句扫描的文件数超过阈值），当Spark与Tez引擎达到提示阈值时拦截日志会在Yarn任务日志中打印，不支持在Beeline客户端输出。熔断规则存在统计误差，例如规则running_0004，扫描数据量阈值配置10GB，但是因为判断周期和任

 帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群SQL防御规则
如何配置HBase双读功能 - MapReduce服务 MRS

一个关键特性，适用于四个查询场景：使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据，减少查询毛刺，具体表现为：高成功率：双并发读机制，保证每一次读请求的成功率。可用性：单集群故障时，查询业务不中断。短暂的网络抖动也不会导致查询时间变长。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > HBase应用开发常见问题
Impala应用开发规则 - MapReduce服务 MRS

建表时分区不要超过10万个，分区太多会影响元数据加载速度，阻塞查询 Impala元数据和分区、文件数量正相关，太多分区会导致Impala元数据占用内存过大，刷新元数据时需要扫描的分区文件就越多，极大地降低查询效率。建表时整数类型的分区键不补前置0，例如'hour=01'等分区

 帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Impala应用开发规范
调测Hive Python样例程序 - MapReduce服务 MRS

服务 > Hive > 实例”查看。将“python-examples/pyCLI_sec.py”和“python-examples/pyline.py”的conf数组中的“hadoop.hadoop.com”修改为hadoop.实际域名。实际域名可登录FusionInsight

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 调测Hive应用
离线数据加载：通过CDM将Hive外表数据迁移到Doris - MapReduce服务 MRS

离线数据，端到端时延无要求。在存在DataArts Studio工具的场景下，数据加载使用CDM进行将离线的Hive外表数据迁移到MRS Doris。方案架构离线数据可以从数据湖加载，也可以直接加载本地文件。从数据湖加载可以使用工具CDM，在没有CDM工具时，可以直接使用外表加载、BrokerLo

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > 实时OLAP
配置MapReduce应用安全认证 - MapReduce服务 MRS

test：为准备集群认证用户信息创建的用户名称，例如developuser。系统域名：登录FusionInsight Manager后，选择“系统 > 权限 > 域和互信”，查看“本端域”参数，即为当前系统域名。父主题：准备MapReduce应用开发环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > MapReduce开发指南（安全模式） > 准备MapReduce应用开发环境
配置用户租约隔离访问指定节点的HiveServer - MapReduce服务 MRS

用户可登录FusionInsight Manager，选择“系统 > 权限 > 域和互信”，查看“本端域”参数，即为当前系统域名。“hive/hadoop.<系统域名>”为用户名，用户名所包含的系统域名所有字母为小写。父主题： Hive负载均衡

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强 > Hive负载均衡
Kafka应用开发流程介绍 - MapReduce服务 MRS

Kafka客户端开发的流程说明阶段说明参考文档准备开发环境在进行应用开发前，需首先准备开发环境，推荐使用Java语言进行开发，使用IntelliJ IDEA工具。同时完成JDK、Maven等初始配置。准备本地应用开发环境准备连接集群配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式）
使用JDBC提交数据分析任务 - MapReduce服务 MRS

ive/hadoop.<系统域名>@<系统域名>; 系统域名可登录FusionInsight Manager，选择“系统 > 权限 > 域和互信”，查看“本端域”参数获取。 “hive/hadoop.<系统域名>”为用户名，用户的用户名所包含的系统域名所有字母为小写。例如“本端域

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
HBase故障排除 - MapReduce服务 MRS
HBase故障排除 - MapReduce服务 MRS

使用OfflineMetaRepair工具重新构建元数据后HMaster启动失败 HMaster日志中频繁打印出FileNotFoundException信息 ImportTsv工具执行失败报“Permission denied”异常使用HBase BulkLoad导入数据成功，执行相同的查询时却返回不同的结果

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase
查看MRS集群资源监控指标 - MapReduce服务 MRS

文件。如果需要查看指定时间范围的监控指标对应的分布曲线图，请单击“查看”，界面将显示用户自定义时间范围内选定指标的分布曲线图。用户需要了解服务和主机关键监控指标中最高、最低或平均监控数据形成的曲线，即资源分布情况时，可以在MRS Manager上查看，支持查询1小时以内的监控数据。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > 查看MRS集群监控指标
使用JDBC接口提交数据分析任务 - MapReduce服务 MRS

ive/hadoop.<系统域名>@<系统域名>; 系统域名可登录FusionInsight Manager，选择“系统 > 权限 > 域和互信”，查看“本端域”参数获取。 “hive/hadoop.<系统域名>”为用户名，用户的用户名所包含的系统域名所有字母为小写。例如“本端域

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
如何配置HBase双读能力 - MapReduce服务 MRS

一个关键特性，适用于四个查询场景：使用Get读取数据、使用批量Get读取数据、使用Scan读取数据，以及基于二级索引查询。它能够同时读取主备集群数据，减少查询毛刺，具体表现为：高成功率：双并发读机制，保证每一次读请求的成功率。可用性：单集群故障时，查询业务不中断。短暂的网络抖动也不会导致查询时间变长。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（普通模式） > HBase应用开发常见问题
查询对应版本元数据 - MapReduce服务 MRS

查询对应版本元数据功能介绍查询对应版本元数据。如果参数里指定集群id，则可查询集群更新过补丁之后的最新元数据。调用方法请参见如何调用API。 URI GET /v1.1/{project_id}/metadata/versions/{version_name} 表1 路径参数

 帮助中心 > MapReduce服务 MRS > API参考 > API V1.1 > 版本元数据查询
通过JDBC访问Spark SQL样例程序开发思路 - MapReduce服务 MRS

在default数据库下创建child表。把“/home/data”的数据加载进child表中。查询child表中的数据。删除child表。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。将打包生成的ja

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > 通过JDBC访问Spark SQL样例程序

总条数： 3653

上一页
1
...
11
12
13
...
183
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

Hive基本原理 - MapReduce服务 MRS

配置ZooKeeper ZNode ACL - MapReduce服务 MRS

配置ZooKeeper ZNode ACL - MapReduce服务 MRS

配置Hive SQL防御规则 - MapReduce服务 MRS

如何配置HBase双读功能 - MapReduce服务 MRS

Impala应用开发规则 - MapReduce服务 MRS

调测Hive Python样例程序 - MapReduce服务 MRS

离线数据加载：通过CDM将Hive外表数据迁移到Doris - MapReduce服务 MRS

配置MapReduce应用安全认证 - MapReduce服务 MRS

配置用户租约隔离访问指定节点的HiveServer - MapReduce服务 MRS

Kafka应用开发流程介绍 - MapReduce服务 MRS

使用JDBC提交数据分析任务 - MapReduce服务 MRS

HBase故障排除 - MapReduce服务 MRS

查看MRS集群资源监控指标 - MapReduce服务 MRS

使用JDBC接口提交数据分析任务 - MapReduce服务 MRS

如何配置HBase双读能力 - MapReduce服务 MRS

查询对应版本元数据 - MapReduce服务 MRS

通过JDBC访问Spark SQL样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线