搜索_华为云

Spark客户端使用实践 - MapReduce服务 MRS

Core为Spark的内核模块，主要负责任务的执行，用于编写spark应用程序；Spark SQL为执行SQL的模块。场景说明假定用户有某个周末网民网购停留时间的日志文本，基于某些业务要求，要求开发Spark应用程序实现如下要求：统计日志文件中本周末网购停留总时间超过2个小时的女性网民信息。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本）
编译并调测Flink应用 - MapReduce服务 MRS

Scala或Java语言开发的应用程序在Flink客户端的运行步骤是相同的。基于YARN集群的Flink应用程序不支持在Windows环境下运行，只支持在Linux环境下运行。操作步骤在IntelliJ IDEA中，在生成Jar包之前配置工程的Artifacts信息。在IDEA主页面，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 调测Flink应用
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

假定Hive的person表存储用户当天消费的金额信息，HBase的table2表存储用户历史消费的金额信息。现person表有记录name=1,account=100，表示用户1在当天消费金额为100元。 table2表有记录key=1,cf:cid=1000，表示用户1的历史消息记录金额为1000元。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
聚合算法优化 - MapReduce服务 MRS

SQL中支持基于行的哈希聚合算法，即使用快速聚合hashmap作为缓存，以提高聚合性能。hashmap替代了之前的ColumnarBatch支持，从而避免拥有聚合表的宽模式（大量key字段或value字段）时产生的性能问题。操作步骤要启动聚合算法优化，在Spark客户端的“spark-defaults

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
开发和部署HetuEngine Function Plugin - MapReduce服务 MRS

Plugin 用户可以自定义一些函数，用于扩展SQL以满足个性化的需求，这类函数称为UDF。本章节主要介绍开发和应用HetuEngine Function Plugin的具体步骤。 MRS 3.2.1及以后版本，需要基于JDK17.0.4及以上版本开发。本章节以MRS 3.3.0版本为例。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 开发和部署HetuEngine UDF
ALM-14000 HDFS服务不可用 - MapReduce服务 MRS

是否自动清除 14000 紧急是告警参数参数名称参数含义来源产生告警的集群名称。服务名产生告警的服务名称。角色名产生告警的角色名称。主机名产生告警的主机名。对系统的影响无法为基于HDFS服务的HBase和MapReduce等上层部件提供服务。用户无法读写文件。可能原因

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

2 2 1 1 1 1 2 2 对于以上结果的第一条为什么是(NULL,0)而不是(NULL,4)。回答在进行rollup和cube操作时，用户通常是基于维度进行分析，需要的是度量的结果，因此不会对维度进行聚合操作。例如当前有表src(d1, d2,

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
Hive WebHCat接口介绍 - MapReduce服务 MRS

jobid 删除的Job的ID 返回结果参数描述 user 提交Job的用户。 status 包含Job状态信息的JSON对象。 profile 包含Job信息的JSON对象。WebHCat解析JobProfile对象中的信息，该对象因Hadoop版本不同而不同。 id Job的ID。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Hive开发指南（安全模式） > Hive应用开发常见问题 > Hive对外接口介绍
Hudi Payload操作说明 - MapReduce服务 MRS

通过比较增量数据与存量数据的preCombineField字段值的大小来决定同主键的存量数据是否能被同主键的增量数据更新。在同主键的增量数据的preCombineField字段值绝对大于同主键的存量数据的preCombineField字段值时，同主键的增量数据将会被更新。 Ove

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
配置Hive读取Hudi表 - MapReduce服务 MRS

Hudi表对应的Hive外部表介绍 Hudi源表对应一份HDFS的数据，通过Spark组件、Flink组件或者Hudi客户端，可以将Hudi表的数据映射为Hive外部表，基于该外部表，Hive可以进行实时视图查询、读优化视图查询以及增量视图查询。根据Hudi源表的类型的不同，提供不同的视图查询：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
开发和部署HetuEngine UDF - MapReduce服务 MRS

当前HetuEngine仅支持UDF JAR文件存放在“hdfs://资源URI”的HDFS中。因修改函数或增加函数而导致的重新上传JAR文件，HetuEngine会默认缓存5分钟，不会即时生效，5分钟后才会进行JAR文件的更新和重新加载。使用HetuEngine UDF 使用客户端访问：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 开发和部署HetuEngine UDF
KrbServer及LdapServer开源增强特性 - MapReduce服务 MRS

DFS中执行增、删、改、查数据的操作时，必须获取对应的TGT和ST，用于本次安全访问的认证。应用开发认证 MRS各组件提供了应用开发接口，用于用户或者上层业务产品集群使用。在应用开发过程中，安全模式的集群提供了特定的应用开发认证接口，用于应用程序的安全认证与访问。例如hadoop-common

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > KrbServer及LdapServer
创建Kafka权限角色 - MapReduce服务 MRS

设置此权限，拥有Topic的创建、删除等权限，但是不具备任何Topic的生产和消费权限。设置用户对Topic的生产权限在“配置资源权限”的表格中选择“待操作集群的名称 > Kafka > Kafka Topic生产和消费权限”。在指定Topic的“权限”列，勾选“Kafka生产者权限”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Kafka > Kafka用户权限管理
Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

2 2 1 1 1 1 2 2 对于以上结果的第一条为什么是(NULL,0)而不是(NULL,4)。回答在进行rollup和cube操作时，用户通常是基于维度进行分析，需要的是度量的结果，因此不会对维度进行聚合操作。例如当前有表src(d1, d2,

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
数据分析 - MapReduce服务 MRS
数据分析 - MapReduce服务 MRS

通过Flink作业处理OBS数据通过Spark Streaming作业消费Kafka数据通过Flume采集指定目录日志系统文件至HDFS 基于Kafka的Word Count数据流统计案例实时OLAP数据分析物联网时序数据分析

 帮助中心 > MapReduce服务 MRS > 最佳实践
Hive WebHCat接口介绍 - MapReduce服务 MRS

jobid 删除的Job的ID 返回结果参数描述 user 提交Job的用户。 status 包含Job状态信息的JSON对象。 profile 包含job信息的json对象。WebHCat解析JobProfile对象中的信息，该对象因Hadoop版本不同而不同。 id Job的id。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > Hive应用开发常见问题 > Hive对外接口介绍
Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

'cf:cid', '1000' 开发思路查询table1表的数据。根据table1表数据的key值去table2表做查询。把前两步相应的数据记录做相加操作。把上一步骤的结果写到table2表。打包项目通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中调测Spark应用。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
使用Hive CBO功能优化多表查询效率 - MapReduce服务 MRS

Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。 CBO优化器会基于统计信息和查询条件，尽可能地使Join顺序达到更优。但是也可能存在特

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive性能调优
使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

Cost Based Optimization），系统会自动根据表的统计信息，例如数据量、文件数等，选出合适计划提高多表Join的效率。Hive需要先收集表的统计信息后才能使CBO正确的优化。 CBO优化器会基于统计信息和查询条件，尽可能地使join顺序达到合适。但是也可能存在特

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive性能调优
编译并运行Flink应用 - MapReduce服务 MRS

Scala或Java语言开发的应用程序在Flink客户端的运行步骤是一样的。基于YARN集群的Flink应用程序不支持在Windows环境下运行，只支持在Linux环境下运行。操作步骤在IntelliJ IDEA中，在生成Jar包之前配置工程的Artifacts信息。在IDEA主页面，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Flink开发指南 > 调测Flink应用

总条数： 5762

上一页
1
...
17
18
19
...
289
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark客户端使用实践 - MapReduce服务 MRS

编译并调测Flink应用 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

聚合算法优化 - MapReduce服务 MRS

开发和部署HetuEngine Function Plugin - MapReduce服务 MRS

ALM-14000 HDFS服务不可用 - MapReduce服务 MRS

Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

Hive WebHCat接口介绍 - MapReduce服务 MRS

Hudi Payload操作说明 - MapReduce服务 MRS

配置Hive读取Hudi表 - MapReduce服务 MRS

开发和部署HetuEngine UDF - MapReduce服务 MRS

KrbServer及LdapServer开源增强特性 - MapReduce服务 MRS

创建Kafka权限角色 - MapReduce服务 MRS

Spark SQL ROLLUP和CUBE使用的注意事项 - MapReduce服务 MRS

数据分析 - MapReduce服务 MRS

Hive WebHCat接口介绍 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

使用Hive CBO功能优化多表查询效率 - MapReduce服务 MRS

使用Hive CBO功能优化查询效率 - MapReduce服务 MRS

编译并运行Flink应用 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线