搜索_华为云

将Hudi表数据同步到Hive - MapReduce服务 MRS

--batch-sync-num 指定每批次同步hive的分区数 N 1000 Hive Sync时会判断表不存在时建外表并添加分区，表存在时对比表的schema是否存在差异，存在则替换，对比分区是否有新增，有则添加分区。因此使用hive sync时有以下约束：写入数据Schema只允许增加字段，不允许修改、删除字段。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi写操作
Spark应用开发流程介绍 - MapReduce服务 MRS

Spark提供了不同场景下的样例程序，您可以导入样例工程进行程序学习。或者您可以根据指导，新建一个Spark工程。导入并配置Spark样例工程新建Spark样例工程（可选）根据场景开发工程提供了Scala、Java、Python三种不同语言的样例工程，还提供了Streaming、SQL、JDBC客户端程序以及Spark

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
打包Storm样例工程应用 - MapReduce服务 MRS

打包Storm样例工程应用操作场景通过IntelliJ IDEA导出Jar包并指定导出jar包名称，比如“storm-examples.jar”。操作步骤若Storm-JDBC样例需要在Windows下运行，则需要替换配置文件路径；否则，不需要执行此步骤。在IDEA界面右键单击“jdbc

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > 调测Storm应用
准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境准备本地应用开发环境导入并配置Spark样例工程新建Spark样例工程（可选）配置Spark Python3样例工程父主题： Spark2x开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式）
提升HBase实时读数据效率 - MapReduce服务 MRS

对于可以压缩的数据，配置压缩算法可以有效减少磁盘的IO，从而达到提高性能的目的。说明：并非所有数据都可以进行有效压缩。例如一张图片的数据，因为图片一般已经是压缩后的数据，所以压缩效果有限。常用的压缩算法是SNAPPY，因为它有较好的Encoding/Decoding速度和可以接受的压缩率。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HBase > HBase性能调优
准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境准备Spark本地应用开发环境配置Spark应用安全认证导入并配置Spark样例工程新建Spark样例工程（可选）配置Spark Python3样例工程父主题： Spark2x开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境准备Spark本地应用开发环境准备Spark连接集群配置文件导入并配置Spark样例工程新建Spark样例工程（可选）配置Spark应用安全认证配置Spark Python3样例工程父主题： Spark2x开发指南（安全模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
在IDEA中提交Storm拓扑 - MapReduce服务 MRS

主机名和业务IP映射关系。操作步骤修改WordCountTopology.java类，使用remoteSubmit方式提交应用程序。并替换用户keytab文件名称，用户principal名称，和Jar文件地址。使用remoteSubmit方式提交应用程序 public static

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Storm开发指南（安全模式） > 调测Storm应用 > 提交Storm拓扑
准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境准备Spark本地应用开发环境准备Spark连接集群配置文件导入并配置Spark样例工程新建Spark样例工程（可选）配置Spark Python3样例工程父主题： Spark2x开发指南（普通模式）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式）
表输入 - MapReduce服务 MRS
表输入 - MapReduce服务 MRS

配置“表输入”算子，生成三个字段：设置了数据连接器后，可以单击“自动识别”，系统将自动读取数据库中的字段，可根据需要选择添加，然后根据业务场景手动进行完善或者修正即可，无需逐一手动添加。此操作会覆盖表格内已有数据。单击“自动识别”后，建议手动检查系统自动识别出的字段类型，确保与表中实际的字段类型相符合。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输入类算子
将Hudi表数据同步到Hive - MapReduce服务 MRS

--batch-sync-num 指定每批次同步hive的分区数 N 1000 Hive Sync时会判断表不存在时建外表并添加分区，表存在时对比表的schema是否存在差异，存在则替换，对比分区是否有新增，有则添加分区。因此使用hive sync时有以下约束：写入数据Schema只允许增加字段，不允许修改、删除字段。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > Hudi写操作
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

/opt/female/SparkHivetoHbase-1.0.jar 运行Python样例程序由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。将所提供 Java代码使用maven打包成jar，并放在相同目录下，运行python程序时要使用--jars把jar包加载到classpath中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发用户准备Spark应用Java开发环境准备Spark应用Scala开发环境准备Spark应用Python开发环境准备Spark应用运行环境导入并配置Spark样例工程新建Spark应用开发工程（可选）配置Spark应用安全认证父主题： Spark开发指南

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南
使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

通过IDEA自带的Maven工具，打包项目，生成jar包。具体操作请参考在Linux环境中编包并运行Spark程序。编译打包前，样例代码中的user.keytab、krb5.conf文件路径需要修改为该文件所在客户端服务器的实际路径。运行Python样例代码无需通过Maven打包，只需要上传user.keytab、krb5

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > 使用Spark执行Hudi样例程序
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

/opt/female/SparkHivetoHbase-1.0.jar 运行Python样例程序由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。将所提供 Java代码使用maven打包成jar，并放在相同目录下，运行python程序时要使用--jars把jar包加载到classpath中。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序
Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

setoHbase-1.0.jar 运行Python样例程序由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。将所提供 Java代码使用maven打包成jar，并放在相同目录下，运行python程序时要使用--jars把jar包加载到classpath中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
Spark应用开发流程介绍 - MapReduce服务 MRS

据指导，新建一个Spark工程。导入并配置Spark样例工程新建Spark样例工程（可选）准备安全认证如果您使用的是安全集群，需要进行安全认证。配置Spark应用安全认证根据场景开发工程提供了Scala、Java、Python三种不同语言的样例工程，还提供了Stre

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
如何处理集群内部OBS证书过期 - MapReduce服务 MRS

3.x版本中，替换为“/opt/Bigdata/common/runtime0/jdk1.8*”，MRS 3.x之前版本中，替换为“/opt/Bigdata/jdk”。 MRS 3.x版本集群若按照该指导执行后依然出现证书过期告警，请将${JAVA_HOME}替换为“客户端安装目录/JDK/jdk”，再次执行该指导。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

setoHbase-1.0.jar 运行Python样例程序由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。将所提供 Java代码使用maven打包成jar，并放在相同目录下，运行python程序时要使用--jars把jar包加载到classpath中。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark从HBase读取数据再写入HBase样例程序
Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

/opt/female/SparkHivetoHbase-1.0.jar 运行Python样例程序由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。将所提供 Java代码使用maven打包成jar，并放在相同目录下，运行python程序时要使用--jars把jar包加载到classpath中。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序

总条数： 1430

上一页
1
...
14
15
16
...
72
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Hudi表数据同步到Hive - MapReduce服务 MRS

Spark应用开发流程介绍 - MapReduce服务 MRS

打包Storm样例工程应用 - MapReduce服务 MRS

准备Spark应用开发环境 - MapReduce服务 MRS

提升HBase实时读数据效率 - MapReduce服务 MRS

准备Spark应用开发环境 - MapReduce服务 MRS

准备Spark应用开发环境 - MapReduce服务 MRS

在IDEA中提交Storm拓扑 - MapReduce服务 MRS

准备Spark应用开发环境 - MapReduce服务 MRS

表输入 - MapReduce服务 MRS

将Hudi表数据同步到Hive - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

准备Spark应用开发环境 - MapReduce服务 MRS

使用Spark执行Hudi样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序（Java） - MapReduce服务 MRS

Spark应用开发流程介绍 - MapReduce服务 MRS

如何处理集群内部OBS证书过期 - MapReduce服务 MRS

Spark从HBase读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序开发思路 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线