搜索_华为云

已找到以下 10000 条记录

数据湖（四）：Hudi与Spark整合
数据湖（四）：Hudi与Spark整合

三、 读取Hudi数据使用SparkSQL读取Hudi中的数据，无法使用读取表方式来读取，需要指定HDFS对应的路径来加载，指定的路径只需要指定到*.parquet当前路径或者上一层路径即可，路径中可以使用“*”来替代任意目录和数据。读取数据返回的结

开发者 > 博客

作者： Lansonli

发表时间： 2022-06-01 02:16:37

767

1
《Spark数据分析：基于Python语言》 —2.3　获取Spark

2.3　获取Spark要把Spark安装到特定系统上，最简单的方式是使用正式版的Spark下载包。正式版Spark的包可以在http://spark.apache.org/downloads.html下载到。这些下载包是跨平台的。Spark运行在JVM环境中，而JVM是平台无关的

开发者 > 博客

作者：华章计算机

发表时间： 2020-02-12 18:13:39

5704

0
2021年大数据Spark（十六）：Spark Core的RDD算子练习

mapPartitionsWithIndex 算子取分区中对应的数据时，还可以将分区的编号取出来，这样就可以知道数据是属于哪个分区的。功能：取分区中对应的数据时，还可以将分区的编号取出来，这样就可以知道数据是属于哪个分区的 val rdd1 = sc.parallelize(List(1

开发者 > 博客

作者： Lansonli

发表时间： 2021-09-28 16:54:11

947

0
Spark读取HBase表样例程序 - MapReduce服务 MRS

Spark读取HBase表样例程序操作Avro格式数据操作HBase数据源 BulkPut接口使用 BulkGet接口使用 BulkDelete接口使用 BulkLoad接口使用 foreachPartition接口使用分布式Scan HBase表 mapPartition接口使用

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用
【MindRecord】【数据读取】数据读取失败

【功能模块】MindDataset【操作步骤&问题现象】1、已生成MindRecord文件，文件数64，单个文件大小为13G。2、数据读取时出现错误。错误为"RuntimeError: Unexpected error. Invalid file, failed to open files

开发者 > 其他

作者： kaierlong

626

2
Streaming从Kafka读取数据再写入HBase - MapReduce服务 MRS

Streaming从Kafka读取数据再写入HBase 场景说明 Java样例代码 Scala样例代码父主题：开发Spark应用

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用
《Spark数据分析：基于Python语言》 —1.2　Spark简介

1.2　Spark简介Apache Spark是为了提升Hadoop中MapReduce的效率而创建的。Spark还提供了无可匹敌的可扩展性，是数据处理中高效的瑞士军刀，提供SQL访问、流式数据处理、图计算、NoSQL处理、机器学习等功能。1.2.1　Spark背景Apache

开发者 > 博客

作者：华章计算机

发表时间： 2020-02-12 16:55:39

3604

0
《Spark数据分析：基于Python语言》 —2 部署Spark

第2章部署Spark可以使用的创意才有价值。—美国发明家托马斯A.爱迪生本章提要各种Spark部署模式概览如何安装SparkSpark安装所包含的内容各种在云上部署Spark的方法概览本章介绍如何部署Spark、如何安装Spark、如何启动和运行Spark集群的基础内容。本章介绍

开发者 > 博客

作者：华章计算机

发表时间： 2020-02-12 17:57:05

3420

0
SparkStreaming批量写入HBase表 - MapReduce服务 MRS

装netcat。开发思路使用SparkStreaming持续读取特定端口的数据。将读取到的Dstream通过streamBulkPut接口写入HBase表中。运行前置操作安全模式下Spark Core样例代码需要读取两个文件（user.keytab、krb5.conf）。user

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark读取HBase表样例程序
Spark sql和Spark 作业区别
Spark sql和Spark 作业区别

【功能模块】【DLI数据湖探索】【作业管理】【操作步骤&问题现象】1、进入DLI管理作业管理页面；2、点击sql作业和spark作业【问题详述】这两个作业的应用场景区别是啥，如何选择

开发者 > 其他

作者：雪中独狼

3117

1
《Spark数据分析：基于Python语言》 —1.2.7　Spark与Hadoop

2.7　Spark与Hadoop如前所述，Hadoop和Spark两者是紧密关联的，它们有共同的历史，核心的并行处理概念也有共通之处，比如无共享和数据本地化。下面我们了解一下Hadoop和Spark一般是如何共同使用的。1.以HDFS作为Spark的一种数据源Spark可以用作H

开发者 > 博客

作者：华章计算机

发表时间： 2020-02-12 17:16:55

4930

0
大数据学习，大数据发展趋势和Spark介绍

如合并大量小文件等等。数据湖中这些数据可以用来支持商业分析报表、数据挖掘、人工智能等应用。事实上Spark是当前使用最普遍的大数据计算引擎。在各个大企业的业务系统中，都把Spark作为数据处理和分析的核心组件。简单来说，原始的数据通常需要利用Spark来进行一系列的处理，才能最终

开发者 > 其他

作者： Amber

5922

0
2021年大数据Spark（十）：环境搭建集群模式 Spark on YARN

需要被提交的jar:Spark任务的jar包(如spark/example/jars中有示例程序,或我们后续自己开发的Spark任务) 4.需要其他依赖jar:Yarn的JVM运行Spark的字节码需要Spark的jar包支持!Spark安装目录中有jar包,在spark/jars/中

开发者 > 博客

作者： Lansonli

发表时间： 2021-09-28 17:00:34

1280

0
浅谈Hive on Spark 与 Spark SQL的区别

转载至华为云社区【摘要】 Hive On Spark大体与Spark SQL结构类似，只是SQL引擎不同，但是计算引擎都是Spark。将Spark作为计算引擎，性能会比传统的MapReduce快很多。华为云DLI服务全面兼容Spark能力，DLI SQL在封装Spark SQL的同时，集成了ca

开发者 > 其他

作者：泽宇-Li

3295

0
Java样例代码 - MapReduce服务 MRS
Java样例代码 - MapReduce服务 MRS

// 通过spark接口获取表中的数据 SparkConf conf = new SparkConf().setAppName("SparkHivetoHbase"); JavaSparkContext jsc = new JavaSparkContext(conf);

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从Hive读取数据再写入HBase
Spark从Hive读取数据再写入HBase样例程序 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序 Spark从Hive读取数据再写入HBase样例程序开发思路 Spark从Hive读取数据再写入HBase样例程序（Java） Spark从Hive读取数据再写入HBase样例程序（Scala） Spark从Hive读取数据再写入HBase样例程序（Python）

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > 开发Spark应用
Scala样例代码 - MapReduce服务 MRS
Scala样例代码 - MapReduce服务 MRS

} // 通过spark接口获取表中的数据 val sparkConf = new SparkConf().setAppName("SparkHivetoHbase") val sc = new SparkContext(sparkConf) val

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从Hive读取数据再写入HBase
九十四、Spark-SparkSQL(整合Hive)
九十四、Spark-SparkSQL(整合Hive)

和 HiveSQL语法支持 val spark: SparkSession = SparkSession.builder().appName("test").master("local[*]") .config("spark.sql.warehouse.dir", "hdfs://192

开发者 > 博客

作者：托马斯-酷涛

发表时间： 2022-05-25 16:50:49

316

0
场景说明 - MapReduce服务 MRS
场景说明 - MapReduce服务 MRS

enabled置为true。开发思路查询table1表的数据。根据table1表数据的key值去table2表做查询。把前两步相应的数据记录做连接操作。把上一步骤的结果写到table2表。父主题：从HBase读取数据再写入HBase

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 开发Spark应用 > 从HBase读取数据再写入HBase
Spark任务读取HBase报错“had a not serializable result” - MapReduce服务 MRS

Spark任务读取HBase报错“had a not serializable result” 问题 Spark任务读取HBase报错，报错信息：Task 0.0 in stage 0.0 (TID 0) had a not serializable result: org.apache

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题

总条数： 10000

上一页
1
...
5
6
7
...
500
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据湖（四）：Hudi与Spark整合

《Spark数据分析：基于Python语言》 —2.3　获取Spark

2021年大数据Spark（十六）：Spark Core的RDD算子练习

Spark读取HBase表样例程序 - MapReduce服务 MRS

【MindRecord】【数据读取】数据读取失败

Streaming从Kafka读取数据再写入HBase - MapReduce服务 MRS

《Spark数据分析：基于Python语言》 —1.2　Spark简介

《Spark数据分析：基于Python语言》 —2 部署Spark

SparkStreaming批量写入HBase表 - MapReduce服务 MRS

Spark sql和Spark 作业区别

《Spark数据分析：基于Python语言》 —1.2.7　Spark与Hadoop

大数据学习，大数据发展趋势和Spark介绍

2021年大数据Spark（十）：环境搭建集群模式 Spark on YARN

浅谈Hive on Spark 与 Spark SQL的区别

Java样例代码 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序 - MapReduce服务 MRS

Scala样例代码 - MapReduce服务 MRS

九十四、Spark-SparkSQL(整合Hive)

场景说明 - MapReduce服务 MRS

Spark任务读取HBase报错“had a not serializable result” - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线