搜索_华为云

Spark应用开发流程介绍 - MapReduce服务 MRS

编译并运行程序指导用户将开发好的程序编译并提交运行。调测Spark应用查看程序运行结果程序运行结果会写在用户指定的路径下。用户还可以通过UI查看应用运行情况。调优程序您可以根据程序运行情况，对程序进行调优，使其性能满足业务场景诉求。调优完成后，请重新进行编译和运行。 Spark2x性能调优

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式）
MRS 2.1.0.7补丁说明 - MapReduce服务 MRS

http.server.session.timeout.secs Spark：修改配置spark.session.maxAge的值 Hive：添加自定义配置项http.server.session.timeout.secs 保存配置项时可选择不重启受影响的服务或实例，等待业务不繁忙时再重启服务或实例。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
Spark应用开发流程介绍 - MapReduce服务 MRS

即Spark客户端，请根据指导完成客户端的安装和配置。准备Spark本地应用开发环境准备连接集群配置文件应用程序开发或运行过程中，需通过集群相关配置文件信息连接MRS集群，配置文件通常包括集群组件信息文件以及用于安全认证的用户文件，可从已创建好的MRS集群中获取相关内容。准备Spark连接集群配置文件

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式）
导入并配置HDFS样例工程 - MapReduce服务 MRS

Project对话框中选择样例工程文件夹“hdfs-example-security”，单击“OK”。将工程依赖的jar包添加到类路径。如果通过开源镜像站方式获取的样例工程代码，在配置好Maven后（配置方式参考配置华为开源镜像仓），相关依赖jar包将自动下载，不需手动添加。将工程中的conf目录添加到资源路径。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
导入并配置HDFS样例工程 - MapReduce服务 MRS

Project对话框中选择样例工程文件夹“hdfs-example-security”，单击“OK”。将工程依赖的jar包添加到类路径。如果通过开源镜像站方式获取的样例工程代码，在配置好Maven后（配置方式参考配置华为开源镜像仓），相关依赖jar包将自动下载，不需手动添加。将工程中的conf目录添加到资源路径。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HDFS开发指南（安全模式） > 准备HDFS应用开发环境
INSERT INTO - MapReduce服务 MRS
INSERT INTO - MapReduce服务 MRS

true”和“hoodie.sql.insert.mode = non-strict”来开启bulk insert作为Insert语句的写入方式。也可以通过直接设置hoodie.datasource.write.operation的方式控制insert语句的写入方式，包括bulk_insert

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi SQL语法参考 > Hudi DML语法说明
责任共担 - MapReduce服务 MRS
责任共担 - MapReduce服务 MRS

安全责任在于对使用的IaaS、PaaS和SaaS类各项云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
Flink滑动窗口增强 - MapReduce服务 MRS

当需要触发某个窗口时，计算该窗口包含的所有pane，并取出合并成一个完整的窗口计算。图4 窗口触发计算示例当某个pane不再需要时，将其从内存中删除。图5 窗口删除示例通过优化，可以大幅度降低数据在内存以及快照中的数量。父主题： Flink

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Flink
用add jar方式创建function，执行drop function时出现问题 - MapReduce服务 MRS

执行show functions操作后的结果回答问题根因：上述两个问题是由于多主实例模式或者多租户模式下，使用spark-beeline通过add jar的方式创建function，此function在各个JDBCServer实例之间是不可见的。执行drop function时

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark2x常见问题 > SQL和DataFrame
Hudi支持聚合函数 - MapReduce服务 MRS

建表属性中指定hoodie.merge-engine=aggregate开启hudi表的聚合引擎功能。开启聚合引擎后，每个非主键字段都可以被赋予一个聚合函数，通过字段的fields.<field-name>.aggregate-function表属性来指定。例如，考虑以下表定义。 create table

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi
MRS 1.9.2.2补丁说明 - MapReduce服务 MRS

解决ZK脏数据导致Yarn服务不可用问题 OBS包升级 JDK版本升级解决Yarn的ResourceManager内存泄漏问题增加对调用ECS getSecuritykey接口异常的监控优化刷新临时AK/Sk流程解决ResourceManager内存泄露问题解决Hive union语句合并小文件报错问题

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群补丁说明
用add jar方式创建function，执行drop function时出现问题 - MapReduce服务 MRS

执行show functions操作后的结果回答问题根因：上述两个问题是由于多主实例模式或者多租户模式下，使用spark-beeline通过add jar的方式创建function，此function在各个JDBCServer实例之间是不可见的。执行drop function时

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark常见问题 > SQL和DataFrame
多流Join场景支持配置表级别的TTL时间 - MapReduce服务 MRS

量的已经过期的数据，给状态后端造成了较大的压力。为了减少状态后端的压力，可以单独为左表和右表设置不同的过期时间。不支持where子句。可通过使用Hint方式单独为左表和右表设置不同的过期时间，如左表（state.ttl.left）设置TTL为60秒，右表（state.ttl.right）设置TTL为120秒：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flink > Flink企业级能力增强
Spark SQL join优化 - MapReduce服务 MRS

warehouse.dir</name> <value>/user/hive/warehouse</value> </property> 然后通过hadoop命令查看对应表的大小。如查看表A的大小命令为： hadoop fs -du -s -h ${test.warehouse.dir}/a

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优
配置Hive读取关系型数据库数据 - MapReduce服务 MRS

TBLPROPERTIES ( -- 关系型数据库类型 "qubit.sql.database.type" = "ORACLE", -- 通过JDBC连接关系型数据库的url（不同数据库有不同的url格式） "qubit.sql.jdbc.url" = "jdbc:oracle:thin:@//10

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
常见jar包冲突处理方式 - MapReduce服务 MRS

修改版本。在“dependencies”参数中设置各个jar包的版本的时候可以直接使用上述定义的参数传递。如果遇到其他三方包冲突，可以通过查找依赖关系确认是否存在相同包不同版本的情况，尽量修改成集群自带的jar包版本。可以参考MRS样例工程自带的pom.xml文件：获取MRS应用开发样例工程。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
常见jar包冲突处理方式 - MapReduce服务 MRS

修改版本。在“dependencies”参数中设置各个jar包的版本的时候可以直接使用上述定义的参数传递。如果遇到其他三方包冲突，可以通过查找依赖关系确认是否存在相同包不同版本的情况，尽量修改成集群自带的jar包版本。可以参考MRS样例工程自带的pom.xml文件：获取MRS应用开发样例工程。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
常见jar包冲突处理方式 - MapReduce服务 MRS

修改版本。在“dependencies”参数中设置各个jar包的版本的时候可以直接使用上述定义的参数传递。如果遇到其他三方包冲突，可以通过查找依赖关系确认是否存在相同包不同版本的情况，尽量修改成集群自带的jar包版本。可以参考MRS样例工程自带的pom.xml文件：获取MRS应用开发样例工程。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
配置Hive读取关系型数据库 - MapReduce服务 MRS

TBLPROPERTIES ( -- 关系型数据库类型 "qubit.sql.database.type" = "ORACLE", -- 通过JDBC连接关系型数据库的url（不同数据库有不同的url格式） "qubit.sql.jdbc.url" = "jdbc:oracle:thin:@//10

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
CarbonData Segment API语法说明 - MapReduce服务 MRS

InternalRow]] 例子： CarbonSegmentUtil.getFilteredSegments(carbonrdd) 可以通过传入sql语句来获取过滤后的segment： /** * Returns an array of valid segment numbers

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用CarbonData（MRS 3.x及之后版本） > CarbonData语法参考

总条数： 4195

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark应用开发流程介绍 - MapReduce服务 MRS

MRS 2.1.0.7补丁说明 - MapReduce服务 MRS

Spark应用开发流程介绍 - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

导入并配置HDFS样例工程 - MapReduce服务 MRS

INSERT INTO - MapReduce服务 MRS

责任共担 - MapReduce服务 MRS

Flink滑动窗口增强 - MapReduce服务 MRS

用add jar方式创建function，执行drop function时出现问题 - MapReduce服务 MRS

Hudi支持聚合函数 - MapReduce服务 MRS

MRS 1.9.2.2补丁说明 - MapReduce服务 MRS

用add jar方式创建function，执行drop function时出现问题 - MapReduce服务 MRS

多流Join场景支持配置表级别的TTL时间 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

配置Hive读取关系型数据库数据 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

配置Hive读取关系型数据库 - MapReduce服务 MRS

CarbonData Segment API语法说明 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线