搜索_华为云

Spark HA方案介绍 - MapReduce服务 MRS

DBCServer集群的处理能力取决于主Server的单点能力，可扩展性不够。采用多主实例模式的HA方案，不仅可以规避主备切换服务中断的问题，实现服务不中断或少中断，还可以通过横向扩展集群来提高并发能力。实现方案多主实例模式的HA方案原理如下图所示。图1 Spark JDBCServer

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark
快速配置参数 - MapReduce服务 MRS

1 spark.shuffle.service.enabled NodeManager中一个长期运行的辅助服务，用于提升Shuffle计算性能。 fasle spark.sql.adaptive.enabled 是否开启自适应执行框架。 false spark.executor.memoryOverhead

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
运行Flink作业 - MapReduce服务 MRS
运行Flink作业 - MapReduce服务 MRS

jar”结尾。 - 运行程序参数可选参数，为本次执行的作业配置相关优化参数（例如线程、内存、CPU核数等），用于优化资源使用效率，提升作业的执行性能。 Flink作业常用运行程序参数如表2所示，可根据执行程序及集群资源情况进行配置。 - 执行程序参数可选参数，程序执行的关键参数，该参

 帮助中心 > MapReduce服务 MRS > 用户指南 > 提交MRS作业 > 运行MRS作业
快速配置参数 - MapReduce服务 MRS

1 spark.shuffle.service.enabled NodeManager中一个长期运行的辅助服务，用于提升Shuffle计算性能。 fasle spark.sql.adaptive.enabled 是否开启自适应执行框架。 false spark.executor.memoryOverhead

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

UI页面上查看提交的pyspark应用。图4 查看任务运行情况验证pandas库调用。图5 验证pandas 对接Jupyter常见问题 pandas本地import使用时，报错如下：参考以下步骤进行处理：执行命令python -m pip install backports

帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
创建Hive用户自定义函数 - MapReduce服务 MRS

永久函数，可以在多个会话中使用，不需要每次创建。用户自定义函数需要用户控制函数中变量的内存、线程等资源的占用，如果控制不当可能会导致内存溢出、CPU使用高等问题。若集群开启了Ranger鉴权，需要关闭Ranger鉴权后才能使用Python的UDF函数。下面以编写一个AddDoublesUDF为例，说明UDF的编写和使用方法。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive > Hive企业级能力增强
Json函数和运算符 - MapReduce服务 MRS

对象。 JSON数组可以具有混合元素类型，JSON Map可以有混合值类型。这使得在某些情况下无法将其转换为SQL数组和Map。为了解决该问题，HetuEngine支持对数组和Map进行部分转换： SELECT CAST(JSON'[[1, 23], 456]'AS ARRAY(JSON));--

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
导入并配置Flink样例工程 - MapReduce服务 MRS

sdk目录，单击“OK”。图23 Scala SDK files 设置成功，单击“OK”保存设置。图24 设置成功设置IDEA的文本文件编码格式，解决乱码显示问题。在IDEA首页，选择“File > Settings...”。图25 选择Settings 编码配置。在“Settings”页面，展开“Editor”，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Flink开发指南（安全模式） > 准备Flink应用开发环境
导入并配置Flink样例工程 - MapReduce服务 MRS

sdk目录，单击“OK”。图23 Scala SDK files 设置成功，单击“OK”保存设置。图24 设置成功设置IDEA的文本文件编码格式，解决乱码显示问题。在IDEA首页，选择“File > Settings...”。图25 选择Settings 编码配置。在“Settings”页面，展开“Editor”，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
Geospatial函数 - MapReduce服务 MRS
Geospatial函数 - MapReduce服务 MRS

空间参照系统及空间参照系统之间的转换。 WKB(well-known binary) 是WKT的二进制表示形式，解决了WKT表达方式冗余的问题，便于传输和在数据库中存储相同的信息。 GeoJSON 一种JSON格式的Feature信息输出格式，它便于被JavaScript等脚本语

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
创建Hive用户自定义函数 - MapReduce服务 MRS

永久函数，可以在多个会话中使用，不需要每次创建。用户自定义函数需要用户控制函数中变量的内存、线程等资源的占用，如果控制不当可能会导致内存溢出、CPU使用高等问题。若集群开启了Ranger鉴权，需要关闭Ranger鉴权后才能使用Python的UDF函数。下面以编写一个AddDoublesUDF为例，说明UDF的编写和使用方法。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive企业级能力增强
导入并配置Spark样例工程 - MapReduce服务 MRS

sdk目录，单击“OK”。图21 Scala SDK files 设置成功，单击“OK”保存设置。图22 设置成功设置IDEA的文本文件编码格式，解决乱码显示问题。在IDEA首页，选择“File > Settings...”。图23 选择Settings 编码配置。在“Settings”页面，展开“Editor”，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 准备Spark应用开发环境
Spark2x多主实例 - MapReduce服务 MRS

DBCServer集群的处理能力取决于主Server的单点能力，可扩展性不够。采用多主实例模式的HA方案，不仅可以规避主备切换服务中断的问题，实现服务不中断或少中断，还可以通过横向扩展集群来提高并发能力。实现方案多主实例模式的HA方案原理如下图所示。图1 Spark JDBCServer

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark2x > Spark2x HA方案介绍
使用命令行运行Loader作业 - MapReduce服务 MRS

则需要当前客户端的安装用户或者其他拥有更大权限的用户进行授权（将loader客户端的安装目录赋予“755”权限），请用户关注授权后的安全问题。创建访问Loader服务的用户，如果是“机机”用户需要下载keytab文件。操作步骤配置Loader shell客户端。使用安装客户端的用户登录客户端所在节点。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 客户端工具说明
缩容MRS集群 - MapReduce服务 MRS
缩容MRS集群 - MapReduce服务 MRS

HDFS数据的第一次访问响应时长，可以重启HBase或者对相关的表Disable/Enable来避免。 Task节点本身不存储集群数据，属于计算节点，不存在节点数据迁移的问题。因此在选择Task节点时，优先选择健康状态为故障、未知、亚健康的节点进行缩容。这些节点实例的健康状态信息可以在MRS上的“实例”管理界面查看。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群容量调整
导入并配置Spark样例工程 - MapReduce服务 MRS

sdk目录，单击“OK”。图21 Scala SDK files 设置成功，单击“OK”保存设置。图22 设置成功设置IDEA的文本文件编码格式，解决乱码显示问题。在IDEA首页，选择“File > Settings...”。图23 选择Settings 编码配置。在“Settings”页面，展开“Editor”，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 准备Spark应用开发环境
导入并配置Flink样例工程 - MapReduce服务 MRS

sdk目录，单击“OK”。图24 Scala SDK files 设置成功，单击“OK”保存设置。图25 设置成功设置IDEA的文本文件编码格式，解决乱码显示问题。在IDEA首页，选择“File > Settings...”。图26 选择Settings 编码配置。在“Settings”页面，展开“Editor”，选择“File

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（普通模式） > 准备Flink应用开发环境
使用客户端运行Loader作业 - MapReduce服务 MRS

则需要当前客户端的安装用户或者其他拥有更大权限的用户进行授权（将loader客户端的安装目录赋予“755”权限），请用户关注授权后的安全问题。创建访问Loader服务的用户，如果是“机机”用户需要下载keytab文件。操作步骤配置Loader shell客户端。使用安装客户端的用户登录客户端所在节点。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 客户端工具说明
使用Loader从关系型数据库导入数据到Hive - MapReduce服务 MRS

分区列的排序规则必须支持大小写敏感，否则在数据导入过程中，可能会出现数据丢失。不建议分区列选择类型为float或double的字段，因为精度问题，可能导致分区列字段的最小值、最大值所在记录无法导入。 id 分区列空值配置对数据库列中为null值记录的处理方式。值为“true”时，分区列的值为null的数据会被处理；

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导入作业
典型场景：从关系型数据库导入数据到Hive - MapReduce服务 MRS

分区列的排序规则必须支持大小写敏感，否则在数据导入过程中，可能会出现数据丢失。不建议分区列选择类型为float或double的字段，因为精度问题，可能导致分区列字段的最小值、最大值所在记录无法导入。 id 分区列空值配置对数据库列中为null值记录的处理方式。值为“true”时，分区列的值为null的数据会被处理；

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 数据导入

总条数： 3324

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark HA方案介绍 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

运行Flink作业 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

使用Jupyter Notebook对接MRS Spark - MapReduce服务 MRS

创建Hive用户自定义函数 - MapReduce服务 MRS

Json函数和运算符 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

Geospatial函数 - MapReduce服务 MRS

创建Hive用户自定义函数 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

Spark2x多主实例 - MapReduce服务 MRS

使用命令行运行Loader作业 - MapReduce服务 MRS

缩容MRS集群 - MapReduce服务 MRS

导入并配置Spark样例工程 - MapReduce服务 MRS

导入并配置Flink样例工程 - MapReduce服务 MRS

使用客户端运行Loader作业 - MapReduce服务 MRS

使用Loader从关系型数据库导入数据到Hive - MapReduce服务 MRS

典型场景：从关系型数据库导入数据到Hive - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线