搜索_华为云

配置NameNode内存参数 - MapReduce服务 MRS

配置NameNode内存参数配置场景在HDFS中，每个文件对象都需要在NameNode中注册相应的信息，并占用一定的存储空间。随着文件数的增加，当原有的内存空间无法存储相应的信息时，需要修改内存大小的设置。配置描述参数入口：请参考修改集群服务配置参数，进入HDFS“全部配置”页面。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS
配置HetuEngine维护实例 - MapReduce服务 MRS

维护实例是承担自动化任务的一种特殊的计算实例，主要负责物化视图的自动刷新、自动创建和自动删除。一个集群只能有一个计算实例被设置为维护实例，也可以同时承担计算实例的业务。一个租户存在多个计算实例时，仅有一个计算实例用作维护实例。配置已存在计算实例为维护实例时，其状态需为“已停止”。配置HetuEngine维护实例步骤

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 管理HetuEngine计算实例
使用Loader从HBase导出数据到关系型数据库 - MapReduce服务 MRS

dbName JDBC驱动程序类 JDBC驱动类名。 oracle.jdbc.driver.OracleDriver JDBC连接字符串 JDBC连接字符串。 jdbc:oracle:thin:@//10.16.0.1:1521/oradb 用户名连接数据库使用的用户名。 omm 密码

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

oop大数据体系，具有压缩率和极速查询性能。操作流程开始使用如下样例前，请务必按准备工作指导完成必要操作。创建MRS集群：自定义创建一个MRS 3.2.0-LTS.1版本的“ClickHouse集群”。安装集群客户端：下载并安装MRS集群客户端。使用ClickHouse

帮助中心 > MapReduce服务 MRS > 快速入门
调整Spark Core进程参数 - MapReduce服务 MRS

tor、AM之间的消息通信。当任务数变多，任务平行度增大时，Driver内存都需要相应增大。您可以根据实际任务数量的多少，为Driver设置一个合适的内存。将“spark-defaults.conf”中的“spark.driver.memory”配置项设置为合适大小。在使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
调整Spark Core进程参数 - MapReduce服务 MRS

tor、AM之间的消息通信。当任务数变多，任务平行度增大时，Driver内存都需要相应增大。您可以根据实际任务数量的多少，为Driver设置一个合适的内存。将“spark-defaults.conf”中的“spark.driver.memory”配置项设置为合适大小。在使用

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core性能调优
Spark SQL join优化 - MapReduce服务 MRS

-h ${test.warehouse.dir}/a 进行广播操作，需要至少有一个表不是空表。配置自动广播的阈值。 Spark中，判断表是否广播的阈值为10485760（即10M）。如果两个表的大小至少有一个小于10M时，可以跳过该步骤。自动广播阈值的配置参数介绍，见表1。表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL性能调优
快速开发Hive JDBC应用 - MapReduce服务 MRS

----------- 在本地创建一个目录作为运行目录，如“D:\jdbc_example”，将生成的包名中含有“-with-dependencies”字段的jar包放进该路径下，并在该目录下创建子目录“src/main/resources”。将样例工程“resources”目录下的所有文件复制到该目录下。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

据迁移 ClickHouse数据迁移工具可以将某几个ClickHouseServer实例节点上的一个或多个MergeTree引擎分区表的部分分区迁移至其他ClickHouseServer节点上相同的表中。在扩容场景中，可以使用该工具将原节点上的部分数据迁移至新增节点上，从而达到扩容后的数据均衡。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse运维管理
新建Spark应用开发工程（可选） - MapReduce服务 MRS

新建Spark应用开发工程（可选）操作场景除了导入Spark样例工程，您还可以使用IDEA新建一个Spark工程。如下步骤以创建一个Scala工程为例进行说明。操作步骤打开IDEA工具，选择“Create New Project”。图1 创建工程在“New Proje

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > 准备Spark应用开发环境
提交Storm拓扑后Worker运行异常，日志提示Failed to bind to XXX - MapReduce服务 MRS

| grep <port>命令，查看占用端口的进程ID信息。其中port修改为实际端口号。通过ps -ef | grep <pid>命令查看进程的详细信息，其中pid为查询出的实际进程ID。发现占用端口的进程为worker进程，该进程为另一个拓扑业务进程。同时根据进程详细信息发现，分配给该进程的端口为29122。

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Storm
Flink性能调优建议 - MapReduce服务 MRS

128mb runtime占用的heap的大小，一般来说不用修改，占用空间相对固定。 RUNTIME底层占用的内存，一般不用做较大改变。 taskmanager.memory.framework.off-heap.size: 128mb runtime占用的off-heap的大小，一般来说不用修改，占用空间相对固定。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink性能调优开发规范
集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

据迁移 ClickHouse数据迁移工具可以将某几个ClickHouseServer实例节点上的一个或多个MergeTree引擎分区表的部分分区迁移至其他ClickHouseServer节点上相同的表中。在扩容场景中，可以使用该工具将原节点上的部分数据迁移至新增节点上，从而达到扩容后的数据均衡。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse运维管理
Spark SQL join优化 - MapReduce服务 MRS

-h ${test.warehouse.dir}/a 进行广播操作，需要至少有一个表不是空表。配置自动广播的阈值。 Spark中，判断表是否广播的阈值为10485760（即10M）。如果两个表的大小至少有一个小于10M时，可以跳过该步骤。自动广播阈值的配置参数介绍，见表1。表1

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL性能调优
Hive JDBC样例程序开发思路 - MapReduce服务 MRS

ended中的入职时间为2014的分区中。统计表employees_info中有多少条记录。查询使用以“cn”结尾的邮箱的员工信息。提交数据分析任务，统计表employees_info中有多少条记录。实现请参见使用JDBC接口提交数据分析任务。父主题： Hive JDBC访问样例程序

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（安全模式） > 开发Hive应用 > Hive JDBC访问样例程序
UNNEST - MapReduce服务 MRS
UNNEST - MapReduce服务 MRS

UNNEST UNNEST可以将ARRAY或MAP展开成relation。 ARRAYS展开为单独一列，MAP展开为两列（key，value）。 UNNEST还可以与多个参数一起使用，将被展开成多列，行数与最高基数参数相同（其他列用空填充）。 UNNEST可以选择使用WITH O

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine DQL SQL语法说明
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

Query Language语言操作结构化数据，其基本原理是将HQL语言自动转换成MapReduce任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：海量结构化数据分析汇总。将复杂的MapReduce编写任务简化为SQL语句。灵活的数据

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Hive JDBC样例程序开发思路 - MapReduce服务 MRS

ended中的入职时间为2014的分区中。统计表employees_info中有多少条记录。查询使用以“cn”结尾的邮箱的员工信息。提交数据分析任务，统计表employees_info中有多少条记录。实现请参见使用JDBC接口提交数据分析任务。父主题： Hive JDBC访问样例程序

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Hive开发指南（普通模式） > 开发Hive应用 > Hive JDBC访问样例程序
配置进程参数 - MapReduce服务 MRS

tor、AM之间的消息通信。当任务数变多，任务平行度增大时，Driver内存都需要相应增大。您可以根据实际任务数量的多少，为Driver设置一个合适的内存。将“spark-defaults.conf”中的“spark.driver.memory”配置项或者“spark-env

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark基本原理 - MapReduce服务 MRS
Spark基本原理 - MapReduce服务 MRS

概念上shuffle就是一个沟通数据连接的桥梁，实际上shuffle这一部分是如何实现的呢，下面就以Spark为例讲解shuffle在Spark中的实现。 Shuffle操作将一个Spark的Job分成多个Stage，前面的stages会包括一个或多个ShuffleMapTasks，最后一个sta

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > Spark

总条数： 2481

上一页
1
...
18
19
20
...
125
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置NameNode内存参数 - MapReduce服务 MRS

配置HetuEngine维护实例 - MapReduce服务 MRS

使用Loader从HBase导出数据到关系型数据库 - MapReduce服务 MRS

快速创建和使用ClickHouse列式数据库集群 - MapReduce服务 MRS

调整Spark Core进程参数 - MapReduce服务 MRS

调整Spark Core进程参数 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

快速开发Hive JDBC应用 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

新建Spark应用开发工程（可选） - MapReduce服务 MRS

提交Storm拓扑后Worker运行异常，日志提示Failed to bind to XXX - MapReduce服务 MRS

Flink性能调优建议 - MapReduce服务 MRS

集群内ClickHouseServer节点间数据迁移 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

Hive JDBC样例程序开发思路 - MapReduce服务 MRS

UNNEST - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

Hive JDBC样例程序开发思路 - MapReduce服务 MRS

配置进程参数 - MapReduce服务 MRS

Spark基本原理 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线