搜索_华为云

配置矢量化读取ORC数据 - MapReduce服务 MRS

空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中，SparkSQL支持矢量化读取ORC数据（这个特性在Hive的历史版本中已经得到支持）。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。该特性可以通过下面的配置项开启：

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

空间的消耗。矢量化读取ORC格式的数据能够大幅提升ORC数据读取性能。在Spark2.3版本中，SparkSQL支持矢量化读取ORC数据（这个特性在Hive的历史版本中已经得到支持）。矢量化读取ORC格式的数据能够获得比传统读取方式数倍的性能提升。该特性可以通过下面的配置项开启：

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
配置Hive读取关系型数据库数据 - MapReduce服务 MRS

配置Hive读取关系型数据库数据操作场景 Hive支持创建与其他关系型数据库关联的外表。该外表可以从关联到的关系型数据库中读取数据，并与Hive的其他表进行Join操作。目前支持使用Hive读取数据的关系型数据库如下： DB2 Oracle 本章节适用于MRS 3.x及后续版本。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hive
配置Windows通过EIP访问集群Kafka - MapReduce服务 MRS

该章节通过指导用户配置集群绑定EIP，并配置Kafka文件的方法，方便用户可以在本地对样例文件进行编译。操作步骤为集群的每个节点申请弹性公网IP，并将本地Windows的hosts文件添加所有节点的公网IP对应主机域名的组合（注意如果主机名中出现大写字母要改成小写）。在虚拟私

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（普通模式） > Kafka应用开发常见问题
CREATE TABLE - MapReduce服务 MRS
CREATE TABLE - MapReduce服务 MRS

Doris创建表时限制至少指定2副本，以保证高可用。可以对Table增加上卷表（Rollup）以提高查询性能。表的列的Null属性默认为true，会对查询性能有一定的影响。 Doris表必须指定分桶列。查看表内容： SHOW TABLES; +----------------------+

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Doris > Doris常见SQL语法说明
ALM-16001 Hive数据仓库空间使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

参数名称参数含义 ServiceName 产生告警的服务名称。 RoleName 产生告警的角色名称。 HostName 产生告警的主机名。 Trigger condition 系统当前指标取值满足自定义的告警设置条件。对系统的影响系统可能无法正常写入数据，导致部分数据丢失。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ClickHouse用户及权限管理 - MapReduce服务 MRS

在FusionInsight Manager页面创建的用户。异常场景下登录客户端操作赋权 ClickHouse集群默认每个节点上的表元信息是相同的，因此在Manager的权限管理页面上默认采集的是任意ClickHouse节点的表信息，如果有个别节点上创建DATABASE/TABLE时未使用ON

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse > ClickHouse用户权限管理
HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

[7] }; [4] Client_new：zoo.cfg中指定的读取配置，当该名称修改时，需要同步修改zoo.cfg中对应配置。 [5] keyTab ：指明工程使用的“user.keytab”在运行样例的主机上的保存路径，使用绝对路径便于更好定位文件位置。在Windows环境

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > HBase开发指南（安全模式） > 准备HBase应用开发环境 > 配置HBase应用安全认证
均衡Kafka扩容节点后数据 - MapReduce服务 MRS

--broker-list "1,2,3" --generate 172.16.0.119：ZooKeeper实例的业务IP。 --broker-list "1,2,3"：参数中的“1,2,3”为扩容后的所有broker_id。执行vim ../reassignment.json创建“reassignment

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Kafka > Kafka运维管理
创建HBase全局二级索引 - MapReduce服务 MRS

GlobalIndexAdmin”中的方法进行HBase全局二级索引的管理，该类中addIndices用于创建全局二级索引。全局二级索引的创建需要指定索引列、覆盖列（可选）、索引表预分区（可选，建议指定）。在已有存量数据的表上创建全局二级索引，需要创建索引预分区，防止索引表出现热点，索引表数据的rowk

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（安全模式） > 开发HBase应用 > HBase全局二级索引样例程序
创建HBase全局二级索引 - MapReduce服务 MRS

GlobalIndexAdmin”中的方法进行HBase全局二级索引的管理，该类中addIndices用于创建全局二级索引。全局二级索引的创建需要指定索引列、覆盖列（可选）、索引表预分区（可选，建议指定）。在已有存量数据的表上创建全局二级索引，需要创建索引预分区，防止索引表出现热点，索引表数据的rowk

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > HBase开发指南（普通模式） > 开发HBase应用 > HBase全局二级索引样例程序
修改MRS集群系统域名 - MapReduce服务 MRS

修改MRS集群系统域名操作场景每个系统用户安全使用的范围定义为“域”，不同的系统需要定义唯一的域名。FusionInsight Manager的域名在安装过程中生成，如果需要修改为特定域名，系统管理员可通过FusionInsight Manager进行配置。修改系统域名为高

 帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > 集群互信管理
使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

计费模式选择待创建的MRS集群的计费模式。按需计费区域选择区域。不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。华北-北京四集群名称待创建的MRS集群名称。 MRS_demo 集群类型待创建的MRS集群类型。选择“自定义”

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

录。基于业务需要，开发的Spark应用程序实现实时累加计算每个单词的记录总数的功能。 Spark Streaming样例工程的数据存储在Kafka组件中，向Kafka组件发送数据。 MRS服务提供了Spark服务多种场景下的样例开发工程，本章节对应示例场景的开发思路：接收Kafka中数据，生成相应DStream。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
Spark输出 - MapReduce服务 MRS
Spark输出 - MapReduce服务 MRS

“Spark输出”算子，用于配置已生成的字段输出到SparkSQL表的列。输入与输出输入：需要输出的字段输出：SparkSQL表参数说明表1 算子参数说明参数含义类型是否必填默认值 Spark文件存储格式配置SparkSQL表文件的存储格式（目前支持四种格式：CSV、ORC、RC和PARQUET）。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
常见jar包冲突处理方式 - MapReduce服务 MRS

如果报错的是三方包里面的类，可能是因为Spark已经自带了相关的jar包，但是和代码中使用的版本不一致。操作步骤方案一：针对jar包冲突的问题，可以确认是否不需使用三方工具的包，如果可以更改为集群相同版本的包，则修改引入的依赖版本。建议用户尽量使用MRS集群自带的依赖包。方案二： jar包版本修改演示

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
常见jar包冲突处理方式 - MapReduce服务 MRS

如果报错的是三方包里面的类，可能是因为Spark已经自带了相关的jar包，但是和代码中使用的版本不一致。操作步骤方案一：针对jar包冲突的问题，可以确认是否不需使用三方工具的包，如果可以更改为集群相同版本的包，则修改引入的依赖版本。建议用户尽量使用MRS集群自带的依赖包。方案二： jar包版本修改演示

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
ALM-16003 Background线程使用率超过阈值 - MapReduce服务 MRS

系统当前指标取值满足自定义的告警设置条件。对系统的影响后台Background线程数过多，导致新提交的任务无法及时运行。可能原因 Hive后台的background线程池使用率过大。 HiveServer后台的background线程池执行的任务过多。 HiveServer后台的background线程池的容量过小。

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Hive读取关系型数据库 - MapReduce服务 MRS

Hive支持创建与其他关系型数据库关联的外表。该外表可以从关联到的关系型数据库中读取数据，并与Hive的其他表进行Join操作。目前支持使用Hive读取DB2和Oracle两种关系型数据库的数据。前提条件已安装Hive客户端。操作步骤以Hive客户端安装用户登录安装客户端的节点。执行以下命令，切换到客户端安装目录。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
配置Windows通过EIP访问普通模式集群Kafka - MapReduce服务 MRS

该章节通过指导用户配置集群绑定EIP，并配置Kafka文件的方法，方便用户可以在本地对样例文件进行编译。操作步骤为集群的每个节点申请弹性公网IP，并将本地Windows的hosts文件添加所有节点的公网IP对应主机域名的组合（注意如果主机名中出现大写字母要改成小写）。在虚拟私

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（普通模式） > Kafka应用开发常见问题

总条数： 942

上一页
1
...
37
38
39
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置Hive读取关系型数据库数据 - MapReduce服务 MRS

配置Windows通过EIP访问集群Kafka - MapReduce服务 MRS

CREATE TABLE - MapReduce服务 MRS

ALM-16001 Hive数据仓库空间使用率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ClickHouse用户及权限管理 - MapReduce服务 MRS

HBase访问多ZooKeeper场景安全认证 - MapReduce服务 MRS

均衡Kafka扩容节点后数据 - MapReduce服务 MRS

创建HBase全局二级索引 - MapReduce服务 MRS

创建HBase全局二级索引 - MapReduce服务 MRS

修改MRS集群系统域名 - MapReduce服务 MRS

使用Hive加载HDFS数据并分析图书评分情况 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

Spark输出 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

ALM-16003 Background线程使用率超过阈值 - MapReduce服务 MRS

配置Hive读取关系型数据库 - MapReduce服务 MRS

配置Windows通过EIP访问普通模式集群Kafka - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线