搜索_华为云

快速开发Hive HCatalog应用 - MapReduce服务 MRS

快速开发Hive HCatalog应用 Hive是一个开源的，建立在Hadoop上的数据仓库框架，提供类似SQL的HQL语言操作结构化数据，其基本原理是将HQL语言自动转换成Mapreduce任务或Spark任务，从而完成对Hadoop集群中存储的海量数据进行查询和分析。 Hive主要特点如下：

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
ALM-12048 网络写包错误率超过阈值 - MapReduce服务 MRS

ALM-12048 网络写包错误率超过阈值告警解释系统每30秒周期性检测网络写包错误率，并把实际错误率和阈值（系统默认阈值0.5%）进行比较，当检测到网络写包错误率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12047 网络读包错误率超过阈值 - MapReduce服务 MRS

ALM-12047 网络读包错误率超过阈值告警解释系统每30秒周期性检测网络读包错误率，并把实际错误率和阈值（系统默认阈值0.5%）进行比较，当检测到网络读包错误率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用Flink - MapReduce服务 MRS
使用Flink - MapReduce服务 MRS

使用Flink Flink客户端执行命令报错“Error while parsing YAML configuration file : security.kerberos.login.keytab” Flink客户端执行命令报错“Error while parsing YAML

帮助中心 > MapReduce服务 MRS > 故障排除
ALM-12046 网络写包丢包率超过阈值 - MapReduce服务 MRS

ALM-12046 网络写包丢包率超过阈值告警解释系统每30秒周期性检测网络写包丢包率，并把实际丢包率和阈值（系统默认阈值0.5%）进行比较，当检测到网络写包丢包率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值告警解释系统每30秒周期性检测网络写吞吐率，并把实际吞吐率和阈值（系统默认阈值80%）进行比较，当检测到网络写吞吐率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ALM-12049 网络读吞吐率超过阈值 - MapReduce服务 MRS

ALM-12049 网络读吞吐率超过阈值告警解释系统每30秒周期性检测网络读吞吐率，并把实际吞吐率和阈值（系统默认阈值80%）进行比较，当检测到网络读吞吐率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > 主机 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表操作场景 ZSTD_JNI是ZSTD压缩算法的native实现，相较于ZSTD而言，压缩读写效率和压缩率更优，并允许用户设置压缩级别，以及对特定格式的数据列指定压缩方式。目前仅ORC格式的表支持ZSTD_JNI压缩方式，而普通

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
Flume启动失败 - MapReduce服务 MRS
Flume启动失败 - MapReduce服务 MRS

Flume启动失败问题现象安装Flume服务或重启Flume服务失败。原因分析 Flume堆内存设置的值大于机器剩余内存，查看Flume启动日志： [CST 2019-02-26 13:31:43][INFO] [[checkMemoryValidity:124]] [GC_OPTS

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Flume
快速配置参数 - MapReduce服务 MRS

快速配置参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”文件中配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark运维管理
快速配置参数 - MapReduce服务 MRS

快速配置参数概述本节介绍Spark2x使用过程中快速配置常用参数和不建议修改的配置参数。快速配置常用参数其他参数在安装集群时已进行了适配，以下参数需要根据使用场景进行调整。以下参数除特别指出外，一般在Spark2x客户端的“spark-defaults.conf”文件中配置。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark运维管理
添加Hive数据源 - MapReduce服务 MRS

开启动态过滤有助于Hive连接器的Join算子的计算优化。可参考调整HetuEngine动态过滤。带分区条件查询建立分区表并且查询带分区过滤条件有助于过滤部分分区数据，从而提高性能。 Insert优化通过设置“task.writer-count”的值为“1”和增大“hive.max-partitions-per

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
ALM-12045 网络读包丢包率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ALM-12045 网络读包丢包率超过阈值（2.x及以前版本）告警解释系统每30秒周期性检测网络读包丢包率，并把实际丢包率和阈值（系统默认阈值0.5%）进行比较，当检测到网络读包丢包率连续多次（默认值为5）超过阈值时产生该告警。用户可通过“系统设置 > 阈值配置 > 设备 >

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
ClickHouse客户端使用实践 - MapReduce服务 MRS

地表）上建立视图进行分布式查询，使用很方便。ClickHouse有数据分片（shard）的概念，这也是分布式存储的特点之一，即通过并行读写提高效率。本章节指导用户在创建MRS集群后通过集群客户端快速连接ClickHouse服务。前提条件已安装MRS集群客户端，例如安装目录为“/opt/client”。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse
ClickHouse输出 - MapReduce服务 MRS
ClickHouse输出 - MapReduce服务 MRS

ClickHouse输出概述 “ClickHouse输出”算子，用于配置已生成的字段输出到ClickHouse表的列。输入与输出输入：需要输出的字段输出：ClickHouse表参数说明表1 算子参数说明参数含义类型是否必填默认值数据库名配置ClickHouse表所在的数据库

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > Loader算子帮助 > Loader输出类算子
配置Spark通过IAM委托访问OBS - MapReduce服务 MRS

配置Spark通过IAM委托访问OBS 参考配置MRS集群通过IAM委托对接OBS完成存算分离集群配置后，即可在Spark客户端创建Location为OBS路径的表。集群安装后使用spark beeline 登录FusionInsight Manager，选择“集群 > 服务 >

帮助中心 > MapReduce服务 MRS > 用户指南 > 配置MRS集群存算分离 > 配置MRS集群通过IAM委托对接OBS > 集群服务对接OBS示例
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

<num_maps> 最大的同时运行的执行拷贝的任务数。 -numListstatusThreads 构建被拷贝文件的文件列表时所用的线程数，该选项会提高distcp的运行速度。 -overwrite 覆盖目标位置的文件。 -update 如果源位置和目标位置的文件的大小，校验和不同，则更新目标位置的文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS运维管理
ClickHouse输出 - MapReduce服务 MRS
ClickHouse输出 - MapReduce服务 MRS

ClickHouse输出概述 “ClickHouse输出”算子，用于配置已生成的字段输出到ClickHouse表的列。输入与输出输入：需要输出的字段。输出：ClickHouse表。参数说明表1 算子参数说明参数含义类型是否必填默认值数据库名配置ClickHouse表所在的数据库。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Loader > 算子帮助 > 输出算子
使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

<num_maps> 最大的同时运行的执行拷贝的任务数。 -numListstatusThreads 构建被拷贝文件的文件列表时所用的线程数，该选项会提高distcp的运行速度。 -overwrite 覆盖目标位置的文件。 -update 如果源位置和目标位置的文件的大小，校验和不同，则更新目标位置的文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS运维管理
Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python）功能介绍在Spark应用中，通过使用Spark调用Hive接口来操作hive表，然后把Hive表的数据经过分析后写到HBase表。代码样例由于pyspark不提供Hbase相关api，本样例使用Python调用Java的方式实现。

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（普通模式） > 开发Spark应用 > Spark从Hive读取数据再写入HBase样例程序

总条数： 461

上一页
1
...
14
15
16
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

快速开发Hive HCatalog应用 - MapReduce服务 MRS

ALM-12048 网络写包错误率超过阈值 - MapReduce服务 MRS

ALM-12047 网络读包错误率超过阈值 - MapReduce服务 MRS

使用Flink - MapReduce服务 MRS

ALM-12046 网络写包丢包率超过阈值 - MapReduce服务 MRS

ALM-12050 网络写吞吐率超过阈值 - MapReduce服务 MRS

ALM-12049 网络读吞吐率超过阈值 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

Flume启动失败 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

快速配置参数 - MapReduce服务 MRS

添加Hive数据源 - MapReduce服务 MRS

ALM-12045 网络读包丢包率超过阈值（2.x及以前版本） - MapReduce服务 MRS

ClickHouse客户端使用实践 - MapReduce服务 MRS

ClickHouse输出 - MapReduce服务 MRS

配置Spark通过IAM委托访问OBS - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

ClickHouse输出 - MapReduce服务 MRS

使用distcp命令跨集群复制HDFS数据 - MapReduce服务 MRS

Spark从Hive读取数据再写入HBase样例程序（Python） - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线