搜索_华为云

T-Digest函数 - MapReduce服务 MRS
T-Digest函数 - MapReduce服务 MRS

T-digest是存储近似百分位信息的数据草图。HetuEngine中用tdigest表示这种数据结构。T-digest可以合并，在存储时可以强转为VARBINARY，检索时再由VARBINARY转换为T-digest 函数 merge(tdigest)→tdigest 描述：将所有输

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

例如客户端安装目录为“/opt/client”。步骤2：准备应用程序通过开源镜像站获取样例工程。下载样例工程的Maven工程源码和配置文件，并在本地配置好相关开发工具，可参考通过开源镜像站获取样例工程。根据集群版本选择对应的分支，下载并获取MRS相关样例工程。例如本

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 数据分析
添加MySQL数据源 - MapReduce服务 MRS

mysql 驱动名称选择2中已提前上传的待使用的MySQL驱动，格式为xxx.jar。 mysql-connector-java-8.0.11.jar JDBC URL 连接MySQL的JDBC URL地址。格式：jdbc:mysql://MySQL数据库所在的IP地址:端口号。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
Hudi - MapReduce服务 MRS
Hudi - MapReduce服务 MRS

到的数据相对就会滞后。 Merge On Read 读时合并表也简称mor表，使用列格式parquet和行格式Avro两种方式混合存储数据。其中parquet格式文件用于存储基础数据，Avro格式文件（也可叫做log文件）用于存储增量数据。优点：由于写入数据先写delta log，且delta

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍
常见jar包冲突处理方式 - MapReduce服务 MRS

如果遇到其他三方包冲突，可以通过查找依赖关系确认是否存在相同包不同版本的情况，尽量修改成集群自带的jar包版本。可以参考MRS样例工程自带的pom.xml文件：通过开源镜像站获取样例工程。打印依赖树方式：在pom.xml文件同目录下执行命令：mvn dependency:tree 父主题： Spark应用开发常见问题

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

文件压缩可以减少储存文件的空间，并且提高数据从磁盘读取和网络传输的速度。HDFS有Gzip和Snappy这两种默认压缩格式。本章节为HDFS新增加的压缩格式LZC（Lempel-Ziv Compression）提供配置方法。这种压缩格式增强了Hadoop压缩能力。有关Snappy的详细信息，请参阅http://code

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用HDFS > HDFS性能调优
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每一个行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark SQL企业级能力增强
配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据配置场景 ORC文件格式是一种Hadoop生态圈中的列式存储格式，它最初产生自Apache Hive，用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet文件格式类似，它并不是一个单纯的列式存储格式，仍然是首先根据行组分割整个表，在每一个行

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark SQL企业级能力增强
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

everyone.if.no.acl.found”的值修改为“true”。创建Topic。 {zkQuorum}表示ZooKeeper集群信息，格式为IP:port。 $KAFKA_HOME/bin/kafka-topics.sh --create --zookeeper {zkQuorum}/kafka

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

文件压缩可以减少储存文件的空间，并且提高数据从磁盘读取和网络传输的速度。HDFS有Gzip和Snappy这两种默认压缩格式。本章节为HDFS新增加的压缩格式LZC（Lempel-Ziv Compression）提供配置方法。这种压缩格式增强了Hadoop压缩能力。有关Snappy的详细信息，请参阅http://code

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HDFS > HDFS性能调优
访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

服务器。弹性云服务器的“可用区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个Windows系统的公共镜像。例如，选择一个标准镜像“Windows Server 2012 R2 Standard 64bit(40GB)”。其他配置参数详细信息，请参见购买弹性云服务器。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 常见操作 > 访问集群Manager
在Windows中调测Presto应用开发 - MapReduce服务 MRS

在弹性云服务管理控制台，创建一个新的弹性云服务器。弹性云服务器的“可用分区”、“虚拟私有云”、“安全组”，需要和待访问集群的配置相同。选择一个Windows系统的公共镜像。其他配置参数详细信息，请参见“弹性云服务器 > 快速入门 > 购买并登录Windows弹性云服务器”。开启Kerberos认证集群需

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Presto开发指南 > 调测Presto应用
ClickHouse概述 - MapReduce服务 MRS
ClickHouse概述 - MapReduce服务 MRS

AggregatingMergeTree引擎能够在合并分区时，按照预先定义的条件聚合数据，同时根据预先定义的聚合函数计算数据并通过二进制的格式存入表内。建表语法： CREATE TABLE [IF NOT EXISTS] [db.]table_name [ON CLUSTER cluster]

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
按需转包年/包月 - MapReduce服务 MRS

按需转包年/包月如果您需要长期使用当前按需购买的MRS集群，可以将该MRS集群转为包年/包月计费模式，以节省开支。按需计费变更为包年/包月会生成新的订单，用户支付订单后，包年/包月资源将立即生效。假设用户于2023/06/18 15:29:16购买了一个按需计费的MRS集群，由于业务需要，于2023/06/18

帮助中心 > MapReduce服务 MRS > 计费说明 > 变更计费模式
ClickHouse表创建 - MapReduce服务 MRS

该路径必须在/clickhouse目录下，否则后续可能因为ZooKeeper配额不够导致数据插入失败。为了避免不同表在ZooKeeper上数据冲突，目录格式必须按照如下规范填写： /clickhouse/tables/{shard}/default/test，其中/clickhouse/tab

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用ClickHouse
快速开发Kafka应用 - MapReduce服务 MRS

Kafka/install_files/kafka/libs/* /opt/client/lib 准备应用程序通过开源镜像站获取样例工程。下载样例工程的Maven工程源码和配置文件，并在本地配置好相关开发工具，可参考通过开源镜像站获取样例工程。根据集群版本选择对应的分支，下载并获取MRS相关样例工程。例如本

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > 快速开发MRS组件应用
安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

客户想使用Python3.x的环境对接开启Kerberos认证的Kafka的集群。处理步骤登录Master节点，执行如下命令，配置华为云欧拉镜像源。 wget http://mirrors.myhuaweicloud.com/repo/mirrors_source.sh && sh

帮助中心 > MapReduce服务 MRS > 故障排除 > 使用Kafka
配置MRS集群外节点用户访问普通模式集群资源 - MapReduce服务 MRS

10.17 krb5-client-1.6.3 检查操作系统实际是否已安装清单中的rpm包？是，执行5。否，执行4。从操作系统镜像中获取缺少的rpm包，并上传文件到当前目录，然后执行以下命令安装rpm包： rpm -ivh *.rpm 安装的RPM包可能带来安全风险，

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群安全配置 > MRS集群安全加固
使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

f2为JSON格式的数据，f3为BASE64格式的数据，f4为时间戳格式的数据，f5为UUID格式的数据： create table test_orc_zstd_jni(f1 int, f2 string, f3 string, f4 string, f5 string) stored

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive > Hive数据存储及加密配置
添加Oracle数据源 - MapReduce服务 MRS

取值样例驱动名称选择2中已提前上传的待使用的Oracle驱动，格式为ojdbcxxx.jar。 ojdbc8.jar JDBC URL 连接Oracle的JDBC URL地址。端口号默认为1521。可选择如下格式： jdbc:oracle:thin@Oracle数据库所在的I

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源

总条数： 910

上一页
1
...
6
7
8
...
46
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

T-Digest函数 - MapReduce服务 MRS

通过Spark Streaming作业消费Kafka数据 - MapReduce服务 MRS

添加MySQL数据源 - MapReduce服务 MRS

Hudi - MapReduce服务 MRS

常见jar包冲突处理方式 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

配置矢量化读取ORC数据 - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

使用LZC压缩算法存储HDFS文件 - MapReduce服务 MRS

访问FusionInsight Manager（MRS 3.x及之后版本） - MapReduce服务 MRS

在Windows中调测Presto应用开发 - MapReduce服务 MRS

ClickHouse概述 - MapReduce服务 MRS

按需转包年/包月 - MapReduce服务 MRS

ClickHouse表创建 - MapReduce服务 MRS

快速开发Kafka应用 - MapReduce服务 MRS

安全集群中使用Python3.x对接Kafka - MapReduce服务 MRS

配置MRS集群外节点用户访问普通模式集群资源 - MapReduce服务 MRS

使用ZSTD_JNI压缩算法压缩Hive ORC表 - MapReduce服务 MRS

添加Oracle数据源 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线