搜索_华为云

Flume常用配置参数 - MapReduce服务 MRS

false truststore-type JKS Java信任库类型。填写JKS或其他java支持的truststore类型。 truststore - Java信任库文件。 truststore-password - Java信任库密码。 keystore-type JKS 密钥存储类

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume运维管理
Flume常用配置参数 - MapReduce服务 MRS

false truststore-type JKS Java信任库类型。填写JKS或其他java支持的truststore类型。 truststore - Java信任库文件。 truststore-password - Java信任库密码。 keystore-type JKS 密钥存储类

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
Structured Streaming 任务提交方式变更 - MapReduce服务 MRS

当前版本的Spark内核直接依赖于Kafka相关的jar包（结构流使用），因此提交结构流任务时，需要把Kafka相关jar包加入到结构流任务driver端的库目录下，确保driver能够正常加载kafka包。解决方案提交yarn-client模式的结构流任务时需要额外如下操作：将Spark客户端目录下spark-default

帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Spark2x开发指南（安全模式） > Spark应用开发常见问题
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

登录客户端安装节点，通过Hive客户端查看数据库，确认对接成功。 source 客户端安装路径/bigdata_env kinit 组件业务用户 beeline show databases;desc database default; !q 通过Spark客户端，查看数据库，确认对接成功。如果集群不存在Spark组件请跳过该步骤。

帮助中心 > MapReduce服务 MRS > 最佳实践 > 周边云服务对接 > MRS对接LakeFormation云服务
Structured Streaming 任务提交方式变更 - MapReduce服务 MRS

当前版本的Spark内核直接依赖于kafka相关的jar包（结构流使用），因此提交结构流任务时，需要把Kafka相关jar包加入到结构流任务driver端的库目录下，确保driver能够正常加载kafka包。解决方案提交yarn-client模式的结构流任务时需要额外如下操作：将Spark客户端目录下spark-default

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（普通模式） > Spark应用开发常见问题
ClickHouse数据批量导入 - MapReduce服务 MRS

balancer_tcp_port ClickHouse服务Balancer实例TCP端口。 21428 local_table_name 待导入的本地库名.本地表名。 testdb1.testtb1 thread_num 并发导入线程数。 10 data_format 待导入数据的格式。 CSV

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用ClickHouse > ClickHouse数据导入
创建数据连接 - MapReduce服务 MRS

参数解释：数据连接类型。取值范围： RDS_POSTGRES：RDS服务PostgreSQL数据库 RDS_MYSQL：RDS服务MySQL数据库 gaussdb-mysql：云数据库GaussDB(for MySQL) source_info 是 String 参数解释：数据源信息，为json格式。

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 数据连接管理
更新数据连接 - MapReduce服务 MRS

参数解释：数据连接类型。取值范围： RDS_POSTGRES：RDS服务PostgreSQL数据库 RDS_MYSQL：RDS服务MySQL数据库 gaussdb-mysql：云数据库GaussDB(for MySQL) source_info 是 String 参数解释：数据源信息，为json格式。

帮助中心 > MapReduce服务 MRS > API参考 > API V2 > 数据连接管理
使用Spark小文件合并工具说明 - MapReduce服务 MRS

扫描功能命令形式： sh mergetool.sh scan <db.table> <filesize> db.table的形式是“数据库名.表名”，filesize为用户自定义的小文件阈值（单位MB），返回结果为小于该阈值的文件个数，及整个表目录数据文件的平均大小。例如：sh

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
审计与日志 - MapReduce服务 MRS
审计与日志 - MapReduce服务 MRS

er上的历史操作记录，用于安全事件中定位问题原因及划分责任。审计管理页面介绍请参见审计管理页面概述。Manager的审计日志默认保存在数据库中，如果长期保留可能引起数据目录的磁盘空间不足问题，管理员如果需要将审计日志保存到其他归档服务器，可以在FusionInsight Mana

帮助中心 > MapReduce服务 MRS > 产品介绍 > 安全
添加ClickHouse数据源 - MapReduce服务 MRS

hetu-cli --catalog 数据源名称 --schema 数据库名例如执行以下命令： hetu-cli --catalog clickhouse_1 --schema default 执行以下命令，可正常查看数据库表信息或不报错即表示连接成功。 show tables; ClickHouse数据类型映射

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > 添加HetuEngine数据源
创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

登录客户端安装节点，通过Hive客户端查看数据库，确认对接成功。 source 客户端安装路径/bigdata_env kinit 组件业务用户 beeline show databases;desc database default; !q 通过Spark客户端，查看数据库，确认对接成功。如果集群不存在Spark组件请跳过该步骤。

帮助中心 > MapReduce服务 MRS > 用户指南 > 管理MRS集群 > 管理MRS集群元数据 > 配置LakeFormation数据连接
HetuEngine基本原理 - MapReduce服务 MRS

di数据的交互式快速查询场景。 HetuEngine跨源功能简介出于管理和信息收集的需要，企业内部会存储海量数据，包括数目众多的各种数据库、数据仓库等，此时会面临数据源种类繁多、数据集结构化混合、相关数据存放分散等困境，导致跨源查询开发成本高，跨源复杂查询耗时长。 HetuEn

帮助中心 > MapReduce服务 MRS > 产品介绍 > 组件介绍 > HetuEngine
Flink流式写Hudi表规则 - MapReduce服务 MRS

jdbc链接。根据实际填写 hive_sync.table 选填 Hive的表名。根据实际填写 hive_sync.db 选填 Hive的数据库名，默认为default。根据实际填写 hive_sync.support_timestamp 选填是否支持时间戳。 True changelog

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Flink应用开发规范 > Flink on Hudi开发规范 > Flink流式写Hudi表规范
HetuEngine交互查询引擎概述 - MapReduce服务 MRS

HetuEngine支持查询下推（pushdown），它能把查询，或者部分查询，下推到连接的数据源。这意味着特殊的谓词，聚合函数或者其他一些操作，可以被传递到底层数据库或者文件系统进行处理。查询下推能带来以下好处：提升整体的查询性能。减少HetuEngine和数据源之间的网络流量。减少远端数据源的负载。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine
使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

0.1/install/FusionInsight-Flume-1.9.0/flume/bin 执行以下命令，生成并得到Flume服务端密钥库密码、信任列表密码和keystore-password加密的私钥信息。连续输入两次密码并确认，该密码是flume_sChat.jks证书库的密码。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > 配置Flume加密传输数据采集任务
数据序列化 - MapReduce服务 MRS
数据序列化 - MapReduce服务 MRS

r的10倍以上，而对于一些Int之类的基本类型数据，性能的提升就几乎可以忽略。 KryoSerializer依赖Twitter的Chill库来实现，相对于JavaSerializer，主要的问题在于不是所有的Java Serializable对象都能支持，兼容性不好，所以需要手动注册类。

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > Spark Core调优
Spark Core数据序列化 - MapReduce服务 MRS

r的10倍以上，而对于一些Int之类的基本类型数据，性能的提升就几乎可以忽略。 KryoSerializer依赖Twitter的Chill库来实现，相对于JavaSerializer，主要的问题在于不是所有的Java Serializable对象都能支持，兼容性不好，所以需要手动注册类。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core性能调优
Spark应用开发常用概念 - MapReduce服务 MRS

DataFrame是一个由多个列组成的结构化的分布式数据集合，等同于关系数据库中的一张表，或者是R/Python中的Data Frame。DataFrame是Spark SQL中的最基本的概念，可以通过多种方式创建，例如结构化的数据集、Hive表、外部数据库或者RDD。 Spark SQL的程序入口是SQL

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发概述
Spark SQL join优化 - MapReduce服务 MRS

根据每次加载数据的大小，来估计表大小。也可以在Hive的数据库存储路径下直接查看表的大小。首先在Spark的配置文件“hive-site.xml”中，查看Hive的数据库路径的配置，默认为“/user/hive/warehouse”。 <property> <name>hive.metastore.warehouse

帮助中心 > MapReduce服务 MRS > 开发指南（普通版_2.x） > Spark开发指南 > Spark应用开发常见问题 > Spark应用调优 > SQL和DataFrame调优

总条数： 1234

上一页
1
...
56
57
58
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flume常用配置参数 - MapReduce服务 MRS

Flume常用配置参数 - MapReduce服务 MRS

Structured Streaming 任务提交方式变更 - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

Structured Streaming 任务提交方式变更 - MapReduce服务 MRS

ClickHouse数据批量导入 - MapReduce服务 MRS

创建数据连接 - MapReduce服务 MRS

更新数据连接 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

审计与日志 - MapReduce服务 MRS

添加ClickHouse数据源 - MapReduce服务 MRS

创建集群时配置LakeFormation数据连接 - MapReduce服务 MRS

HetuEngine基本原理 - MapReduce服务 MRS

Flink流式写Hudi表规则 - MapReduce服务 MRS

HetuEngine交互查询引擎概述 - MapReduce服务 MRS

使用多级agent串联从本地采集静态日志保存到HDFS - MapReduce服务 MRS

数据序列化 - MapReduce服务 MRS

Spark Core数据序列化 - MapReduce服务 MRS

Spark应用开发常用概念 - MapReduce服务 MRS

Spark SQL join优化 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线