搜索_华为云

Hudi Clustering操作说明 - MapReduce服务 MRS

间轴中标记Clustering操作。 Clustering服务基于Hudi的MVCC设计，允许继续插入新数据，而Clustering操作在后台运行以重新格式化数据布局，从而确保并发读写者之间的快照隔离。总体而言Clustering分为两个部分：调度Clustering：使用可

 帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Hudi > 数据管理维护
条件表达式 - MapReduce服务 MRS
条件表达式 - MapReduce服务 MRS

false | true (1 row) TRY 评估一个表达式，如果出错，则返回Null。类似于编程语言中的try catch。try函数一般结合COALESCE使用，COALESCE可以将异常的空值转为0或者空，以下情况会被try捕获：分母为0 错误的cast操作或者函数入参

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用HetuEngine > HetuEngine常见SQL语法说明 > HetuEngine SQL函数和操作符说明
按需计费 - MapReduce服务 MRS
按需计费 - MapReduce服务 MRS

系统中的数据也将被永久删除。华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于充值的详细操作请参见账户充值。关机计费策略一般情况下，对于按需计费的MRS集群，对集群所有的弹性云服务器进行关机后，相关计费策略如下： MRS集群管理服务费仍旧正常计费，如需停止计费请删除相应集群。

帮助中心 > MapReduce服务 MRS > 计费说明 > 计费模式
MRS集群更换磁盘（适用于2.x及之前） - MapReduce服务 MRS

登录MRS管理控制台。在集群详情页面，选择“节点管理”。单击待更换磁盘的“节点名称”进入弹性云服务器管理控制台，单击“关机”。联系华为云支持人员在后台更换磁盘。在弹性云服务器管理控制台，单击“开机”，将已更换磁盘的节点开机。执行fdisk -l命令，查看新增磁盘。使用cat /etc/fstab获取盘符。

帮助中心 > MapReduce服务 MRS > 故障排除 > 集群管理类
ClickHouse数据库应用开发 - MapReduce服务 MRS

rt batch时，会对不同的分区创建一个目录。如果一个batch里面的数据对应了过多的分区，那么一次insert就会生成较多的分区目录，后台merge线程处理速度跟不上分区增加的速度，社区规格是每秒不超过一个数据目录。具体的操作：确认一个batch的数据对应了多少个分区，in

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse数据库开发
ALM-19007 HBase GC时间超出阈值 - MapReduce服务 MRS

存大小时影响性能。调整“-XX:NewSize”大小的时候，建议把其设置为“-Xmx”大小的1/8。 RegionServer需要的内存一般比HMaster要大。在内存充足的情况下，堆内存可以相对设置大一些。根据机器的内存大小设置“-Xmx”大小：机器内存>200G，“-Xm

帮助中心 > MapReduce服务 MRS > 用户指南 > MRS集群运维 > MRS集群告警处理参考
配置Hive读取Hudi表 - MapReduce服务 MRS

Spark2x：FusionInsight_Spark2x_xxx，Hudi内核版本：0.11.0。创建Hudi表对应的Hive外部表 Hudi表数据在入湖的时候一般会同步到Hive外部表，此时在Beeline中可以直接查询到对应的Hive外部表，如果没有同步到Hive外部表，则可以通过Hudi客户端工

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hive
使用Spark小文件合并工具说明 - MapReduce服务 MRS

此工具应用客户端配置，需要做性能调优可修改客户端配置文件的相关配置。 shuffle设置对于合并功能，可粗略估计合并前后分区数的变化：一般来说，旧分区数>新分区数，可设置shuffle为false；但如果旧分区远大于新分区数，例如高于100倍以上，可以考虑设置shuffle为true，增加并行度，提高合并的速度。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Spark2x（MRS 3.x及之后版本） > Spark Core企业级能力增强
准备连接集群配置文件 - MapReduce服务 MRS

安全认证的用户文件，可从已创建好的MRS集群中获取相关内容。用于程序调测或运行的节点，需要与MRS集群内节点网络互通，同时配置hosts域名信息。准备Linux环境运行程序所需配置文件。在节点中安装MRS集群客户端。例如客户端安装目录为“/opt/client”。客户端机

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Flink开发指南（安全模式） > 准备Flink应用开发环境
准备连接Kafka集群配置文件 - MapReduce服务 MRS

安全认证的用户文件，可从已创建好的MRS集群中获取相关内容。用于程序调测或运行的节点，需要与MRS集群内节点网络互通，同时配置hosts域名信息。场景一：准备本地Windows开发环境调测程序所需配置文件。登录FusionInsight Manager，选择“集群 > 概览

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境
使用Spark小文件合并工具说明 - MapReduce服务 MRS

此工具应用客户端配置，需要做性能调优可修改客户端配置文件的相关配置。 shuffle设置对于合并功能，可粗略估计合并前后分区数的变化：一般来说，旧分区数>新分区数，可设置shuffle为false；但如果旧分区远大于新分区数，例如高于100倍以上，可以考虑设置shuffle为true，增加并行度，提高合并的速度。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Spark/Spark2x > Spark Core企业级能力增强
Hudi Clustering操作说明 - MapReduce服务 MRS

间轴中标记Clustering操作。 Clustering服务基于Hudi的MVCC设计，允许继续插入新数据，而Clustering操作在后台运行以重新格式化数据布局，从而确保并发读写者之间的快照隔离。总体而言Clustering分为两个部分：调度Clustering：使用可

 帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Hudi > Hudi数据管理维护
Flume常用配置参数 - MapReduce服务 MRS

线程监控阈值，更新时间大于阈值时会重新启动该Source，单位：秒。 spoolDir - 监控目录。 fileSuffix .COMPLETED 文件传输完成后添加的后缀。 deletePolicy never 文件传输完成后源文件删除策略，支持“never”或“immediate”。分别是从不删除和立即删除。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Flume > Flume运维管理
使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

文件，不对文件做任何处理。说明：文件类型选择“TEXT_FILE”或“SEQUENCE_FILE”导入时，Loader会自动根据文件的后缀选择对应的解压方法，对文件进行解压。 TEXT_FILE 文件分割方式选择按文件或大小分割源文件，作为数据导出的MapReduce任务中各个map的输入文件。

帮助中心 > MapReduce服务 MRS > 组件操作指南（LTS版） > 使用Loader > 创建Loader数据导出作业
使用DBeaver访问Phoenix - MapReduce服务 MRS

不通，需要为每个HBase节点以及ZooKeeper节点配置EIP，并且在本地Windows的hosts文件添加所有节点的公网IP对应主机域名的映射关系，例如：如果使用的是Windows云服务器，并且与集群的网络是通的，则无需配置EIP。登录FusionInsight Manager，选择“集群

 帮助中心 > MapReduce服务 MRS > 最佳实践 > 生态组件对接
Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

required useKeyTab=true keyTab="./user.keytab" principal="sparkuser@<系统域名>" useTicketCache=false storeKey=true debug=true; }; 使用--files和相对路径提交

 帮助中心 > MapReduce服务 MRS > 开发指南（普通版_3.x） > Spark2x开发指南（安全模式） > 开发Spark应用 > Spark Streaming对接Kafka0-10样例程序
准备连接Kafka集群配置文件 - MapReduce服务 MRS

安全认证的用户文件，可从已创建好的MRS集群中获取相关内容。用于程序调测或运行的节点，需要与MRS集群内节点网络互通，同时配置hosts域名信息。场景一：准备本地Windows开发环境调测程序所需配置文件。登录FusionInsight Manager，选择“集群 > 概览

 帮助中心 > MapReduce服务 MRS > 开发指南（LTS版） > Kafka开发指南（安全模式） > 准备Kafka应用开发环境
Flume常用配置参数 - MapReduce服务 MRS

线程监控阈值，更新时间大于阈值时会重新启动该Source，单位：秒。 spoolDir - 监控目录。 fileSuffix .COMPLETED 文件传输完成后添加的后缀。 deletePolicy never 文件传输完成后源文件删除策略，支持“never”或“immediate”。分别是从不删除和立即删除。

帮助中心 > MapReduce服务 MRS > 组件操作指南（普通版） > 使用Flume > Flume运维管理
Hudi表索引设计规范 - MapReduce服务 MRS

2GB的数据存储成列存Parquet文件后，大概的数据文件大小是150MB ~ 256MB左右。不同业务数据会有出入。而HDFS单个数据块一般会是128MB，这样可以有效地利用存储空间。数据读写占用的内存空间都是原始数据大小（包括空值也是会占用内存的），2GB在大数据计算过程中，处于单task读写可接受范围之内。

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > Hudi应用开发规范 > Hudi数据表设计规范
ClickHouse本地表设计 - MapReduce服务 MRS

分区键不允许为null，如果字段中有null值，需要做数据转换处理。表级别的参数配置： index_granularity：稀疏索引粒度配置，默认是8192，一般不需要修改。建表定义，参考链接： https://clickhouse.tech/docs/en/engines/table-engin

帮助中心 > MapReduce服务 MRS > 组件应用开发规范 > ClickHouse应用开发规范 > ClickHouse宽表设计

总条数： 690

上一页
1
...
28
29
30
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clustering操作说明 - MapReduce服务 MRS

条件表达式 - MapReduce服务 MRS

按需计费 - MapReduce服务 MRS

MRS集群更换磁盘（适用于2.x及之前） - MapReduce服务 MRS

ClickHouse数据库应用开发 - MapReduce服务 MRS

ALM-19007 HBase GC时间超出阈值 - MapReduce服务 MRS

配置Hive读取Hudi表 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

准备连接集群配置文件 - MapReduce服务 MRS

准备连接Kafka集群配置文件 - MapReduce服务 MRS

使用Spark小文件合并工具说明 - MapReduce服务 MRS

Hudi Clustering操作说明 - MapReduce服务 MRS

Flume常用配置参数 - MapReduce服务 MRS

使用Loader从HDFS导出数据到ClickHouse - MapReduce服务 MRS

使用DBeaver访问Phoenix - MapReduce服务 MRS

Spark Streaming对接Kafka0-10样例程序开发思路 - MapReduce服务 MRS

准备连接Kafka集群配置文件 - MapReduce服务 MRS

Flume常用配置参数 - MapReduce服务 MRS

Hudi表索引设计规范 - MapReduce服务 MRS

ClickHouse本地表设计 - MapReduce服务 MRS

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线