检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
separator + "conf" + File.separator + "krb5.conf"; ... 本样例工程中,基于业务场景的开发思路如下,各功能代码片段详情说明可参考开发HDFS应用。 以“/user/hdfs-examples/test.txt”文件的读
操作流程 本实践操作流程如下所示: 步骤1:创建MRS集群:创建一个包含有Flume组件的MRS集群。 步骤2:生成Flume配置文件:根据业务场景配置Flume服务端和客户端侧配置文件。 步骤3:安装Flume客户端:在MRS集群中下载并安装Flume客户端。 步骤4:查看日志采集结果:查看日志采集结果。
fusionInsight-flume-1.9.0/conf/”(要求已安装Flume客户端),其中10.196.26.1为客户端所在节点业务平面的IP地址。 scp ${BIGDATA_HOME}/FusionInsight_Porter_8.1.0.1/install/FusionInsight-Flume-1
调度器切换过程中,正在Yarn上面执行的Job的Task任务会继续执行,但不会启动新的Task。 调度器切换完成后,在Yarn上面执行的任务有可能会失败进而导致业务中断。 调度器切换完成后,在租户管理中将使用Superior的相关参数。 调度器切换完成后,Capacity调度器中“资源容量”为“0”的
默认为“gaussdba”。 gaussdba JDBC URL 连接GaussDB数据库的JDBC URL地址。格式为: jdbc:postgresql://CN业务IP:端口/数据库名称 说明: 若GaussDB数据库开启SSL,URL地址需添加如下SSL相关参数:ssl=true&sslfactory=org
/install.sh /opt/hadoopclient -ou命令安装客户端。 客户端节点为集群外部服务器且此节点无法与主OMS节点的业务平面IP互通时或者无法访问主节点的20029端口时,客户端可以正常安装成功,但无法注册到集群中,无法在界面上进行展示。 检查客户端是否安装成功。
参见表1配置集群软件信息。 表1 软件配置 参数名称 参数说明 取值样例 区域 选择区域。 不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。 选择“华北-北京四” 说明: 本指导以“华北-北京四”为例进行介绍,如果您需要选择其他区域进行操作,请确保所有操作均在同一区域进行。
PREWHERE只支持*MergeTree系列的表。系统配置optimize_move_to_prewhere默认开启,将WHERE转成PREWHERE,可以根据自己的业务场景调整这个配置。 查询语句中同时有PREWHERE和WHERE,在这种情况下,PREWHERE先于WHERE执行。 合理配置最大并发数。
进入购买MRS集群页面。 选择“快速购买”,填写配置参数。 表1 软件配置 参数项 参数说明 取值 区域 不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。 华北-北京四 计费模式 MRS提供两种计费模式: 包年/包月 按需计费 选择“按需计费”时,可能需
在源端数据库存在delete操作场景下,delete事件只包含主键信息, 在这时写入到Hudi的delete数据会出现只有主键字段有值, 其他业务字段都是null的情况。 场景二: 在数据库单条数据大小超过8k(包括8k)场景下,update事件只包含变更字段,此时Hudi数据中会出
ager实例的IP地址。可在Manager界面,选择“集群 > 服务 > Yarn > 实例”,查看主ResourceManager实例的业务IP地址;端口号可单击“配置”,在搜索框中搜索“yarn.resourcemanager.port”参数获取。 hadoop.rpc.pr
huaweixxx.bigdata.hudi.examples.TransformerExample // 指定如何处理数据源拉取来的数据,可根据自身业务需求做定制 --enable-hive-sync // 开启hive同步,同步hudi表到hive --continuous // 指定流处理模式为连续模式
该参数为客户端参数,keytab路径。 根据实际业务配置 是 security.kerberos.login.principal 该参数为客户端参数,如果keytab和principal都设置,默认会使用keytab认证。 根据实际业务配置 否 security.kerberos.login
软件配置(以下参数仅供参考,可根据实际情况调整) 参数名称 参数说明 取值样例 区域 选择区域。 不同区域的云服务产品之间内网互不相通。请就近选择靠近您业务的区域,可减少网络时延,提高访问速度。 华北-北京四 计费模式 选择待创建的MRS集群的计费模式。 按需计费 集群名称 待创建的MRS集群名称。
集群时可同时添加磁盘。可以根据如下应用场景合理选择磁盘存储空间大小: 数据存储和计算分离,数据存储在OBS系统中,集群费用相对较低,计算性能不高,并且集群随时可以删除,建议数据计算不频繁场景下使用。 数据存储和计算不分离,数据存储在HDFS中,集群费用相对较高,计算性能高,集群需
HBase容灾等待同步的wal文件数量超过阈值 ALM-19021 RegionSever handler 使用率超过阈值 ALM-19022 HBase热点检测功能不可用 ALM-19023 HBase Region限流 ALM-19024 RegionServer RPC响应时间的P99超过阈值 ALM-19025
计算的多个Task组成。 Stage 每个Job由多个Stage组成,每个Stage是一个Task集合,由DAG分割而成。 Task 承载业务逻辑的运算单元,是Spark平台上可执行的最小工作单元。一个应用根据执行计划以及计算量分为多个Task。 Spark应用运行原理 Spark的应用运行架构如图