检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
-”。 样例 通过“CSV文件输入”算子,生成两个字段A和B。 源文件如下: 配置“更新域”算子,当发现值为test时,更新值,在test后面加上good。 转换后,输出A和B,结果如下: 父主题: 转换算子
-”。 样例 通过“CSV文件输入”算子,生成两个字段A和B。 源文件如下: 配置“更新域”算子,当发现值为test时,更新值,在test后面加上good。 转换后,输出A和B,结果如下: 父主题: Loader转换类算子
nt.getStreamTimeCharacteristic()参数选择是ProcessingTime还是EventTime,根据参数个数确定是TumblingWindow还是SlidingWindow。 size指的是窗口时间的大小。 slide指的是窗口的滑动时间。 说明:
nt.getStreamTimeCharacteristic()参数选择是ProcessingTime还是EventTime,根据参数个数确定是TumblingWindow还是SlidingWindow。 size指的是窗口时间的大小。 slide指的是窗口的滑动时间。 说明:
nt.getStreamTimeCharacteristic()参数选择是ProcessingTime还是EventTime,根据参数个数确定是TumblingWindow还是SlidingWindow。 size指的是窗口时间的大小。 slide指的是窗口的滑动时间。 说明:
nt.getStreamTimeCharacteristic()参数选择是ProcessingTime还是EventTime,根据参数个数确定是TumblingWindow还是SlidingWindow。 size指的是窗口时间的大小。 slide指的是窗口的滑动时间。 说明:
登录FusionInsight Manager页面,选择“集群 > 服务 > Yarn > 概览”,单击“ResourceManager WebUI”后面对应的链接,进入Yarn的WebUI页面,查看对应任务。 图3 作业任务 父主题: Flink企业级能力增强
ip为192.168.1.18。 在遇到诸如下述类问题时,需要查看审计日志: 如客户端发起请求,但是未得到响应。由于不确定任务是卡在客户端还是服务端,可以通过审计日志查看。如果审计日志根本没有相关信息,那么说明任务终止在客户端;如果审计日志有相关信息打印,那么就需要去运行日志里进一步定位原因。
10 3 spark-sql 可用于local模式或者集群模式运行Hive元数据服务以及命令行查询。如果需要查看其逻辑计划,只需在SQL语句前面加上explain extended即可。 示例: Select key from src group by key 您可以直接在命令行中
响集群性能,请谨慎开启。 该章节仅适用于MRS 3.x及之后版本。 配置LDAP防火墙策略 在双平面组网的集群中,由于LDAP部署在业务平面中,为保证LDAP数据安全,建议通过配置整个集群对外的防火墙策略,关闭LDAP相关端口。 登录FusionInsight Manager。 选择“集群
ipeline)优化。 Transformation和Action(RDD的操作) 对RDD的操作包含Transformation(返回值还是一个RDD)和Action(返回值不是一个RDD)两种。RDD的操作流程如图2所示。其中Transformation操作是Lazy的,也就
Status: OK”,表示当前磁盘是健康的,执行6。 若检测结果如下图所示,其中“Elements in grown defect list”后面的数字非零,则说明磁盘可能存在坏道,或“SMART Health Status:FAILURE”,则说明磁盘处于亚健康状态,联系运维人员处理。
ata/hive/hiveserver/hive.log”,搜索运行的SQL对应的线程日志,再搜索Kill Command日志,如果该日志后面间隔较长时间才打出下一行日志,则表示访问Yarn变慢。 访问元数据变慢 在FusionInsight Manager界面,选择“集群 > 服务
10 3 spark-sql 可用于local模式或者集群模式运行Hive元数据服务以及命令行查询。如果需要查看其逻辑计划,只需在SQL语句前面加上explain extended即可。 示例: Select key from src group by key 您可以直接在命令行中
大数据量的表,可以通过采用Bucket索引来避免状态后端的复杂调优。 如果Bucket索引+分区表的模式无法平衡Bueckt桶过大的问题,还是可以继续采用Flink状态索引,按照规范去优化对应的配置参数即可。 建议 基于Flink的流式写入的表,在数据量超过2亿条记录,采用Buc
处理对应问题,问题解决后等待10分钟,检查该告警是否恢复。 NTP不能正常同步,通常与系统防火墙有关:如果能关闭防火墙,建议尝试关闭防火墙后查看问题能否解决;如果不能关闭防火墙,请检查防火墙配置策略,确保UDP 123端口未禁用(具体遵循各系统下防火墙配置策略)。 是,处理完毕。 否,执行3。 检查该节点NTP
-kt /opt/conf/user.keytab test。 这里的user.keytab文件路径为Linux机器上配置文件的存放路径,后面的test用户名可以更改为5.2.2-准备开发用户中新建的用户名。 父主题: 准备MapReduce应用开发环境
AggregatedLogs 查看运行中的任务日志 在Spark2x原生页面,通过“Jobs > Stage > Task”找到对应的executor,单击后面的stdout或者stderr查看整个executor日志。 图3 Jobs 图4 Stage 图5 Task 参考信息 通过单击stdo
P地址,查找方式为“集群 > 待操作集群的名称 > 服务 > ZooKeeper > 实例”。 “zooKeeperNamespace=”后面的“hiveserver2_zk”为4中参数“hive.server2.zookeeper.namespace”设置的具体设定值。 结果将
可能是两台主机处于不同VPC网络中。 密码填写错误。 远端主机开启了防火墙。 处理步骤 两台主机处于不同VPC网络中 放开远端主机的22端口。 密码填写错误 请检查密码是否正确,密码中不能有特殊符号。 远端主机开启防火墙 先将这个MRS集群客户端下载到服务器端主机,然后通过Linux提供的scp命令复制到远端主机。