检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ontainer最大内存可用值。不支持实例级别的修改,需要在Yarn服务的配置中修改参数值,并重启Yarn服务。 单击“保存配置”,勾选“重新启动受影响的服务或实例”,单击“确定”。重启NodeManager角色实例。 界面提示“操作成功。”,单击“完成”,NodeManager角色实例成功启动。
滚动重启 滚动重启时,重启节点数据流将停止,启动后恢复。 滚动重启10个节点耗时约30分钟。 Hue 直接重启 重启期间Hue页面无法访问。 直接重启耗时约5分钟。 滚动重启 不支持滚动重启。 - Sqoop 直接重启 重启期间无法提交作业。 直接重启耗时约5分钟。 滚动重启 不支持滚动重启。
方法一:申请一台Windows的ECS访问MRS集群操作Impala,在安装开发环境后可直接运行样例代码。 在“现有集群”列表中,单击已创建的集群名称。 记录集群的“可用分区”、“虚拟私有云”,以及Master节点的“默认安全组”。 在弹性云服务管理控制台,创建一个新的弹性云服务器。 弹性云服务器的“可用
DBServer启动失败 问题背景与现象 DBService组件启动失败,重启还是失败,实例状态一直为正在恢复状态。 图1 DBService 的状态 原因分析 查看DBService的日志/var/log/Bigdata/dbservice/DB/gs_ctl-current.log,报如下错误。
方法一:申请一台Windows的ECS访问MRS集群操作Impala,在安装开发环境后可直接运行样例代码。 在“现有集群”列表中,单击已创建的集群名称。 记录集群的“可用分区”、“虚拟私有云”,以及Master节点的“默认安全组”。 在弹性云服务管理控制台,创建一个新的弹性云服务器。 弹性云服务器的“可用
滚动重启 滚动重启时,重启节点数据流将停止,启动后恢复。 滚动重启10个节点耗时约30分钟。 Hue 直接重启 重启期间Hue页面无法访问。 直接重启耗时约5分钟。 滚动重启 不支持滚动重启。 - Sqoop 直接重启 重启期间无法提交作业。 直接重启耗时约5分钟。 滚动重启 不支持滚动重启。
maximum-allocation-mb”可配置单个Container最大内存可用值。不支持实例级别的修改,需要在Yarn服务的配置中修改参数值,并重启Yarn服务。 单击“保存”,单击“确定”。重启NodeManager角色实例。 界面提示“操作成功”,单击“完成”,NodeManager角色实例成功启动。 父主题:
dir”的值,对于其中磁盘挂载目录相同的DataNode目录,仅保留其中的一个目录,删除其他目录。 继续执行6.a。 重启DataNode,检查告警是否消除。 单击“组件管理 > HDFS > 实例”,重启该DataNode实例。 检查该告警是否恢复。 是,处理完毕。 否,执行7。 收集故障信息。 在MRS
滚动重启时,重启节点数据流将停止,启动后恢复 滚动重启10个节点耗时约30分钟 Hue 直接重启 重启期间Hue页面无法访问 直接重启耗时约5分钟 滚动重启 不支持滚动重启 - Loader 直接重启 重启期间无法提交作业 直接重启耗时约5分钟 滚动重启 不支持滚动重启 - Kafka 直接重启 直接重启业务会中断 直接重启耗时约5分钟。
表格。 表1 重启组件 集群当前补丁版本 目标补丁版本 重启的组件 MRS 3.3.0.3 MRS_3.3.0.3.1 StarRocks 表2 重启策略以及影响 组件名称 重启策略 影响范围 影响时间 StarRocks 直接重启 存量作业和新提交作业会失败。 5-10分钟 父主题:
其他配置参数详细信息,请参见购买弹性云服务器。 如果ECS的安全组和Master节点的“默认安全组”不同,用户可以选择以下任一种方法修改配置: 将ECS的安全组修改为Master节点的默认安全组,请参见更改安全组。 在集群Master节点和Core节点的安全组添加两条安全组规则使ECS可以访问集群,
用于开发Kafka应用程序的工具。 网络 确保本地与Kafka服务所在的VPC的至少一个节点在网络上互通。 访问云服务器的安全认证 本地可以通过密钥或密码方式登录访问Linux弹性云服务器 父主题: 准备Kafka应用开发环境
ve服务,以使补丁功能生效。组件重启期间,部分业务可能短暂不可用。请选择适当的时间进行重启,以降低对业务持续性的影响。 重启组件的范围,是以补丁依次升级给定的范围,即如果是从MRS 3.1.0.0.7打补丁升级到MRS 3.1.0.0.8,需要重启MRS 3.1.0.0.8补丁的
cannot be null if SASL is enabled异常,部分关键日志如下图所示: 回答 造成该现象的原因是NodeManager重启。使用ExternalShuffle的时候,Spark将借用NodeManager传输Shuffle数据,因此NodeManager的内存将成为瓶颈。
DBService配置文件丢失导致启动失败 问题背景与现象 节点异常下电,重启备DBService失败。 原因分析 查看/var/log/Bigdata/dbservice/DB/gaussdb.log日志没有内容。 查看/var/log/Bigdata/dbservice/sc
集群基本信息页面。 在“节点管理”页签单击Master节点组中某一Master节点名称,登录到弹性云服务器管理控制台。 选择“弹性公网IP”页签,单击“绑定弹性公网IP”为弹性云服务器绑定一个弹性公网IP。 登录Master节点执行pip3 install命令安装Python。 父主题:
2-LTS版本的补丁安装过程中会自动重启OMS,安装过程中将影响作业提交以及集群扩缩容等管控面集群控制功能,请选择适当的时间进行补丁安装。 MRS 3.1.2-LTS版本的补丁安装完成后需要在FusionInsight Manager Web界面重启Flink、Hadoop、HBas
附录 MRS所使用的弹性云服务器规格 MRS所使用的裸金属服务器规格 状态码 错误码 获取项目ID 获取账号ID 获取MRS集群信息 MRS支持的角色与组件对应表
是,执行11。 否,执行13。 执行命令cat /var/log/messages,查看sssd是否频繁重启或者存在Can't contact LDAP server的异常信息。 sssd重启样例 Feb 7 11:38:16 10-132-190-105 sssd[pam]: Shutting
创建大量ZNode后ZooKeeper Server启动失败 问题 创建大量ZNode后,ZooKeeper集群处于故障状态不能自动恢复,尝试重启失败,ZooKeeper Server日志显示如下内容: Follower: 2016-06-23 08:00:18,763 | WARN