检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
恢复CDL业务数据 操作场景 在用户意外修改、删除或需要找回数据时,系统管理员对CDL进行重大操作(如升级、重大数据调整等)后,系统数据出现异常或未达到预期结果,模块全部故障无法使用,或者迁移数据到新集群的场景中,需要对CDL进行恢复数据操作。 CDL的元数据存储在DBServi
集群默认是200,作业可以单独设置。如果发现瓶颈stage(执行时间长),且分配给当前作业的核数大于当前的并发数,说明并发度不足。通过以下配置优化。 场景 配置项 集群默认值 调整后 Jar作业 spark.default.parallelism 200 按实际作业可用资源2倍设置 SQL作业 spark
Router堆内存使用率指标默认提供一个阈值范围。当HDFS Router堆内存使用率超出阈值范围时,产生该告警。 用户可通过“运维 > 告警 > 阈值设置 > 待操作集群的名称 > HDFS”修改阈值。 当HDFS Router堆内存使用率小于或等于阈值时,告警恢复。 该告警仅适用于MRS 3
使用客户端安装用户登录安装了客户端的节点,并执行以下命令: cd 客户端安装目录 source bigdata_env source Hudi/component_env kinit 组件业务用户(如果集群未开启Kerberos认证,请跳过该操作) 执行以下命令登录spark-sql命令行:
非安全模式下,KafkaUI对所有操作不作鉴权处理。 本章节内容仅适用于MRS 3.1.2及之后版本。 查看生产消费详情 进入KafkaUI界面。 使用具有KafkaUI页面访问权限的用户登录FusionInsight Manager,选择“集群 > 服务 > Kafka”。 如需在页面上进行相关操作,例如创建To
Manager,基于实际CPU使用情况,修改告警阈值和平滑次数配置项。 根据实际服务的使用情况在“系统设置 > 阈值配置 > 设备 > 主机 > CPU > CPU使用率 > CPU使用率”中更改告警阈值。 根据实际服务的使用情况在“系统设置 > 阈值配置 > 设备 > 主机 > CPU > CPU使用率 >
以root用户登录主Master节点。 执行如下命令初始化环境变量。 source 客户端安装目录/bigdata_env 如果当前集群已启用Kerberos认证,执行以下命令认证当前用户。如果当前集群未启用Kerberos认证,则无需执行此命令。 kinit MRS集群用户 执行以下命令获取指定任务的日志信息。
如果当前集群已启用Kerberos认证,执行以下命令认证当前用户。如果当前集群未启用Kerberos认证,则无需执行此命令。当前用户为准备Hive应用开发用户时增加的开发用户。 人机用户:kinit MRS集群用户 例如: kinit hiveuser 机机用户:kinit -kt <user.keytab路径>
系统当前指标取值满足自定义的告警设置条件。 对系统的影响 业务失败:磁盘容量不足时,如果需要修改或使用该磁盘上的数据,可能会导致作业运行失败。 可能原因 告警阈值配置不合理。 磁盘配置无法满足业务需求,磁盘使用率达到上限。 处理步骤 检查阈值设置是否合理。 在FusionInsight
导入导出HetuEngine计算实例配置 在HetuEngine的WebUI界面,可以导入/导出实例配置文件、下载实例配置模板。 导入导出步骤 使用可访问HetuEngine WebUI界面的用户登录FusionInsight Manager,选择“集群 > 服务 > HetuEngine”,进入HetuEngine服务页面。
数组 ARRAY_ELEM 通过下标访问数组。 ARRAY_ELEM(ARRAY[1,2,3], 1) ARRAY_PREPEND 指定位置插入数据到数组。 ARRAY_APPEND(ARRAY[1,2,3], 4) ARRAY_CAT 连接数组。 ARRAY_CAT(ARRAY[1
单击右上角用户名后,选择“Log Out”,退出当前用户后使用rangeradmin用户登录。 在首页中单击“Settings”,选择“Roles”。 单击“Role Name”为“admin”的角色,在“Users”区域,单击“Select User”,选择指定用户名。 单击Add
需要采集的角色勾选“HiveServer”。 选择采集的内容勾选“jstack”和“使能jstack和jmap -histo连续采集”。 采集间隔设置为10秒,持续时长设置为2分钟。 单击“确定”,等待采集完成后单击“下载”。 请联系运维人员,并发送已收集的故障日志信息和堆栈信息。 告警清除 此告警
parser.safeMode=true”。 单击“保存”,配置保存完成后。在Flink实例页签勾选所有“FlinkServer”实例,选择“更多 > 重启实例”。 使用omm用户登录任意FlinkServe实例节点,查看进程: ps -ef | grep FlinkServer 如果包含参数“-Dfastjson
初始化HBase配置 功能介绍 HBase通过login方法来获取配置项。包括用户登录信息、安全认证信息等配置项。 代码样例 下面代码片段在com.huawei.bigdata.hbase.examples包的“TestMain”类的init方法中。 private static
添加SQL防御规则 使用具有Manager界面管理权限的用户登录FusionInsight Manager。 选择“集群 > SQL防御”,打开SQL防御页面。 可以单击“查看所有支持规则”查看当前集群所有支持的SQL防御规则。 单击“添加规则”,验证当前用户密码后,打开添加规则页面。 配置相关参数后,单击“确定”。
服务名 产生告警的服务名称。 角色名 产生告警的角色名称。 主机名 产生告警的主机名。 附加信息 触发条件 系统当前指标取值满足自定义的告警设置条件。 对系统的影响 用户无法使用Kudu服务。 可能原因 存在KuduTserver实例内存使用过高。 处理步骤 处理Kudu实例异常 在FusionInsight
单击“确定”保存。 在MRS Manager界面选择“系统设置>用户管理>添加用户”,为样例工程创建一个用户。填写用户名例如sparkuser,用户类型为“机机”用户,加入用户组supergroup和kafkaadmin,设置其“主组”为supergroup,并绑定角色sparkrole取得权限,单击“确定”。
在运行的任务将失败。 HiveServer滚动重启时,将等待客户端连接断开,最长等待30分钟。 Mapreduce 直接重启 重启期间无法访问作业历史页面查看历史任务信息,不影响作业运行。 直接重启耗时约5分钟。 滚动重启 滚动重启不影响业务。 滚动重启耗时约10分钟。 Yarn
不足导致的ApplicationMaster启动失败问题。适用于所有ApplicationMaster的全局设置。每个ApplicationMaster都可以使用API设置一个单独的最大尝试次数,但这个次数不能大于全局的最大次数。如果大于,ResourceManager将会覆写这