检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
名_数据源_任务创建时间/数据源_任务执行时间.tar.gz”。 OBS 表示从OBS中恢复数据,仅MRS 3.3.0-LTS及之后版本支持。 选择此参数值,还需要配置以下参数: “源端路径”:填写备份文件在OBS中保存的完整路径。例如:“备份路径/备份任务名_数据源_任务创建时间/版本号_数据源_任务执行时间
解决相同AZ下,扩容的节点返回的AZ有误问题 解决[YARN-10854]问题 Hive支持Redis缓存连接失败重试 支持OBSA客户端数据监控上报 支持OBS流控重试机制 pms性能优化 mrs-obs-provider的缓存过期优化 优化删除分区的逻辑 Yarn的refresh node速度优化 删除无效告警
在default数据库下创建child表。 把“/home/data”的数据加载进child表中。 查询child表中的数据。 删除child表。 打包项目 通过IDEA自带的Maven工具,打包项目,生成jar包。具体操作请参考在Linux环境中编包并运行Spark程序。 将打包生成的jar包上传到Spark客户端所在服务器的任意目录(例如“
xml”,选择“Add as Maven Project”,将该项目添加为Maven Project。若"pom.xml"图标如所示,可直接进行下一步骤操作。 图6 Add as Maven Project 设置项目使用的Maven版本。 在IntelliJ IDEA的菜单栏中,选择“File
3.3.0版本为例。 开发HetuEngine UDF项目 本样例实现一个HetuEngine UDF,说明见下表。 表1 HetuEngine UDF说明 名称 说明 AddTwo 对输入的数字加2后返回 创建Maven项目,“groupId”配置“com.test.udf”,
Manager例行维护 为了保证系统长期正常、稳定的运行,管理员或维护工程师需要定期对下表所示的项目进行检查,并根据检查出的异常结果排除故障。建议检查人员根据企业管理规范,记录每个任务场景的结果并签名确认。 表1 项目一览表 例行维护周期 任务场景 例行维护内容 每天 检查集群服务状态 检查每个服
/opt/client/HBase2/component_env。 将应用开发环境中生成的样例项目Jar包(非依赖jar包)上传至客户端运行环境的“$BIGDATA_CLIENT_HOME/HBase/hbase/lib”目录,根据具体样例项目“README.md”检查“$BIGDATA_CLIENT_HOM
”。 在“修改资源分配”窗口设置任务队列在此资源池中的资源容量策略。 “资源容量 (%)”:表示当前租户计算资源使用的资源百分比。 “最大资源容量 (%)”:表示当前租户计算资源使用的最大资源百分比。 单击“确定”保存配置。 通过Manager配置队列容量策略 MRS 3.x及之后版本集群:
9:00:00期间按照创建集群时的规格计费,计费时长为41.5小时,费用计算如下: 在2023/03/20 9:00:00 ~ 2023/03/20 10:00:00期间对Core节点组进行扩容1个节点,计费时长为1小时,费用计算如下: 在2023/03/20 10:00:00 ~ 2023/03/20
xml”,选择“Add as Maven Project”,将该项目添加为Maven Project。若"pom.xml"图标如所示,可直接进行下一步骤操作。 图6 Add as Maven Project 设置项目使用的Maven版本。 在IntelliJ IDEA的菜单栏中,选择“File
obs://obs-mrstest/data Mounted obs://obs-mrstest/data at /mnt/obs 通过Alluxio命名空间列出OBS文件系统中的文件。使用ls命令列出OBS挂载目录下的文件。 alluxio fs ls /mnt/obs 38
联的节点数进行计算,其值为故障节点数与有效节点标签表达式关联的节点数的比值。 假设集群中有100个节点,其中有10个节点为有效节点标签表达式关联的节点(labelA)。其中所有有效节点标签表达式关联的节点都已经故障,黑名单节点释放阈值默认值为0.33,按照传统的计算方式,10/100=0
(%) 80 配置当前租户在“default”资源池中使用的计算资源百分比。“计算资源”选择“Yarn”时配置。 默认资源池最大容量 (%) 70 配置当前租户在“default”资源池中使用的最大计算资源百分比。“计算资源”选择“Yarn”时配置。 储存资源 HDFS 为当前租户选择存储资源。
客户端无法访问,但正在运行的业务不受影响。 直接重启耗时约5分钟 滚动重启 不影响业务。 滚动重启10个节点耗时约10分钟 HetuEngine计算实例 直接重启 计算实例重启期间无法执行SQL任务。 直接重启耗时约5分钟。 滚动重启 不支持滚动重启。 - MemArtsCC 直接重启 重启期间无法使用缓存数据,影响上层组件性能
节点间网络互通异常”或“节点故障”等告警。 是,节点间网络不互通,请联系运维人员修复。 否,节点间网络互通,检查结束。 检查弹性伸缩是否关闭 登录华为云管理控制台界面,选择对应集群,单击“弹性伸缩”。 查看当前集群的弹性伸缩策略是否是关闭状态。 否,请跟业务方确认是否可以关闭,如果可以请关
根据table1表数据的key值去table2表做查询。 把前两步相应的数据记录做相加操作。 把上一步骤的结果写到table2表。 打包项目 通过IDEA自带的Maven工具,打包项目,生成jar包。具体操作请参考在Linux环境中调测Spark应用。 将打包生成的jar包上传到Spark客户端所在服务器的任意目录(例如“
创建表,将日志文件数据导入到表中。 筛选女性网民,提取上网时间数据信息。 汇总每个女性上网总时间。 筛选出停留时间大于两个小时的女性网民信息。 打包项目 通过IDEA自带的Maven工具,打包项目,生成jar包。具体操作请参考在Linux环境中调测Spark应用。 将打包生成的jar包上传到Spark客户端所在服务器的任意目录(例如“
precombine.field' = 'price') 流式计算采用MOR表。 流式计算为低时延的实时计算,需要高性能的流式读写能力,在Hudi表中存在的MOR和COW两种模型中,MOR表的流式读写性能相对较好,因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下:
Ranger权限,可参考添加HetuEngine的Ranger访问权限策略。 创建HetuEngine计算实例。 创建计算实例并确保运行正常,可参考创建HetuEngine计算实例。 步骤二:获取JDBC jar包 下载HetuEngine客户端获取JDBC jar包。 登录FusionInsight
example.ConsumerMultThread类中,用于实现对指定Topic的并发消费。 Kafka不支持无缝集成SpringBoot项目。 代码样例 单个消费者线程的doWork()方法逻辑(run方法重写)。 /** * 订阅Topic的消息处理函数