检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
将其与新资源池绑定。 步骤五:创建用户:新创建一个MRS集群用户并绑定租户。 步骤六:使用spark-submit提交任务:使用指定的队列运行作业任务。 步骤七:删除Task节点:释放资源。 步骤一:添加Task节点 在MRS集群的集群详情页面,选择“节点管理”页签,单击“新增节点组”,进入“新增节点组”页面。
如果对资源池、Yarn节点标签(Label)和租户做了添加、删除的操作,切换回Capacity调度器后可能导致资源池或者队列信息不存在,Capacity调度器异常,无法正常运行。 将Superior调度器回退到Capacity调度器的操作步骤如下。 修改调度器为Capacity调度器,并启动Yarn。 登录FusionInsight
当业务正常时需要恢复数据,建议手动备份最新管理数据后,再执行恢复数据操作。否则会丢失从备份时刻到恢复时刻之间的HDFS数据。 对于Yarn任务运行时使用的目录(例如“/tmp/logs”、“/tmp/archived”、“/tmp/hadoop-yarn/staging”),不能进行
中。 MRS集群安全组入方向将所有端口对客户端节点放开,具体操作请参考添加安全组规则。 弹性云服务器操作系统已安装NTP服务,且NTP服务运行正常。 若未安装,在配置了yum源的情况下,可执行yum install ntp -y命令进行安装。 弹性云服务器需要允许用户使用密码方式登录(SSH方式)。
</action> 在编写xml文件时,用户应该注意行为操作的配置和顺序。冷热数据迁移工具按照输入xml中给定的顺序执行规则。 如果只希望运行基于atime/age的一个规则,则按照时间逆序排列,且将idempotent属性设置为false。 如果为文件集配置删除操作,则在删除操作后不能再配置其他规则。
ortTsv继承了HBase批量加载数据工具ImportTsv的所有功能。此外,若在执行HIndexImportTsv工具之前未建表,直接运行该工具,将会在创建表时创建索引,并在生成用户数据的同时生成索引数据。 前提条件 已安装客户端,具体请参考安装客户端章节。 已根据业务需要创
弹性云服务器的VPC需要与MRS集群在同一个VPC中。 弹性云服务器的安全组需要和MRS集群Master节点的安全组相同。 弹性云服务器操作系统已安装NTP服务,且NTP服务运行正常。 如果未安装,在配置了yum源的情况下,可执行yum install ntp -y命令自行安装。 需要允许用户使用密码方式登录Linux弹性云服务器(SSH方式)。
恢复操作,必须重新备份。 检查恢复数据时集群中已添加的服务与备份数据时是否相同。如果不相同,不能执行恢复操作,必须重新备份。 停止依赖集群运行的上层业务应用。 恢复Manager数据 在FusionInsight Manager,选择“运维 > 备份恢复 > 备份管理” 。 在任务列表指定任务的“操作”列,选择“更多
优点:写入过程中对主键进行hash分桶写入,性能比较高,不受表的数据量限制。Flink和Spark引擎都支持,Flink和Spark引擎可以实现交叉混写同一张表。 缺点:Bucket个数不能动态调整,数据量波动和整表数据量持续上涨会导致单个Bucket数据量过大出现大数据文件。需要结合分区表来进行平衡改善。
Ranger权限,则级联权限将不会生效。 CDL业务用户权限配置 集群已启用Kerberos认证(安全模式)若需在对接OBS成功后,使用CDL实现实时数据入湖选择存储到OBS时,则需参考以下操作为对应用户赋予相应OBS路径的“Read”和“Write”权限。 登录FusionInsight
提供At-Least Once,At-Most Once,Exactly Once消息可靠传递。消息被处理的状态是在Consumer端维护,需要结合应用层实现Exactly Once。 高吞吐 同时为发布和订阅提供高吞吐量。 持久化 将消息持久化到磁盘,因此可用于批量消费以及实时应用程序。通过将
情况,那么通过该参数可以避免这种情况。 -clear-staging-table 如果该staging-table非空,则通过该参数可以在运行导入前清除staging-table里的数据。 通过sqoop import导入MySQL数据到Hive表 登录客户端所在节点。 执行如下命令初始化环境变量。
active_master 否 Boolean 参数解释: 自定义自动化脚本是否只运行在主Master节点上。 约束限制: 不涉及 取值范围: true:自定义自动化脚本只运行在主Master节点上。 false:自定义自动化脚本可运行在所有Master节点上。 默认取值: false fail_action
</action> 在编写xml文件时,用户应该注意行为操作的配置和顺序。冷热数据迁移工具按照输入xml中给定的顺序执行规则。 如果只希望运行基于atime/age的一个规则,则按照时间逆序排列,且将idempotent属性设置为false。 如果为文件集配置删除操作,则在删除操作后不能再配置其他规则。
rtTsv继承了HBase批量加载数据工具ImportTsv的所有功能。此外,如果在执行HIndexImportTsv工具之前未建表,直接运行该工具,将会在创建表时创建索引,并在生成用户数据的同时生成索引数据。 前提条件 已安装客户端,具体请参考安装客户端章节。 已根据业务需要创
单击“返回集群列表”,在“现有集群”列表中可以查看到集群创建的状态。 集群创建需要时间,所创集群的初始状态为“启动中”,创建成功后状态更新为“运行中”,请您耐心等待。 步骤二:安装集群客户端 MRS集群创建成功后,用户可安装集群客户端用于连接集群内各组件服务,进行作业提交等操作。 客
情况,那么通过该参数可以避免这种情况。 -clear-staging-table 如果该staging-table非空,则通过该参数可以在运行导入前清除staging-table里的数据。 sqoop import(MySQL到Hive表) 登录客户端所在节点。 执行如下命令初始化环境变量。
buffer-flush.max-rows' = '0', 'sink.buffer-flush.interval' = '0s' 查看作业管理界面,作业状态为“运行中”。 参考管理Kafka Topic中的消息,向kafka中写入数据。 sh kafka-console-producer.sh --broker-list
单击右上角的“新建”,选择“文件”创建文件,选择“目录”创建目录。 管理文件或目录 勾选文件或目录的复选框,单击“操作”,选择“重命名”、“移动”、“复制”和“更改权限”等,实现文件或目录的重命名、移动、复制、更改权限等功能。 上传文件 单击右上角的“上传”,单击“选择文件”或将文件拖至窗口中可进行文件上传。 存储策略定义使用介绍
block.cache.size”的和不能超过0.8,也就是写和读操作的内存不能超过HeapSize的80%,这样可以保证除读和写外其它操作的正常运行。 0.4 hbase.hstore.blockingStoreFiles 在region flush前首先判断file文件个数,是否大于hbase