检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
等情况,则通过该参数可以避免这种情况。 -clear-staging-table 如果该staging-table非空,则通过该参数可以在运行导入前清除staging-table里的数据。 sqoop import(MySQL到Hive表) 登录Sqoop客户端所在节点。 执行如下命令初始化环境变量。
统就会自动细粒度关联数据存储源的权限,不需要感知表的存储路径,无需进行二次授权。同时也补齐了基于存算分离授权功能缺陷,可以在Ranger上实现对存算分离表的授权鉴权。Hive表的级联授权功能主要体现为: 开启Ranger级联授权后,Ranger中创建策略对表授权时,只需创建表的H
23,456]' AS ARRAY(INTEGER)); -- [1, 23, 456] JSON函数 NULL到JSON的转换并不能简单地实现。从独立的NULL进行转换将产生一个SQLNULL,而不是JSON 'null'。不过,在从包含NULL的数组或Map进行转换时,生成的JSON将包含NULL。
keystore-password - 密钥存储密码。 SpoolDir Source SpoolDir Source监控并传输目录下新增的文件,可实现准实时数据传输。常用配置如表 2 Spooling Source常用配置所示: 图2 SpoolDir Source 表2 SpoolDir
keystore-password - 密钥存储密码。 SpoolDir Source SpoolDir Source监控并传输目录下新增的文件,可实现准实时数据传输。常用配置如表 2 Spooling Source常用配置所示: 图2 SpoolDir Source 表2 SpoolDir
数据量在几十到百GB级别。 支持导入CSV、Parquet、ORC格式的数据,默认支持导入CSV格式数据。 前提条件 已创建包含Doris服务的集群,集群内各服务运行正常。 待连接Doris数据库的节点与MRS集群网络互通。 创建具有Doris管理权限的用户。 集群已启用Kerberos认证(安全模式)
e客户端配置文件所在路径为“客户端安装目录/HBase/hbase/conf”。 支持在提交命令中指定executor数量、内存、CPU等实现资源控制,例如,提交时指定以下参数: --driver-memory=20G --num-executors=10 --executor-memory=4G
spark-submit --master yarn --jars /opt/hudi-java-examples-1.0.jar // 指定spark运行时需要的hudi jars路径 --driver-memory 1g --executor-memory 1g --executor-cores
策略中的Policy Conditions),spark-submit与spark-sql不支持。 前提条件 已安装Ranger服务且服务运行正常。 已启用Hive服务的Ranger鉴权功能,并且需要先重启Hive服务,再重启Spark服务,再启用Spark服务的Ranger鉴权
story2x变更为JobHistory。相关涉及服务名称、角色名称的描述和操作请以实际版本为准。 前提条件 已安装Ranger服务且服务运行正常。 已启用Hive服务的Ranger鉴权功能,并且需要先重启Hive服务,再重启Spark服务,再启用Spark服务的Ranger鉴权
JOIN ( SELECT DISTINCT did FROM t_r_308 ) AS b ON a.did = b.did; 【bitmap实现示例】 SELECT bitmapAndCardinality(user1, user2) FROM ( SELECT 1 AS join_id
endpoint=获取AK/SK和Endpoint信息准备的Endpoint; spark-beeline spark-beeline也可以通过在Manager中配置服务参数实现访问OBS。操作如下: 登录服务配置页面。 针对MRS 3.x之前版本,登录集群详情页面,选择“组件管理 > Spark > 服务配置”。
Yarn任务挂起数超过阈值 ALM-18024 Yarn任务挂起内存量超阈值 ALM-18025 Yarn被终止的任务数超过阈值 ALM-18026 Yarn上运行失败的任务数超过阈值 ALM-18027 JobHistoryServer进程状态异常 ALM-18028 TimeLineServer进程状态异常
的可用区下创建集群。 可用区1 企业项目 企业项目所在的企业管理控制台以面向企业资源管理为出发点,帮助企业以公司、部门、项目等分级管理方式实现企业云上的人员、资源、权限、财务的管理。 default 虚拟私有云 VPC即虚拟私有云,是通过逻辑方式进行网络隔离,提供安全、隔离的网络环境。
'hot_cold_table', {NAME=>'f', COLD_BOUNDARY=>""} 为已经存在的表设置冷热分离,或者修改冷热分离分界线,单位为秒,可实现数据热存储转为冷存储或冷存储转为热存储,例如: 将热存储数据转为冷存储数据: 将写入到hot_cold_table表的f列的超过一天(86400秒)的数据归档到冷存储中:
表中涉及端口的协议类型均为:TCP。 配置参数 默认端口 端口说明 LOADER_HTTPS_PORT 21351 该端口用于提供Loader作业配置、运行的REST接口 安装时是否缺省启用:是 安全加固后是否启用:是 Manager常用端口 表中涉及端口的协议类型均为:TCP。 配置参数 默认端口
Manager:云专线用于搭建用户本地数据中心与线上云VPC之间高速、低时延、稳定安全的专属连接通道,充分利用线上云服务优势的同时,继续使用现有的IT设施,实现灵活一体,可伸缩的混合计算环境。 操作前请确保云专线服务可用,并已打通本地数据中心到线上VPC的连接通道。云专线详情请参考什么是云专线。
Manager:云专线用于搭建用户本地数据中心与线上云VPC之间高速、低时延、稳定安全的专属连接通道,充分利用线上云服务优势的同时,继续使用现有的IT设施,实现灵活一体,可伸缩的混合计算环境。 操作前请确保云专线服务可用,并已打通本地数据中心到线上VPC的连接通道。云专线详情请参考什么是云专线。
如果在创建索引后将列族TTL更改为较低值,则索引可能会晚于用户数据被删除。 HBase表启动容灾之后,主集群新建二级索引,索引表变更不会自动同步到备集群。要实现该容灾场景,必须执行以下操作: 在主表创建二级索引之后,需要在备集群使用相同方法创建结构、名称完全相同的二级索引。 在主集群手动将索引列族
如果在创建索引后将列族TTL更改为较低值,则索引可能会晚于用户数据被删除。 HBase表启动容灾之后,主集群新建二级索引,索引表变更不会自动同步到备集群。要实现该容灾场景,必须执行以下操作: 在主表创建二级索引之后,需要在备集群使用相同方法创建结构、名称完全相同的二级索引。 在主集群手动将索引列族