检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
metastore.warehouse.dir”。 设置值为配置LakeFormation实例章节获取的hive Catalog在OBS中的存储路径。 图1 hive.metastore.warehouse.dir配置 单击“保存”,保存配置。 配置Spark对接OBS文件系统。如
配置ClickHouse对接OBS源文件 本章节主要介绍使用ClickHouse对接OBS进行文件读写。 使用S3表函数 登录主OMS节点。 执行以下命令获取OBS内的存储数据。 select * from S3(path, [ak, sk,] format, structure, [compression])
在左侧租户列表,单击某个租户节点。 检查租户数据状态。 在“概述”,查看租户状态,绿色表示租户可用,灰色表示租户不可用。 单击“资源”,查看“Yarn”或者“HDFS 存储”状态,绿色表示资源可用,灰色表示资源不可用。 单击“服务关联”,查看关联的服务表格的“状态”列,“良好”表示组件可正常为关联的租户提供服
property_value)] AS query 限制 仅Hive数据源的Catalog支持视图的列描述。 在HetuEngine中创建的视图,视图的定义以编码方式存储在数据源里。在数据源可以查询到该视图,但无法对该视图执行操作。 视图是只读的,不可对它执行LOAD、INSERT操作。 视图可以包含ORDER
务前需先停止计算实例,服务重启成功后再启动计算实例。 登录HetuEngine客户端创建Schema或表时,无需指定Location,默认存储在OBS上。 Ranger权限配置 集群已启用Kerberos认证(安全模式)的HetuEngine在存算分离场景和非存算分离场景下不区分
ameNode,单击“下一步”。 每对NameService最多可添加5个从NameNode。 在配置页面,按照规划配置NameNode的存储目录、端口等信息,单击“下一步”。 确认信息无误,单击“提交”,等待从NameNode安装完成。 重启依赖HDFS的上层组件,更新客户端应用配置,重启客户端应用。
metastore.warehouse.dir”。 设置值为配置LakeFormation实例章节获取的hive Catalog在OBS中的存储路径。 名称:hive.metastore.warehouse.dir 值:obs://lakeformation-test/hive 图1
hiveserver主机名:10000/ 由于使用zookeeper连接会访问zookeeper的“/hiveserver2”目录下的IP,但是里面存储的是私有IP,本地Windows无法连通,所以需要替换为hiveserver2的地址连接。 hiveserver2服务的主机名可以在Manager界面选择“集群
ameNode,单击“下一步”。 每对NameService最多可添加5个从NameNode。 在配置页面,按照规划配置NameNode的存储目录、端口等信息,单击“下一步”。 确认信息无误,单击“提交”,等待从NameNode安装完成。 重启依赖HDFS的上层组件,更新客户端应用配置,重启客户端应用。
提速。 该能力可以极大降低用户使用物化视图功能的使用难度,带来业务无感知的分析加速效果。HetuEngine管理员通过付出少量的计算资源和存储空间,可实现对高频SQL业务的智能加速。同时,该能力可以降低数据平台的整体负载(CPU、内存、IO等),有助于提升系统稳定性。 智能物化视图包括以下几个功能:
x之前版本) 用户已经获取账号对应的Access Key ID(AK)和Secret Access Key(SK)。 用户已经在账号的对象存储服务(OBS)中创建了并行文件系统。 在MRS Manager,单击“系统设置”。 单击“维护”下方的“日志导出”。 “服务”选择服务,“
当前用户需要对该文件的目录有执行权限。 由于load操作会将该文件移动到表对应的目录中,所以要求当前用户需要对表的对应目录有写权限。 要求文件的格式与表指定的存储格式相同。如创建表时指定stored as rcfile,但是文件格式为txt,则不符合要求。 文件必须是HDFS上的文件,不可以用fil
调整元数据缓存配置可参考调整HetuEngine元数据缓存。 调整动态过滤配置可参考调整HetuEngine动态过滤。 调优案例 某用户使用Hudi MOR表存储其设备的订单出借信息,可通过订单号查询订单详细信息,每天订单量相对稳定,部分节假日可能存在小高峰,该场景存在以下特点: 订单号作为唯一值,
hiveserver主机名:10000/ 由于使用zookeeper连接会访问zookeeper的“/hiveserver2”目录下的IP,但是里面存储的是私有IP,本地Windows无法连通,所以需要替换为hiveserver2的地址连接。 hiveserver2服务的主机名可以在Manager界面选择“集群
helloword python3 import helloworld helloworld.say_hello("test") 测试安装第三方Python库(如pandas、sklearn)。 pip3 install pandas pip3 install backports.lzma
性能,UserSync也不会同步没有所属用户的用户组到RangerAdmin中。 统一审计 Ranger插件支持记录审计日志,当前审计日志存储介质支持本地文件。 高可靠性 Ranger支持RangerAdmin双主,两个RangerAdmin同时提供服务,任意一个RangerAdmin故障不会影响Ranger的功能。
后就清理这些临时文件,但是当Job对应的Yarn任务异常退出时,这些临时文件不会被清理,长时间积攒导致该临时目录下的文件数量越来越多,占用存储空间越来越多。 处理步骤 登录集群客户端。 以root用户登录任意一个Master节点,用户密码为创建集群时用户自定义的密码。 如果集群开
hiveserver主机名:10000/ 由于使用ZooKeeper连接会访问ZooKeeper的“/hiveserver2”目录下的IP,但是里面存储的是私有IP,本地Windows无法连通,所以需要替换为HiveServer2的地址连接。 HiveServer2服务的主机名可以在Manager界面选择“集群
Flink流式写Hudi表参数规范 参数名称 是否必填 参数描述 建议值 Connector 必填 读取表类型。 hudi Path 必填 表存储的路径。 根据实际填写 hoodie.datasource.write.recordkey.field 必填 表的主键。 根据实际填写 write
string|char|varchar to) →varchar 描述:对于input字符串,将其中的参数from指代字符串替换为参数to指代的字符串。三个参数有一个为NULL,则结果返回NULL。 select translate('aabbcc','bb','BB'); _col0 --------