检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
创建LakeFormation实例及客户端连接 准备用户 如果您是第一次使用LakeFormation,请参考LakeFormation准备工作章节,完成用户创建并授权使用LakeFormation等准备工作。 本入门示例,是为了演示使用LakeFormation的全流程,用户还需提前完成以下准备工作:
管理接入客户端 用户可以通过接入管理页面,简单快速地创建并管理接入客户端,可以在客户端详情中获取接入IP等信息,用于多种服务接入LakeFormation实例。 操作步骤 登录管理控制台。 在左上角单击“”,选择“大数据 > 湖仓构建 LakeFormation”进入LakeFormation控制台。
获取服务接入客户端详情 功能介绍 根据ID获取服务接入客户端详情。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI GET /v1/{project_id}/inst
创建服务接入客户端 功能介绍 创建服务接入客户端。 其他限制: 同一个实例下默认最多创建20个接入客户端。 调试 您可以在API Explorer中调试该接口,支持自动认证鉴权。API Explorer可以自动生成SDK代码示例,并提供SDK代码示例调试功能。 URI POST
lakecat.client.obs.LakeFormationObsCredentialProvider # 可选参数,关闭OBS文件系统缓存,长任务需要增加该配置,避免缓存中的临时AKSK失效 spark.hadoop.fs.obs.impl.disable.cache=true E
MRS对接LakeFormation实例 MRS对接前准备 MRS对接LakeFormation实例前准备请参考准备工作章节创建委托、配置LakeFormation数据连接等操作。 MRS对接LakeFormation实例 当前仅MRS 3.3.0-LTS版本集群支持对接LakeFormation。
共享型与独享型LakeFormation对比 LakeFormation提供了不同实例类别,满足不同场景下用户对性能和成本的不同诉求。 独享型特性当前仅针对白名单用户开放。 计费对比 共享型与独享型实例的计费项及计费说明详细介绍请参考计费说明章节中表1。 性能对比 表1 性能对比
MRS_LOCAL_GAUSSDB datasource_parameter DataSourceParameter object 数据源参数。 source_catalog String 源Catalog,要迁移出的catalog。 target_catalog String 目标Catalog,要迁移至的catalog。
什么是区域和可用区 通常用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region)指物理的数据中心。每个区域完全独立,这样可以实现一定程度的容错能力和稳定性。资源创建成功后不能更换区域。 可用区(AZ,Availability Zone)是同一
object 字节数组类型统计信息。 long_statistics_data LongColumnStatisticsData object 长整数类型统计信息。 decimal_statistics_data DecimalColumnStatisticsData object 小数类型统计信息。
MRS_LOCAL_GAUSSDB datasource_parameter 是 DataSourceParameter object 数据源参数。 source_catalog 是 String 源Catalog,要迁移出的catalog。 target_catalog 是 String 目标Catalog,要迁移至的catalog。
object 字节数组类型统计信息。 long_statistics_data LongColumnStatisticsData object 长整数类型统计信息。 decimal_statistics_data DecimalColumnStatisticsData object 小数类型统计信息。
object 字节数组类型统计信息。 long_statistics_data 否 LongColumnStatisticsData object 长整数类型统计信息。 decimal_statistics_data 否 DecimalColumnStatisticsData object
迁移除MRS本地数据库以外的数据源类型时,URL中的IP为数据源绑定的弹性公网IP。 此外还需配置以下参数: 用户名:访问数据源所使用的用户。 密码:访问数据源所使用的用户密码。 如果所使用用户存在密码,则必须填写;如果用户无密码,则为空即可。 服务接入点 配置待迁移元数据服务接入点。 “数据源类型”为
特性暂不支持,请等待版本更新。 403 00010119 当前实例不支持配置生命周期。 请尝试其他实例。 400 00010120 当前数据源类型不支持。 请检查数据源类型。 400 00010121 当前权限策略类型不支持。 请检查权限策略类型。 400 00010122 输入的VPC网段与LakeFormtion网段冲突。
MRS_LOCAL_GAUSSDB datasource_parameter 是 DataSourceParameter object 数据源参数。 source_catalog 是 String 源Catalog,要迁移出的catalog。 target_catalog 是 String 目标Catalog,要迁移至的catalog。
object 字节数组类型统计信息。 long_statistics_data 否 LongColumnStatisticsData object 长整数类型统计信息。 decimal_statistics_data 否 DecimalColumnStatisticsData object
区域与可用区 通常用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region)指物理的数据中心。每个区域完全独立,这样可以实现一定程度的容错能力和稳定性。资源创建成功后不能更换区域。 可用区(AZ,Availability Zone)是同一区域内
规划数据湖 MRS对接LakeFormation仅支持对接LakeFormation实例的数据目录名称为“hive”的Catalog,名称为“default”的数据库。 LakeFormation实例创建成功后,用户可按照业务规划创建相关Catalog及内部的数据库、表等元数据。
表存储位置”的子路径。 是否压缩 数据表是否压缩。 压缩表能够使表中的数据以压缩格式存储,表压缩能提升性能,减少存储空间。 数据源格式 待创建表的数据源格式,目前支持以下类型: Avro Json Xml Parquet Csv Orc Text Rc Sequence 自定义