搜索_华为云

CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

"obs://bucket/path/h1"; 注意事项对表执行clean操作时需要表的owner才可以执行。如果需要修改clean默认的参数，需要在执行SQL时，在设置中配置需要保留的commit数量等参数，参见Hudi常见配置参数。使用由DLI提供的元数据服务时，本命令不支持使用OBS路径。系统响应

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

则该行数据将被设置为null。 DROPMALFORMED：选择DROPMALFORMED模式时，如果某一列数据类型与目标表列数据类型不匹配，则不导入该行数据。 FAILFAST：选择FAILFAST模式时，如果某一列类型不匹配，则会抛出异常，导入失败。模式设置可通过在OPTIONS中添加

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到关系型数据库中。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

04-x86_64-uid1000-20230308194728-68791b4 请按需更换地址中的Region名称后使用例如，新加坡区域的endpoint为ap-southeast-3.myhuaweicloud.com 拼接后的基础镜像地址为：swr.ap-southeast-3.myhuaweicloud

帮助中心 > 数据湖探索 DLI > 用户指南
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

在“SQL编辑器”页面创建队列。在DLI管理控制台的左侧导航栏中，选择“SQL编辑器”。单击“队列”切换到该页签，单击右侧的创建队列。在“购买队列”页面，参见表2设置相关参数。表2 参数说明参数名称描述计费模式包年/包月该计费模式的队列为专属队列。按需计费：建议购买cu时套餐包享受优惠。区域

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

set location truncate table V1表 √ √ √ × × × × × × V2表 √ √ √ √ √ √ √ √ √ 怎么确认当前用户创建的表是v1还是v2表？ 1. 使用datasource语法建表： CREATE TABLE IF NOT EXISTS table_name

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

Forbidden 解决方案 Spark程序访问OBS数据时，需要通过配置AK、SK的访问进行访问。具体访问方式可以参考：通用队列操作OBS表如何设置AK/SK。父主题： Spark作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

I上创建数据库和表中创建的表名，即为“user_info”。导入前清空数据选择导入前是否清空目的表的数据。当前示例选择为“否”。如果设置为是，任务启动前会清除目标表中数据。更多参数的详细配置可以参考：CDM配置DLI目的端参数。单击“下一步”，进入到字段映射界面，CDM会自动匹配源和目的字段。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

ink Jar写入数据到OBS开发指南。 Flink 1.15 Jar 程序，采用反向类加载机制（child-first），可通过优化参数设置某些依赖包由父类加载器加载：parent.first.classloader.jars=test1.jar,test2.jar Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

的参数和示例代码。前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table dataGenSource( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

storage_path 指定目录的完整FS绝对路径 space_consumed 返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
修改DLI程序包所有者 - 数据湖探索 DLI

在“程序包管理”页面，单击程序包“操作 ”列中的“更多 > 修改所有者”。如果该程序包进行过分组设置，选择“组”或者“程序包”进行修改。图1 修改程序包所有者如果该程序包没有进行过分组设置，则可以参考下图，直接修改该程序包的所有者。图2 程序包管理-修改程序包所有者表1 参数说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
DESCRIBE - 数据湖探索 DLI
DESCRIBE - 数据湖探索 DLI

分区列 numFiles 表的最新版本中的文件个数 sizeInBytes 表的最新快照的大小（以字节为单位） properties 为此表设置的所有属性 minReaderVersion 可以读取该表的最低Reader版本 minWriterVersion 可以写入该表的最低Writer版本

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
DLI Delta常见问题 - 数据湖探索 DLI

predicate on partitioned table `777dd`.`test_delta_parts1` 解决方案：在console页面设置中添加参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled值为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
FileSytem结果表 - 数据湖探索 DLI

timestamp(3), time。为了避免数据丢失或者数据被覆盖，开启作业异常自动重启，需要配置为“从checkpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
离线Compaction配置 - 数据湖探索 DLI

离线Compaction配置对于MOR表的实时业务，通常设置在写入中同步生成compaction计划，因此需要额外通过DataArts或者脚本调度SparkSQL去执行已经产生的compaction计划。执行参数 set hoodie.compact.inline = true;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述

总条数： 544

上一页
1
...
19
20
21
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CLEAN - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

Spark作业访问OBS数据时报ResponseCode: 403和ResponseStatus: Forbidden错误 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

修改DLI程序包所有者 - 数据湖探索 DLI

DESCRIBE - 数据湖探索 DLI

DLI Delta常见问题 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线