搜索_华为云

迁移外部数据源数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 典型场景示例：迁移Kafka数据至DLI 典型场景示例：迁移Elasticsearch数据至DLI 典型场景示例：迁移RDS数据至DLI 典型场景示例：迁移DWS数据至DLI 父主题：数据迁移与数据传输

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
窗口Top-N - 数据湖探索 DLI
窗口Top-N - 数据湖探索 DLI

窗口Top-N 功能描述窗口 Top-N 是特殊的 Top-N，它返回每个分区键的每个窗口的N个最小或最大值。与普通Top-N不同，窗口Top-N只在窗口最后返回汇总的Top-N数据，不会产生中间结果。窗口 Top-N 会在窗口结束后清除不需要的中间状态。窗口 Top-N

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

CLEANARCHIVE 命令功能用于对Hudi表的归档文件进行清理，以减少Hudi表的数据存储及读写压力。命令格式按文件容量进行清理，需要配置参数： hoodie.archive.file.cleaner.policy = KEEP_ARCHIVED_FILES_BY_SIZE;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
标示符 - 数据湖探索 DLI
标示符 - 数据湖探索 DLI

output_format_classname partition_col_name partition_col_value partition_specs property_name property_value regex_expression result_expression row_format

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建DLI自定义委托权限 - 数据湖探索 DLI

创建DLI自定义委托权限使用Flink 1.15和Spark 3.3及以上版本的引擎执行作业时，当您所需的委托没有包含在DLI系统委托dli_management_agency时，您需要在IAM页面创建相关委托，并在作业配置中添加新建的委托信息。dli_management_a

帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
添加列 - 数据湖探索 DLI
添加列 - 数据湖探索 DLI

); 关键字 ADD COLUMNS：添加列。 COMMENT：列描述。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 表名称。 col_name 列字段名称。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。更多具体使用可参考开源社区文档：Avro Format。支持的Connector Kafka Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

Avro Format 功能描述 Avro格式允许基于Avro schema 读取和写入Avro 数据。目前，Avro schema 从表schema 推导。支持的Connector Kafka Upsert Kafka 参数说明表1 参数说明参数是否必选默认值类型说明

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
CLEAN - 数据湖探索 DLI
CLEAN - 数据湖探索 DLI

CLEAN 命令功能用于根据配置对Timeline上的Instant进行clean，删除老旧的历史版本文件，以减少hudi表的数据存储及读写压力。命令格式 RUN CLEAN ON tableIdentifier; RUN CLEAN ON tablelocation; 参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

hive.NonPartitionedExtractor"). option("hoodie.datasource.hive_sync.database", databaseName). option("hoodie.datasource.hive_sync.table", tableName)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

COMPACTION 命令功能压缩( compaction)用于在 MergeOnRead表将基于行的log日志文件转化为parquet列式数据文件，用于加快记录的查找。命令格式 SCHEDULE COMPACTION on tableIdentifier |tablelocation;

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi Clustering操作说明 - 数据湖探索 DLI

Hudi Clustering操作说明什么是Clustering 即数据布局，该服务可重新组织数据以提高查询性能，也不会影响摄取速度。 Clustering架构 Hudi通过其写入客户端API提供了不同的操作，如insert/upsert/bulk_insert来将数据写入Hu

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
实时任务接入 - 数据湖探索 DLI

db' = 'default', //同步元数据的database 'hive_sync.table' = 'hudi_sink_table',

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
SparkSQL建表参数规范 - 数据湖探索 DLI

SparkSQL建表参数规范规则建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
from - 数据湖探索 DLI
from - 数据湖探索 DLI

unixdate, from_unixtime(unixdate) as timestamp_from_unixtime from database_t; 输出： +------------------+------------------------------+ | unixdate

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

扫描量计费按扫描量计费按扫描量计费即：按运行查询作业扫描的数据量付费，如果扫描字节数量少于10M，按10M计算。且数据定义语言（DDL）语句（如 CREATE、ALTER、DROP TABLE等语句）、管理分区语句、失败的查询语句无需付费。对于取消的查询，按取消查询时扫描的总数据量计费。

帮助中心 > 数据湖探索 DLI > 计费说明
修改列注释 - 数据湖探索 DLI
修改列注释 - 数据湖探索 DLI

关键字 CHANGE COLUMN：修改列 COMMENT：列描述。参数说明表1 参数描述参数是否必选描述 db_name 否 Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 是表名称。 col_name 是

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

'[file_versions_retained]'); 参数描述表1 参数描述参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 clean_policy 清理老版本数据文件的策略，默认KEEP_LATEST_COMMITS 否 retain_commits

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
COMPACTION - 数据湖探索 DLI
COMPACTION - 数据湖探索 DLI

生成compaction计划（op指定为“schedule”），或者执行已经生成的compaction计划（op指定为“run”）是 table 需要查询表的表名，支持database.tablename格式 table，path须选填其中之一 path 需要查询表的路径 table，path须选填其中之一 timestamp

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
ALTER COLUMN - 数据湖探索 DLI
ALTER COLUMN - 数据湖探索 DLI

ALTER COLUMN 命令功能 ALTER TABLE ... ALTER COLUMN语法用于修改当前列属性包括列comment、空约束，当前不支持修改列类型、列位置。注意事项目前不支持修改列类型。目前不支持修改已存在列的顺序。目前不支持指定顺序添加列。命令语法 ALTER

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Schema演进语法说明

总条数： 720

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

迁移外部数据源数据至DLI - 数据湖探索 DLI

窗口Top-N - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

标示符 - 数据湖探索 DLI

创建DLI自定义委托权限 - 数据湖探索 DLI

添加列 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

CLEAN - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

from - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

修改列注释 - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

COMPACTION - 数据湖探索 DLI

ALTER COLUMN - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线