搜索_华为云

Hudi Compaction操作说明 - 数据湖探索 DLI

action生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进行不阻塞摄入的异步Compaction很有意义。如何执行Compaction 仅执行Schedule Spark SQL（设置如下参数，写数据时触发） hoodie.compact.inline=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

从键值对列表构建JSON对象字符串。请注意，键必须是非NULL字符串文字，而值可以是任意表达式。函数返回一个JSON字符串。ON NULL行为定义了如何处理NULL值。如果省略，则默认为NULL ON NULL。从另一个JSON构造函数调用（JSON_OBJECT,JSON_ARRAY）

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与Kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
ClickHouse结果表 - 数据湖探索 DLI

该场景需要与ClickHouse建立增强型跨源连接，并根据实际情况设置ClickHouse集群所在安全组规则中的端口。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。默认值为0，表示忽略该提示。 connector.lookup.cache.max-rows 否维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。-1表示不使用缓存。 connector.lookup.cache.ttl 否维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。默认值为0，表示忽略该提示 connector.lookup.cache.max-rows 否维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。-1表示不使用缓存。 connector.lookup.cache.ttl 否维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

返回一组有序值中的最后一个值。 LISTAGG(expression [, separator]) 连接字符串表达式的值并在它们之间放置分隔符值。字符串末尾不添加分隔符时则分隔符的默认值为“,”。父主题：内置函数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
使用Hive语法创建DLI表 - 数据湖探索 DLI

SEQUENCEFILE, RCFILE, PARQUET几种格式。创建DLI表时必须指定此关键字。 TBLPROPERTIES：用于为表添加key/value的属性。在表存储格式为PARQUET时，可以通过指定TBLPROPERTIES(parquet.compression

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
pyspark样例代码 - 数据湖探索 DLI

如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的其他依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：图1 添加依赖文件在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Hudi常见配置参数 - 数据湖探索 DLI

false hoodie.datasource.hive_sync.database 要同步给hive的数据库名。 default hoodie.datasource.hive_sync.table 要同步给hive的表名，建议这个值和hoodie.datasource.write.table

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

PARTITION时，如果使用类型化文字（例如date'2020-01-01'），分区值会被解析为字符串值date'2020-01-01'，会生成一个非法的日期值，因此会添加一个值为null的分区。正确的做法是使用字符串值，例如ADD PARTITION(dt = '2020-01-01') Spark3.3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
创建批处理作业 - 数据湖探索 DLI

当用户设置“feature”为“custom”时，该参数生效。用户可通过与“feature”参数配合使用，指定作业运行使用自定义的Spark镜像。关于如何使用自定义镜像，请参考《数据湖探索用户指南》。 catalog_name 否 String 访问元数据时，需要将该参数配置为dli。表3

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
创建Kerberos跨源认证 - 数据湖探索 DLI

> 用户”。单击“更多 > 下载认证凭据”，保存后解压得到用户的keytab文件与krb5.conf文件。上传认证凭证到OBS桶。关于如何创建OBS桶并上传数据，请参考《对象存储服务快速入门》。创建跨源认证。登录DLI管理控制台。选择“跨源管理 > 跨源认证”。单击“创建”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

选择“系统 > 权限 > 用户”。单击“更多 > 下载认证凭据”，保存后解压得到Truststore文件。上传认证凭证到OBS桶。关于如何创建OBS桶并上传数据，请参考《对象存储服务快速入门》。创建跨源认证。登录DLI管理控制台。选择“跨源管理 > 跨源认证”。单击“创建”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

io/。前提条件 DLI要建立与Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

完成驱动安装和配置后，需要重启Superset服务以确保安装的驱动生效。步骤3：配置SuperSet连接DLI 在Superset中，通过以下步骤添加新的数据库连接。打开并登录Superset。单击“Settings > Database Connections”，单击“ +DATABASE”。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

每次从数据库拉取数据的行数。默认值为0，表示忽略该提示。 lookup.cache.max-rows 否维表配置，缓存的最大行数，超过该值时，最先添加的数据将被标记为过期。-1表示不使用缓存。 lookup.cache.ttl 否维表配置，缓存超时时间，超过该时间的数据会被剔除。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
EXPLAIN - 数据湖探索 DLI
EXPLAIN - 数据湖探索 DLI

者多个节点执行。Fragments separation表示数据在两个节点之间进行交换。Fragment type表示一个fragment如何被执行以及数据在不同fragment之间怎样分布。 SINGLE Fragment会在单个节点上执行。 HASH Fragment会在固定

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 辅助命令语法
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1 CREATE FUNCTION udf_test AS 'com.huaweicompany

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

io/。前提条件 DLI要建立与Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis

总条数： 405

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Compaction操作说明 - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

创建批处理作业 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

配置Superset连接DLI进行数据查询和分析 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

EXPLAIN - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线