搜索_华为云

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

下面的示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists dimension_hive_table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'datagen' ); 参数说明表1 参数说明参数是否必选默认值数据类型参数说明 connector 是无 String 指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。 fields

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hudi常见配置参数 - 数据湖探索 DLI

120 * 1024 * 1024 byte hoodie.parquet.block.size parquet页面大小，页面是parquet文件中的读取单位，在一个块内，页面被分别压缩。 120 * 1024 * 1024 byte hoodie.parquet.compression

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
CREATE FUNCTION语句 - 数据湖探索 DLI

EXISTS] function_name AS identifier [LANGUAGE JAVA|SCALA] 功能描述创建一个用户自定义函数语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
查看赋权对象使用者权限信息 - 数据湖探索 DLI

授权对象，和赋权API中的“object”对应。 is_admin 否 Boolean 判断用户是否为管理员。 user_name 否 String 用户名称，即该用户在当前数据库上有权限。 privileges 否 Array of Strings 该用户在数据库上的权限。请求示例无响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API
类型转换函数 - 数据湖探索 DLI

timestamp), cast(case_timestamp_to_date as date) from kafkaSource; 连接Kafka集群，向Kafka的topic中发送如下测试数据： {"cast_int_to_string":"1", "cast_String_to_int":

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

select * from hudiSource; 该作业提交后，作业状态变成“运行中”，后续您可通过如下操作查看输出结果。方法一：登录DLI管理控制台，选择“作业管理 > Flink作业”。在对应Flink作业所在行的“操作”列，选择“更多 > FlinkUI”。在FlinkUI界面，选择“Task

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
FileSystem结果表 - 数据湖探索 DLI

文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。在STREAMING模式下使用FileSink需要开启Checkpoint功能。Part文件只在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitio

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
更新Flink Jar作业 - 数据湖探索 DLI

entrypoint 否 String 用户已上传到DLI资源管理系统的程序包名，用户自定义作业主类所在的jar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。示例“myGroup/test

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

程序包。在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据创建的HBase结果表的列簇必须定义为ROW类型，字段名对应列簇名（column family），嵌套的字段名对应列限定符名（column

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
查看队列的使用者（废弃） - 数据湖探索 DLI

of Object 有权限使用该队列的用户及其对应的权限数组。具体参数请参考表4。 count 否 Long 用户的总个数。表4 privileges参数参数名称是否必选参数类型说明 is_admin 否 Boolean 判断用户是否为管理员。示例值：false。 user_name

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
CREATE FUNCTION语句 - 数据湖探索 DLI

EXISTS] function_name AS identifier [LANGUAGE JAVA|SCALA] 功能描述创建一个用户自定义函数。如果您需要了解创建自定义函数的步骤请参考自定义函数。语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Data masking函数 - 数据湖探索 DLI

mask_hash(string|char|varchar str) →varchar 描述：返回基于str的散列值。散列是一致的，可以用于跨表连接被屏蔽的值。对于非字符串类型，返回NULL。 select mask_hash('panda');

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？场景概述用户使用Flink SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Hudi Archive操作说明 - 数据湖探索 DLI

Hudi Archive操作说明什么是Archive Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
超出套餐包额度的使用量怎么收费？ - 数据湖探索 DLI

购买了套餐包时，按需使用过程中优先抵扣套餐包的额度，超过额度的使用量按照按需计费。套餐包需结合重置周期使用，如重置周期为月，且按订购周期重置，即如果用户1月5日订购套餐包资源，之后每个月的5日同一时间重置套餐包资源。父主题：计费相关问题

 帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题

总条数： 787

上一页
1
...
35
36
37
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

查看赋权对象使用者权限信息 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

查看队列的使用者（废弃） - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

Data masking函数 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

超出套餐包额度的使用量怎么收费？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线