搜索_华为云

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

下面的示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists dimension_hive_table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
类型转换函数 - 数据湖探索 DLI

timestamp), cast(case_timestamp_to_date as date) from kafkaSource; 连接Kafka集群，向Kafka的topic中发送如下测试数据： {"cast_int_to_string":"1", "cast_String_to_int":

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
查看表属性 - 数据湖探索 DLI
查看表属性 - 数据湖探索 DLI

TBLPROPERTIES table_name [('property_name')]; 关键字 TBLPROPERTIES：TBLPROPERTIES子句允许用户给表添加key/value的属性。参数说明表1 参数说明参数描述 table_name 表名称。 property_name 命令

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'datagen' ); 参数说明表1 参数说明参数是否必选默认值数据类型参数说明 connector 是无 String 指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。 fields

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
CREATE FUNCTION语句 - 数据湖探索 DLI

EXISTS] function_name AS identifier [LANGUAGE JAVA|SCALA] 功能描述创建一个用户自定义函数语法说明 IF NOT EXISTS 若该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

queue_scaling_policies 是 Array of objects 该队列在该弹性资源池下的扩缩容策略信息。单条策略信息包含时间段、优先级和CU范围。每个队列至少要配置一条时间段为[00:00, 24:00]的默认扩缩容策略。详细参数说明请参考表3。表3 queue_scaling_policies

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
FileSystem结果表 - 数据湖探索 DLI

文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。在STREAMING模式下使用FileSink需要开启Checkpoint功能。Part文件只在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
查看赋权对象使用者权限信息 - 数据湖探索 DLI

授权对象，和赋权API中的“object”对应。 is_admin 否 Boolean 判断用户是否为管理员。 user_name 否 String 用户名称，即该用户在当前数据库上有权限。 privileges 否 Array of Strings 该用户在数据库上的权限。请求示例无响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > 权限相关API
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

select * from hudiSource; 该作业提交后，作业状态变成“运行中”，后续您可通过如下操作查看输出结果。方法一：登录DLI管理控制台，选择“作业管理 > Flink作业”。在对应Flink作业所在行的“操作”列，选择“更多 > FlinkUI”。在FlinkUI界面，选择“Task

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.forcePartitio

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

需要执行INSERT命令的Hudi表的名称。 select query 查询语句。注意事项写入模式：Hudi对于设置了主键的表支持三种写入模式，用户可以设置参数hoodie.sql.insert.mode来指定Insert模式，默认为upsert。 hoodie.sql.insert.mode

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
查询弹性资源池下所有队列 - 数据湖探索 DLI

表5 queue_scaling_policies 参数是否必填参数类型描述 priority 否 Integer 策略优先级1-100，100优先级最高。 impact_start_time 否 String 生效开始时间。 impact_stop_time 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
提示OBS Bucket没有授权怎么办？ - 数据湖探索 DLI

DLI更新委托后，将原有的dli_admin_agency升级为dli_management_agency。 dli_management_agency包含跨源操作、消息通知、用户授权操作所需的权限，除此之外的其他委托权限需求，都需自定义DLI委托。授权DLI读写OBS的权限并不包含在的DLI委托dli_manag

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

partitions提高shuffle read task的并行度来进行解决。设置spark.sql.shuffle.partitions参数提高并行度用户可在JDBC中通过set方式设置dli.sql.shuffle.partitions参数。具体方法如下： Statement st = conn

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Data masking函数 - 数据湖探索 DLI

mask_hash(string|char|varchar str) →varchar 描述：返回基于str的散列值。散列是一致的，可以用于跨表连接被屏蔽的值。对于非字符串类型，返回NULL。 select mask_hash('panda');

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
更新Flink Jar作业 - 数据湖探索 DLI

entrypoint 否 String 用户已上传到DLI资源管理系统的程序包名，用户自定义作业主类所在的jar包。 dependency_jars 否 Array of Strings 用户已上传到DLI资源管理系统的程序包名，用户自定义作业的其他依赖包。示例“myGroup/test

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Hudi数据表Clean规范 - 数据湖探索 DLI

ompaction.delta_commits的值）。 MOR表下游采用流式计算，历史版本保留小时级。如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

返回"This is a test String." REPEAT(string, integer) STRING 返回integer个string连接后的字符串例如REPEAT('This is a test String.', 2) 返回"This is a test String.This

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
CREATE TABLE语句 - 数据湖探索 DLI

ENFORCED。它申明了是否输入/出数据会做合法性检查（是否唯一）。Flink 不存储数据因此只支持 NOT ENFORCED 模式，即不做检查，用户需要自己保证唯一性。 Flink 假设声明了主键的列都是不包含 Null 值的，Connector 在处理数据时需要自己保证语义正确。注意:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义

总条数： 955

上一页
1
...
41
42
43
...
48
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

查看表属性 - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

修改弹性资源池关联队列的扩缩容策略 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

查看赋权对象使用者权限信息 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

查询弹性资源池下所有队列 - 数据湖探索 DLI

提示OBS Bucket没有授权怎么办？ - 数据湖探索 DLI

如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 - 数据湖探索 DLI

Data masking函数 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线