搜索_华为云

创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

Executor CPU核数用于设置Spark作业申请的每个Executor的CPU核数，决定每个Executor并行执行Task的能力。 Executor个数用于设置Spark作业申请的Executor的数量。 driver CPU核数用于设置driver CPU核数。 driver内存

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元参数设置详见：manager_cu_number。 parallel_number 否 Integer 用户设置的作业并行数目。默认值为“1”。并行数是指同时运行Flink SQL作业的最大任务数

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
修改表分区位置（只支持OBS表） - 数据湖探索 DLI

PARTITION partition_specs SET LOCATION obs_path; 关键字 PARTITION：分区。 LOCATION：分区路径。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。 obs_path

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

jks文件传入OBS中。具体方式请参考客户端SSL加密功能使用说明。端口请注意使用KafKa服务配置中设置的ssl.port端口 security.protocol请设置为SSL。 ssl.mode.enable请设置为true。 CREATE TABLE ordersSource ( order_id

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

DLI不支持直接使用SET语句配置参数点击”设置”，随后在”参数设置”一栏可以配置键和值，Hudi的参数可以通过此处提交。配置在此处的参数会在提交SQL作业时被应用。随后可以在左侧菜单点击”作业管理”->”SQL作业”，随后在列表中选中执行的作业，并点击下方窗格，唤出作业详情，在”参数设置”一栏中，可以检查参数配置情况。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数 > 表值函数
string_split - 数据湖探索 DLI
string_split - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数 > 表值函数
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

eckPoint间隔为分钟级。 checkpoint容忍失败次数设置，execution.checkpointing.tolerable-failed-checkpoints。 Flink On Hudi作业建议设置checkpoint容忍次数多次，如100。若需要使用Hive风格分区，需同时配置如下参数：

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

它能提升写入HBase数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。注意："sink.buffer-flush.max-size" 和 "sink.buffer-flush.max-rows" 同时设置为 "0"，并设置刷新缓存的间隔，则以完整的异步处理方式刷新缓存。格式为：{length

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

在DLI管理控制台的左侧导航栏中，单击作业管理>“Flink作业”，在需要编辑作业对应的“操作”列中，单击“编辑”，进入作业编辑页面。在“运行参数设置”页签，“UDF Jar”选择创建的程序包，单击“保存”。选定JAR包以后，SQL里添加UDF声明语句，就可以像普通函数一样使用了。 1

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Hudi当前只有int、bigint、float、double、decimal、string、date、timestamp、boolean、binary类型支持设置默认值。 Hudi表必须指定primaryKey与preCombineField。在指定路径下创建表时，如果路径下已存在Hudi表，则建

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
创建表（废弃） - 数据湖探索 DLI

"message": "" } 状态码状态码如表6所示。表6 状态码状态码描述 200 创建成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：表相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta Lake 具有一

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

ne顺序执行各个节点。请参考步骤4：作业编排。测试作业运行：测试作业运行。请参考步骤5：测试作业运行。设置作业调度与监控：设置作业调度属性与监控规则。请参考步骤6：设置作业周期调度和相关操作。环境准备 DLI资源环境准备配置DLI作业桶使用DLI服务前需配置DLI作业桶

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

customer GROUP BY mktsegment; GROUPING SETS 可以指定多个列进行分组，结果列中不属于分组列的将被设置为NUll。具有复杂分组语法（GROUPING SETS、CUBE或ROLLUP）的查询只从基础数据源读取一次，而使用UNION ALL的

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3 4 5 6 7 8 9

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 487

上一页
1
...
11
12
13
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建Spark作业 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

修改表分区位置（只支持OBS表） - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

string_split - 数据湖探索 DLI

string_split - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线