搜索_华为云

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

VPC安全策略，有利于资源有序集中管理。企业业务账号使用共享的VPC和子网创建资源，并想要使用DLI提交作业访问共享VPC中的资源。此时需要建立DLI与共享VPC中资源的网络连接。例如：账号A为企业IT管理账号，是VPC资源的所有者，创建VPC、子网。并将VPC、子网共享给企业业务账号B。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Flink作业性能调优 - 数据湖探索 DLI

和时延，确定算子的性能瓶颈点。作业最后一个算子(Sink)反压正常（绿色），前面算子反压高（红色）该场景说明性能瓶颈点在sink，此时需要根据具体数据源具体优化，比如对于JDBC数据源，可以通过调整写出批次(connector.write.flush.max-rows)、JD

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.mongo。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
pyspark样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.opentsdb。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

time) and UpperBound(L.time) 带有时间属性(L.time/R.time)的比较表达式。注意事项时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。例如使用两个适当的范围谓词（<, <=, >=, >），一个 BETWEEN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
lead - 数据湖探索 DLI
lead - 数据湖探索 DLI

BLE类型则隐式转换为BIGINT类型后进行运算。 default 是常量，默认值为NULL。当offset指定的范围越界时的缺省值，需要与expr对应的数据类型相同。如果expr非常量，则基于当前行进行求值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

time) and UpperBound(L.time) 带有时间属性(L.time/R.time)的比较表达式。注意事项时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。例如使用两个适当的范围谓词（<, <=, >=, >），一个 BETWEEN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

中的 INSERT / UPDATE / DELETE 消息编码为 Canal 格式的 JSON 消息，输出到 Kafka 等存储中。但需要注意的是，目前 Flink 还不支持将 UPDATE_BEFORE 和 UPDATE_AFTER 合并为一条 UPDATE 消息。因此，Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

time) and UpperBound(L.time) 带有时间属性(L.time/R.time)的比较表达式。注意事项时间窗口join需要至少一个 equi-join 谓词和一个限制了双方时间的 join 条件。例如使用两个适当的范围谓词（<, <=, >=, >），一个 BETWEEN

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
将OBS数据导入至DLI - 数据湖探索 DLI

在“SQL编辑器”页面导入数据。在管理控制台的左侧，单击“SQL编辑器”。在“SQL编辑器”页面左侧导航栏选择“数据库”页签，鼠标左键单击需要导入数据的表对应的数据库名，进入“表”区域。鼠标左键单击对应表右侧的，在列表菜单中选择“导入”，弹出“导入数据”页面。图2 SQL编辑器-导入数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

/ UPDATE / DELETE 消息编码为 Debezium 格式的 JSON 或 Avro 消息，输出到 Kafka 等存储中。但需要注意的是，目前 Flink 还不支持将 UPDATE_BEFORE 和 UPDATE_AFTER 合并为一条 UPDATE 消息。因此，Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
更新Flink Jar作业 - 数据湖探索 DLI

认值为“-1”，表示无限次数。 checkpoint_path 否 String 用户Jar中checkpoint的储存地址，不同作业路径需要保持不同。 runtime_config 否 String Flink作业运行时自定义优化参数。 job_type 否 String 作业类型。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
pyspark样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.mongo。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
lag - 数据湖探索 DLI
lag - 数据湖探索 DLI

BLE类型则隐式转换为BIGINT类型后进行运算。 default 是常量，默认值为NULL。当offset指定的范围越界时的缺省值，需要与expr对应的数据类型相同。如果expr非常量，则基于当前行进行求值。 partition_clause 否指定分区。分区列的值相同的行被视为在同一个窗口内。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(?!_)(?![0-9]+$)[A-Za-z0-9_$]*$。如果特殊字符需要使用单引号（''）包围起来。该命令仅支持操作OBS表，不支持对DLI表进行操作。 partition_filtercondition 分区筛选条件。具体可以为以下格式：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
正则表达式函数 - 数据湖探索 DLI

模式匹配的子字符串的每个实例。对于每个匹配，以数组形式传递的捕获组都会调用lambda表达式函数。捕获组号从1开始；整个匹配没有分组（如果需要，请用括号将整个表达式括起来）。 SELECT regexp_replace('new york','(\w)(\w*)',x->uppe

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

ord类型的跨源认证名称。使用跨源认证则无需在作业中配置账号和密码。 )" ) 表1 创建表参数参数说明 url DWS的连接地址，需要先创建跨源连接，管理控制台操作请参考《数据湖探索用户指南》。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

Flink SQL 中的 INSERT/UPDATE/DELETE 消息编码为 Ogg JSON 格式的消息, 输出到 Kafka 等存储中。但需要注意, 目前 Flink 还不支持将 UPDATE_BEFORE 和 UPDATE_AFTER 合并为一条 UPDATE 消息. 因此, Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.opentsdb。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
pyspark样例代码 - 数据湖探索 DLI

在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.dws。如果选择Spark版本为3.1.1及以上版本时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS

总条数： 596

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

lead - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

lag - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线