搜索_华为云

Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据 Upsert Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
比较函数 - 数据湖探索 DLI
比较函数 - 数据湖探索 DLI

和分组操作中可以被重写的操作。对于流式查询，该操作在 join 和分组操作中被重写。根据输入行的数量计算查询结果所需的状态可能会无限增长。请提供具有有效保留间隔的查询配置，以防止状态过大。 value IN (sub-query) BOOLEAN 如果 value 等于子查询结果集中的一行则返回 TRUE。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
创建表（废弃） - 数据湖探索 DLI

OBS表必选参数。 data_path 否 String 新增OBS表数据的存储路径，必须是OBS的路径。说明： OBS表必选参数。 data_path配置的OBS桶路径不建议为根目录，否则清空表数据的时候，就会把根目录内的数据全部清除，导致数据丢失。 with_column_header 否

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

thon程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析程序。传统上，通常是直接基于pip把Python库安装到执行机器上，对于DLI这样的Serverless化服务用户无需也感知不到底层的计算资源，那如何来保证用户可以更好的运行他的程序呢？ DL

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
CREATE TABLE语句 - 数据湖探索 DLI

则新的 watermark 不会被发出。 Watermark 根据 pipeline.auto-watermark-interval 中所配置的间隔发出。若 watermark 的间隔是 0ms ，那么每条记录都会产生一个 watermark，且 watermark 会在不为空并大于上一个发出的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
Ogg Format - 数据湖探索 DLI
Ogg Format - 数据湖探索 DLI

NAME primary-keys ARRAY<STRING> NULL 保存源表的主键的列名的数组。如果includePrimaryKeys配置属性设置为true，则仅在JSON输出中包含primary-keys字段。 ingestion-timestamp TIMESTAMP_LTZ(6)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

fka写入重复的改动消息，Flink将获得重复的消息。这可能会导致Flink查询得到错误的结果或意外的异常。因此，在这种情况下，建议将作业配置table.exec.source.cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Fram

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

用户为作业选择的CU数。默认值为“2”。 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。管理单元参数设置详见：manager_cu_number。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用DLI分析电商BI报表 - 数据湖探索 DLI

将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。下载OBS Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录

 帮助中心 > 数据湖探索 DLI > 最佳实践
CREATE TABLE语句 - 数据湖探索 DLI

则新的 watermark 不会被发出。 Watermark 根据 pipeline.auto-watermark-interval 中所配置的间隔发出。如果 watermark 的间隔是 0ms ，那么每条记录都会产生一个 watermark，且 watermark 会在不为空并大于上一个发出的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

db/{table_name}，其中{lakeformation_catalog_url}对接的lakeformation catalog配置的location，{schema_name}为建表时使用的schema，{table_name}为表名。不允许向托管表（表属性external

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

口的周期触发策略；当lateness_interval为0时，表示没有使用窗口结束后的延迟策略；当二者都没有填写时，默认两种策略都没有配置，仅使用普通的TUMBLE窗口。若仅需使用延迟时间策略，则需要将上述period_interval格式中的'10'设置为 '0'。 OVER

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
查询作业列表 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置。 “show_detail”为“false”时独有。具体参数说明请参见表6。 main_class 否 String jar包主类。“s

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

shared_cluster：共享 exclusive_cluster：独享 edge_node：边缘节点 job_config 否 Object 作业配置, 具体参数说明请参见表4。 main_class 否 String jar包主类。例如，org.apache.spark.examples

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

integer2 ]) STRING 返回string中从integer1位置开始的长度为integer2的子字符串。若integer2未配置，则默认返回从integer1开始到末尾的子字符串 REPLACE(string1, string2, string3) STRING 用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

integer2 ]) STRING 返回string中从integer1位置开始的长度为integer2的子字符串。若integer2未配置，则默认返回从integer1开始到末尾的子字符串 REPLACE(string1, string2, string3) STRING 用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

数据的具体格式通过调用ImportJob对象的setCsvFormatInfo接口进行设置。在提交导入作业前，可选择设置导入数据的分区并配置是否是overwrite写入，分区信息可以调用ImportJob对象的setPartitionSpec接口设置，如：importJob.setPartitionSpec(new

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

户组授予策略或角色，才能使得该用户组中的用户获得对应的权限，这一过程称为授权。授权后，用户就可以基于被授予的权限对云服务进行操作。 DLI部署时通过物理区域划分，为项目级服务。授权时，“作用范围”需要选择“区域级项目”，然后在指定区域对应的项目中设置相关权限，并且该权限仅对此项目

 帮助中心 > 数据湖探索 DLI > 产品介绍
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

DLI委托可以确保DLI在跨源分析场景中安全、有效地访问其他云服务。发布区域：全部创建DLI自定义委托 OBS 2.0支持自定义镜像 DLI支持容器部署的集群。在容器集群中，Spark作业和Flink作业相关组件都运行在容器中，通过下载DLI提供的自定义镜像，可以改变Spark作业和Fli

帮助中心 > 数据湖探索 DLI > 功能总览

总条数： 501

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Upsert Kafka - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

比较函数 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

Ogg Format - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线