搜索_华为云

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

操作系统 Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本（访问Java官网）。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其2019.1往后的版本。安装Maven 开发环境的基本配置（下载并安装

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

小数可以使用科学计数法书写。例如，0.000000027在默认情况下被编码为2.7E-8，如果将此选项设置为true，则将被写入为0.000000027。元数据元数据可以在 DDL 中作为只读（虚拟）meta 列声明。表2 元数据 Key 数据类型说明 database STRING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
DWS源表（不推荐使用） - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
上传分组资源（废弃） - 数据湖探索 DLI

是否使用异步方式上传资源包。默认值为“false”，表示不使用异步方式。推荐使用异步方式上传资源包。 tags 否 Array of Objects 资源标签。具体请参考表3。表3 tags参数参数名称是否必选参数类型说明 key 是 String 标签的键。说明：标签的键的最大长度为128个

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed 问题现象 Flink Jar作业运行异常，作业日志中有如下报错信息： org.apache.flink.shaded.curator.org.apache.curator.ConnectionState

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
查询增强型跨源连接列表 - 数据湖探索 DLI

表2 query参数参数名称是否必选参数类型说明 limit 否 String 查询最大连接个数，默认为100。“limit”为“0”时，将返回全部跨源连接列表。 offset 否 String 查询结果偏移量，默认为0（连接以创建时间进行排序）。 status 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

接器支持的表属性，以Hive连接器为例： TBLPROPERTIES ("transactional"="true") ，可能的取值为[true,false] TBLPROPERTIES ("auto.purge"="true") ，可能的取值为[true,false] 修改表的列属性。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
导出DLI表数据至OBS中 - 数据湖探索 DLI

S服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。支持跨账号导出数据，即，如果B账户对A账户授权后，A账户拥

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

“异常重试最大次数”：配置异常重试最大次数。单位为“次/小时”。无限：无限次重试。有限：自定义重试次数。 “从Checkpoint恢复”：需要同时勾选“开启Checkpoint”才可配置该参数。空闲状态保留时长用于清除GroupBy或Window经过最大保留时间后仍未更新的中间状态，默认设置为1小时。脏数据策略

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
添加分区（只支持OBS表） - 数据湖探索 DLI

您需要保证该分区目录下所有文件类型和文件内容与表的字段一致，否则查询将报错。您可以在建表语句OPTIONS中设置“multiLevelDirEnable”为true以查询子目录下的内容，此参数默认值为false（注意，此配置项为表属性，请谨慎配置。Hive表不支持此配置项)。示例建OBS表时仅有一个分区列，建表成功后添加分区数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Confluent Avro Format - 数据湖探索 DLI

根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试地址连通性-->输入kafka或ecs的地址-->

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
查询分组资源列表（废弃） - 数据湖探索 DLI

} ] } 状态码状态码如表6所示。表6 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：分组资源相关API（废弃）

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
创建表（废弃） - 数据湖探索 DLI

列的描述信息。 is_partition_column 否 Boolean 表示该列是否为分区列。“true”表示为分区列，“false”为非分区列，默认为“false”。说明：创建分区表时，需要保证表中至少有一列为非分区列。详见“请求样例”。响应消息表5 响应参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

当“fields.#.kind”字段为：random时有效。表示随机生成器的最小值，'#' 指定的字段仅适用于数字类型。 fields.#.max 否 '#'号指定的字段类型的最大值 '#'号指定的字段类型当“fields.#.kind”字段为：random时有效。随机生成器的最大值，'#'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
DWS维表（不推荐使用） - 数据湖探索 DLI

connector类型，需配置为'gaussdb'。 url 是无 String jdbc连接地址。使用gsjdbc4驱动连接时，格式为：jdbc:postgresql://${ip}:${port}/${dbName} 。使用gsjdbc200驱动连接时，格式为：jdbc:gaus

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

“default”为内置数据库，不能创建名为“default”的数据库。 DLI支持创建的数据库的最大数量为50个。数据表 DLI支持创建的表的最大数量为5000个。 DLI支持创建表类型： Managed：数据存储位置为DLI的表。 External：数据存储位置为OBS的表。

帮助中心 > 数据湖探索 DLI > 产品介绍
FileSytem结果表 - 数据湖探索 DLI

'' ); 注意事项该建表语法的数据输出目录为OBS时，OBS必须为并行文件系统，不能为OBS桶。使用fileSystem时必须开启checkpoint，保证作业的一致性。 format.type为parquet时，支持的数据类型为string, boolean, tinyint

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

写数据时刷新数据的最大行数，默认值为100。 sink.buffer-flush.interval 否 1s Duration 刷新数据的时间间隔，单位可以为ms、milli、millisecond/s、sec、second/min、minute等，默认值为1s。设置为0则表示不根据时间刷新。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 478

上一页
1
...
13
14
15
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

上传分组资源（废弃） - 数据湖探索 DLI

Flink Jar作业运行报错，报错信息为Authentication failed - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

查询增强型跨源连接列表 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

查询分组资源列表（废弃） - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线