搜索_华为云

从Kafka读取数据写入到DWS - 数据湖探索 DLI

已创建DMS Kafka实例。具体步骤可参考：DMS Kafka入门指引。创建DMS Kafka实例时，不能开启Kafka SASL_SSL。已创建DWS实例。具体创建DWS集群的操作可以参考创建DWS集群。整体作业开发流程整体作业开发流程参考图1。图1 作业开发流程

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

已创建DMS Kafka实例。具体步骤可参考：DMS Kafka入门指引。创建DMS Kafka实例时，不能开启Kafka SASL_SSL。已创建Elasticsearch类型的CSS集群。具体创建CSS集群的操作可以参考创建CSS集群。本示例创建的CSS集群版本为：7

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
分组聚合 - 数据湖探索 DLI
分组聚合 - 数据湖探索 DLI

后不符合条件的行。 HAVING 和 WHERE 的不同点：WHERE 在 GROUP BY 之前过滤单独的数据行。HAVING 过滤 GROUP BY 生成的数据行。 HAVING 条件中的每一列引用必须是明确的 grouping 列，除非它出现在聚合函数中。即使没有 GROUP BY 子句，HAVING

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
复杂数据类型 - 数据湖探索 DLI

array(<value>,<value>[, ...]) 具体使用示例详见：ARRAY示例。 MAP 一组无序的键/值对，使用给定的Key和Value对生成MAP。键的类型必须是原生数据类型，值的类型可以是原生数据类型或复杂数据类型。同一个MAP键的类型必须相同，值的类型也必须相同。 map(K

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
使用CDM迁移数据至DLI - 数据湖探索 DLI

Id和Secret Access Key）。说明：每个用户仅允许新增两个访问密钥。为保证访问密钥的安全，访问密钥仅在初次生成时自动下载，后续不可再次通过管理控制台界面获取。请在生成后妥善保管。 - 密钥(SK) - 项目ID DLI服务所在区域的项目ID。项目ID表示租户的资源，账号ID

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
导出查询结果 - 数据湖探索 DLI

请求发送是否成功。“true”表示请求发送成功。 message 是 String 系统提示信息，执行成功时，信息可能为空。 job_id 否 String 提交请求成功时，生成并提交一个新的作业，返回作业ID。用户可以使用作业ID来查询作业状态和获取作业结果。 job_mode 否 String 作业执行模式： async：异步

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

VARBINARY BLOB BYTEA BYTES - ARRAY ARRAY 示例从Kafka源表中读取数据，将JDBC表作为维表，并将二者生成的表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

界的表。 STREAMING读取支持同时使用分区表和非分区表。对于分区表，Flink将监控新分区的生成，并在可用时增量读取它们。对于未分区的表，Flink 会监控文件夹中新文件的生成情况，并增量读取新文件。前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

connector.key-column 否 table存储模式下可配置，将该字段值作为redis中的ext-key，未配置时，ext-key为生成的uuid connector.write-schema 否 table存储模式下可配置，是否将当前schema写入到redis，默认为false

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

'json' 'sink.properties.read_json_by_line' = 'true' 示例该示例是从Datagen数据源中生成数据，并将结果写入到Doris结果表中。参考增强型跨源连接，在DLI上根据Doris所在的虚拟私有云和子网分别创建相应的增强型跨源连接，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
从Kafka读取数据写入到RDS - 数据湖探索 DLI

已创建DMS Kafka实例。具体步骤可参考：DMS Kafka入门指引。创建DMS Kafka实例时，不能开启Kafka SASL_SSL。已创建RDS MySQL实例。本示例创建的RDS MySQL数据库版本选择为：8.0。具体步骤可参考：购买RDS for MySQL实例。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查询作业执行进度信息 - 数据湖探索 DLI

请求发送是否成功。“true”表示请求发送成功。 message 是 String 系统提示信息，执行成功时，信息可能为空。 job_id 否 String 提交请求成功时，生成并提交一个新的作业，返回作业ID。用户可以使用作业ID来查询作业状态和获取作业结果。 status 是 String 作业状态。状态可能为

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

之中自动推导得到。不支持显式地定义 JSON schema。在 Flink 中，JSON Format 使用 jackson databind API 去解析和生成 JSON。下表列出了 Flink 中的数据类型与 JSON 中的数据类型的映射关系。表2 数据类型映射 Flink SQL类型 JSON类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

置（闭区间） hoodie.datasource.write.keygenerator.type 否 COMPLEX Enum 上游表主键生成类型： SIMPLE（默认值） COMPLEX TIMESTAMP CUSTOM NON_PARTITION GLOBAL_DELETE read

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

7 | 6 | 7 (7 rows) row_number()→ bigint 描述：从1开始，按照顺序，生成分组内记录的序列–比如，按照pv降序排列，生成分组内每天的pv名次ROW_NUMBER() 的应用场景非常多，再比如，获取分组内排序第一的记录。获取一个session中的第一条refer等。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
了解数据目录、数据库和表 - 数据湖探索 DLI

库表管理中表的列表页面，表类型为External，存储位置为OBS路径的即代表OBS表。视图表视图表（View）是一种虚拟表，它不存储实际的数据，而是根据定义的查询逻辑动态生成数据。视图通常用于简化复杂的查询，或者为不同的用户或应用提供定制化的数据视图。视图表可以基于一个或多个表创建，提供了一种灵活的方式来展示数据，而不影响底层数据的存储和组织。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from testhbase").show(); 提交Spark作业将写好的代码文件生成jar包，上传至OBS桶中。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keyta

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

format("opentsdb").options(map.toMap).load().show() 返回结果：提交Spark作业将写好的代码生成jar包，上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
DWS源表（不推荐使用） - 数据湖探索 DLI

础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。推荐使用DWS服务自研的DWS Connector。 DWS-Connector的使用方法请参考dws-connector-flink。前提条件请务必确保您

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS

总条数： 205

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

从Kafka读取数据写入到DWS - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

分组聚合 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

从Kafka读取数据写入到RDS - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DWS源表（不推荐使用） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线