搜索_华为云

Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DWS的更多信息，请参见《数据仓库服务管理指南》。前提条件请务必确保您的账户下已在数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变更事件进行去重，并生成一个规范化的changelog流。参数说明表1 参数说明参数是否必选默认值类型说明 format

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

插入语句后加入“DISTRIBUTE BY number”。例如，在插入语句后添加“DISTRIBUTE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark 2.4.5版本说明 - 数据湖探索 DLI

更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.name.kind' = 'random', --为字段user_id指定random生成器 'fields.name.length' = '7', --限制user_id长度为7

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

中定义的顺序连接所有主键字段，为每一行记录生成一个文档ID字符串。某些类型不允许作为主键字段，因为它们没有对应的字符串表示形式，例如，BYTES，ROW，ARRAY，MAP 等。如果未指定主键，Elasticsearch 将自动生成文档ID。动态索引 Elasticsearch

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
数据保护技术 - 数据湖探索 DLI

ssl.keystore keystore的存放路径，“flink.keystore”表示用户通过generate_keystore.sh*工具生成的keystore文件名称。是 /opt/flink/usrlib/userData/flink.keystore security.ssl

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建Hive Catalog - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

如上述举例中的car_infos_sink表，是否开启了Checkpoint。如果未开启则需要开启Checkpoint参数，重新运行作业生成OBS数据文件。开启Checkpoint步骤如下。到DLI管理控制台，左侧导航栏选择“作业管理 > Flink作业”，在对应的Flink作业所在行，操作列下单击“编辑”。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

配置数据更新间隔。示例该示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
管理Spark作业 - 数据湖探索 DLI
管理Spark作业 - 数据湖探索 DLI

量较多时，系统分页显示，您可以查看任何状态下的作业。表1 作业管理参数参数参数说明作业ID 所提交Spark作业的ID，由系统默认生成。名称所提交Spark作业的名称。队列所提交Spark作业所在的队列。用户名执行Spark作业的用户名称。状态作业的状态信息，包括如下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

from testcsvdata2source; 图3 查询结果在OBS桶的“obs://dli-test-021/data”目录下刷新后查询，生成了csv数据文件，文件内容为insert插入的数据内容。图4 查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Spark 3.3.1版本说明 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

启“恢复保存点”，作业将从选择的savepoint文件中恢复消费位点及状态。同时，由于Flink Checkpoint和Savepoint生成机制及格式一致，因而，也可以通过Flink作业列表“操作”列中的“更多”>“导入保存点”，导入OBS中最新成功的Checkpoint，并从中恢复。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建DLI表关联DDS - 数据湖探索 DLI

使用跨源密码认证时配置为“true”。如果在DDS中已存在collection，则建表可以不指定schema信息，DLI会根据collection中的数据自动生成schema信息。示例 1 2 3 4 5 6 create table 1_datasource_mongo.test_momgo(id

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
Elasticsearch结果表 - 数据湖探索 DLI

DL中定义的顺序连接所有主键字段，从而为每一行生成一个文档ID字符串。某些类型（例如BYTES、ROW、ARRAY和MAP等）由于没有对应的字符串表示形式，所以不允许其作为主键字段。如果未指定主键，Elasticsearch将自动生成随机的文档ID。 Elasticsearch结果表同时支持静态索引和动态索引。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

connector.key-column 否 table存储模式下可配置，将该字段值作为redis中的ext-key，未配置时，ext-key为生成的uuid。示例从Redis中读取数据。 create table redisSource( car_id STRING, car_owner

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
导入数据（废弃） - 数据湖探索 DLI

data_type 是 String 导入的数据类型（当前支持csv、parquet、orc、json、avro数据类型）。说明：不支持导入Hive表生成的avro格式数据。 database_name 是 String 导入表所属的数据库名称。 table_name 是 String 导入表的名称。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）

总条数： 169

上一页
1
...
4
5
6
...
9
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Print - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

管理Spark作业 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线