搜索_华为云

Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。数据结果参考如下： +I(fz-source-json,0,{}

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
在DLI控制台创建数据库和表 - 数据湖探索 DLI

鼠标左键单击对应数据库右侧的，在列表菜单中选择“创建表”，创建当前数据库下的表。在“创建表”页面，填写参数。当数据位置为DLI时，请参见表2填写相关参数；图2 创建表-DLI 当数据位置为OBS时，请参见表2和表3填写相关参数。图3 创建表-OBS 表2 通用参数说明参数名称描述示例表名称

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
CREATE TABLE语句 - 数据湖探索 DLI

功能描述根据指定的表名创建一个表。语法说明 COMPUTED COLUMN 计算列是一个使用 “column_name AS computed_column_expression” 语法生成的虚拟列。它由使用同一表中其他列的非查询表达式生成，并且不会在表中进行物理存储。例如，一个计算列可以使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
导出数据（废弃） - 数据湖探索 DLI

“Overwrite”：覆盖。在指定目录下新建文件，会删除已有文件。 with_column_header 否 Boolean 导出csv和json格式数据时，是否导出列名。设置为“true”，表示导出列名。设置为“false”，表示不导出列名。若为空，默认为“false”。响应消息表3 响应参数参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

不支持 MAP / MULTISET 不支持 ROW 不支持示例该示例是从Kafka数据源中读取数据，将HBase表作为维表，从而生成宽表，并将结果写入到Kafka结果表中，其具体步骤如下（该示例中HBase的版本为1.3.1和2.2.3）：参考增强型跨源连接，在DLI上根据HB

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通操作场景公网数据源指的是可以通过互联网访问的数据源。这些数据源资源有一个公网IP地址，配置DLI与公网网络联通可以实现对这些数据源的访问。本节提供了详细的操作指导，介绍如何通过设置SNAT规则和配置路由信息，实现DLI服务与公网的网络连接。操作流程

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Hudi数据表Archive规范 - 数据湖探索 DLI

Hudi数据表Archive规范 Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
配置多版本过期数据回收站 - 数据湖探索 DLI

建表SQL语法可以参考使用Hive语法创建OBS表。回收站数据自动清理需要在OBS并行文件系统的桶上配置回收站数据的生命周期规则。具体步骤参考如下：在OBS服务控制台页面左侧选择“并行文件系统”，单击对应的文件系统名称。在“基础配置”下单击“生命周期规则”，创建或者编辑生命周期规则。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
创建DLI表关联DDS - 数据湖探索 DLI

创建DLI表关联DDS 功能描述使用CREATE TABLE命令创建DLI表并关联DDS上已有的collection。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE [db_name.]table_name; 关键字无。参数说明表1 参数描述参数描述 db_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

创建共享的详细操作，请参见创建共享。建立DLI与共享VPC下资源的网络连通账号A创建增强型跨源连接。账号A登录DLI管理控制台。在左侧导航栏中，选择“跨源管理 > 增强型跨源 ”。选择“增强型跨源”，单击“创建”。配置增强型跨源连接信息，详细参数介绍请参见表1。表1 账号A创建的增强型跨源连接参数说明

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

upper-bound：最后一个分区的最大值。建表时以上扫描分区参数必须同时存在或者同时不存在。 scan.partition.lower-bound和scan.partition.upper-bound参数仅用于决定分区步长，而不是用于过滤表中的行，表中的所有行都会被分区并返回。数据类型映射表2 数据类型映射

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

连接器应忽略更新插入/撤回流模式下的收回消息。 key-column 否无 String Redis 表schema的key 示例从Kafka源表中读取数据，将Redis表作为维表，并将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，根据Redis和Kafka所在的虚拟

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？配置DLI队列与内网数据源的网络连通 DLI在创建运行作业需要连接外部其他数据源，如：DLI连接MRS、RDS、CSS、Kafka、DWS时，需要打通DLI和外部数据源之间的网络。 DLI提供的增强型跨源连接功能，底层采用对等连接的方式打通

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
删除表 - 数据湖探索 DLI
删除表 - 数据湖探索 DLI

开头。 table_name 表名称。注意事项所要删除的表必须是当前数据库下存在的，否则会出错，可以通过添加IF EXISTS来避免出错。示例参考创建OBS表或者创建DLI表中的示例描述创建对应的表。在当前所在数据库下删除名为test的表。 1 DROP TABLE IF

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
Hudi Clustering操作说明 - 数据湖探索 DLI

入Hudi表。为了能够在文件大小和入湖速度之间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
表别名 - 数据湖探索 DLI
表别名 - 数据湖探索 DLI

表别名功能描述给表或者子查询结果起别名。语法格式 1 SELECT attr_expr_list FROM table_reference [AS] alias; 关键字 table_reference：可以是表，视图或者子查询。 AS：可用于连接table_refere

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 别名SELECT
Doris结果表 - 数据湖探索 DLI
Doris结果表 - 数据湖探索 DLI

设置Doris的安全组，添加入向规则使其对Flink的队列网段放通。分别根据Doris的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。参考测试地址连通性。参考MRS Doris使用指南，创建doris表，创建语句如下： CREATE TABLE IF NOT EXISTS dorisdemo

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Doris
Hudi表初始化 - 数据湖探索 DLI
Hudi表初始化 - 数据湖探索 DLI

需要更多资源才能完成。 Hudi表在Hive元数据中，应该会存在1张内部表（手动创建），2张外部表（写入数据后自动创建）。 2张外部表，表名_ro（用户只读合并后的parquet文件，即读优化视图表），_rt（读实时写入的最新版本数据，即实时视图表）。父主题： Bucket调优示例

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例

总条数： 1223

上一页
1
2
3
4
5
...
62
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Kafka源表 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

导出数据（废弃） - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

怎样配置DLI队列与数据源的网络连通？ - 数据湖探索 DLI

删除表 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

表别名 - 数据湖探索 DLI

Doris结果表 - 数据湖探索 DLI

Hudi表初始化 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线