搜索_华为云

去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

去重功能描述对在列的集合内重复的行进行删除，只保留第一行或最后一行数据。语法格式 SELECT [column_list] FROM ( SELECT [column_list], ROW_NUMBER() OVER ([PARTITION BY col1[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
隐式连接 - 数据湖探索 DLI
隐式连接 - 数据湖探索 DLI

ON...的连接，返回匹配的记录。语法格式中仅给出等式条件下的WHERE条件过滤，同时也支持不等式WHERE条件过滤。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。隐式JOIN的命令中不含有JOIN...ON...关键词，而是通过WHERE子句作为连接条件将两张表连接。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表）功能描述指定筛选条件删除分区表的一个或多个分区。注意事项该命令仅支持操作OBS表，不支持对DLI表进行操作。所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF EXISTS”避免该错误。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Upsert Kafka结果表 - 数据湖探索 DLI

副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka是线下集群，需要通过增强型跨源连接功能将Flink作业与Kafka进行对接。且用户可以根据实际所需设置相应安全组规则。注意事项对接的Kafka集群不支持开启SASL_SSL。语法格式 1 2 3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
去重 - 数据湖探索 DLI
去重 - 数据湖探索 DLI

去重功能描述对在列的集合内重复的行进行删除，只保留第一行或最后一行数据。语法格式 SELECT [column_list] FROM ( SELECT [column_list], ROW_NUMBER() OVER ([PARTITION BY col1[

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

status [403] 该报错信息可能是由于OBS桶被设置为了DLI日志桶，而日志桶不能用于DLI的其他业务功能。您可以按以下操作步骤进行查询：检查该OBS桶是否被设置为了DLI日志桶。在DLI管理控制台的“全局配置 > 作业配置” 页查看对应OBS桶是否被设置为了DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？问题现象客户在DLI中创建了DWS跨源连接和DWS跨源表，然后对DWS中的源表schema进行更新，执行DLI作业，发现DWS中源表schema被修改为更新前的形式，导致schema不匹配，作业执行失败。原因分析 DLI跨源表执行

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

该场景需要与ClickHouse建立增强型跨源连接，并根据实际情况设置ClickHouse集群所在安全组规则中的端口。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi表分区设计规范 - 数据湖探索 DLI

如果维度表的总数据量很大或者增量也很大，可以考虑采用某个业务ID进行分区，在大部分数据处理逻辑中针对大维度表，会有一定的业务条件进行过滤来提升处理性能，这类表要结合一定的业务场景来进行优化，无法从单纯的日期分区进行优化。事实表读取方式都会按照时间段切分，近一年、近一个月或者近一天

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执行注册viewManager时，会校验该数据库在metastore是否存在，如果该数据库存在则会导致Spark作业执行失败。因此当Spark3

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

conf文件。创建MRS HBase表创建DLI表关联MRS HBase表之前确保HBase的表是存在的。以样例代码为例，具体的流程是：远程登录ECS，通过hbase shell命令查看表信息。其中，“hbtest”是要查询的表名。 describe 'hbtest' （可选）如果不存在

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
对象存储OBS结果表 - 数据湖探索 DLI

t文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。更多信息参考文件系统

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

forcePartitionPredicatesOnPartitionedTable.enabled”，值设置为“false”。图1 参数设置上述步骤参数设置完成后，则可以进行全表查询，不用查询表的时候要包含分区字段。父主题： DLI数据库和表类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
ClickHouse结果表 - 数据湖探索 DLI

该场景需要与ClickHouse建立增强型跨源连接，并根据实际情况设置ClickHouse集群所在安全组规则中的端口。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka - 数据湖探索 DLI
Upsert Kafka - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
查询所有作业 - 数据湖探索 DLI

false } ] } 状态码状态码如表6所示。表6 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： SQL作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
增强型跨源连接权限管理 - 数据湖探索 DLI

作介绍对增强型跨源连接授权或回收权限的操作步骤。如果被授权的项目属于相同区域（region）的不同用户，则需使用被授权项目所属的用户账号进行登录。如果被授权的项目属于相同区域（region）的同一用户，则需使用当前账号切换到对应的项目下。应用示例项目B需要访问项目A上的数据源，对应操作如下。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Hudi常见配置参数 - 数据湖探索 DLI

COPY_ON_WRITE hoodie.datasource.write.precombine.field 该值用于在写之前对具有相同的key的行进行合并去重。指定为具体的表字段 hoodie.datasource.write.payload.class 在更新过程中，该类用于提供方法

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

< 2 来识别查询能否被翻译成窗口去重。注意事项 Flink 只支持在滚动窗口、滑动窗口和累积窗口的窗口表值函数后进行窗口去重窗口去重只支持根据事件时间属性进行排序示例本示例展示了在10分钟的滚动窗口上保持最后一条记录。 -- tables must have time attribute

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
按表达式GROUP BY - 数据湖探索 DLI

按表达式GROUP BY 功能描述按表达式对表进行分组操作。语法格式 1 2 SELECT attr_expr_list FROM table_reference GROUP BY groupby_expression [, groupby_expression, ...];

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组

总条数： 677

上一页
1
...
23
24
25
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

去重 - 数据湖探索 DLI

隐式连接 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

去重 - 数据湖探索 DLI

有访问OBS对应的桶的权限，但是Spark作业访问时报错 verifyBucketExists on XXXX: status [403] - 数据湖探索 DLI

更新跨源目的端源表后，未同时更新对应跨源表，导致insert作业失败怎么办？ - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

DLI分区内表导入的文件不包含分区列的数据，导致数据导入完成后查询表数据失败怎么办？ - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

Upsert Kafka - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

增强型跨源连接权限管理 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

按表达式GROUP BY - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线