搜索_华为云

使用Hive语法创建DLI表 - 数据湖探索 DLI

db_name 否 Database名称。由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 是 Database中的表名。由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。匹配规则为：^(?!_)(?![0-9]+

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述数据类型是数据的一个基本属性，用于区分不同类型的数据。不同的数据类型所占的存储空间不同，能够进行的操作也不相同。数据库中的数据存储在表中。表中的每一列都定义了数据类型，用户存储数据时，须遵从这些数据类型的属性，否则可能会出错。 DLI当前只支持原生数据类型。父主题：数据类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型
关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表如果需要关联OBS桶中嵌套的JSON格式数据，可以使用异步模式创建表。以下是一个示例的建表语句，展示了如何使用 JSON 格式选项来指定 OBS 中的路径： create table tb1 using json options(path

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

关键字 PARTITION BY：可以用一个或多个键分区。和GROUP BY子句类似，PARTITION BY将表按分区键分区，每个分区是一个窗口，窗口函数作用于各个分区。单表分区数最多允许7000个。 ORDER BY：决定窗口函数求值的顺序。可以用一个或多个键排序。通过AS

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复什么是从checkpoint恢复？ Flink Checkpoint 是一种容错恢复机制。这种机制保证了实时程序运行时，遇到异常或者机器问题时能够进行自我恢复。从checkpoint恢复的原则通常当作业执行失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

OPTIMIZE 命令功能 OPTIMIZE命令用于优化数据在存储中的布局，提高查询速度。注意事项由于Optimize是一项耗时的活动，因此需要根据更好的最终用户查询性能与优化计算时间之间的权衡来确定运行Optimized的频率。分区表优化需要设置参数spark.sql.f

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
显示已授权限 - 数据湖探索 DLI

语法格式 1 SHOW GRANT USER user_name ON resource; 关键字 USER：限定后面的user_name是一个用户。注意事项 resource可以是queue、database、table、column、view，格式分别为： queue的格式为：queues

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据权限相关
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

列。否则优化器无法翻译。 Flink 使用 ROW_NUMBER() 移除重复数据，就像窗口TopN一样。理论上，窗口是一种特殊的窗口 Top-N：N是1并且是根据处理时间或事件时间排序的。更多介绍和使用请参考开源社区文档：窗口去重。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
创建指定地址连通性测试请求 - 数据湖探索 DLI

说明 is_success 是 Boolean 请求执行是否成功。“true”表示请求执行成功。 message 是 String 系统提示信息，执行成功时，信息可能为空。 task_id 是 Integer 请求id。请求示例测试队列与该地址“iam.xxx.com:443”的连通性。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

SQL权限管理或者IAM鉴权管理DLI元数据的权限 DLI SQL权限管理：在“数据湖探索 > 数据管理 > 库表管理”页面，搜索要授权的库/表。单击表操作列的“权限管理”，即可查看当前库/表授权信息或者新增授权。更多信息请参考在DLI控制台管理数据库资源。 IAM鉴权：参考权

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

桶保存作业日志和Checkpoint。但是运行该Flink SQL作业的IAM用户没有OBS写入权限导致该问题。解决方案登录IAM控制台页面，单击“用户”，在搜索框中选择“用户名”，输入运行作业的IAM用户名。单击查询到用户名，查看该用户对应的用户组。单击“用户组”，输入

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

by sum desc查询具体是哪些key引起的数据倾斜。然后对于倾斜Key单独做处理，加盐让其先将他分为多个task分别统计，最后再对分开统计结果进行结合统计。例如：如下SQL示例，假设已知倾斜key为'Key01',导致单个task处理大量数据，做如下处理： SELECT

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
CASE搜索函数 - 数据湖探索 DLI
CASE搜索函数 - 数据湖探索 DLI

n] END; 关键字 boolean_expression：可以包含子查询，但整个boolean_expression表达式返回值只能是布尔类型。注意事项如果没有取值为TRUE的Boolean_expression，则当指定ELSE子句时，DLI将返回else_resul

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > CASE...WHEN
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

access_id和secret_key 是 AK/SK认证密钥。 - queue 是 DLI服务的队列名称。 dli_test database 是数据目录名称。默认使用dli数据目录。如果使用Lakeformation元数据，填写具体的数据目录名称。 dli schema 是提交作业使用的DLI的数据库名称。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
创建弹性资源池并添加队列 - 数据湖探索 DLI

务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
添加增强型跨源连接的路由信息 - 数据湖探索 DLI

可以根据需要添加自定义路由规则，将指向目的地址的流量转发到指定的下一跳地址。了解更多路由相关信息请参考路由表。创建增强型跨源时的路由表是数据源子网关联的路由表。添加路由信息页的路由是弹性资源池子网关联的路由表中的路由。数据源子网与弹性资源池所在子网为不同的子网，否则会造成网段冲突。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
DLI Delta元数据 - 数据湖探索 DLI

SQL权限管理或者IAM鉴权管理DLI元数据的权限 DLI SQL权限管理：在“数据湖探索 > 数据管理 > 库表管理”页面，搜索要授权的库/表。单击表操作列的“权限管理”，即可查看当前库/表授权信息或者新增授权。更多信息请参考在DLI控制台管理数据库资源。 IAM鉴权：参考权

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > DLI中使用Delta开发作业
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

存储计费 DLI数据存储计费模式存储资源是DLI服务内部的存储资源，用于存储数据库和DLI表。支持以下计费模式：按需计费：按需计费是一种后付费模式，DLI支持使用按需计费模式购买数据存储。按照存储在DLI服务中的数据存储量（单位为“GB”）收取存储费用。计费方式自创建起按自然

 帮助中心 > 数据湖探索 DLI > 计费说明

总条数： 551

上一页
1
...
7
8
9
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hive语法创建DLI表 - 数据湖探索 DLI

概述 - 数据湖探索 DLI

关联OBS桶中嵌套的JSON格式数据如何创建表 - 数据湖探索 DLI

OVER - 数据湖探索 DLI

Flink作业重启后，如何判断是否可以从checkpoint恢复 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

显示已授权限 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

创建指定地址连通性测试请求 - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

CASE搜索函数 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

添加增强型跨源连接的路由信息 - 数据湖探索 DLI

DLI Delta元数据 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线