搜索_华为云

查看Flink作业详情 - 数据湖探索 DLI

过Flink作业列表可以了解Flink作业的基本信息。表2 Flink作业基本信息参数参数说明 ID 所提交Flink作业的ID，由系统默认生成。名称所提交Flink作业的名称。类型所提交Flink作业的类型。包括： Flink SQL：Flink SQL作业 Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
创建增强型跨源连接 - 数据湖探索 DLI

详细的入方向规则参数说明请参考表3。图2 添加入方向规则表3 入方向规则参数说明参数说明取值样例优先级安全组规则优先级。优先级可选范围为1-100，默认值为1，即最高优先级。优先级数字越小，规则优先级级别越高。 1 策略安全组规则策略。允许协议端口网络协议。目前支持“All”、“

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
Hudi数据表Clean规范 - 数据湖探索 DLI

ompaction.delta_commits的值）。 MOR表下游采用流式计算，历史版本保留小时级。如果MOR表的下游是流式计算，例如Flink流读，可以按照业务需要保留小时级的历史版本，这样的话近几个小时之内的增量数据可以通过log文件读出，如果保留时长过短，下游flink

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

注意事项 Hive方言只能用于操作Hive对象，并要求当前Catalog是一个HiveCatalog 。 Hive方言只支持db.table这种两级的标识符，不支持带有Catalog名字的标识符。更多信息请参考Apache Flink Hive Read & Write。虽然所有Hiv

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

ODBC，推荐使用v2.5.12。 Microsoft Hive ODBC，推荐使用v2.6.12.1012。配置ODBC连接Kyuubi 在Windows系统中，打开“控制面板 > 管理工具 > 数据源 (ODBC)”。配置新的ODBC数据源。在ODBC中单击“User DSN”。单击“Add”创建新的数据源。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

ODBC，推荐使用v2.5.12。 Microsoft Hive ODBC，推荐使用v2.6.12.1012。配置ODBC连接Kyuubi 在Windows系统中，打开“控制面板 > 管理工具 > 数据源 (ODBC)”。配置新的ODBC数据源。在ODBC中单击“User DSN”。单击“Add”创建新的数据源。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
在DLI控制台创建数据库和表 - 数据湖探索 DLI

会优先指向文件而非文件夹。创建数据库和表时，有权限控制，需要对其他用户授权，其他用户才可查看该用户新建的数据库和表。具体请参考常用操作与系统权限关系。创建数据库创建数据库的入口有两个，分别在“数据管理”和“SQL编辑器”页面。在“数据管理”页面创建数据库。在管理控制台左侧，单击“数据管理”>“库表管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

MRS集群上创建Kafka的Topic并且向Topic发送消息。参考访问MRS Manager登录MRS Manager。在MRS Manager上，选择“系统 > 权限 > 用户”，单击“添加用户”，在添加用户页面分别配置如下参数。用户名：自定义的用户名。当前示例输入为：testuser2。用户类型：当前选择为“人机”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

csv的分隔符，转义符等。当OBS桶目录下有文件夹和文件同名时，加载数据会优先指向该路径下的文件而非文件夹。建议创建OBS对象时，在同一级中不要出现同名的文件和文件夹。导出数据 DLI提供导出数据的接口。您可以使用该接口将DLI表中的数据导出到OBS中。示例代码如下： 1

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > SQL作业相关
函数概览 - 数据湖探索 DLI
函数概览 - 数据湖探索 DLI

javahash(string a) STRING 返回hash值。 max_pt max_pt(<table_full_name>) STRING 返回分区表的一级分区中有数据的分区的最大值，按字母排序，且读取该分区下对应的数据。 ordinal ordinal(bigint <nth>, <var1>

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
产品规格 - 数据湖探索 DLI
产品规格 - 数据湖探索 DLI

DLI提供的弹性资源池规格如表1所示。表1 弹性资源池规格类型规格约束限制适用场景基础版 16-64CUs规格不支持高可靠与高可用。不支持设置队列属性和作业优先级。不支持对接Notebook实例。其他弹性资源池使用相关约束限制请参考弹性资源池使用约束限制。适用于对资源消耗不高、对资源高可靠性和高可用性要求不高的测试场景。

帮助中心 > 数据湖探索 DLI > 产品介绍
Hudi表索引设计规范 - 数据湖探索 DLI

实时入湖场景中，Spark引擎采用Bucket索引，Flink引擎可以用Bucket索引或者状态索引。实时入湖都是需要分钟内或者分钟级的高性能入湖，索引的选择会影响到写Hudi表的性能。在性能方面各个索引的区别如下： Bucket索引优点：写入过程中对主键进行hash分桶

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

Flink 1.15版本新增读写Hive、Hudi等Connector。更多Flink 1.15版本的优势请参考Flink 1.15升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

CDC源表、Redis源表、Upsert Kafka源表、Hbase源表更多升级Flink 1.12版本的优势请参考Flink 1.12升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

访问MySQL集群填写"数据库名.表名"，访问PostGre集群填写"模式名.表名"。说明：如果数据库和表不存在，请先创建数据库和表，否则系统会报错并且运行失败。 user RDS数据库用户名。 password RDS数据库用户名对应密码。 driver jdbc驱动类名，访问MySQL集群请填写："com

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

图2 进入DataArts Studio实例控制台单击“空间管理”，进入数据开发页面。购买DataArts Studio实例的用户，系统将默认为其创建一个默认的工作空间“default”，并赋予该用户为管理员角色。您可以使用默认的工作空间，也可以参考本章节的内容创建一个新的工作空间。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
使用CES监控DLI服务 - 数据湖探索 DLI

queue_max_cu_num 队列最大CU 展示用户队列中的最大CU。 ≥0 队列 5分钟 queue_priority 队列优先级展示用户队列的优先级。 1~100 队列 5分钟 queue_cpu_usage 队列CPU使用率展示用户队列的CPU使用率。该指标仅适用于普通队列。

帮助中心 > 数据湖探索 DLI > 用户指南
禁止或恢复表的生命周期 - 数据湖探索 DLI

周期后因使用之前的配置导致数据被误回收。 disable 否禁止表或指定分区的生命周期功能。禁止表本身及其所有分区被生命周期回收，优先级高于恢复表分区生命周期。即当使用禁止表或指定分区的生命周期功能时，设置待禁止或恢复生命周期的表的分区信息是无效的。禁止表的生命周期功能后，

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
Hudi表分区设计规范 - 数据湖探索 DLI

各个分区的数据量是会有波动的，分区下桶的个数设计一般会按照最大分区数据量计算，这样会出现越细粒度的分区，桶的个数会冗余越多。例如：采用天级分区，平均的日增数据量是3GB，最多一天的日志是8GB，这个会采用Bucket桶数= 8GB/2GB = 4 来创建表；每天的更新数据占比较

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建DLI表关联DCS - 数据湖探索 DLI

访问DCS时，不支持复杂类型数据（Array、Struct、Map等）。可以考虑以下几种方式进行复杂类型数据处理：字段扁平化处理，将下一级的字段展开放在同一层Schema字段中。使用二进制方式进行写入与读取，并通过自定义函数进行编解码。示例指定table 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表

总条数： 433

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查看Flink作业详情 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

函数概览 - 数据湖探索 DLI

产品规格 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

使用CES监控DLI服务 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线