搜索_华为云

java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

datasource.css。如果选择Spark版本为3.1.1时，无需选择Module模块，需在 “Spark参数（--conf)” 配置 spark.driver.extraClassPath=/usr/share/extension/dli/spark-jar/datasource/css/*

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
提交SQL作业（废弃） - 数据湖探索 DLI

SQL语句执行所在的数据库。当创建新数据库时，不需要提供此参数。 conf 否 Array of objects 用户定义适用于此作业的配置参数。目前支持的配置项： dli.sql.join.preferSortMergeJoin（是否优先使用SortMergeJoin） dli.sql

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

enabled 否 true Boolean Flink默认采用的是内存索引（使用Bueckt索引时不配置该项），需要将数据的主键缓存到内存中，保证目标表的数据唯一，因此需要配置该值，否则会导致数据重复，默认值：true。 write.index_bootstrap.tasks 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

创建自定义镜像以tensorflow为例，说明如何将tensorflow打包进镜像，生成安装了tensorflow的自定义镜像，在DLI作业中使用该镜像运行作业。准备容器环境。请参考安装容器引擎文档中的“安装容器引擎”章节。使用root用户登录1容器镜像环境，执行以下命令获取DLI的基础镜像。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
Hudi表索引设计规范 - 数据湖探索 DLI

文件的footer中。 Bucket索引：在写入数据过程中，通过主键进行Hash计算，将数据进行分桶写入；该索引写入速度最快，但是需要合理配置分桶数目；Flink、Spark均支持该索引写入。状态索引：Flink引擎独有索引，是将行记录的存储位置记录到状态后端的一种索引形式，在

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
ClickHouse结果表 - 数据湖探索 DLI

口：登录MRS管理控制台，选择“集群名称 > 组件管理 > ClickHouse > 服务配置”，角色选择“ClickHouseBalancer”，搜索“lb_http_port”配置参数值。默认为：21425。数据库名为ClickHouse集群创建的数据库名称。 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
查看队列的基本信息 - 数据湖探索 DLI

要的队列资源。单击查看队列的详细信息。关于队列引擎相关字段的含义：执行引擎：负责执行队列中任务的引擎类型。默认版本：执行引擎的默认配置版本，或者是在没有指定特定版本时系统将使用的版本。支持版本：执行引擎支持的所有版本列表。通过查看队列的支持版本，您可以了解哪些版本的执行引擎可以用于处理队列中的任务。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
创建弹性资源池 - 数据湖探索 DLI

队列的标签，使用标签标识云资源。包括“标签键”和“标签值”，具体请参考表3。 label 否 map 弹性资源池属性字段。如果需要购买基础版，配置该参数值为{"spec":"basic"}。不配置该参数时默认为标准版弹性资源池。表3 tags参数参数名称是否必选参数类型说明 key 是 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
弹性资源池权限管理 - 数据湖探索 DLI

控制台。权限设置更新：当前用户可更新弹性资源池的描述信息。资源管理：当前用户可在弹性资源池上添加队列、删除队列、操作队列的扩缩容策略配置。删除：当前用户可删除此弹性资源池。规格变更：当前用户对于包年包月的弹性资源池可以执行规格变更操作。赋权：当前用户可将弹性资源池的操作权限赋予其他用户。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

缓存到Slot内存中，然后通过键将流中的每条记录与表进行关联，以确定是否找到匹配项。将最新的Hive表用作时间表不需要任何额外的配置。使用以下属性配置Hive表缓存的TTL。在缓存过期后，将重新扫描Hive表以加载最新的数据。参数默认值类型说明 lookup.join.cache

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hive维表 - 数据湖探索 DLI
Hive维表 - 数据湖探索 DLI

使用hive 方言：表属性中需要添加'is_lakehouse'='true'。创建Flink OpenSource SQL作业时，在作业编辑界面配置开启checkpoint功能。语法格式、参数说明请参考Hive源表的语法格式和参数说明。父主题： Hive

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
查询所有弹性资源池 - 数据湖探索 DLI

弹性资源池名称。 description 否 String 弹性资源池描述信息。 max_cu 否 Integer 配置的最大CU数。 min_cu 否 Integer 配置的最小CU数。 actual_cu 否 Integer 当前实际的CU数。 cidr_in_vpc 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
SQL作业使用咨询 - 数据湖探索 DLI

系统按超时取消处理。用户可以通过dli.sql.job.timeout（单位是秒）参数配置超时时间。 DLI支撑本地测试Spark作业吗? DLI暂不支持本地测试Spark作业，您可以安装DLI Livy工具，通过Livy工具提供的交互式会话能力调测Spark作业。推荐使用使用Livy提交Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

<scope> provided </scope> </dependency> 或使用exclusions标签将其排除关联。若使用到hdfs的配置文件，则需要将core-site.xml、hdfs-site.xml、yarn-site.xml 修改为mrs-core-site.xml、mrs-hdfs-site

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Spark 2.4.5版本说明 - 数据湖探索 DLI

版本主要的功能特性。更多版本新特性请参考Release Notes - Spark 2.4.5。表1 Spark 2.4.5版本优势特性说明支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

中的open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

以SQL作业为例：单击“作业管理 > SQL作业”。在作业管理控制台页面筛选使用default队列的作业。单击展开作业详情，查看作业扫描量。图1 配置费用示例计费示例价格仅供参考，实际计算请以数据湖探索价格详情中的价格为准。参考数据湖价格详情页的按数据扫描量计算计费样例。欠费影响

 帮助中心 > 数据湖探索 DLI > 计费说明
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

topic发送数据，验证kafka sink.topic能否收到数据。图8 查看作业任务图9 查看kafka sink.topic JAVA样例代码 pom文件配置 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 599

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

java样例代码 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

查看队列的基本信息 - 数据湖探索 DLI

创建弹性资源池 - 数据湖探索 DLI

弹性资源池权限管理 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Hive维表 - 数据湖探索 DLI

查询所有弹性资源池 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

SQL作业使用咨询 - 数据湖探索 DLI

Hadoop jar包冲突，导致Flink提交失败 - 数据湖探索 DLI

Spark 2.4.5版本说明 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线