搜索_华为云

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置为-1代表不限制返回的条数。是 50000 kyuubi.engine.dli.small.file.merge 配置是否开启小文件自动合并。默认为false，代表不开启。 true：开启 false：不开启是 true kyuubi.engine.dli.bi.type

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置为-1代表不限制返回的条数。是 50000 kyuubi.engine.dli.small.file.merge 配置是否开启小文件自动合并。默认为false，代表不开启。 true：开启 false：不开启是 true kyuubi.engine.dli.bi.type

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

作业列表、查询作业详情、查询作业执行计划、查询作业监控信息、批量停止作业、删除作业、批量删除作业、导出Flink作业、导入Flink作业、生成Flink SQL作业的静态流图、创建IEF消息通道、边缘Flink作业状态上报、边缘Flink作业Action回调、IEF系统事件上报。

帮助中心 > 数据湖探索 DLI > API参考
配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置为-1代表不限制返回的条数。是 50000 kyuubi.engine.dli.small.file.merge 配置是否开启小文件自动合并。默认为false，代表不开启。 true：开启 false：不开启是 true kyuubi.engine.dli.bi.type

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查询作业详情 - 数据湖探索 DLI

表4 job_config参数说明参数名称是否必选参数类型说明 checkpoint_enabled 否 Boolean 是否开启作业自动快照功能。 true：开启 false：关闭默认为“false”。 checkpoint_interval 否 Integer 快照时间间隔。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
ClickHouse结果表 - 数据湖探索 DLI

table 是要创建的ClickHouse的表名。 connector.driver 否连接数据库所需要的驱动。如果建表时不指定该参数，驱动会自动通过ClickHouse的url提取。如果建表时指定该参数，则该参数值固定为“ru.yandex.clickhouse.ClickHouseDriver”。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
自定义函数参数传递 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

'datagen', 'rows-per-second' = '1', --每秒生成一条数据 'fields.user_id.kind' = 'random', --为字段user_id指定random生成器 'fields.user_id.length' = '3' --限制user_id长度为3

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

pile”对代码进行编译。编译成功后，双击“package”对代码进行打包。图9 编译打包打包成功后，生成的Jar包会放到target目录下，以备后用。本示例将会生成到：“D:\DLITest\SparkJarMetadata\target”下名为“SparkJarMetadata-1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sql("select * from opentsdb_new_test").show(); 插入数据后：提交Spark作业将写好的代码文件生成jar包，上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

cdc-events-duplicate 设置成true，并在该source上定义PRIMARY KEY。框架会生成一个额外的有状态算子，使用该primary key来对变更事件去重并生成一个规范化的changelog流。更新信息请参考Debezium 官方文档。消费Debezium Postgres

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from dli_to_dws").show(); 插入数据后：提交Spark作业将写好的代码文件生成jar包，上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。如果选择spark版本为2.3.2（即将下线）或2

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

配置完成后，单击“立即购买”。 “虚拟私有云”为步骤1：创建VPC创建的VPC。添加路由。进入VPC的路由表，配置路由规则。通常NAT创建成功会自动创建到NAT网关的路由。目的地址为访问的公网IP地址，下一跳为NAT网关。图6 添加路由添加SNAT规则。为新建的NAT网关添加S

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。参考如何合并小文件完成合并小文件。支持修改非分区表或分区表的列注释

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
SHOW_LOG_FILE - 数据湖探索 DLI
SHOW_LOG_FILE - 数据湖探索 DLI

SHOW_LOG_FILE 命令功能查看log文件的meta和record信息。命令格式查看meta： call show_logfile_metadata(table => '[table]', log_file_path_pattern => '[log_file_path_pattern]'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

sparkSession.sql("select * from dli_to_rd").show(); 插入数据后：提交Spark作业将写好的代码生成jar包，上传至OBS桶中。在Spark作业编辑器中选择对应的Module模块并执行Spark作业。创建Spark作业完成后，在控制台

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。 clean.async.enabled 否 true Boolean COW表：设置为true MOR表，且默认开启异步压缩时（compaction

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
查询作业模板列表 - 数据湖探索 DLI

保存Spark作业的obs桶，需要保存作业时配置该参数。 auto_recovery Boolean 是否开启重试功能，如果开启，可在Spark作业异常失败后自动重试。默认值为“false”。 max_retry_times Integer 最大重试次数。最大值为“100”，默认值为“20”。 feature

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
配置SQL防御规则 - 数据湖探索 DLI

则。 DLI支持的SQL防御系统规则本节操作介绍DLI支持的系统防御规则，详细信息参考表2。系统默认创建的规则是指在队列创建时，DLI自动为您创建的SQL防御规则，该规则与队列绑定，且不支持删除。以下规则为系统默认创建的规则：Scan files number、Scan partitions

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 362

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置PowerBI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

配置Fine BI通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

典型场景示例：配置DLI 与公网网络连通 - 数据湖探索 DLI

DLI Spark 2.3.2版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

SHOW_LOG_FILE - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线