搜索_华为云

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

incremental.collect kyuubi会预加载select结果数据到缓存加快读取数据，数据量较大的场景防止内存OOM建议关闭。否 false 配置为false代表关闭预加载。 kyuubi.engine.jdbc.memory jdbc engine进程内存默认为1g，建议改成5g以上加大jdbc

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
实时任务接入 - 数据湖探索 DLI

//异步clean关闭 'hoodie.archive.automatic' = 'false', //自动archive关闭 'hoodie.clean.automatic'

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Hudi常见配置参数 - 数据湖探索 DLI

Hudi常见配置参数本章节介绍Hudi重要配置的详细信息，更多配置请参考hudi官网：https://hudi.apache.org/cn/docs/0.11.0/configurations/。提交DLI Spark SQL作业时，在SQL编辑器界面右上角的”设置”->”参数设置”中可以配置Hudi参数。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
修改表 - 数据湖探索 DLI
修改表 - 数据湖探索 DLI

修改表添加列修改列注释开启或关闭数据多版本父主题：表相关

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提升写入数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。注意："sink.buffer-flush

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
DWS结果表（不推荐使用） - 数据湖探索 DLI

它能提升写入数据的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。 sink.buffer-flush.interval 否 1s Duration 刷新缓存的间隔，在这段时间内以异步线程刷新数据。它能提升写入数据库的性能，但是也可能增加延迟。设置为 "0" 关闭此选项。注意："sink.buffer-flush

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

在GaussDB(DWS) 控制台设置会话闲置超时时长session_timeout，在闲置会话超过所设定的时间后服务端将主动关闭连接。 session_timeout默认值为600秒，设置为0表示关闭超时限制，一般不建议设置为0。 session_timeout设置方法如下：登录GaussDB(DWS)

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
设置多版本备份数据保留周期 - 数据湖探索 DLI

修改分区表时，也可以设置表属性“dli.multi.version.retention.days”调整保留周期。开启和关闭多版本功能SQL语法请参考开启或关闭数据多版本。 DLI数据多版本功能当前仅支持通过Hive语法创建的OBS表，具体建表SQL语法可以参考使用Hive语法创建OBS表。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

本节操作介绍适用增强型跨源连接配置DLI与内网数据源的网络联通的操作指导。创建增强型跨源连接网络不通的问题，可以根据本指导的整体流程和步骤进行排查验证。整体流程图1 增强型跨源连接配置流程前提条件已创建DLI队列。创建队列详见创建DLI队列操作指导。队列的计费类型必须为：“包年

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
Elasticsearch结果表 - 数据湖探索 DLI

若开启安全模式，开启https：方法1：推荐使用CSS类型跨源认证名称，并配置es_auth_name为跨源认证的名称。请注意该场景hosts字段值以https开头。方法2：不使用跨源认证，但需要配置用户名username、密码password、证书位置certificat

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
正则表达式函数 - 数据湖探索 DLI

14m','(\d+)([a-z]+)',2);-- 'a' regexp_like(string, pattern) → boolean 描述：验证字符串是否包含满足正则表达式的子串，如果有，返回true。 SELECT regexp_like('1a 2b 14m','\d+b');--

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
在Spark SQL作业中使用UDF - 数据湖探索 DLI

将生成的UDF函数Jar包文件上传到OBS目录下。 5 创建DLI的UDF函数 DLI控制台在DLI控制台的SQL作业管理界面创建使用的UDF函数。 6 验证和使用DLI的UDF函数 DLI控制台在DLI作业中使用创建的UDF函数。操作步骤新建Maven工程，配置pom文件。以下通过IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
故障处理 - 数据湖探索 DLI
故障处理 - 数据湖探索 DLI

故障处理运行Spark作业，作业运行失败，作业日志中提示No respond错误问题现象运行Spark作业，作业运行失败，作业日志中提示No respond错误解决方案重新创建Spark作业，创建作业时需要在“Spark参数（--conf）”中添加配置：“spark.sql

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
FileSystem结果表 - 数据湖探索 DLI

策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
查看Flink作业详情 - 数据湖探索 DLI

保存作业日志开启或关闭。作业异常告警开启或关闭。 SMN主题作业配置的SMN主题名称。当作业勾选了“作业异常告警”参数时显示。异常自动重启开启或关闭。异常重试最大次数异常重试最大次数为无限时显示为“无限”，其余为设置的具体值。从Checkpoint恢复开启或关闭。 ID 作业ID。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询OpenTSDB表 - 数据湖探索 DLI
查询OpenTSDB表 - 数据湖探索 DLI

查询OpenTSDB表 SELECT命令用于查询OpenTSDB表中的数据。若OpenTSDB上不存在metric，查询对应的DLI表会报错。若OpenTSDB开了安全模式，则访问时，需要设置conf:dli.sql.mrs.opentsdb.ssl.enabled=true

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接OpenTSDB表
对象存储OBS结果表 - 数据湖探索 DLI

策略来创建其他Part文件。对于Row Formats默认的策略是根据Part文件大小进行滚动，需要指定文件打开状态最长时间的超时以及文件关闭后的非活动状态的超时时间。对于Bulk Formats在每次创建Checkpoint时进行滚动，并且用户也可以添加基于大小或者时间等的其他条件。更多信息参考文件系统

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

compaction.async.enabled 否 false Boolean 是否开启在线压缩。 true：开启 false：关闭建议关闭在线压缩，提升性能。但是调度compaction.schedule.enabled仍然建议开启，之后可通过离线异步压缩，执行阶段性生成的压缩plan。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hudi数据表Compaction规范 - 数据湖探索 DLI

'clean.async.enabled' = 'false' // 关闭Clean操作 'hoodie.archive.automatic' = 'false' // 关闭Archive操作 Spark离线完成Compaction计划的执行，以及Clean和Archive操作

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

OPTIONS('FILEHEADER'='column1,column2') ESCAPECHAR：如果用户想在CSV上对Escape字符进行严格验证，可以提供Escape字符。默认值为“\\”。配置项为OPTIONS('ESCAPECHAR'='\\') 如果在CSV数据中输入ESC

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关

总条数： 154

上一页
1
2
3
4
5
...
8
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

配置Tableau通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

实时任务接入 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

修改表 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 - 数据湖探索 DLI

设置多版本备份数据保留周期 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

正则表达式函数 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

故障处理 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

查询OpenTSDB表 - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线