搜索_华为云

CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性 > 输入kafka的地址 > 测试）。如果能

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi存储结构 - 数据湖探索 DLI
Hudi存储结构 - 数据湖探索 DLI

Hudi存储结构 Hudi在写入数据时会根据设置的存储路径、表名、分区结构等属性生成Hudi表。在DLI环境，Hudi表的数据文件存储在OBS上，因此可以通过查看OBS文件检查。如下，展示了Hudi 多级分区COW表存储结构的示意。 hudi_table ├── .hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
离线Compaction配置 - 数据湖探索 DLI

分别配置不同的资源执行来节省资源使用。执行资源 Compaction调度的间隔应小于Compaction计划生成的间隔，例如1小时左右生成一个Compaction计划的话，执行Compaction计划的调度任务应该至少半小时调度一次。 Compaction作业配置的资源，vco

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

sum(expression) FROM table; 注意事项所要分组的表必须是已经存在的表，否则会出错。不同于ROLLUP，GROUPING SETS目前仅支持一种格式。示例根据group_id与job两个字段生成交叉表格行，返回每种聚合情况下的salary总和。 1 2 3 SELECT group_id

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

该示例是从Kafka的一个topic中读取数据，并使用Kafka结果表将数据写入到kafka的另一个topic中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
CSS安全集群配置 - 数据湖探索 DLI

此处设置keystore.jks文件的位置以及进入这个文件的密钥。在准备工作中生成的keystore.jks文件需要先放到OBS桶中，然后填入ak和sk以及jks文件的具体位置。最后在“es.net.ssl.keystore.pass”填入进入文件的密钥。 .option("es.net

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
ROLLUP - 数据湖探索 DLI
ROLLUP - 数据湖探索 DLI

sum(expression) FROM table; 注意事项所要分组的表必须是已经存在的表，否则会出错。示例根据group_id与job两个字段生成聚合行、超聚合行和总计行，返回每种聚合情况下的salary总和。 1 2 3 SELECT group_id, job, SUM(salary)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

Checkpoint保存的OBS桶。手工停止Flink作业后，再次启动该Flink作业怎样从指定Checkpoint恢复。解决方案由于Flink Checkpoint和Savepoint生成机制及格式一致，因此可以通过Flink作业列表“操作”列中的“更多 > 导入保存点”，

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业咨询类
SELECT - 数据湖探索 DLI
SELECT - 数据湖探索 DLI

SETS 的 GROUP BY 子句可以生成一个等效于由多个简单 GROUP BY 子句的 UNION ALL 生成的结果集，并且其效率比 GROUP BY 要高。 ROLLUP与CUBE按一定的规则产生多种分组，然后按各种分组统计数据。 CUBE生成的结果集显示了所选列中值的所有组合的聚合。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
如何合并小文件 - 数据湖探索 DLI

如何合并小文件使用SQL过程中，生成的小文件过多时，会导致作业执行时间过长，且查询对应表时耗时增大，建议对小文件进行合并。推荐使用临时表进行数据中转自读自写在突发异常场景下存在数据丢失的风险执行SQL： INSERT OVERWRITE TABLE tablename select

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建Kerberos跨源认证 - 数据湖探索 DLI

创建Kerberos跨源认证操作场景通过在DLI控制台创建的Kerberos类型的跨源认证，将数据源的认证信息存储到DLI，无需在SQL作业中配置账号密码，安全访问数据源。 MRS Kafka开启Kerberos认证，未开启SSL认证时，创建Kerberos类型的认证。建表时通过krb_auth_name关联跨源认证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。 number-of-rows 否无 Long 生成数据的总行数。默认条件下，不限制生成数据的总行数。如果有字段生成器类型为序列生成器，则

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

length”字段指定长度。random是无界的生成器。 sequence生成器，您可以通过“fields.#.start”和“fields.#.end”指定序列的起始和结束值。sequence是有界的生成器，当序列数字达到结束值，读取结束。 fields.#.min 否 '#'号指定的字段类型的最小值 '#'号指定的字段类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
二进制函数和运算符 - 数据湖探索 DLI

使用给定的key计算二进制块的HMAC值（采用 sha1）。 hmac_sha256(binary, key) → varbinary 使用给定的key计算二进制块的HMAC值（采用 sha256）。 hmac_sha512(binary, key) → varbinary 使用给定的key计算二进制块的HMAC值（采用

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Hudi表使用约束 - 数据湖探索 DLI

1.0 0.11.0 如何判断队列支持的计算引擎版本：首先进入DLI的控制台界面，点击左侧菜单栏的”资源管理”-> ”队列管理”。在队列管理的界面筛选并选中需要查询的队列，随后点击窗口底部的窗格，展开隐藏的队列详情页面，在支持版本即可查看可用的计算引擎版本。对于SQL队列，无法切换

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

"{{myAk}}", sk = "{{mySk}}" ); 数据最终在OBS中的存储目录结构为：obs://obs-sink/car_infos/day=xx/part-x-x。数据生成后，可通过如下SQL语句建立OBS分区表，用于后续批处理：创建OBS分区表。 1 2

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
DWS维表（不推荐使用） - 数据湖探索 DLI

并将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
BI工具连接DLI方案概述 - 数据湖探索 DLI

BI工具是数据分析的强大助手，提供数据可视化、报表生成和仪表板创建等功能。 DLI服务通过对数据的融合分析处理，可以为BI工具提供标准的、有效的高质量数据，供给后续的数据统计分析使用。通过连接到DLI，BI工具可以更加灵活的使用DLI访问和分析数据，帮助企业快速做出基于数据的决策。 DLI为BI工具提供了便捷的连接方法：

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 196

上一页
1
2
3
4
5
...
10
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

CSV Format - 数据湖探索 DLI

Hudi存储结构 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

ROLLUP - 数据湖探索 DLI

手动停止了Flink作业，再次启动时怎样从指定Checkpoint恢复？ - 数据湖探索 DLI

SELECT - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何合并小文件 - 数据湖探索 DLI

创建Kerberos跨源认证 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

BI工具连接DLI方案概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线