搜索_华为云

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

Livy工具配置文件上传指定的DLI Livy工具jar资源包到OBS桶路径下。登录OBS控制台，在指定的OBS桶下创建一个存放Livy工具jar包的资源目录。例如：“obs://bucket/livy/jars/”。进入3.a中DLI Livy工具所在ECS服务器的安装目录，获取以下jar包，将获取的jar包上传到1

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
GROUP BY - 数据湖探索 DLI
GROUP BY - 数据湖探索 DLI

GROUP BY GROUP BY GROUP BY将SELECT语句的输出行划分成包含匹配值的分组。简单的GROUP BY可以包含由输入列组成的任何表达式，也可以是按位置选择输出列的序号。以下查询是等效的： SELECT count(*), nationkey FROM customer

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

save() 表1 redis操作参数参数描述 host 需要连接的redis集群的IP。获取方式为：登录华为云官网，之后搜索redis，进入“分布式缓存服务”,接着选择“缓存管理”，根据主机名称需要的IP，可选择其中任意一个IP进行复制即可（其中也包含了port信息），请参考图1。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

表1 参数描述参数描述 tableIdentifier Hudi表的名称。 tablelocation Hudi表的存储路径。 hoodie.archive.file.cleaner.policy 清理归档文件的策略：目前仅支持KEEP_ARCHIVED_FILES_BY_SIZ

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

String USER_BUCKET_NAME为用户的桶名，需要进行替换为用户的使用的OBS桶名。参数的值为用户定义在CSMS通用凭证中的键key，其Key对应的value为用户的AK（Access Key Id），需要具备访问OBS对应桶的权限。 flink.hadoop.fs.obs

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
GROUPING SETS - 数据湖探索 DLI
GROUPING SETS - 数据湖探索 DLI

sum(expression) FROM table; 注意事项所要分组的表必须是已经存在的表，否则会出错。不同于ROLLUP，GROUPING SETS目前仅支持一种格式。示例根据group_id与job两个字段生成交叉表格行，返回每种聚合情况下的salary总和。 1 2 3 SELECT group_id

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
数学函数和运算符 - 数据湖探索 DLI

返回x的以2为底的对数 select log2(4);-- 2.0 log10(x) → double 返回x的以10为底的对数 select log10(1000);-- 3.0 log(b, x) → double 返回x的以b为底的对数 select log(3,81); -- 4.0 mod(n

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
配置Flink作业权限 - 数据湖探索 DLI

赋权：当前用户可将作业的权限赋予其他用户。回收：当前用户可回收其他用户具备的该作业的权限，但不能回收该作业所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该作业的权限。为已有权限的用户赋予权限或回收权限。在对应作业“用户权限信息”区域的用户列表中，选择需要

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

proctime表示table1的proctime处理时间属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

proctime表示table1的proctime处理时间属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
SQL作业运行慢如何定位 - 数据湖探索 DLI

参考图10可以看到数据倾斜时，单个任务的shuffle数据远大于其他Task的数据，导致该任务耗时时间变长。图10 数据倾斜示例图数据倾斜原因和解决： Shuffle的数据倾斜基本是由于join中的key值数量不均衡导致。对join连接条件进行group by 和count，统计每个连接条件的key值的数量。示例如下：

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Flink 1.15版本说明 - 数据湖探索 DLI

Flink Jar作业最小化提交是指Flink仅提交作业必须的依赖项，而不是整个Flink环境。通过将非Connector的Flink依赖项（以flink-开头）和第三方库（如Hadoop、Hive、Hudi、Mysql-cdc）的作用域设置为provided，可以确保这些依赖项不会被

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表）功能描述指定筛选条件删除分区表的一个或多个分区。注意事项该命令仅支持操作OBS表，不支持对DLI表进行操作。所要删除分区的表必须是已经存在的表，否则会出错。所要删除的分区必须是已经存在的，否则会出错，可通过语句中添加“IF EXISTS”避免该错误。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

用于展示表或分区的详细信息。可以使用规则运算表达式来同时匹配多个表，但不可用于匹配分区。展示的信息将包括表的基本信息和相关的文件系统信息，其中文件系统信息包括总文件数、总文件大小、最大文件长度、最小文件长度、最后访问时间以及最后更新时间。如果指定了分区，将给出指定分区的文件系统信息，而不是分区所在表的文件系统信息。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
弹性资源池权限管理 - 数据湖探索 DLI

回收：当前用户可回收其他用户具备的该弹性资源池的权限，但不能回收该弹性资源池所有者的权限。查看其他用户具备的权限：当前用户可查看其他用户具备的该弹性资源池的权限。为已有权限的用户赋予权限或回收权限。在对应弹性资源池“权限信息”区域的用户列表中，选择需要修改权限的用户，在“操作”列单击“权限设置”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DWS维表（不推荐使用） - 数据湖探索 DLI

将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
JOIN - 数据湖探索 DLI
JOIN - 数据湖探索 DLI

proctime表示table1的proctime处理时间属性(计算列) 使用FOR SYSTEM_TIME AS OF table1.proctime表示当左边表的记录与右边的维表join时，只匹配当前处理时间维表所对应的的快照数据。注意事项仅支持带有处理时间的 temporal tables

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
ADD COLUMNS - 数据湖探索 DLI
ADD COLUMNS - 数据湖探索 DLI

ullable][comment][col_position]五部分组成。 col_name：新增列名，必须指定。给嵌套列添加新的子列需要指定子列的全名称：添加新列col1到STURCT类型嵌套列users struct<name: string, age: int>，新列名称需要指定为users

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Schema演进语法说明
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据Kafka的地址测试队列连通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 499

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Livy提交Spark Jar作业 - 数据湖探索 DLI

GROUP BY - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

GROUPING SETS - 数据湖探索 DLI

数学函数和运算符 - 数据湖探索 DLI

配置Flink作业权限 - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Flink 1.15版本说明 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

SHOW TABLE/PARTITION EXTENDED - 数据湖探索 DLI

弹性资源池权限管理 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

JOIN - 数据湖探索 DLI

ADD COLUMNS - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线