搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com.huawei.demo”，完成后回车。图7 自定义Package

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量、修改全局变量和查询所有全局变量。增强型跨源连接相关API 包括创建增强型跨源连接、删除增强型跨源连接、查询增强型跨源连接列表、查询增强型跨源连接、绑定队列、解绑队列、修改主机信息和查询增强型跨源授权信息。

帮助中心 > 数据湖探索 DLI > API参考
OPTIMIZE - 数据湖探索 DLI
OPTIMIZE - 数据湖探索 DLI

参数描述表1 参数描述参数描述 database_name Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 boolExpression 过滤条件表达式。 columnList z排序指定的字段列表，Z顺序列应与分区列不同。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

通过IAM，您可以在华为云账号中给员工创建IAM用户，并使用策略来控制他们对华为云资源的访问范围。目前包括角色（粗粒度授权）和策略（细粒度授权）。具体的权限介绍和授权操作请参考《数据湖探索用户指南》。创建队列。在“资源管理 > 队列管理”下，单击右上角“购买队列”，进入购买队列页面

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

dli-spark-demo：开发Spark作业时的样例代码参考。具体如下： “dli-spark-demo-obs”读取和写入OBS数据。 “dli-spark-demo-redis”读取和写入Redis数据。 dli-pyspark-demo：使用Python语言开发Spark作业。例如，样例

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
使用前必读 - 数据湖探索 DLI
使用前必读 - 数据湖探索 DLI

现海量数据的秒级交互式查询。 DLI+HetuEngine能够快速处理大规模数据集的查询请求，迅速和高效从大数据中提取信息，极大地简化了数据的管理和分析流程，提升大数据环境下的索引和查询性能。 TB级数据秒级响应： HetuEngine通过自动优化资源与负载的配比，能够对TB级数

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

参数描述表1 参数描述参数描述 database_name Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 obs_path Obs路径，表示Delta表的存储位置。 timestamp_expression

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
SHALLOW CLONE - 数据湖探索 DLI
SHALLOW CLONE - 数据湖探索 DLI

目标Database名称，由字母、数字和下划线（_）组成。 target_table 目标表名，由字母、数字和下划线（_）组成。 source_db 源Database名称，由字母、数字和下划线（_）组成。 source_table 源表名，由字母、数字和下划线（_）组成。 bucket_name

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
查询Flink作业日志 - 数据湖探索 DLI

单击需要查看的作业名称，进入“作业详情”页面。在“运行日志”页签，可以查看运行中作业的JobManager和TaskManager信息。图4 Flink作业运行日志 JobManager和TaskManager信息每分钟刷新一次，默认展示最近一分钟的运行日志。如果作业配置了保存作业日

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

value1 and column2<= value2) or column3 != value3 过滤条件为like 和 not like，支持前缀，后缀和包含匹配例如： 1 select * from tableName where column1 like "%value"

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
对象存储OBS源表 - 数据湖探索 DLI

次。已处理的文件在 source 的整个生命周期内存储在 state 中，因此，source 的 state 在 checkpoint 和 savepoint 时进行保存。更短的时间间隔意味着文件被更快地发现，但也意味着更频繁地遍历文件系统/对象存储。如果未设置此配置选项，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

15升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink 1.15版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。在DLI管理控制台，单击“作业管理 > Flink作业”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

12升级指导。切换至新版本计算引擎对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到Flink 1.12版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。在DLI管理控制台，单击“作业管理 > Flink作业”。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

保留期到期后，若您仍未支付账户欠款，那么资源将被释放，数据无法恢复。华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于充值的详细操作请参见账户充值。按需计费模式和套餐包组合使用 DLI支持套餐包和按需计费模式结合使用。购买了套餐包时，按需使用过程中优先抵扣套餐包的规格额度，超过额度的使用量按需计费。

帮助中心 > 数据湖探索 DLI > 计费说明
Spark Jar作业开发指南 - 数据湖探索 DLI

Spark Jar作业开发指南使用Spark Jar作业读取和查询OBS数据使用Spark作业访问DLI元数据使用Spark作业跨源访问数据源 Spark Jar 使用DEW获取访问凭证读写OBS 获取Spark作业委托临时凭证用于访问其他云服务

 帮助中心 > 数据湖探索 DLI > 开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com.huawei.demo”，完成后回车。图7 自定义Package

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN 操作倾斜在执行表JOIN操作时，参与JOIN的键在某个表中分布极不均匀，导致大量数据集中

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

表1 VACUUM参数参数描述 database_name Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Multi-INSERT语句查询性能提升。切换至新版本对DLI资源价格是否有影响？ DLI按作业运行所需的计算资源和存储资源计费，与计算引擎版本无关。如何升级到DLI Spark 3.1.1版本？在DLI管理控制台，购买弹性资源池和队列资源，用于提供执行作业所需的计算资源。单击“作业管理 > Spark作业”，新建Spark作业。

帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告
创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

证。 MRS Kafka开启Kerberos认证，同时开启了SSL认证时，需要同时创建Kerberos和Kafka_SSL类型的认证。建表时分别通过krb_auth_name和ssl_auth_name关联跨源认证。 MRS Kafka未开启Kerberos认证，仅开启了SASL

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证

总条数： 658

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

OPTIMIZE - 数据湖探索 DLI

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

怎样获取DLI作业样例（Demo） - 数据湖探索 DLI

使用前必读 - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

SHALLOW CLONE - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

DLI Flink 1.10、Flink 1.11版本停止服务（EOS）公告 - 数据湖探索 DLI

DLI Flink1.7版本停止服务（EOS）公告 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

Spark Jar作业开发指南 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

创建Kafka_SSL类型跨源认证 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线