搜索_华为云

使用DLI进行电商BI报表分析 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

关联，以确定是否找到匹配项。将最新的Hive表用作时间表不需要任何额外的配置。使用以下属性配置Hive表缓存的TTL。在缓存过期后，将重新扫描Hive表以加载最新的数据。参数默认值类型说明 lookup.join.cache.ttl 60 min Duration 查找连接中构建表的缓存

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
永洪BI制作图表 - 数据湖探索 DLI

滤等，以新建图表为例，单击工具栏中的“新建图表 ”，将其拖入编辑区域，请参见图4。图4 新建图表选择“name”作为X变量，“age”作为Y变量，将其直接拖入对应的位置，系统将自动生成对应的柱状图，请参见图5。图5 生成图表在“制作图表”页面工具栏中单击“保存”，完成制作图表。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
在Spark SQL作业中使用UDF - 数据湖探索 DLI

int b) { return a + b; } } 编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
提交SQL作业（推荐） - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
调用说明 - 数据湖探索 DLI
调用说明 - 数据湖探索 DLI

状态API，从而获取该异步操作API最终是否执行成功。同时数据湖探索还提供多种编程语言的SDK供您使用，SDK的使用方法请参见华为云开发工具包（SDK）。父主题： API使用前必读

 帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

查看审计日志查看监控指标 06 开发您可以使用客户端或第三方BI工具对接DLI，以及通过DLI跨源连接进行数据分析。客户端工具操作指导使用Spark-submit提交作业使用UDF操作指导第三方BI工具对接DLI 永洪BI对接DLI 跨源数据分析操作指导概述对接HBase

帮助中心 > 数据湖探索 DLI > 成长地图
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Spark3.3.1基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud.sdk</groupId>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark作业委托场景开发指导
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

sum; } } } 图8 编写UDAF函数代码编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

} } 最后调用close方法，对需要清理的方法进行清理。编写调试完成代码后，通过IntelliJ IDEA工具编译代码并导出Jar包。单击工具右侧的“Maven”，参考下图分别单击“clean”、“compile”对代码进行编译。编译成功后，单击“package”对代码进行打包。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SDK的获取与安装 - 数据湖探索 DLI

Maven安装完成后，可根据开发需要，直接引入依赖到已有的Maven工程或先用开发工具创建Maven工程。创建项目以idea开发工具为例(已有Maven 工程可跳过此步骤)：打开IntelliJ IDEA 开发工具。点击File - New - project... 在New Pro

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

64CUs队列不支持缩容。约束限制 DLI服务预置了名为“default”的队列供用户体验，资源的大小按需分配。运行作业时按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。队列类型： SQL类型队列：SQL队列支持提交Spark SQL作业。通用队列：支持Spark程序、Flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

本做了安全加固。为了避免依赖包兼容性问题或日志输出及转储问题，打包时请注意排除以下文件：系统内置的依赖包，或者在Maven或者Sbt构建工具中将scope设为provided 日志配置文件（例如l：“log4j.properties”或者“logback.xml”等）日志输出实现类JAR包（例如：log4j等）

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
永洪BI创建数据集 - 数据湖探索 DLI

图5 查询数据表单击右侧“预览数据”栏下右侧的“数据细节”，可查询出该表的数据，请参见图6。图6 查询数据表数据在“创建数据集”页面工具栏中单击“保存”，完成创建数据集。父主题：永洪BI对接DLI提交Spark作业

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 数据分析 > 永洪BI对接DLI提交Spark作业
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

1.10以上版本，certifi，python-dateutil。关于Python SDK的获取与安装请参考SDK获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Toke

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

按月重置。队列使用约束限制 DLI服务预置了名为“default”的队列供用户体验，资源的大小按需分配。运行作业时按照用户每个作业的数据扫描量（单位为“GB”）收取计算费用。队列类型： SQL类型队列：SQL队列支持提交Spark SQL作业。通用队列：支持Spark程序、Flink

帮助中心 > 数据湖探索 DLI > 产品介绍
数据保护技术 - 数据湖探索 DLI

ssl.keystore keystore的存放路径，“flink.keystore”表示用户通过generate_keystore.sh*工具生成的keystore文件名称。是 /opt/flink/usrlib/userData/flink.keystore security

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
Java SDK概述 - 数据湖探索 DLI
Java SDK概述 - 数据湖探索 DLI

及其以上版本。关于Java开发环境的配置请参考Java SDK环境配置。关于Java SDK的获取与安装请参考SDK的获取与安装。使用SDK工具访问DLI，需要用户初始化DLI客户端。用户可以使用AK/SK(Access Key ID/Secret Access Key)或Toke

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Flink1.15基础镜像内置了3.1.62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 Maven工程的pom.xml文件配置请参考JAVA样例代码中“pom文件配置”说明。 pom文件配置中依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业委托场景开发指导
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

ive'，否则在HiveCatalog中一个表默认被认为是通用的。注意，如果使用Hive方言，就不需要connector属性。监视策略是扫描当前位置路径中的所有目录/文件。许多分区可能会导致性能下降。对未分区表进行流式读取时，要求将每个文件以原子方式写入目标目录。分区表的流式读取要求在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive

总条数： 104

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI进行电商BI报表分析 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

永洪BI制作图表 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

调用说明 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

DLI Flink作业提交运行后（已选择保存作业日志到OBS桶），提交运行失败的情形（例如：jar包冲突），有时日志不会写到OBS桶中 - 数据湖探索 DLI

永洪BI创建数据集 - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

Java SDK概述 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线