搜索_华为云

初始化DLI客户端 - 数据湖探索 DLI

Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

Secret Access Key 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
删除分区 - 数据湖探索 DLI
删除分区 - 数据湖探索 DLI

单引号（''）包围起来。 partition_specs 分区信息，key=value形式，key为分区字段，value为分区值。若分区字段为多个字段，可以不包含所有的字段，会删除匹配上的所有分区。“partition_specs”中的参数默认带有“( )”，例如：PARTITION

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

返回间隔。 CURRENT_DATE DATE 返回本地时区中的当前 SQL 日期。在流模式下为每条记录进行取值。但在批处理模式下，它在查询开始时计算一次，并对每一行使用相同的结果。 CURRENT_TIME TIME 返回本地时区的当前 SQL 时间，这是 LOCAL_TIME

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

12:03:00", "user_id":"0002", "user_name":"Bob", "area_id":"330110"}) 示例2：将Kafka作为源表，Print作为结果表，从Kafka中读取编码格式为json数据类型的数据，输出到日志文件中。参考增强型跨源连接，根据K

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

准备工作已注册华为账号并开通华为云，且在使用DLI前检查账号状态，账号不能处于欠费或冻结状态。配置DLI委托访问授权 DLI使用过程中涉及到OBS、VPC、SMN等服务交互，首次使用DLI需要用户配置委托授权，允许访问这些依赖服务。使用华为云账号登录DLI管理控制台，在左侧导航栏单击“全局配置

 帮助中心 > 数据湖探索 DLI > 快速入门
责任共担 - 数据湖探索 DLI
责任共担 - 数据湖探索 DLI

户的安全责任在于对使用的IaaS、PaaS和SaaS类云服务内部的安全以及对租户定制配置进行安全有效的管理，包括但不限于虚拟网络、虚拟主机和访客虚拟机的操作系统，虚拟防火墙、API网关和高级安全服务，各项云服务，租户数据，以及身份账号和密钥管理等方面的安全配置。《华为云安全白皮

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

等等指标，从而能在显示大屏上实时展示相关数据，方便及时了解数据变化，有针对性地调整营销策略。而如何高效快捷地统计这些指标呢？假设平台已经将每个商品的订单信息实时写入Kafka中，这些信息包括订单ID、订单生成的渠道(即web方式、app方式等)、订单时间、订单金额、折扣后实际支

 帮助中心 > 数据湖探索 DLI > 最佳实践
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖。涉及到mvn依赖 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
下载并安装JDBC驱动包 - 数据湖探索 DLI

7及以上版本。下载的JDBC驱动包中包含了.bat（Windows）或.sh（Linux/Mac）脚本，这些脚本用于自动化安装JDBC驱动到本地Maven仓库。您可以根据操作系统运行相应的脚本安装JDBC驱动 Windows：双击.bat文件或在命令行中运行。 Linux/Mac：运行

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

自建大数据生态的调度工具，如Airflow。企业级多租户基于表的权限管理，可以精细化到列权限。基于文件的权限管理。高性能性能基于软硬件一体化的深度垂直优化。大数据开源版本性能。跨源分析支持多种数据格式，云上多种数据源、ECS自建数据库以及线下数据库，数据无需搬迁，即可实现对云上多个数据源

 帮助中心 > 数据湖探索 DLI > 产品介绍
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

retry-count 是 5 Integer 设置每个连接请求的队列大小。如果超过队列大小，则命令调用将导致RedisException。将requestQueueSize设置为较低的值将导致在过载期间或连接处于断开状态时更早出现异常。更高的值意味着达到边界需要更长的时间，但可能会有更

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
SDK的获取与安装 - 数据湖探索 DLI

K链接，即可获取对应的SDK安装包。表1 目录结构名称说明 jars SDK及其依赖的jar包。 maven-install 安装至本地Maven仓库的脚本及对应jar包。 dli-sdk-java.version Java SDK版本说明。方法一：通过Maven安装DLI

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

UDF：自定义函数，支持一个或多个输入参数，返回一个结果值。 UDTF：自定义表值函数，支持一个或多个输入参数，可返回多行多列。 UDAF：自定义聚合函数，将多条记录聚合成一个值。 POM依赖 <dependency> <groupId>org.apache.flink</groupId>

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。构造依赖信息，创建SparkSession 导入依赖。涉及到mvn依赖 1 2 3 4 5 6 7 8

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

其数据量可以设定从1G~3T不等。TPC-H 基准测试包括 22 个查询(Q1~Q22)，其主要评价指标是各个查询的响应时间，即从提交查询到结果返回所需时间。TPC-H 基准测试的度量单位是每小时执行的查询数( QphH@size)，其中“H”表示每小时系统执行复杂查询的平均次数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
Hudi常见配置参数 - 数据湖探索 DLI

中的记录总数约为130K。默认值（60000）大约是此近似值的一半。注意：将此值设置得太低，将产生很多误报，并且索引查找将必须扫描比其所需的更多的文件；如果将其设置得非常高，将线性增加每个数据文件的大小（每50000个条目大约4KB）。 60000 hoodie.index

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

保持记录，才能创建队列。新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。按需队列创建完成后，如果在1小时内未运行作业，系统将进行释放。按需队列与包年/包月队列不能互相转换，如需使用包年/包月队列，直接购买即可。 16CUs队列不支持扩容和缩容。 64CUs队列不支持缩容。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 215

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

删除分区 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

责任共担 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线