搜索_华为云

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

* 否无 String 设置和传递任意 Kafka 的配置项。 “properties.”中的后缀名必须匹配在Apache Kafka中定义的配置键。 Flink 将移除 "properties." 配置键前缀并将变换后的配置键和值传入底层的 Kafka 客户端。例如，您可以通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

当key-ttl-mode取值为no-ttl时，不需要配置此参数。当key-ttl-mode取值为expire-msec时，需要配置为可以解析成Long型的字符串。例如5000，表示5000ms后key过期。当key-ttl-mode取值为expire-at-date时，需要配置为Date类型字符串，例如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
FileSytem结果表 - 数据湖探索 DLI

为了避免数据丢失或者数据被覆盖，开启作业异常自动重启，需要配置为“从checkpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs时，请配置主NameNode的所在节点信息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
数据保护技术 - 数据湖探索 DLI

来对传输中的数据进行加密。 Spark作业传输通信加密 Spark作业支持通过配置表1中的参数开启通信加密。请确保已上传密钥和证书到指定的OBS路径下，并在作业配置中的其他依赖文件中引入。表1 Spark作业传输开启通信加密配置项参数说明配置示例 spark.network.crypto.enabled

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
创建DLI表关联DDS - 数据湖探索 DLI

创建DLI表关联DDS 功能描述使用CREATE TABLE命令创建DLI表并关联DDS上已有的collection。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。前提条件创建DLI

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
JDBC源表 - 数据湖探索 DLI
JDBC源表 - 数据湖探索 DLI

连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
查询批处理作业列表 - 数据湖探索 DLI

作业运行时长，单位毫秒。 id 否 String 批处理作业的id。 state 否 String 批处理作业的状态。 appId 否 String 批处理作业的后台app id。 log 否 Array of Strings 显示当前批处理作业的最后10条记录。 sc_type 否 String 计算

 帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
数据库相关 - 数据湖探索 DLI
数据库相关 - 数据湖探索 DLI

数据库相关前提条件已参考Java SDK概述配置Java SDK环境。已参考初始化DLI客户端完成客户端DLIClient的初始化，参考队列相关完成队列创建等操作。创建数据库 DLI提供创建数据库的接口。您可以使用该接口创建数据库，示例代码如下： 1 2 3 4 5 6 7

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

登录DLI管理控制台，单击“数据管理 > 程序包管理”。在“程序包管理”页面，单击右上角“创建”可创建程序包。在“创建程序包”对话框，配置如下参数：包类型：PyFile。 OBS路径：选择1.aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备导入依赖涉及到的mvn依赖库 1 2 3 4 5 <dependency>

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
pyspark样例代码 - 数据湖探索 DLI

在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。操作前准备 import相关依赖包 1 2 3 from __future__ import

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

如果未开启安全模式，语法中hosts字段值以http开头。如果开启安全模式，未开启https，需要配置用户名username、密码password，且语法中hosts字段值以http开头。如果开启安全模式，开启https，需要配置用户名username、密码password、证书位置certificat

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.write.mode 否数据写入模式，支持: copy, insert以及upsert三种。默认值为upsert。该参数与'primary

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建Hive Catalog - 数据湖探索 DLI

系统中存储的函数和信息。数据处理最关键的方面之一是管理元数据。元数据可以是临时的，例如临时表、或者通过TableEnvironment注册的UDF。元数据也可以是持久化的，例如Hive Metastore中的元数据。Catalog 提供了一个统一的API，用于管理元数据，并使其可以从Table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
查询作业模板列表 - 数据湖探索 DLI

Object batch配置项，参考Spark Configuration。 name String 创建时用户指定的批处理名称，不能超过128个字符。 driverMemory String Spark应用的Driver内存，参数配置例如2G, 2048M。该配置项会替换“sc_ty

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业模板相关API
创建跨源认证（废弃） - 数据湖探索 DLI

Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
创建跨源认证 - 数据湖探索 DLI

Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

参数“connector.table-name”与“connector.data-type”必须配置其中一个。示例配置“connector.table-name”参数时的table存储模式示例。 table模式采用hash类型存储数据，与基本hash类型将表的三个字段分别作为key

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

通用队列类型：用于运行Flink和Spark Jar作业。其他参数请根据需要配置。图3 添加队列配置完基本参数后，单击“下一步”，在队列的扩缩容策略配置界面，修改扩缩容策略配置：最小CU：64、最大CU：64。图4 队列扩缩容策略配置单击“确定”完成添加队列操作。（可选）步骤三：创建增强型跨源连接

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 658

上一页
1
...
15
16
17
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi表索引设计规范 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

JDBC源表 - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

数据库相关 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

创建Hive Catalog - 数据湖探索 DLI

查询作业模板列表 - 数据湖探索 DLI

创建跨源认证（废弃） - 数据湖探索 DLI

创建跨源认证 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

典型场景示例：创建弹性资源池并运行作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线