搜索_华为云

数据保护技术 - 数据湖探索 DLI

service.ssl.enabled 打开blob通道SSL开关。否 true taskmanager.data.ssl.enable 打开taskmanager之间通信的SSL开关。否 true security.ssl.algorithms 设置SSL加密的算法。否

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

管理SQL作业在SQL作业列表页面查看作业的基本信息 DLI SQL作业管理页面显示所有SQL作业，作业数量较多时，系统分页显示，可根据需要跳转至指定页面。您可以查看任何状态下的作业。作业列表默认按创建时间降序排列。表1 作业管理参数参数参数说明队列作业所属队列的名称。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
跨源认证概述 - 数据湖探索 DLI

考使用DEW管理数据源访问凭证。跨源认证用于管理访问指定数据源的认证信息。配置跨源认证后，无需在作业中重复配置数据源认证信息，提高数据源认证的安全性，便于DLI安全访问数据源。 SQL作业、Flink 1.12版本的跨源访问场景，使用DLI提供的“跨源认证”管理数据源的访问凭证。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
Kafka结果表 - 数据湖探索 DLI
Kafka结果表 - 数据湖探索 DLI

"area_id":"330106"} 示例（适用于Kafka集群已开启SASL_SSL场景）示例1：DMS集群使用SASL_SSL认证方式。创建DMS的kafka集群，开启SASL_SSL，并下载SSL证书，将下载的证书client.jks上传到OBS桶中。 CREATE TABLE ordersSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
获取跨源认证列表 - 数据湖探索 DLI

certificate_location String 创建时指定的证书OBS路径。 datasource_type String 数据源的类型。 create_time Int 创建时间戳。 update_time Int 更新时间戳。 krb5_conf String krb5配置文件obs路径。

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
CSS安全集群配置 - 数据湖探索 DLI

4或以上集群版本，创建CSS安全集群，并下载安全集群证书（CloudSearchService.cer）。登录云搜索服务控制台，单击“集群管理”，选择需要建立跨源连接的集群，如图1所示：图1 CSS集群管理单击“安全模式”中的“下载证书”下载安全证书。使用keytool工具生成keystore和truststore文件。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据功能描述 Spark为了提高性能会缓存Parquet的元数据信息。当更新了Parquet表时，缓存的元数据信息未更新，导致Spark SQL查询不到新插入的数据作业执行报错，报错信息参考如下： DLI.0002: FileNotFoundException:

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

= '/mytest','es.net.ssl'='true','es.net.ssl.keystore.location' = 'file://" + esTransportKeystoreLocalPath + "','es.net.ssl.keystore.pass' = '**'

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
获取跨源认证列表（废弃） - 数据湖探索 DLI

certificate_location String 创建时指定的证书OBS路径。 datasource_type String 数据源的类型。 create_time Int 创建时间戳。 update_time Int 更新时间戳。 krb5_conf String krb5配置文件obs路径。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

es.net.ssl 连接安全CSS集群，默认值为“false”。 es.net.ssl.keystore.location 安全CSS集群的证书，生成的keystore文件在OBS上的地址。 es.net.ssl.keystore.pass 安全CSS集群的证书，生成的keystore文件时的密码。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Kafka - 数据湖探索 DLI
Kafka - 数据湖探索 DLI

示例3：将DMS Kafka作为源表，Print作为结果表（适用于Kafka集群已开启SASL_SSL场景）创建DMS的kafka集群，开启SASL_SSL，并下载SSL证书，将下载的证书client.jks上传到OBS桶中。其中，properties.sasl.jaas.con

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
SparkSQL建表参数规范 - 数据湖探索 DLI

建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称参数描述输入值

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
Confluent Avro Format - 数据湖探索 DLI

Registry的属性Map。这对于没有通过Flink显示配置的配置项非常有用。但是，请注意，Flink配置项具有更高的优先级。 avro-confluent.ssl.keystore.location 否无 String SSL keystore的位置/文件。 avro-confluent.ssl.keystore

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通p

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？问题现象运行的SQL语句中存在join表，但是join没有添加on条件，多表关联造成笛卡尔积查询，最终导致队列资源占满，该队列上的作业运行失败。例如，如下问题SQL语句，存在三个表的left

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
UPDATE - 数据湖探索 DLI
UPDATE - 数据湖探索 DLI

boolExpression] 参数描述表1 UPDATE参数参数描述 tableIdentifier 在其中执行更新操作的Hudi表的名称。 column 待更新的目标列。 EXPRESSION 需在目标表中更新的源表列值的表达式。 boolExpression 过滤条件表达式。示例 update h0

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
Hudi表分区设计规范 - 数据湖探索 DLI

分区采用日期字段，分区表粒度，要基于数据更新范围确定，不要过大也不要过小。分区粒度可以采用年、月、日，分区粒度的目标是减少同时写入的文件桶数，尤其是在有数据量更新，且更新数据有一定时间范围规律的，比如：近一个月的数据更新占比最大，可以按照月份创建分区；近一天内的数据更新占比大，可以按照天进行分区。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Upsert Kafka结果表 - 数据湖探索 DLI

些参数的值。 ssl_auth_name 否无 String DLI侧创建的Kafka_SSL类型的跨源认证名称。Kafka配置SSL时使用该配置。注意：若仅使用SSL类型，则需要同时配置'properties.security.protocol '= 'SSL'; 若使用S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
pyspark样例代码 - 数据湖探索 DLI

option("es.net.ssl", "true") .option("es.net.ssl.keystore.location", "obs://桶名/path/transport-keystore.jks") .option("es.net.ssl.keystore.pass"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

这是因为DLI在执行SQL作业时，会对表进行元数据更新，如果在作业执行完成前修改了表名，会和作业的元数据更新过程冲突，从而影响对数据大小的判断。为了避免这种情况，建议在SQL作业执行完成后，等待5分钟后再修改表名。确保系统有足够的时间更新表的元数据，避免因修改表名而导致的数据大小统计不准确的问题。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 639

上一页
1
2
3
4
5
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据保护技术 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

Kafka结果表 - 数据湖探索 DLI

获取跨源认证列表 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

获取跨源认证列表（废弃） - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Kafka - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

UPDATE - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize不正确怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线