搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的HBase和MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明支持对接CloudTable的OpenTSDB和MRS的OpenTSDB。前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现详解 import相关依赖包

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

scala样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
CSS安全集群配置 - 数据湖探索 DLI

CSS安全集群配置准备工作当前CSS服务提供的Elasticsearch 6.5.4或以上集群版本为用户增加了安全模式功能，开启安全模式后，将会为用户提供身份验证、授权以及加密等功能。DLI服务对接CSS安全集群时，需要先进行以下准备工作。选择CSS Elasticsearch

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
流表JOIN - 数据湖探索 DLI
流表JOIN - 数据湖探索 DLI

流表JOIN 流与表进行连接操作，从表中查询并补全流字段。目前支持连接RDS表和DCS服务的Redis表。通过ON条件描述查询的Key，并补全表结构的Value字段。 RDS表的数据定义语句请参见创建RDS表。 Redis表的数据定义语句请参见创建Redis表。语法格式 1 2

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 数据操作语句DML
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区功能描述对于随时间变化的分区表，我们可以将其读取为无界流，如果每个分区包含某个版本的完整数据，则该分区可以被视为时间表的一个版本，时间表的版本保留了分区的数据。Flink支持在处理时间关联中自动跟踪时间表的最新分区（版本）。最新分区（版本）由

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
SQL作业执行完成后，修改表名导致datasize修改失败怎么办？ - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize修改失败怎么办？如果执行SQL后立即修改了表名，可能会导致表的数据大小结果不正确。如需修改表名，建议在SQL作业执行完成后，间隔5分钟再修改表名。父主题：运维指导

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业相关问题 > 运维指导
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？首先测试地址连通性。操作方法请参考测试地址连通性。若果网络不可达，需要先配置网络连通。确保DLI 队列与外部数据源的网络连接性正常。配置详情请参考配置网络连通。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > 运维指导
开源Kafka输出流 - 数据湖探索 DLI

开源Kafka输出流功能描述 DLI将Flink作业的输出数据输出到Kafka中。 Apache Kafka是一个快速、可扩展的、高吞吐、可容错的分布式发布订阅消息系统，具有高吞吐量、内置分区、支持数据副本和容错的特性，适合在大规模消息处理场景中使用。前提条件 Kafka服务

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
创建Redis表 - 数据湖探索 DLI
创建Redis表 - 数据湖探索 DLI

创建Redis表创建Redis表用于与输入流连接。 DCS的详细信息请参见《分布式缓存服务用户指南》。流表JOIN语法请参见流表JOIN。语法格式 1 2 3 4 5 6 CREATE TABLE table_id (key_attr_name STRING(, hash_key_attr_name

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建维表
自拓展输入流 - 数据湖探索 DLI

自拓展输入流用户可通过编写代码实现从想要的云生态或者开源生态获取数据，作为Flink作业的输入数据。语法格式 1 2 3 4 5 6 7 CREATE SOURCE STREAM stream_id (attr_name attr_type (',' attr_name attr_type)*

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 自拓展生态
CREATE FUNCTION语句 - 数据湖探索 DLI

CREATE FUNCTION语句语法定义 CREATE FUNCTION [IF NOT EXISTS] function_name AS identifier [LANGUAGE JAVA|SCALA] 功能描述创建一个用户自定义函数语法说明 IF NOT EXISTS

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
CREATE TABLE语句 - 数据湖探索 DLI

CREATE TABLE语句语法定义 CREATE TABLE table_name ( { <column_definition> | <computed_column_definition> }[ , ...n] [ <watermark_definition>

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > SQL语法约束与定义 > 语法定义 > DDL语法定义
因队列网段IP不足无法分配IP地址导致Flink作业提交失败怎么办？ - 数据湖探索 DLI

因队列网段IP不足无法分配IP地址导致Flink作业提交失败怎么办？问题描述在使用Flink 1.12和Flink 1.15提交作业时，遇到了因队列网段IP地址不足而无法为计算资源分配IP地址的问题，导致Flink 作业提交失败。尽管资源充足，但没有可分配的IP地址。根因分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > 运维指导
执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY - 数据湖探索 DLI

执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY 原因分析：上述报错信息说明：partitioned table XX.YYY执行查询时，其查询条件中未使用其表分区列。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业相关问题 > 作业运维报错
Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据问题现象客户创建Flink SQL作业，消费Kafka后sink到es集群，作业执行成功，但无数据。原因分析查看客户作业脚本内容，排查无问题，作业执行成功，出现该问题可能的原因如下：数据不准确。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > Flink SQL作业相关问题
通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException 问题现象客户通过DLI跨源表向CloudTable Hbase导入数据，原始数据：HBASE表，一个列簇，一个rowkey运行一个亿的模拟数据，数据量为9

帮助中心 > 数据湖探索 DLI > 常见问题 > 跨源连接相关问题 > 跨源连接运维报错
为什么Spark3.x的作业日志中打印找不到global - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global_temp数据库问题描述 Spark3.x的作业日志中提示找不到global_temp数据库。根因分析 global_temp数据库是Spark3.x默认内置的数据库，是Spark的全局临时视图。通常在Spark作业执

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相关问题 > 作业运维报错

总条数： 1933

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

CSS安全集群配置 - 数据湖探索 DLI

流表JOIN - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

SQL作业执行完成后，修改表名导致datasize修改失败怎么办？ - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

开源Kafka输出流 - 数据湖探索 DLI

创建Redis表 - 数据湖探索 DLI

自拓展输入流 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

因队列网段IP不足无法分配IP地址导致Flink作业提交失败怎么办？ - 数据湖探索 DLI

执行查询语句报错：There should be at least one partition pruning predicate on partitioned table XX.YYY - 数据湖探索 DLI

Flink SQL作业消费Kafka后sink到es集群，作业执行成功，但未写入数据 - 数据湖探索 DLI

通过跨源表向CloudTable Hbase表导入数据，executor报错：RegionTooBusyException - 数据湖探索 DLI

为什么Spark3.x的作业日志中打印找不到global - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线