搜索_华为云

ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

使用以下命令在ClickHouse的default_cluster集群节点上创建数据库flink。 CREATE DATABASE flink ON CLUSTER default_cluster; 使用以下命令在default_cluster集群节点上和flink数据库下创建表名为order的ReplicatedMergeTree表。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
查询作业详情 - 数据湖探索 DLI

String 流图编辑数据。默认为null。 executor_number 否 Integer 作业使用计算节点个数。 executor_cu_number 否 Integer 计算节点cu数。 cu_number 否 Integer 用户为作业选择的CU数量。 “show_detail”为“true”时独有。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
提交SQL作业（推荐） - 数据湖探索 DLI

负，则没有限制。 spark.sql.autoBroadcastJoinThreshold 209715200 配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

参数为启用时，配置成整数范围。在当前 MySQL 集群中运行的所有 slave 节点，标记每个 salve 节点的 id 都必须是唯一的。所以当连接器加入 MySQL 集群作为另一个 slave 节点（并且具有唯一 id 的情况下），它就可以读取 binlog。默认情况下，连接器会在

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
SQL作业运行慢如何定位 - 数据湖探索 DLI

击Description中的超链接。图7 单击作业链接查看对应作业的DAG图，判断是否有BroadcastNestedLoopJoin节点。图8 作业的DAG图。如果存在广播，则参考SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中处理。可能原因2：数据倾斜

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

se建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

<key1>=<val1>;<key2>=<val2>… endpoint指DLI的域名。projectId指项目ID。在地区和终端节点获取DLI对应的Endpoint，从华为云“用户名”>“我的凭证”页面获取项目编号。 “？”后面接其他配置项，每个配置项以“key=val

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
查看Flink作业详情 - 数据湖探索 DLI

理”>“Flink作业”，进入Flink作业管理页面。单击需要查看的作业名称，进入“作业详情”页面。在“任务列表”页签，可以查看任务的节点信息。图2 任务列表查看算子任务列表，具体参见下表：表4 算子任务列表参数参数说明名称算子名称。持续时间算子运行的持续时间。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

se建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
数据保护技术 - 数据湖探索 DLI

Spark作业传输开启通信加密配置项参数说明配置示例 spark.network.crypto.enabled 该参数用于启用或禁用数据在节点之间传输时的加密。当设置为true时，Spark会加密Executor和Driver之间以及Executor之间的所有通信。这是确保数据传输安全的重要配置。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI弹性资源池与队列简介 - 数据湖探索 DLI

源。弹性资源池扩缩容当弹性资源池中添加队列、删除队列时，会触发弹性资源扩缩容。而弹性资源池缩容可能会触发缩容含有shuffle数据的节点，会导致Spark Task重算，引起Spark作业和SQL作业内部自动重试，当作业重试超过限制会导致作业执行失败，需用户重新执行作业。 Spark2

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
开启Flink作业动态扩缩容 - 数据湖探索 DLI

开启Flink作业动态扩缩容后，系统将根据Flink作业的实际资源需求动态调整资源分配。当弹性资源池中剩余的Pod资源足以支持作业的最小资源需求时，系统将自动减少作业所在节点的数量，确保作业高效运行，同时提高资源的利用效率。当前仅Flink 1.12版本的作业支持开启动态扩缩容。使用须知在Flink作业进

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
ClickHouse结果表 - 数据湖探索 DLI

使用以下命令在ClickHouse的default_cluster集群节点上创建数据库flink。 CREATE DATABASE flink ON CLUSTER default_cluster; 使用以下命令在default_cluster集群节点上和flink数据库下创建表名为order的ReplicatedMergeTree表。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业登录DLI管理控制台，选择“SQL编辑器”首进入提交SQL作业的界面。提交SQL作业时需要选择支持Hudi的Spark SQL队列。创建一张Hudi表：将如下的建表语句粘贴至DLI SQL编辑器的输入区域，修改 LOCATION

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Elasticsearch结果表 - 数据湖探索 DLI

elasticsearch请求失败时的策略，默认为fail fail：当请求失败且作业失败时抛出异常 ignore:忽略 retry-rejected:对于由于es节点的队列满时，会重新请求而不抛出失败。 custom:使用定制策略 connector.failure-handler-class 否使用

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
创建DLI表关联CSS - 数据湖探索 DLI

则停止存储数据，以batch.size.entries为准，提交该批次的数据。 es.nodes.wan.only 是否仅通过域名访问es节点，默认为false。使用经典型跨源的连接地址作为es.nodes时，该参数需要配置为true；使用css服务提供的原始内网IP地址作为es

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
Spark SQL常用配置项说明 - 数据湖探索 DLI

如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
更新Flink Jar作业 - 数据湖探索 DLI

否 Integer 用户为作业选择的CU数量。默认值为“2”。 manager_cu_number 否 Integer 用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。默认值为“1”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

默认值数据类型参数说明 dew.endpoint 是无 String 指定要使用的DEW服务所在的endpoint信息。获取地区和终端节点。配置示例：'dew.endpoint'='kms.cn-xxxx.myhuaweicloud.com' dew.projectId 否

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

spark.hadoop.fs.dew.endpoint 是无 String 指定要使用的DEW服务所在的endpoint信息。获取地区和终端节点。配置示例：spark.hadoop.fs.dew.endpoint=kms.cn-xxxx.myhuaweicloud.com spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南

总条数： 112

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ClickHouse - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线