搜索_华为云

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

- DLI服务的域名。在地区和终端节点获取DLI对应区域的域名。如果不配置，程序根据region参数来确定域名。 obsEndPoint 是 obs.cn-north-1.myhuaweicloud.com OBS服务的域名。在地区和终端节点获取OBS对应区域的域名。 bucketName

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
提交SQL作业（推荐） - 数据湖探索 DLI

负，则没有限制。 spark.sql.autoBroadcastJoinThreshold 209715200 配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

S集群所有节点的主机IP信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

表1 创建表参数参数说明 es.nodes CSS的连接地址，需要先创建跨源连接。具体操作请参考《数据湖探索用户指南》。创建经典型跨源连接后，使用经典型跨源连接中返回的连接地址。创建增强型跨源连接后，使用CSS提供的"内网访问地址"，格式为"IP1:PORT1,IP2:PORT2"。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
查看Flink作业详情 - 数据湖探索 DLI

理”>“Flink作业”，进入Flink作业管理页面。单击需要查看的作业名称，进入“作业详情”页面。在“任务列表”页签，可以查看任务的节点信息。图2 任务列表查看算子任务列表，具体参见下表：表5 算子任务列表参数参数说明名称算子名称。持续时间算子运行的持续时间。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

S集群所有节点的主机IP信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。注意事项创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

<key1>=<val1>;<key2>=<val2>… endpoint指DLI的域名。projectId指项目ID。在地区和终端节点获取DLI对应的Endpoint，从华为云“用户名”>“我的凭证”页面获取项目编号。 “？”后面接其他配置项，每个配置项以“key=val

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
Spark作业相关 - 数据湖探索 DLI
Spark作业相关 - 数据湖探索 DLI

a8c3-28fbee399fa6"; // 调用BatchJob对象的delBatch接口取消批处理作业 MessageInfo messageInfo = client.delBatchJob(batchId); System.out.println(messageInfo

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
Spark SQL常用配置项说明 - 数据湖探索 DLI

如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区修剪优化，有助于减少内存使用，避免内存溢出和频繁的Full

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。如果使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
数据保护技术 - 数据湖探索 DLI

Spark作业传输开启通信加密配置项参数说明配置示例 spark.network.crypto.enabled 该参数用于启用或禁用数据在节点之间传输时的加密。当设置为true时，Spark会加密Executor和Driver之间以及Executor之间的所有通信。这是确保数据传输安全的重要配置。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
更新Flink Jar作业 - 数据湖探索 DLI

否 Integer 用户为作业选择的CU数量。默认值为“2”。 manager_cu_number 否 Integer 用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。默认值为“1”。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

ZK_IP2:ZK_PORT2"。说明：访问MRS集群，只支持创建增强型跨源连接并且需要配置主机信息，管理控制台操作请参考《数据湖探索用户指南》中的“增强型跨源连接”，相关API信息请参考创建增强型跨源连接。 RowKey 指定作为rowkey的dli关联表字段，支持单rowkey与

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

UI 多版本支持支持不同作业使用不同Flink版本单Flink集群仅支持单版本下的作业开发易用性即开即用，Serverless架构，跨AZ容灾能力。用户仅编写SQL代码，无需编译，只需关心业务代码。支持用户通过编写SQL连接各个数据源，如RDS、DWS、Kafka、Elasticsearch等数据源;

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

否 String 作业运行模式： shared_cluster：共享。 exclusive_cluster：独享。 edge_node：边缘节点。默认值为“shared_cluster”。 cu_number 否 Integer 用户为作业选择的CU数量。默认值为“2”。 parallel_number

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
新建Flink Jar作业 - 数据湖探索 DLI

cu_number 否 Integer 用户为作业选择的CU数量。 manager_cu_number 否 Integer 用户为作业选择的管理节点CU数量，对应为flink jobmanager数量。默认值为“1”。 parallel_number 否 Integer 用户为作业选择的并发量。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

spark.hadoop.fs.dew.endpoint 是无 String 指定要使用的DEW服务所在的endpoint信息。获取地区和终端节点。配置示例：spark.hadoop.fs.dew.endpoint=kms.cn-xxxx.myhuaweicloud.com spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
数据湖探索简介 - 数据湖探索 DLI

分析。具体内容请参考《数据湖探索API参考》。多数据源分析： Spark跨源连接：可通过DLI访问CloudTable，DWS，RDS和CSS等数据源。具体内容请参考《数据湖探索用户指南》。 Flink跨源支持与多种云服务连通，形成丰富的流生态圈。数据湖探索的流生态分为云服务生态和开源生态：

帮助中心 > 数据湖探索 DLI > 产品介绍

总条数： 118

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark-submit提交Spark Jar作业 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

Spark作业相关 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

数据保护技术 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

Spark Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

数据湖探索简介 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线