搜索_华为云

DLI SDK与API的对应关系 - 数据湖探索 DLI

GET /v1.0/{project_id}/streaming/jobs/{job_id}/execute-graph 查询Flink作业监控信息 getFlinkJobsMetrics - POST /v1.0/{project_id}/streaming/jobs/metrics

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

Browser+。下载地址请参考《对象存储服务工具指南》。安装OBS Browser+。安装步骤请参考《对象存储服务工具指南》。登录OBS Browser+。OBS Browser+支持AK方式登录，以及授权码登录两种登录方式。登录步骤请参考《对象存储服务工具指南》。通过OBS Browser+上传数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
Hudi常见配置参数 - 数据湖探索 DLI

或者，在提交作业时配置到"Spark参数(--conf)" 中，注意，此处配置的参数，键需要添加前缀 ”spark.hadoop.”，例如”spark.hadoop.hoodie.compact.inline=true” 写入操作配置表1 写入操作重要配置项参数描述默认值

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

of orders.proctime as area on orders.area_id = area.area_id; 连接Kafka集群，向Kafka的source topic中插入如下测试数据： {"order_id":"202103241606060001", "ord

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

数据库名"，例如："jdbc:postgresql://192.168.0.77:8000/postgres"，获取方式请参考“图 DWS集群信息”。说明： DWS的连接地址格式为："协议头://访问地址:访问端口/数据库名" 例如： jdbc:postgresql://to-

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

snapshot.enabled' 参数为启用时，配置成整数范围。在当前 MySQL 集群中运行的所有 slave 节点，标记每个 salve 节点的 id 都必须是唯一的。所以当连接器加入 MySQL 集群作为另一个 slave 节点（并且具有唯一 id 的情况下），它就可以读取 binlog。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

orders.proctime as dim on orders.product_id = dim.product_id; 连接Kafka集群，向Kafka的source topic中插入如下测试数据： {"product_id": "product_id_11", "user_name":

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi数据表Compaction规范 - 数据湖探索 DLI

太多的Compaction Plan没有去执行而导致Spark任务耗时长并且也会导致下游的读作业时延高。对此场景，在这里给出以下建议：按照集群资源使用情况，可以每2小时或每4个小时去调度执行一次异步Compaction作业，这是一个基本的维护MOR表的方案。采用Spark异步执

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码前提条件在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。 CSS非安全集群开发说明代码实现详解 import相关依赖包 1 2 3 from __future__ import print_function from pyspark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

将写好的代码文件生成jar包，上传至DLI中。控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《上传资源包》。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业的依赖文件中，未开启Kerberos认证该步骤忽略。如图1所示：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

达到PB级。数据种类多，有结构化的遥感影像栅格数据、矢量数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子

 帮助中心 > 数据湖探索 DLI > 产品介绍
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Windows系统，支持Windows7以上版本。安装JDK JDK使用1.8版本。安装和配置IntelliJ IDEA IntelliJ IDEA为进行应用开发的工具，版本要求使用2019.1或其他兼容版本。安装Maven 开发环境的基本配置。用于项目管理，贯穿软件开发生命周期。开发流程 DLI进行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

max-rows' = '1' ); insert into jdbcSink select * from kafkaSource; 连接Kafka集群，向Kafka相应的topic中发送如下测试数据： {"order_id":"202103241000000001", "order_channel":"webShop"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建增强型跨源连接 - 数据湖探索 DLI

主机信息可选参数，用于配置主机的IP与域名的映射关系，在作业配置时只需使用配置的域名即可访问对应的主机。例如：访问MRS的HBase集群时需要配置Zookeeper实例的主机名（即域名）与对应的IP地址。每行填写一条记录，填写格式为：“IP 主机名/域名”。示例： 192

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DLI弹性资源池与队列简介 - 数据湖探索 DLI

的作业或数据处理任务创建不同的队列，并按需对这些队列分配和调整资源。了解DLI的队列类型请参考DLI队列类型。 DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。建议您对测试业务场景和生产业务场景分别创建弹性资源池，通过资源物理隔离的方式，保障资源管理的独立性和安全性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Upsert Kafka源表 - 数据湖探索 DLI

的现有行都被覆盖。另外，value 为空的消息将会被视作为 DELETE 消息。前提条件该场景作业需要运行在DLI的独享队列上，因此要与kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL数据库的端口号。 server-id 否 5400~6000随机值 String 数据库客户端的一个数字ID，该ID必须是MySQL集群中全局唯一的。建议针对同一个数据库的每个作业都设置一个不同的ID。默认会随机生成一个5400~6400的值。 scan.startup.mode

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建弹性资源池并添加队列 - 数据湖探索 DLI

通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。本章节介绍创建弹性资源池并添加队列的操作步骤。 DLI弹性资源池之间为物理集群隔离，同一个弹性资源池中的队列之间为逻辑隔离。建议您对测试业务场景和生产业务场景分别创建弹性资源池，通过资源物理隔离的方式，保障资源管理的独立性和安全性。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

如果以上错误信息不足以定位问题，还可以参考Flink作业运行异常，如何定位，从OBS桶中下载作业日志对问题进一步定位。连接Kafka集群，向Kafka相应的topic中发送如下测试数据： Kafka生产和发送数据的方法请参考：连接实例生产消费信息。 {"order_id":

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 259

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI SDK与API的对应关系 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线