搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

MySQL CDC源表功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。前提条件 MySQL CDC要求MySQL版本为5.7或8.0.x。该场景作业需要DLI与MySQL建立增强型跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

问RDS的表数据。操作流程使用DLI提交SQL作业查询RDS MySQL数据操作流程如表1所示。开始进行如下操作前，请务必参考准备工作完成必要操作。表1 使用DLI提交SQL作业查询RDS MySQL数据的操作流程操作步骤说明步骤1：创建RDS MySQL实例样例场景需要创建RDS

帮助中心 > 数据湖探索 DLI > 快速入门
Hudi表分区设计规范 - 数据湖探索 DLI

议使用。建议事实表采用日期分区表，维度表采用非分区或者大颗粒度的日期分区是否采用分区表要根据表的总数据量、增量和使用方式来决定。从表的使用属性看事实表和维度表具有的特点：事实表：数据总量大，增量大，数据读取多以日期做切分，读取一定时间段的数据。维度表：总量相对小，增量小

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

参数模板：Default-MySQL-8.0 只读实例：暂不购买单击“立即购买”，确认规格信息。单击“提交”，完成RDS实例的创建。登录MySQL，并使用下述命令在flink库下创建orders表。登录MySQL，单击“SQL窗口”，在SQL查询页面输入以下创建表语句，创建RDS MySQL表。

帮助中心 > 数据湖探索 DLI > 快速入门
Hudi表索引设计规范 - 数据湖探索 DLI

Hudi表索引设计规范规则禁止修改表索引类型。 Hudi表的索引会决定数据存储方式，随意修改索引类型会导致表中已有的存量数据与新增数据之间出现数据重复和数据准确性问题。常见的索引类型如下：布隆索引：Spark引擎独有索引，采用bloomfiter机制，将布隆索引内容写入到Parquet文件的footer中。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
Hudi数据表设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 Hudi表模型设计规范 Hudi表索引设计规范 Hudi表分区设计规范父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
Hudi表模型设计规范 - 数据湖探索 DLI

流式计算采用MOR表。流式计算为低时延的实时计算，需要高性能的流式读写能力，在Hudi表中存在的MOR和COW两种模型中，MOR表的流式读写性能相对较好，因此在流式计算场景下采用MOR表模型。关于MOR表在读写性能的对比关系如下：对比维度 MOR表 COW表流式写高低流式读

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

MySql CDC 功能描述 MySQL的CDC源表，即MySQL的流式源表，会先读取数据库的历史全量数据，并平滑切换到Binlog读取上，保证数据的完整读取。表1 支持类别类别详情支持表类型源表前提条件 MySQL CDC要求MySQL版本为5.6，5.7或8.0.x。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

理，例如分组（GROUP BY）、多表的关联（JOIN）等。本示例通过创建MySQL CDC源表来监控MySQL的数据变化，并将变化的数据信息插入到DWS数据库中。前提条件已创建RDS MySQL实例。本示例创建的RDS MySQL数据库版本选择为：8.0。具体步骤可参考购买RDS

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
查看表统计信息 - 数据湖探索 DLI

FORMATTED：使用表格形式显示所有表的元数据。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
创建DLI表关联RDS - 数据湖探索 DLI

创建DLI表关联RDS 功能描述使用CREATE TABLE命令创建DLI表并关联RDS上已有的表。该功能支持访问RDS的MySQL集群和PostGre集群。 Spark跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证方式。跨源认证简介及操作方法请参考跨源认证简介。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
使用DataSource语法创建DLI表 - 数据湖探索 DLI

示例3：使用CTAS将源表的全部数据或部分数据创建新的DLI表示例说明：根据示例1：创建DLI非分区表中创建的DLI表table1，使用CTAS语法将table1中的数据复制到table1_ctas表中。在使用CTAS建表的时候，可以忽略被复制的表在建表时所使用的语法，即不论在

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
使用DataSource语法创建OBS表 - 数据湖探索 DLI

v表中的null值； comment：表示该csv表使用斜杠（/）表示注释的开头； compression：表示该csv表被压缩，此处csv表支持gzip、bzip2和deflate的压缩格式，若不需要压缩，也可以设置为none； encoding：表示该表使用utf-8的数据编

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
Hudi开发规范概述 - 数据湖探索 DLI

Hudi开发规范概述范围本节内容介绍DLI-Hudi组件进行湖仓一体、流批一体方案的设计与开发方面的规则，适用于Hudi开发场景的表的设计、管理与作业开发。主要包括以下方面的规范：数据表设计资源配置性能调优常见故障处理常用参数配置术语约定本规范采用以下的术语描述：

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

b://${ip}:${port}/${dbName}。 connector.table 是操作的表名。如果该DWS表在某schema下，则格式为：'schema\".\"具体表名'，具体可以参考示例说明。 connector.driver 否 jdbc连接驱动，默认为: org

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
DLI Delta表概述 - 数据湖探索 DLI

2.3.0。 Spark 3.3.1（3.0.0）版本的SQL仍有部分不支持Delta表的相关开源语法，具体内容请参考表1。表1 Spark 3.3.1-3.0.0版本SQL不支持的Delta表相关开源语法不支持的语法示例 ALTER TABLE REPLACE COLUMNS替换列

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

功能描述 JDBC连接器是Flink内置的Connector，提供了对MySQL、PostgreSQL等常见数据库的读写支持。表类型支持源表、结果表和维表。表1 支持类别类别详情支持表类型源表、维表、结果表前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Connector概述 - 数据湖探索 DLI
Connector概述 - 数据湖探索 DLI

商品类别信息维表关联起来，然后聚合统计订单总额，最后将统计结果写入结果表。本例中订单表作为驱动源表输入，商品类别信息表作为静态维表，统计结果表作为作业最终输出。 Connector支持列表表1 Connector支持列表 Connector 源表维表结果表 BlackHole

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败问题说明 Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类

总条数： 768

上一页
1
2
3
4
5
...
39
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Hudi表分区设计规范 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

Hudi数据表设计规范 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

查看表统计信息 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

Connector概述 - 数据湖探索 DLI

Flink Opensource SQL Elasticsearch结果表failure-handler参数填写retry_rejected导致提交失败 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线