搜索_华为云

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？缺少pymysql模块，可以查看是否有对应的egg包，如果没有，在“程序包管理”页面上传pyFile。具体步骤参考如下：将egg包上传到指定的OBS桶路径下。登录DLI管理控制台，单击“数据管理

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

使用跨源认证则无需在作业中配置置账号和密码。示例该示例是利用MySQL-CDC实时读取RDS MySQL中的数据，并写入到Print结果表中，其具体步骤如下（本示例使用RDS MySQL数据库引擎版本为MySQL 5.7.32）。参考增强型跨源连接，根据MySQL所在的虚拟私有云和子网创建相应的增强型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
rand - 数据湖探索 DLI
rand - 数据湖探索 DLI

rand函数用于返回大于或等于0且小于1的平均分布随机数。命令格式 rand(INT seed) 参数说明表1 参数说明参数是否必选参数类型说明 seed 否 INT类型。参数seed的格式包括浮点数格式、整数格式、字符串格式。如果指定种子seed，在相同运行环境下，将会得到一个稳定的随机数序列。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
UUID函数 - 数据湖探索 DLI
UUID函数 - 数据湖探索 DLI

UUID函数使用该函数产生一个伪随机的唯一通用标识符。 select uuid(); 父主题： SQL函数和操作符

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

GEOMETRYCOLLECTION STRING MySQL中的空间数据类型将转换为具有固定Json格式的字符串。示例该示例是利用MySQL-CDC实时读取RDS MySQL中的数据及其元数据，并写入到Print结果表中。本示例使用RDS MySQL数据库引擎版本为MySQL 5.7.33。参考增

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

random是默认的生成器，您可以通过“fields.#.max”和“fields.#.min”参数指定随机生成的最大和最小值。当指定的字段类型为char、varchar、string时，可以同时通过“fields.#.length”字段指定长度。random是无界的生成器。 sequ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

nt_agency的委托信息。步骤1：创建RDS MySQL实例本样例中，假设作业名称为“JobSample”，采用RDS服务作为数据源，创建RDS MySQL实例。具体操作请参见购买RDS for MySQL实例。登录RDS管理控制台。在管理控制台左上角选择区域和项目。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

分区数：1。副本数：1。其他参数保持默认即可。步骤2：准备数据输出通道采用RDS作为数据输出通道，创建RDS MySQL实例。具体操作请参见购买RDS for MySQL实例。登录RDS管理控制台。在管理控制台左上角选择区域。单击“购买数据库实例”配置相关参数。主

 帮助中心 > 数据湖探索 DLI > 快速入门
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

appName("datasource-rds").getOrCreate(); 通过SQL API 访问创建DLI跨源访问RDS的关联表，填写连接参数。 1 2 3 4 5 6 7 sparkSession.sql( "CREATE TABLE IF NOT EXISTS dli_to_rds USING

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

10000 Long 每秒生成的行数，用以控制数据发出速率。 number-of-rows 否无 Long 生成数据的总行数。默认条件下，不限制生成数据的总行数。如果有字段生成器类型为序列生成器，则当生成数据的行数达到上限或者序列数字达到结束值时，都不会再生成数据。 fields.#

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

Format 功能描述 Debezium是一个 CDC（Changelog Data Capture，变更数据捕获）的工具，可以把来自 MySQL、PostgreSQL、Oracle、Microsoft SQL Server 和许多其他数据库的更改实时流式传输到 Kafka 中。 Debezium

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

创建DLI队列时队列类型需要选择为“SQL队列”。已创建云数据库RDS的MySQL的数据库实例。具体创建RDS集群的操作可以参考创建RDS MySQL数据库实例。本示例RDS数据库引擎：MySQL 本示例RDS MySQL数据库版本：5.7。已创建CDM迁移集群。创建CDM集群的操作可以参考创建CDM集群。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
SQL作业运行慢如何定位 - 数据湖探索 DLI

考虑在对应key值上添加concat(cast(round(rand() * 999999999) as string)随机数进行打散。如果确实因为单个key值倾斜严重且不可对key值拼接随机值打散，则参考执行SQL作业时产生数据倾斜怎么办？处理。父主题： SQL作业开发类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到关系型数据库中。前提条件要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 1 2 3 4 5

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

BY）、多表的关联（JOIN）等。本示例通过创建MySQL CDC源表来监控MySQL的数据变化，并将变化的数据信息插入到DWS数据库中。前提条件已创建RDS MySQL实例。本示例创建的RDS MySQL数据库版本选择为：8.0。具体步骤可参考购买RDS for MySQL实例。已创建DWS实例。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

是无 String 数据库的URL。连接MySQL数据库时，格式为：jdbc:mysql://MySQLAddress:MySQLPort/dbName 。连接PostgreSQL数据库时，格式为：jdbc:postgresql://PostgreSQLAddress:Po

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

= 'jdbc:mysql://MySQLAddress:MySQLPort/flink',--其中url中的flink表示MySQL中orders表所在的数据库名 'table-name' = 'orders', 'username' = 'MySQLUsername'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

cdc-events-duplicate设置为true，并在源表上定义PRIMARY KEY。Framework将生成一个额外的有状态操作符，并使用主键对变更事件进行去重，并生成一个规范化的changelog流。参数说明表1 参数说明参数是否必选默认值类型说明 format

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

= 'jdbc:mysql://MySQLAddress:MySQLPort/flink',--其中url中的flink表示MySQL中orders表所在的数据库名 'table-name' = 'orders', 'username' = 'MySQLUsername'

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
Spark作业开发类 - 数据湖探索 DLI

Spark作业使用咨询 Spark如何将数据写入到DLI表中通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类

总条数： 514

上一页
1
2
3
4
5
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

rand - 数据湖探索 DLI

UUID函数 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

使用DLI提交Flink OpenSource SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

Flink Opensource SQL使用DEW管理访问凭据 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线