搜索_华为云

插入数据至CSS表 - 数据湖探索 DLI

类型不一致时不一定报错，例如插入int类型数据，但CSS中Schema保存的是文本类型，int类型会被转换成文本类型。不建议对同一张表并发插入数据，因为有一定概率发生并发冲突，导致插入失败。示例查询表“user”中的数据插入表“test”中。 1 2 3 4 5 6 INSERT INTO

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
队列属性设置 - 数据湖探索 DLI

driver实例最大并发数”的值时，作业将会分配到预先启动的spark driver上面。当队列为16CUs时范围：0-1 当队列大于16CUs时范围：2-（CU数/16）队列最小CUs小于16CUs时，该配置项不生效。单spark driver实例最大并发数单个spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
插入数据至RDS表 - 数据湖探索 DLI

S表的信息。如果select子句中选择的字段数量和类型与RDS表的Schema信息不匹配时，系统将报错。不建议对同一张表并发插入数据，因为有一定概率发生并发冲突，导致插入失败。示例查询表“user”中的数据插入表“test”中。 1 2 3 4 5 6 INSERT INTO

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
从Kafka读取数据写入到DWS - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 password ：默认管理员用户的密码。在命令行窗口输

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

可在资源预估后恢复初始值。支持展示页面缩放。支持根据算子链展开/合并。支持编辑“并行数”，“流量”和“命中率”。并行数：一个任务的并发数。流量：算子的数据流量，单位：条/s。命中率：数据经过算子处理之后的保留率。命中率=算子的数据流出量/流入量，单位：%。图5 静态流图

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
Flink作业性能调优 - 数据湖探索 DLI

数并增加source并发解决。作业一个算子反压高（红色），而其后续的多个并行算子都不存在反压（绿色）该场景说明性能瓶颈在Vertex2或者Vertex3，为了进一步确定具体瓶颈点算子，可以在FlinkUI页面开启inPoolUsage监控。如果某个算子并发对应的inPoolU

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

临时连接更改数据库表的历史等等。 Flink 还支持将 Flink SQL 中的 INSERT/UPDATE/DELETE 消息编码为 Maxwell JSON 消息，并发送到 Kafka 等外部系统。但是，目前 Flink 无法将 UPDATE_BEFORE 和 UPDATE_AFTER 合并为一条 UPDATE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
创建Flink Jar作业 - 数据湖探索 DLI

即算子子任务数就是其对应算子的并行度。说明：并行数不能大于计算单元（CU数量-管理单元CU数量）的4倍。并行数应大于用户作业里设置的并发数，否则有可能提交失败。 TaskManager配置用于设置TaskManager资源参数。勾选后需配置下列参数： “单TM所占CU数

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

被插入的OBS表在建表时只能指定文件夹路径。源表和目标表的数据类型和列字段个数应该相同，否则插入失败。不建议对同一张表并发插入数据，可能会由于并发冲突导致插入数据结果异常。 INSERT INTO命令用于将查询的结果追加到目标表中。 INSERT OVERWRITE命令用于覆盖源表中已有的数据。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”，“lowerBound”，“upperBound”，“numPartitions”4个参数必须同时设置，不支持仅设置其中一部分。为了提升并发读取的性能，建议使用自增列。 lowerBound

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
Flink Jar作业类 - 数据湖探索 DLI

Jar作业是否支持上传配置文件，要如何操作？ Flink Jar 包冲突，导致作业提交失败 Flink Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed Flink Jar作业设置backend为OBS，报错不支持OBS文件系统

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明： “partitionColumn”，“lowerBound”，“upperBound”，“numPartitions”4个参数必须同时设置，不支持仅设置其中一部分为了提升并发读取的性能，建议使用自增列。 lowerBound

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
创建DLI表关联DCS - 数据湖探索 DLI

非必填。用于指定schema中的某个字段作为Redis中key的标识。在插入数据时与参数“table”配合使用。 partitions.number 读取数据时，并发task数。 scan.count 每批次读取的数据记录数，默认为100。如果在读取过程中，redis集群中的CPU使用率还有提升空间，可以调大该参数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
笛卡尔连接 - 数据湖探索 DLI
笛卡尔连接 - 数据湖探索 DLI

笛卡尔连接功能描述笛卡尔连接把第一个表的每一条记录和第二个表的所有记录相连接，如果第一个表的记录数为m, 第二个表的记录数为n,则会产生m*n条记录数。语法格式 1 2 SELECT attr_expr_list FROM table_reference CROSS JOIN

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
Hudi常见配置参数 - 数据湖探索 DLI

inline 通过Sql执行run compaction命令时，是否只执行压缩操作，压缩计划不存在时直接退出。 false 单表并发控制配置表6 单表并发控制参数配置参数描述默认值 hoodie.write.lock.provider 指定lock provider，在元数据由DLI托管的场景，推荐配置com

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
使用CDM迁移数据至DLI - 数据湖探索 DLI

批量启动作业、按分组导出作业等操作。是否定时执行：如果需要配置作业定时自动执行可开启。这里保持默认值“否”。抽取并发数：设置同时执行的抽取任务数，适当的抽取并发数可以提升迁移效率，配置原则请参见性能调优。这里保持默认值“1”。是否写入脏数据：如果需要将作业执行过程中处理失败

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Hudi数据表Compaction规范 - 数据湖探索 DLI

建议通过增加并发数提升Compaction性能。 CPU和内存比例配置合理会保证Compaction作业是稳定的，实现单个Compaction task的稳定运行。但是Compaction整体的运行时长取决于本次Compaction处理文件数以及分配的cpu核数（并发能力），因此

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

RDS实例的端口。选择数据库服务器后自动自动关联。数据库名称当前需要迁移的RDS MySQL数据库名称。当前示例为3中创建的数据库“testrdsdb”。用户名待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。本示例使用创建RDS MySQL数据库实例的默认用户“root”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI

总条数： 120

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

插入数据至CSS表 - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

插入数据至RDS表 - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Maxwell Format - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

笛卡尔连接 - 数据湖探索 DLI

Hudi常见配置参数 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

典型场景示例：迁移RDS数据至DLI - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线