搜索_华为云

最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

最新动态本文介绍了数据湖探索DLI各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2020年8月序号功能名称功能描述阶段相关文档 1 集成TPC-H测试套件用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查

 帮助中心 > 数据湖探索 DLI > 最新动态
开启Flink作业动态扩缩容 - 数据湖探索 DLI

SQL作业单击“自定义配置”，配置动态扩缩容参数。 Flink Jar作业单击“优化参数”框，配置动态扩缩容参数。表1 动态扩缩容参数说明名称默认值描述 flink.dli.job.scale.enable false 该配置表示是否开启动态扩缩的功能，即是否允许根据作业的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
导入数据（废弃） - 数据湖探索 DLI

dynamicPartitionOverwrite.enabled”默认值为“false”，对于DataSource表，表示动态插入覆盖整表数据，为“true”表示覆盖指定分区数据。说明：对于Hive分区表的动态覆盖写，仅支持覆盖涉及到的分区数据，不支持覆盖整表数据。表3 日期及时间模式字符定义模式字符

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

源表上的SELECT查询（支持DLI表、OBS表）。 values_row 想要插入到表中的值，列与列之间用逗号分隔。注意事项表必须已经存在。如果动态分区不需要指定分区，则将“part_spec”作为普通字段放置SELECT语句中。被插入的OBS表在建表时只能指定文件夹路径。源表和目

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Spark SQL常用配置项说明 - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

半托管（需要人力运维集群）弹性扩缩容支持集群容器化部署。用户可以根据业务负载进行弹性扩缩容，能够基于作业的负载动态调整作业使用资源大小。支持基于作业优先级动态调整作业的使用资源。仅支持YARN集群。上下游数据连接除了开源connector之外，还提供开箱即用的conn

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

如果未指定主键，Elasticsearch 将自动生成文档ID。动态索引 Elasticsearch sink同时支持静态索引和动态索引。如果您想使用静态索引，则index选项值应为纯字符串，例如 'myusers'，所有记录都将被写入到“myusers”索引中。如果您想使用动态索引，您可以使用 {field_name}

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
设置Flink作业优先级 - 数据湖探索 DLI

在“自定义配置”中输入如下语句，先开启动态扩缩容功能，再设置作业优先级。对于Flink作业，必须先设置flink.dli.job.scale.enable=true开启动态扩缩容功能，再设置作业优先级。开启动态扩缩容的更多参数设置请参考开启Flink作业动态扩缩容。 flink.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
提交SQL作业（推荐） - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
从Kafka读取数据写入到DWS - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 password ：默认管理员用户的密码。在命令行窗口输

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
管理Flink作业 - 数据湖探索 DLI
管理Flink作业 - 数据湖探索 DLI

管理Flink作业查看Flink作业详情设置Flink作业优先级开启Flink作业动态扩缩容查询Flink作业日志 Flink作业常用操作父主题：使用DLI提交Flink作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
DLI弹性资源池与队列简介 - 数据湖探索 DLI

SQL队列通用队列单用户单队列独享资源无法动态调整，资源可能会闲置废弃，不推荐使用为了方便您理解DLI不同计算资源模式的适用场景，我们把购买DLI计算资源比作用车服务：弹性资源池模式可以比作“租车”，您可以根据实际需求动态调整资源的规模。这种模式适合于业务需求波动较大

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Elasticsearch结果表 - 数据湖探索 DLI

Elasticsearch结果表同时支持静态索引和动态索引。如果使用静态索引，则索引选项值应为纯字符串，例如myusers，所有记录都将被写入myusers索引。如果使用动态索引，可以使用{field_name}引用记录中的字段值以动态生成目标索引。您还可以使用 {field_na

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
Spark 3.3.1版本说明 - 数据湖探索 DLI

高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

tsdb-values”个数相同。多个metric请使用“;”分隔。 connector.tsdb-timestamps 是数据点的timestamp，仅支持指定动态列。数据类型支持int、bigint、string，仅支持数据形式。其个数需要为1或者和“connector.tsdb-values”的个数相同。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 56

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

最新动态 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

管理Flink作业 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

从MySQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线