搜索_华为云

最新动态 - 数据湖探索 DLI
最新动态 - 数据湖探索 DLI

最新动态本文介绍了数据湖探索DLI各特性版本的功能发布和对应的文档动态，新特性将在各个区域（Region）陆续发布，欢迎体验。 2020年8月序号功能名称功能描述阶段相关文档 1 集成TPC-H测试套件用户可以通过DLI内置的TPC-H测试套件进行简单高效的交互式查

 帮助中心 > 数据湖探索 DLI > 最新动态
开启Flink作业动态扩缩容 - 数据湖探索 DLI

SQL作业单击“自定义配置”，配置动态扩缩容参数。 Flink Jar作业单击“优化参数”框，配置动态扩缩容参数。表1 动态扩缩容参数说明名称默认值描述 flink.dli.job.scale.enable false 该配置表示是否开启动态扩缩的功能，即是否允许根据作业的

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？问题描述用户执行Flink Opensource SQL, 采用Flink 1.10版本。初期Flink作业规划的Kafka的分区数partition设置过小或过大，后期需要更改Kafka区分数。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
IP Address函数 - 数据湖探索 DLI
IP Address函数 - 数据湖探索 DLI

IP Address函数 contains(network, address) → boolean 当CIDR网络中包含address时返回true。 SELECT contains('10.0.0.0/8', IPADDRESS '10.255.255.255'); -- true

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
SDK获取与安装 - 数据湖探索 DLI

将"dli-sdk-python-<version>.zip"解压到本地目录，目录可自行调整。安装SDK。打开Windows操作系统“开始”菜单，输入cmd命令。在命令行窗口，进入“dli-sdk-python-<version>.zip”解压目录下的windows目录。例如：“D:

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
SDK的获取与安装 - 数据湖探索 DLI

</settings> 方法二：通过在Eclipse中导入JAR文件安装SDK 使用Eclipse集成开发环境的项目，在集成开发环境中导入JAR文件。从Eclipse官网下载并安装Eclipse IDE for Java Developers最新版本。在Eclipse中配置好JDK。创建新工程，选择JRE版本，请参见图1

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
修改弹性资源池的主机信息 - 数据湖探索 DLI

一个业务IP。参考修改主机信息修改主机信息。如果MapReduce服务集群存在多个IP，创建跨源连接时填写其中任意一个业务IP即可。方法二：通过MRS节点的“/etc/hosts”信息获取MRS主机信息以root用户登录MRS的任意一个主机节点。执行以下命令获取MRS对应主机节点的hosts信息，复制保存。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
Spark SQL常用配置项说明 - 数据湖探索 DLI

dynamicPartitionPruning.enabled true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
导入数据（废弃） - 数据湖探索 DLI

dynamicPartitionOverwrite.enabled”默认值为“false”，对于DataSource表，表示动态插入覆盖整表数据，为“true”表示覆盖指定分区数据。说明：对于Hive分区表的动态覆盖写，仅支持覆盖涉及到的分区数据，不支持覆盖整表数据。表3 日期及时间模式字符定义模式字符

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
JSON函数 - 数据湖探索 DLI
JSON函数 - 数据湖探索 DLI

JSON函数使用SQL标准的ISO/IEC TR 19075-6中描述的JSON路径表达式。它们的语法受到ECMAScript的启发并采用了ECMAScript的许多特性，但既不是其子集，也不是其超集。路径表达式有两种，一种是宽松模式，另一种是严格模式。当省略时，它默认为严格模

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

源表上的SELECT查询（支持DLI表、OBS表）。 values_row 想要插入到表中的值，列与列之间用逗号分隔。注意事项表必须已经存在。如果动态分区不需要指定分区，则将“part_spec”作为普通字段放置SELECT语句中。被插入的OBS表在建表时只能指定文件夹路径。源表和目

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 DLI JDBC Driver支持JDBC标准的众多API，也有部分API不支持用户调用，例如涉及事务调用的API“prepareCall”，调用这类API将抛出“SQLFeatureNotSupportedException”异常

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

当您使用insert overwrite语句覆盖分区表的数据时，如果发现它覆盖了全量数据而不是预期的分区数据，这可能是因为动态分区覆盖功能没有被启用。如果需要动态覆盖DataSource表指定的分区数据，您需要先配置参数 dli.sql.dynamicPartitionOverwrite

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

tsdb-link-address”参数值格式为https://ip:port。若“tsd.https.enabled”为false，则“connector.tsdb-link-address”参数值格式可以为http://ip:port或者ip:port。在建立增强型跨源连接时，需要将MRS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
了解数据目录、数据库和表 - 数据湖探索 DLI

了解数据目录、数据库和表数据库和表是SQL作业、Spark作业场景开发的基础，在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Spark 3.3.1版本说明 - 数据湖探索 DLI

高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩容的稳定性，当shuffle文件不需要时清理Executor。支持配置小文件合并

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

如果未指定主键，Elasticsearch 将自动生成文档ID。动态索引 Elasticsearch sink同时支持静态索引和动态索引。如果您想使用静态索引，则index选项值应为纯字符串，例如 'myusers'，所有记录都将被写入到“myusers”索引中。如果您想使用动态索引，您可以使用 {field_name}

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
设置Flink作业优先级 - 数据湖探索 DLI

在“自定义配置”中输入如下语句，先开启动态扩缩容功能，再设置作业优先级。对于Flink作业，必须先设置flink.dli.job.scale.enable=true开启动态扩缩容功能，再设置作业优先级。开启动态扩缩容的更多参数设置请参考开启Flink作业动态扩缩容。 flink.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
复杂类型 - 数据湖探索 DLI
复杂类型 - 数据湖探索 DLI

-- 1 IPADDRESS IP地址，可以表征IPv4或者IPv6地址。但在系统内，该类型是一个统一的IPv6地址。对于IPv4的支持，是通过将IPv4映射到IPv6的取值范围（RFC 4291#section-2.5.5.2）来实现的。当创建一个IPv4时，会被映射到IPv6。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

dynamicPartitionPruning.enabled = true 该配置项用于启用或禁用动态分区修剪。在执行SQL查询时，动态分区修剪可以帮助减少需要扫描的数据量，提高查询性能。配置为true时，代表启用动态分区修剪，SQL会在查询中自动检测并删除那些不满足WHERE子句条件的分区，适用于在处理具有大量分区的表时。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南

总条数： 383

上一页
1
2
3
4
5
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

最新动态 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

Flink SQL作业Kafka分区数增加或减少，怎样不停止Flink作业实现动态感知？ - 数据湖探索 DLI

IP Address函数 - 数据湖探索 DLI

SDK获取与安装 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

修改弹性资源池的主机信息 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

导入数据（废弃） - 数据湖探索 DLI

JSON函数 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

DLI JDBC Driver支持的API列表 - 数据湖探索 DLI

为什么insert overwrite覆盖分区表数据的时候，覆盖了全量数据？ - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

Spark 3.3.1版本说明 - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

复杂类型 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线