搜索_华为云

ClickHouse结果表 - 数据湖探索 DLI

否刷新数据的时间间隔，单位可以为ms、milli、millisecond/s、sec、second/min、minute等。 connector.write.max-retries 否写数据失败时的最大尝试次数，默认值为：3。示例从dis中读取数据，并将数据插入到数据库为f

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

会删除不带uuid分区路径下数据。升级引擎版本后是否对作业有影响：有影响，会清理脏数据。示例代码：准备数据： obs://bucket1/test/overwrite_datasource下创建pt=pt1目录，并导入一个parquet数据文件。 create table ove

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

v1表（以下简称V1表）：DLI的Datasource表格式，建表/插入/truncate命令使用DLI自定义的command，表的数据路径为$tablepath/UUID/数据文件。图1 DLI datasource v1表 DLI datasource v2表（以下简称V2表）：spark开

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

场景概述用户使用Flink SQL作业时，需要创建OBS分区表，用于后续进行批处理。操作步骤该示例将car_info数据，以day字段为分区字段，parquet为编码格式，转储数据到OBS。更多内容请参考《数据湖探索Flink SQL语法参考》。 1 2 3 4 5 6

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误当Spark作业运行大批量数据时，如果出现作业运行超时异常错误，通常是由于作业的资源配置不足、数据倾斜、网络问题或任务过多导致的。解决方案：设置并发数：通过设置合适的并发数，可以启动多任务并行运行，从而提高作业的处理能力。例如访

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业运维类
CREATE TABLE语句 - 数据湖探索 DLI

ENFORCED。它申明了是否输入/出数据会做合法性检查（是否唯一）。Flink 不存储数据因此只支持 NOT ENFORCED 模式，即不做检查，用户需要自己保证唯一性。 Flink 假设声明了主键的列都是不包含 Null 值的，Connector 在处理数据时需要自己保证语义正确。注意:

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

池绑定的Prometheus 实例。配置高级设置：仅”全量指标创建”的方式支持该配置项，配置时建议开启无数据处理。即配置监控周期内无指标数据产生或指标数据不足时系统的处理方式。告警通知的行动规则：建议开启告警通知的行动规则，确保告警时可以通过邮件或者短信等方式获取通知。配置时选择2中配置的告警行动规则。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

pattern为空串或其他类型时返回报错。 start_position 否 BIGINT BIGINT类型常量，必须大于0。其他类型或值小于等于0时返回报错。不指定时默认为1，表示从source的第一个字符开始匹配。返回值说明返回BIGINT类型的值。如果没有匹配成功，返回0。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询HBase表 - 数据湖探索 DLI
查询HBase表 - 数据湖探索 DLI

通过hbase进行数据过滤，即HBase Client将过滤条件传给HBase服务端进行处理，HBase服务端只返回用户需要的数据，提高了Spark SQL查询的速度。对于HBase不支持的过滤条件，例如组合Rowkey的查询，直接由Spark SQL进行。支持查询下压的场景数据类型场景

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
DWS Connector概述 - 数据湖探索 DLI

DWS Connector概述数据仓库服务（Data Warehouse Service，简称DWS）是一种基于基础架构和平台的在线数据处理数据库，为用户提供海量数据挖掘和分析服务。DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
使用DataSource语法创建DLI表 - 数据湖探索 DLI

表名对大小写不敏感，即不区分大小写。 col_name 是以逗号分隔的带数据类型的列名。列名由字母、数字和下划线（_）组成。不能是纯数字，且至少包含一个字母。列名为大小写不敏感，即不区分大小写。 col_type 是列字段的数据类型。数据类型为原生类型。请参考原生数据类型。 col_comment 否列字段描述。仅支持字符串常量。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
datediff - 数据湖探索 DLI
datediff - 数据湖探索 DLI

type mismatch。 date1、date2为DATE或STRING类型，但不符合日期值的入参格式时，返回NULL。如果date1小于date2，返回值为负数。 date1或date2值为NULL时，返回NULL。示例代码返回10。 select datediff('2023-06-30

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
pyspark样例代码 - 数据湖探索 DLI

id、location、city：限定了长度，插入数据时须按长度给定数据值，否则查询时会发生编码格式错误。操作结果；提交Spark作业将写好的python代码文件上传至OBS桶中。如果MRS集群开启了Kerberos认证，创建Spark作业时需要将krb5.conf和user.keytab文件添加到作业

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

依赖包，用于支持各种数据处理和分析任务。如果您上传的Jar包中包含DLI Flink运行平台中已经存在的包，则会提示Flink Jar 包冲突，导致作用提交失败。请参考DLI用户指南中提供的依赖包信息先将重复的包删除后再上传。 DLI内置依赖包请参考《数据湖探索用户指南》。父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink Jar作业类
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

fields：适用于所有数据类型 fields-scores：适用于sorted set数据类型 array：适用于list、set、sorted set数据类型 array-scores：适用于sorted set数据类型 map：适用于hash、sorted set数据类型 schem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
percentile - 数据湖探索 DLI
percentile - 数据湖探索 DLI

表1 参数说明参数是否必选说明 col 是数据类型为数值的列。其他类型返回NULL。 p 是 0<=P<=1,否则返回NULL。 B 是参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。返回值说明返回DOUBLE类型的值。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数
DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

Spark查询语句性能提升。元数据访问性能提升提升Spark在处理大数据时的元数据访问性能，提高数据处理流程效率。提升OBS committer小文件写性能提升对象存储服务（OBS）在处理小文件写入时的性能，提高数据传输效率。动态Executor shuffle数据优化提升资源扩缩

 帮助中心 > 数据湖探索 DLI > 服务公告 > 产品公告

总条数： 600

上一页
1
...
11
12
13
...
30
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

ClickHouse结果表 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

怎样将OBS表映射为DLI的分区表？ - 数据湖探索 DLI

Spark作业运行大批量数据时上报作业运行超时异常错误 - 数据湖探索 DLI

CREATE TABLE语句 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

查询HBase表 - 数据湖探索 DLI

DWS Connector概述 - 数据湖探索 DLI

使用DataSource语法创建DLI表 - 数据湖探索 DLI

datediff - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Flink Jar 包冲突，导致作业提交失败 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

percentile - 数据湖探索 DLI

DLI Spark 3.1.1版本停止服务（EOS）公告 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线