搜索_华为云

Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以从

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

BY子句定义的，其特征是包含窗口表值函数产生的 “window_start” 和 “window_end” 列。和普通的 GROUP BY 子句一样，窗口聚合对于每个组会计算出一行数据。和其他连续表上的聚合不同，窗口聚合不产生中间结果，只在窗口结束产生一个总的聚合结果，另外，窗口聚合会清除不需要的中间状态。更

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

窗口函数窗口函数跨查询结果的行执行计算。它们在HAVING子句之后但在ORDER BY子句之前运行。调用窗口函数需要使用OVER子句来指定窗口的特殊语法。窗口具有三个组成部分：分区规范，它将输入行分为不同的分区。这类似于GROUP BY子句如何将行分为聚合函数的不同组。排序

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
instr1 - 数据湖探索 DLI
instr1 - 数据湖探索 DLI

instr1 instr1函数用于计算子串str2在字符串str1中的位置。相似函数：instr，instr函数用于返回substr在str中最早出现的下标。但是instr不支持指定起始搜索位置和匹配次数。命令格式 instr1(string <str1>, string <str2>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
rank - 数据湖探索 DLI
rank - 数据湖探索 DLI

rank rank函数用于计算一个值在一组值中的排位。如果出现并列的情况，RANK函数会在排名序列中留出空位。使用限制窗口函数的使用限制如下：窗口函数只能出现在select语句中。窗口函数中不能嵌套使用窗口函数和聚合函数。窗口函数不能和同级别的聚合函数一起使用。命令格式

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 分析窗口函数
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

分钟生成一个新的窗口。图1 滚动窗口示例图语法描述 TUMBLE 函数通过时间属性字段为每行数据分配一个窗口。在流计算模式，时间属性字段必须被指定为事件或处理时间属性。在批计算模式，窗口表函数的时间属性字段必须是 TIMESTAMP 或 TIMESTAMP_LTZ 的类型。 TUMBLE

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
instr - 数据湖探索 DLI
instr - 数据湖探索 DLI

当参数中出现NULL时，返回NULL，当str中不存在substr时返回0，注意下标从1开始。相似函数：instr1，instr1函数用于计算子串str2在字符串str1中的位置，instr1函数支持指定起始搜索位置和匹配次数。命令格式 instr(string <str>, string

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie percentile函数用于计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取第p位百分数的精确值。命令格式 percentile(colname,DOUBLE p) 参数说明表1 参数说明参数是否必选参数类型说明 colname 是 STRING类型

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以从

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

数据库认证密码，需要和'username'一起配置。 connection.max-retry-timeout 否 60s Duration 尝试连接数据库服务器最大重试超时时间，不应小于1s。 scan.partition.column 否无 String 用于对输入进行分区的列名。分区扫描参数，具体请参考分区扫描功能介绍。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentlie_approx percentile_approx函数用于计算近似百分位数，适用于大数据量。先对指定列升序排列，然后取第p位百分数最靠近的值。命令格式 percentile_approx (colname,DOUBLE p) 参数说明表1 参数说明参数是否必选

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
增强型跨源连接概述 - 数据湖探索 DLI

此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。使用约束限制使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。检测连通性要求

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

如购买按需计费的队列，在使用队列资源时，按照队列CU时进行计费。以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。队列CU时按需计费的计算费用=单价*CU数*小时数。步骤1：创建并上传数据创建CSV数据，例如，如图2所示test.csv：图2 创建test.csv文件

 帮助中心 > 数据湖探索 DLI > 最佳实践
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

指定为集群“公网访问地址”或“公网访问域名”，如果通过内网地址连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

则对所有值去重后计算。 COUNT(*) | COUNT(1) 返回输入行数。 AVG([ ALL | DISTINCT ] expression) 默认情况下或使用关键字 ALL，返回所有输入行中表达式的平均值（算术平均值）。使用 DISTINCT 则对所有值去重后计算。 SUM([

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

自动续费自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致资源被自动删除。自动续费的规则如下所述：以资源的到期日计算第一次自动续费日期和计费周期。您可以在购买资源时开通自动续费，在购买资源时，自动续费周期以实际选择的续费时长为准。在到期前均可开通自动续费，到期前

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。如果进一步处理采样输出，则可能会影响总查询时间。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
二进制函数和运算符 - 数据湖探索 DLI

15 48 crc32(binary) → bigint 计算二进制块的CRC 32值。 md5(binary) → varbinary 计算二进制块的MD 5哈希值。 sha1(binary) → varbinary 计算二进制块的SHA 1哈希值。 sha2(string, integer)

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
创建并提交SQL作业 - 数据湖探索 DLI

下拉选择需要使用的队列。如果没有可用队列，此处显示“default”队列，default队列为体验使用，建议重新创建队列。具体队列创建可以参考创建弹性资源池并添加队列。 SQL作业只能在队列类型为“SQL队列”下执行。数据目录数据目录（Catalog）是元数据管理对象，它可以包含多个数据库。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

如购买按需计费的队列，在使用队列资源时，按照队列CU时进行计费。以小时为单位进行结算。不足一小时按一小时计费，小时数按整点计算。队列CU时按需计费的计算费用=单价*CU数*小时数。数据说明详单数据车辆上报的详单数据，包括定时上报的位置记录和异常的驾驶行为触发的告警事件数据。

帮助中心 > 数据湖探索 DLI > 最佳实践

总条数： 443

上一页
1
...
12
13
14
...
23
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hbase源表 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

instr1 - 数据湖探索 DLI

rank - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

instr - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

使用DLI分析车联网场景驾驶行为数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线