搜索_华为云

数据湖探索简介 - 数据湖探索 DLI

聚焦于查询计算分析。DLI在开源Spark基础上进行了大量的性能优化与服务化改造，不仅兼容Apache Spark生态和接口，性能较开源提升了2.5倍，在小时级即可实现EB级数据查询分析。 Flink是一款分布式的计算引擎，可以用来做批处理，即处理静态的数据集、历史的数据集；也可

 帮助中心 > 数据湖探索 DLI > 产品介绍
存储计费 - 数据湖探索 DLI
存储计费 - 数据湖探索 DLI

华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于充值的详细操作请参见账户充值。按需计费模式和套餐包组合使用 DLI支持套餐包和按需计费模式结合使用。购买了存储量套餐包，按需使用过程中优先抵扣存储套餐包的规格额度，超过套餐包额度的按照按需计费。存储套餐的额度每个小时会重置。套餐包使用示例请参考套餐包计费。

帮助中心 > 数据湖探索 DLI > 计费说明
自动续费 - 数据湖探索 DLI
自动续费 - 数据湖探索 DLI

自动续费自动续费可以减少手动续费的管理成本，避免因忘记手动续费而导致资源被自动删除。自动续费的规则如下所述：以资源的到期日计算第一次自动续费日期和计费周期。您可以在购买资源时开通自动续费，在购买资源时，自动续费周期以实际选择的续费时长为准。在到期前均可开通自动续费，到期前

 帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

Spark jar 作业一直处于“提交中”可能是队列剩余的CU量不足导致作业无法提交。查看队列的的剩余步骤如下：查看队列CU使用量。点击“云监控服务 > 云服务监控 > 数据探索湖 > 队列监控 > 队列CU使用量” 。计算剩余CU量。队列剩余CU量=队列CU量 - 队列CU使用量。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

华为云根据客户等级定义了不同客户的宽限期和保留期时长。关于充值的详细操作请参见账户充值。按需计费模式和套餐包组合使用 DLI支持套餐包和按需计费模式结合使用。购买了扫描数据量套餐包，按需使用过程中优先抵扣扫描数据量套餐包的规格额度，超过扫描数据量套餐包额度的按照按需计费。扫描数据量套餐的额度每个月会重置。

帮助中心 > 数据湖探索 DLI > 计费说明
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

功能描述本节介绍FileSystem源表的定义，以及创建源表时使用的参数和示例代码。前提条件该场景作业需要建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

percentile函数用于计算精确百分位数，适用于小数据量。先对指定列升序排列，然后取第p位百分数的精确值。命令格式 percentile(colname,DOUBLE p) 参数说明表1 参数说明参数是否必选参数类型说明 colname 是 STRING类型代表需要排序的列名。列中元素只能为整数类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

EXISTS：所需创建的数据库已存在时使用，可避免系统报错。 COMMENT：对数据库的描述。 DBPROPERTIES：数据库的属性，且属性名和属性值成对出现。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
MySQL CDC源表 - 数据湖探索 DLI
MySQL CDC源表 - 数据湖探索 DLI

Integer MySQL数据库的端口号。 server-id 否 5400~6000随机值 String 数据库客户端的一个数字ID，该ID必须是MySQL集群中全局唯一的。建议针对同一个数据库的每个作业都设置一个不同的ID。默认会随机生成一个5400~6400的值。 scan.startup

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
percentlie - 数据湖探索 DLI
percentlie - 数据湖探索 DLI

STRING类型代表需要排序的列名。列中元素为DOUBLE类型。当列中元素非DOUBLE类型时，会隐式转换为DOUBLE类型后参与运算。 p 是 DOUBLE类型参数a的格式包括浮点数格式、整数格式、字符串格式。参数p的范围为0-1。参数p的格式包括浮点数格式。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 数学函数
创建Flink Jar作业 - 数据湖探索 DLI

CU数量=实际CU数量=max[管理单元和TaskManager的CPU总和，(管理单元和TaskManager的内存总和/4)] 管理单元和TaskManager的CPU总和=实际TM数 * 单TM所占CU数 + 管理单元。管理单元和TaskManager的内存总和= 实际TM数 * 设置的单个TM的内存 +

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

_cust_sum 这个函数里面有delete 和 insert SAA_OUTBOUND_ORDER_CUST_SUM的操作。处理步骤修改作业逻辑，避免对同一张表并发执行insert overwrite操作。父主题：增强型跨源连接类

 帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据MySQL和Kafka的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
创建表（废弃） - 数据湖探索 DLI

Array of Objects 数据库的标签。具体请参考tags参数。表3 tags参数参数名称是否必选参数类型说明 key 是 String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 资源相关API（废弃） > 表相关API（废弃）
怎样监控DLI队列上的作业异常？ - 数据湖探索 DLI

怎样监控DLI队列上的作业异常？ DLI为用户提供了作业失败的topic订阅功能。登录DLI控制台。单击左侧“队列管理”，进入队列管理页面。在队列管理页面，单击左上角“创建消息通知主题”进行配置。详细操作请参考《数据湖探索用户指南》。父主题： DLI弹性资源池和队列类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

该字段的map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

Redis 表schema的key 示例从Kafka源表中读取数据，将Redis表作为维表，并将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，根据Redis和Kafka所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果注意事项

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据操作语句DML
JDBC - 数据湖探索 DLI
JDBC - 数据湖探索 DLI

二者生成的表信息写入Print结果表中。参考增强型跨源连接，根据RDS MySQL所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置RDS MySQL的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根RDS的地址测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表

总条数： 898

上一页
1
...
9
10
11
...
45
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

数据湖探索简介 - 数据湖探索 DLI

存储计费 - 数据湖探索 DLI

自动续费 - 数据湖探索 DLI

为什么Spark jar 作业一直处于“提交中”？ - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

MySQL CDC源表 - 数据湖探索 DLI

percentlie - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

对跨源DWS表执行insert overwrite操作，报错：org.postgresql.util.PSQLException: ERROR: tuple concurrently updated - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

创建表（废弃） - 数据湖探索 DLI

怎样监控DLI队列上的作业异常？ - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

JDBC - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线