搜索_华为云

TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

escapeChar]] 描述该语法中DATABASES和SCHEMAS在概念上是等价的，是可互换的，该语法用于例举所有metastore中定义的schemas。可选子句LIKE可以使用规则运算来过滤结果，它支持的通配符为“*”（匹配任意字符）和“|”(匹配可选项)。示例列出当前catalog所有的schemas：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
创建并使用跨源链接 - 数据湖探索 DLI

本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云API参考》。获取子网网络ID接口，具体请参考《虚拟私有云API参考》。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
Hudi Clustering操作说明 - 数据湖探索 DLI

置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。 Clustering服务

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

es"修改为对应的数据库名字。 passwdauth DLI侧创建的Password类型的跨源认证名称。使用跨源认证则无需在作业中配置账号和密码。 dbtable 数据库postgres中的数据表。 partitionColumn 读取数据时，用于设置并发使用的数值型字段。说明：

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
产品优势 - 数据湖探索 DLI
产品优势 - 数据湖探索 DLI

互式分析为一体的Serverless大数据计算分析服务。线下应用可无缝平滑迁移上云，减少迁移工作量。采用批流融合高扩展性框架，为TB~EB级数据提供了更实时高效的多样性算力，可支撑更丰富的大数据处理需求。产品内核及架构深度优化，综合性能是传统MapReduce模型的百倍以上，SLA保障99

帮助中心 > 数据湖探索 DLI > 产品介绍
DWS维表（不推荐使用） - 数据湖探索 DLI

将二者生成的宽表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
Python SDK概述 - 数据湖探索 DLI
Python SDK概述 - 数据湖探索 DLI

Python SDK列表类型说明队列相关介绍查询所有队列的Python SDK使用说明。资源相关介绍上传资源包、查询所有资源包、查询制定资源包、删除资源包的Python SDK使用说明。 SQL作业相关介绍数据库相关、表相关、作业相关的Python SDK使用说明。 Spark作业相关

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
ORDER BY - 数据湖探索 DLI
ORDER BY - 数据湖探索 DLI

选择输出列的序号。 ORDER BY子句在GROUP BY或HAVING子句之后，在OFFSET、LIMIT或FETCH FIRST子句之前进行计算。按照SQL规范，ORDER BY子句只影响包含该子句的查询结果的行顺序。HetuEngine遵循该规范，并删除该子句的冗余用法，以避免对性能造成负面影响。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
数据赋权（用户）（废弃） - 数据湖探索 DLI

功能介绍该API用于将数据库或数据表的数据权限赋给指定的其他用户。被赋权用户所在用户组的所属区域需具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
CREATE VIEW - 数据湖探索 DLI
CREATE VIEW - 数据湖探索 DLI

BY和LIMIT子句，如果关联了该视图的查询语句也包含了这些子句，那么查询语句中的ORDER BY和LIMIT子句将以视图的结果为基础进行运算。描述使用SELECT查询结果创建新视图。视图是一个逻辑表，可以被将来的查询所引用，视图中没有数据。该视图对应的查询在每次被其他查询引用该视图时都会被执行。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
资源标签相关API - 数据湖探索 DLI

资源标签相关API 批量添加资源标签批量删除资源标签查询资源实例数量查询资源实例列表查询指定资源类型的标签信息查询指定资源实例的标签信息

 帮助中心 > 数据湖探索 DLI > API参考
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

图1描述了按需计费的DLI资源各个阶段的状态。购买后，在计费周期内资源正常运行，此阶段为有效期；当您的账号因按需资源自动扣费导致欠费后，账号将变成欠费状态，资源将陆续进入宽限期和保留期。图1 按需计费的DLI资源生命周期欠费预警系统会在每个计费周期后的一段时间对按需计费资源进行扣费。当您的账

 帮助中心 > 数据湖探索 DLI > 计费说明
窗口聚合 - 数据湖探索 DLI
窗口聚合 - 数据湖探索 DLI

GROUPING SETS 的每个子列表可以是空的，多列或表达式，它们的解释方式和直接使用 GROUP BY 子句是一样的。一个空的 Grouping Sets 表示所有行都聚合在一个分组下，即使没有数据，也会输出结果。对于 Grouping Sets 中的空子列表，结果数据中的分组或表达式列会用NULL代替。例如，上例中的

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

where id = 1").show() 查询结果： DataFrame相关操作 createDataFrame() 方法创建的数据和read.format() 方法及read.jdbc() 方法查询的数据都为DataFrame对象，可以直接进行查询单条记录等操作（在“步骤4”中，提到

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
pyspark样例代码 - 数据湖探索 DLI

交作业，页面显示“批处理作业提交成功”说明Spark作业提交成功，可以在Spark作业管理页面查看提交的作业的状态和日志。创建Spark作业时选择的“所属队列”为创建跨源连接时所绑定的队列。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
SHOW TABLES - 数据湖探索 DLI
SHOW TABLES - 数据湖探索 DLI

LIKE pattern [ESCAPE escapeChar] ] 描述这个表达式用于列出指定schema下的所有表。如果没有指定schema，则默认使用当前所在的schema。可选参数like被用于基于关键字来进行匹配。示例 --创建测试表 Create table show_table1(a

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
按列GROUP BY - 数据湖探索 DLI
按列GROUP BY - 数据湖探索 DLI

BY的所有字段分组，所有字段都相同的记录将被放在同一组中，同样，GROUP BY中出现的字段必须在attr_expr_list的字段内，attr_expr_list也可以使用聚合函数。注意事项所要分组的表必须是已经存在的表，否则会出错。示例根据score及name两个字段对表student进行分组，并返回分组结果。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 分组
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

SQL编辑页面，自定义配置中修改该参数值，即可达到快速修改UDF参数值的目的。操作步骤自定义函数中提供了可选的open(FunctionContext context)方法，FunctionContext具备参数传递功能，自定义配置项通过此对象来传递。自定义函数的参数传递操作步骤如下：在Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数

总条数： 975

上一页
1
...
44
45
46
...
49
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

TABLESAMPLE - 数据湖探索 DLI

SHOW SCHEMAS（DATABASES） - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

产品优势 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

Python SDK概述 - 数据湖探索 DLI

ORDER BY - 数据湖探索 DLI

数据赋权（用户）（废弃） - 数据湖探索 DLI

CREATE VIEW - 数据湖探索 DLI

资源标签相关API - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

窗口聚合 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

SHOW TABLES - 数据湖探索 DLI

按列GROUP BY - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线