搜索_华为云

JOINS - 数据湖探索 DLI
JOINS - 数据湖探索 DLI

当一张表在另一张表找到匹配的记录之后，半连接（semi-join）返回第一张表中的记录。与条件连接相反，即使在右节点中找到几条匹配的记录，左节点的表也只会返回一条记录。另外，右节点的表一条记录也不会返回。半连接通常使用IN或EXISTS作为连接条件。而anti-join则与semi-

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
创建并提交SQL作业 - 数据湖探索 DLI

209715200 配置执行连接时显示所有工作节点的表的最大字节大小。通过将此值设置为“-1”，可以禁用显示。说明：当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
查询Spark作业日志 - 数据湖探索 DLI

Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
SDK的获取与安装 - 数据湖探索 DLI

dli-sdk-java.version Java SDK版本说明。方法一：通过Maven安装DLI SDK依赖推荐您通过Maven安装依赖的方式使用华为云 Java SDK：安装服务级SDK依赖首先您需要在您的操作系统中下载并安装Maven 。安装配置完成后，输入命令“mvn -v”

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

Key:Value,...} path 是 STRING 表示在json中的path，以$开头。不同字符的含义如下： $表示根节点。 .表示子节点。 []表示[number]表示数组下标，从0开始。 *表示Wildcard for []，返回整个数组。*不支持转义。返回值说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Flink作业常用操作 - 数据湖探索 DLI

Flink作业常用操作用户创建了新作业后，需要根据用户的实际需求对作业进行操作，包括编辑作业基本信息，启停作业、导入/导出作业等。编辑作业用户可以对已经创建的作业进行编辑，如修改SQL语句、作业名称和描述、作业配置信息等。在DLI管理控制台的左侧导航栏中，单击“作业管理”

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
变更普通队列规格 - 数据湖探索 DLI

选择需要扩容的队列，单击“操作”列“更多”中的“规格变更”。在“规格变更”页面，“变更方式”选择“扩容”，设置扩容的CU值。图1 扩容确定费用后，单击“提交”。缩容当计算业务较小，不需要那么大的队列规格时，可以通过手动变更队列规格来缩容当前队列。缩容属于耗时操作，在DLI“规格变更”页面执行缩容操作后，需

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

获取AK/SK DLI Endpoint地址地区与终端节点，即云服务在不同Region有不同的访问域名。获取EndPoint DLI所在的项目ID 项目编号，用于资源隔离。获取项目ID DLI区域信息 DLI所属区域信息地区和终端节点步骤1：部署DBT环境安装dbt-core

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
构造请求 - 数据湖探索 DLI
构造请求 - 数据湖探索 DLI

Endpoint 指定承载REST服务端点的服务器域名或IP。不同服务不同区域的Endpoint不同，您可以从地区和终端节点中查询所有服务的终端节点。例如IAM服务在“华北-北京四”区域的Endpoint为“iam.cn-north-4.myhuaweicloud.com”。

帮助中心 > 数据湖探索 DLI > API参考 > 如何调用API
创建Hbase维表 - 数据湖探索 DLI
创建Hbase维表 - 数据湖探索 DLI

如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。语法格式

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
OVER - 数据湖探索 DLI
OVER - 数据湖探索 DLI

ROWS BETWEEN…和RANGE BETWEEN…的区别： ROW为物理窗口，即根据ORDER BY子句排序后，取前N行及后N行的数据计算（与当前行的值无关，只与排序后的行号相关）。 RANGE为逻辑窗口，即指定当前行对应值的范围取值，列数不固定，只要行值在范围内，对应列都包含在内。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 子句
查询批处理作业详情 - 数据湖探索 DLI

批处理作业类型，只支持spark类型参数。 log 否 Array of Strings 显示当前批处理作业的最后10条记录。 sc_type 否 String 计算资源类型。用户自定义时返回CUSTOMIZED。 cluster_name 否 String 批处理作业所在队列。 queue 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
查询Flink作业日志 - 数据湖探索 DLI

Service，OBS）提供的一种经过优化的高性能文件系统，提供毫秒级别访问时延，以及TB/s级别带宽和百万级别的IOPS，能够快速处理高性能计算（HPC）工作负载。并行文件系统的详细介绍和使用说明，请参见《并行文件系统特性指南》。配置DLI作业桶在DLI控制台左侧导航栏中单击“全局配置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
FileSytem结果表 - 数据湖探索 DLI

时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs时，请配置主NameNode的所在节点信息。参数说明表1 参数说明参数是否必选说明 connector.type 是固定为filesystem。 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
查询队列详情 - 数据湖探索 DLI

String 队列类型。 sql general all 如果不指定，默认为“sql”。 cuCount 否 Integer 与该队列绑定的计算单元数。即当前队列的CU数。 chargingMode 否 integer 队列的收费模式。 0：系统默认default队列。按照扫描量计费。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
提交SQL作业（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 queue_name 是当前所在的队列的名称，此SQL若需使用资源将使用该队列的资源进行计算。请求消息表2 请求参数参数是否必选参数类型说明 sql 是 String 待执行的SQL语句。 currentdb 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > SQL作业相关API（废弃）
查询批处理作业列表 - 数据湖探索 DLI

批处理作业的后台app id。 log 否 Array of Strings 显示当前批处理作业的最后10条记录。 sc_type 否 String 计算资源类型。用户自定义时返回CUSTOMIZED。 cluster_name 否 String 批处理作业所在队列。 create_time

帮助中心 > 数据湖探索 DLI > API参考 > Spark作业相关API
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

定义上峰度是样本的标准四阶中心矩（standardized 4th central moment)。随机变量的峰度计算方法为随机变量的四阶中心矩与方差平方的比值。具体计算公式为： select kurtosis(x) from (values (1),(2),(3),(4)) as

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
生成Flink SQL作业的静态流图 - 数据湖探索 DLI

Integer 最大并行度。并行数为作业每个算子的并行数，适度增加并行数会提高作业整体算力，但也须考虑线程增多带来的切换开销，上限是计算单元CU数的4倍，最佳实践为计算单元CU数的1-2倍。 tm_cus 否 Integer 单个taskManagerCU数量。 tm_slot_num 否

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建DLI表关联HBase - 数据湖探索 DLI

创建DLI表关联HBase之前需要创建跨源连接。管理控制台操作请参考增强型跨源连接。请确保在DLI队列host文件中添加MRS集群master节点的“/etc/hosts”信息。如何添加IP域名映射，请参见《数据湖探索用户指南》中增强型跨源连接章节。该语法不支持安全集群。语法格式

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表

总条数： 709

上一页
1
...
11
12
13
...
36
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

JOINS - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

查询Spark作业日志 - 数据湖探索 DLI

SDK的获取与安装 - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

变更普通队列规格 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

构造请求 - 数据湖探索 DLI

创建Hbase维表 - 数据湖探索 DLI

OVER - 数据湖探索 DLI

查询批处理作业详情 - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

提交SQL作业（废弃） - 数据湖探索 DLI

查询批处理作业列表 - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

生成Flink SQL作业的静态流图 - 数据湖探索 DLI

创建DLI表关联HBase - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线