搜索_华为云

设置Spark作业优先级 - 数据湖探索 DLI

在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Spark 2.4

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
keyvalue - 数据湖探索 DLI
keyvalue - 数据湖探索 DLI

split1、split2 否 STRING 用于作为分隔符的字符串，按照指定的两个分隔符拆分源字符串。如果表达式中没有指定这两项，默认split1为";"，split2为":"。当某个被split1拆分后的字符串中有多个split2时，返回结果未定义。 key 否 BIGINT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
查询所有弹性资源池 - 数据湖探索 DLI

Query参数参数是否必选参数类型描述 limit 否 Integer 每页的数量。默认为100。 name 否 String 通过弹性资源池名称进行模糊匹配。 offset 否 Integer 偏移量。默认为0。 status 否 String 弹性资源池状态。具体参数范围如下：

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API
CLEANING - 数据湖探索 DLI
CLEANING - 数据湖探索 DLI

d]'); 参数描述表1 参数描述参数描述是否必填 table 需要查询表的表名，支持database.tablename格式是 clean_policy 清理老版本数据文件的策略，默认KEEP_LATEST_COMMITS 否 retain_commits 仅对KEE

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

中。如果WITH子句指定的属性名称与复制的属性名称相同，则将使用WITH子句中的值。默认是EXCLUDING PROPERTIES属性，而且最多只能为一个表指定INCLUDING PROPERTIES属性。 PARTITIONED BY能够用于指定分区的列；CLUSTERED BY能够被用于指定分桶的列；SORT

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

来将多个SELECT语句的结果集合并成单个结果集。 UNION UNION将第一个查询的结果集中的所有行与第二个查询的结果集中的行合并。 query UNION [ALL | DISTINCT] query ALL和DISTINCT表示是否返回包含重复的行。ALL返回所有的行；D

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
导出查询结果 - 数据湖探索 DLI

USING：指定所存储格式。 OPTIONS：导出时的属性列表，为可选项。参数表1 INSERT OVERWRITE DIRECTORY参数描述参数描述 path 要将查询结果写入的OBS路径。 file_format 写入的文件格式，支持按CSV、Parquet、ORC、JSON、Avro格式。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
DLI SDK功能矩阵 - 数据湖探索 DLI

SDK提供的接口函数进行二次开发。 Java、Python SDK功能矩阵请参见表1 表1 SDK功能矩阵语言功能内容 Java OBS授权介绍将OBS桶的操作权限授权给DLI的Java SDK使用说明。队列相关介绍创建队列、获取默认队列、查询所有队列、删除队列的Java

帮助中心 > 数据湖探索 DLI > SDK参考 > DLI SDK
字符类型 - 数据湖探索 DLI
字符类型 - 数据湖探索 DLI

STRING 兼容impala的String，底层是varchar。 BINARY 兼容hive的Binary，底层实现为varbinary。 SQL表达式中，支持简单的字符表达式，也支持Unicode方式，一个Unicode字符串是以U&为固定前缀，以4位数值表示的Unicode前需要加转义符。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > 数据类型
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_extract REGEXP_EXTRACT函数用于将字符串source按照pattern的分组规则进行字符串匹配，返回第groupid个组匹配到的字符串内容。命令格式 regexp_extract(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
Flink作业性能调优 - 数据湖探索 DLI

出，说明的是该消费组当前待消费的数据总量。如果Flink作业对接的是kafka专享版，则可通过云监控服务(CES)进行查看。具体可选择“云服务监控 > 分布式消息服务 > kafka专享版” ，单击“kafka实例名称 > 消费组” ，选择具体的消费组名称，查看消费组的指标信息。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

返回string中从integer1位置开始的长度为integer2的子字符串。若integer2未配置，则默认返回从integer1开始到末尾的子字符串 REPLACE(string1, string2, string3) STRING 用string3代替string1中的string2后的字符串，并返回替换后的string1字符串

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务弹性扩缩容定时任务使用场景通常，用户业务繁忙的场景是有周期性的，在某个周期内，用户需要更多的计算资源来处理业务，过了这个周期，则不需要那么多资源。如果用户购买的队列规格比较小，在业务繁忙时会存在资源不足的情况；而如果购买的队列规格比较大，又可能会存在资源浪费的情况。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
字符串函数 - 数据湖探索 DLI
字符串函数 - 数据湖探索 DLI

返回string中从integer1位置开始的长度为integer2的子字符串。若integer2未配置，则默认返回从integer1开始到末尾的子字符串 REPLACE(string1, string2, string3) STRING 用string3代替string1中的string2后的字符串，并返回替换后的string1字符串

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
怎样排查DLI计费异常？ - 数据湖探索 DLI

了大量数据而产生的计费。具体操作请参考数据存储。数据存储进入“数据管理”>“库表管理”页面。查看所建的数据库中是否有存储在DLI中的数据：单击所要查看的数据库名，进入对应的“表管理”页面；查看对应表的“数据存储位置”是否为DLI。如果有存储在DLI中的数据，则按照存储计费的标准计费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
创建弹性资源池并添加队列 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
DLI Hudi SQL语法参考 - 数据湖探索 DLI

Hudi DDL语法说明 Hudi DML语法说明 Hudi CALL COMMAND语法说明 Schema演进语法说明配置Hudi数据列默认值

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
批量停止作业 - 数据湖探索 DLI

在停止作业之前，用户可以选择是否对作业创建保存点，保存作业的状态信息。类型为boolean。当triggerSavePoint为true时，表示创建保存点。当triggerSavePoint为false时，表示不创建保存点。默认为false。响应消息表3 响应参数说明参数名称

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
聚合函数概览 - 数据湖探索 DLI

1]之间。参数B控制近似的精确度，B值越大，近似度越高，默认值为10000。当列中非重复值的数量小于B时，返回精确的百分数。 stddev_pop stddev_pop(col) DOUBLE 返回指定列的偏差。 stddev_samp stddev_samp(col) DOUBLE 返回指定列的样本偏差。 sum sum(col)

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 聚合函数

总条数： 687

上一页
1
...
19
20
21
...
35
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

设置Spark作业优先级 - 数据湖探索 DLI

keyvalue - 数据湖探索 DLI

查询所有弹性资源池 - 数据湖探索 DLI

CLEANING - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

UNION | INTERSECT | EXCEPT - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

DLI SDK功能矩阵 - 数据湖探索 DLI

字符类型 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

设置普通队列的弹性扩缩容定时任务 - 数据湖探索 DLI

字符串函数 - 数据湖探索 DLI

怎样排查DLI计费异常？ - 数据湖探索 DLI

创建弹性资源池并添加队列 - 数据湖探索 DLI

DLI Hudi SQL语法参考 - 数据湖探索 DLI

批量停止作业 - 数据湖探索 DLI

聚合函数概览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线