搜索_华为云

了解数据目录、数据库和表 - 数据湖探索 DLI

敏感类的业务，如交互类的查询等。库表管理中表的列表页面，表类型为Managed的即代表DLI表。 OBS表 OBS表的数据存储在OBS上，适用于对时延不敏感的业务，如历史数据统计分析等。 OBS表通常以对象的形式存储数据，每个对象包含数据和相关的元数据。库表管理中表的列表页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行时计算的随机值之间的比较）。结果中包含一行的概率与任何其他行无关。这不会减少从磁盘读取采样表所需的时间。

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
设置Spark作业优先级 - 数据湖探索 DLI

在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Spark作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Spark 2.4

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

指定日期减去目标天数后的日期，数据类型为STRING。 TIME string TIME 以“HH:mm:ss”的形式返回从字符串解析的 SQL 时间。 TIMESTAMP string TIMESTAMP 以“yyyy-MM-dd HH:mm:ss[.SSS]”的形式返回从字符串解析的 SQL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_extract REGEXP_EXTRACT函数用于将字符串source按照pattern的分组规则进行字符串匹配，返回第groupid个组匹配到的字符串内容。命令格式 regexp_extract(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
SparkSQL建表参数规范 - 数据湖探索 DLI

preCombineField 预合并键，相同主键的多条数据按该字段进行合并按需必须指定，相同主键的数据会按该字段合并，不能指定多个字段。禁止建表时将hoodie.datasource.hive_sync.enable指定为false。指定为false将导致新写入的分区无法同步到Hive Me

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
导出Flink作业 - 数据湖探索 DLI
导出Flink作业 - 数据湖探索 DLI

String OBS路径，用于保存导出的作业文件。 is_selected 是 Boolean 是否导出指定的作业。 job_selected 否 Array of Longs 当“is_selected”为“true”时，该参数是待导出作业的ID集合。说明：当“is_sele

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
算术运算符 - 数据湖探索 DLI
算术运算符 - 数据湖探索 DLI

查看两个参数的二进制表示法的值，并执行按位”或”操作。只要任一表达式的一位为1，则结果的该位为 1。否则，结果的该位为0。 A ^ B 所有数字类型查看两个参数的二进制表示法的值，并执行按位”异或”操作。当且仅当只有一个表达式的某位上为1时，结果的该位才为1。否则结果的该位为0。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 运算符
日期函数概览 - 数据湖探索 DLI

mat中出现多余的格式串，则只取第一个格式串对应的日期数值，其余的会被视为分隔符。例如isdate("1234-yyyy", "yyyy-yyyy")，会返回True。 last_day last_day(string date) DATE 返回date所在月份的最后一天，格式为

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

骤如下：参考增强型跨源连接，根据redis所在的虚拟私有云和子网创建相应的增强型跨源，并绑定所要使用的Flink弹性资源池。设置Redis的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性根据redis的地址测试队列连通性。如果能连通，则表示跨源已经绑定成功，否则表示未成功。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

该非主键字段需要为map类型，同时该字段map的value需要为double类型，表示score，该字段的map的key表示redis的set中的值。当data-type为sorted-set，且schema-syntax为array-scores时，除主键字段外，只能有两个非主键字段，且这两个字段的类型需要为array。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

参数类型说明 zip_file 是 String 从OBS上导入的作业zip文件路径，支持填写文件夹，导入文件夹下的所有zip文件。说明：文件夹中只能包含zip文件。 is_cover 否 Boolean 如果导入的作业与服务已有的作业同名，是否覆盖服务中已有的作业。响应消息

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业列表 - 数据湖探索 DLI

查询作业列表功能介绍查询当前用户的作业列表，可以根据作业ID作为ID，查询大于ID或小于ID的限定条数的作业，默认查询全部状态的作业，也可以设定运行中或其他状态条件。调试您可以在API Explorer中调试该接口。 URI URI格式 GET /v1.0/{projec

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
创建并提交SQL作业 - 数据湖探索 DLI

柱状图和折线图的X轴可为任意一列，Y轴仅支持数值类型的列，扇形图对应图例和指标。 SQL编辑器功能概览 SQL作业参数设置单击SQL编辑器页面右上方的“设置”按钮。可以设置SQL作业运行参数和作业标签。参数设置：以“key/value”的形式设置提交SQL作业的配置项。详细

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
管理Spark作业模板 - 数据湖探索 DLI

模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。当前云平台尚未提供预置的Spark模板，但支持用户自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。新建Spark作业模板 Spark作业模板的创建方法是在创建Spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
什么是用户配额？ - 数据湖探索 DLI

配额是指云平台预先设定的资源使用限制，包括资源数量和容量等。设置配额是为了确保资源合理的分配和使用，避免资源过度集中和资源浪费。如果资源配额限制满足不了用户的使用需求，可以通过工单系统来提交您的申请，并告知您申请提高配额的理由。在通过审理之后，系统会更新您的配额并进行通知。关于配额的具体操作说明，请参见关于配额。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI资源配额类
查询作业详情 - 数据湖探索 DLI

String 用户上传的config包OBS路径。 udf_jar_url 否 String 用户已上传到DLI资源管理系统的程序包名，用户sql作业的udf jar通过该参数传入。 dirty_data_strategy 否 String 作业脏数据策略。 “2:obsDir”

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
设置Flink作业优先级 - 数据湖探索 DLI

在实际作业运行中，由于作业的重要程度以及紧急程度不同，需要重点保障重要和紧急的作业正常运行，因此需要满足它们正常运行所需的计算资源。 DLI提供的设置作业优先级功能，可以对每个Flink作业设置作业优先级，当资源不充足时，可以优先满足优先级较高的作业的计算资源。 Flink 1.

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
查询所有表（废弃） - 数据湖探索 DLI

Long 最近更新时间。是单位为“毫秒”的时间戳。 location 否 String OBS表上的存储路径。 owner 是 String 表创建者。 table_name 是 String 表名称。 table_size 是 Long DLI表的大小。非DLI表该参数值为0。 table_type

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 表相关API（废弃）

总条数： 717

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

了解数据目录、数据库和表 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

设置Spark作业优先级 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

regexp - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

导出Flink作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

算术运算符 - 数据湖探索 DLI

日期函数概览 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

创建并提交SQL作业 - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

什么是用户配额？ - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

查询所有表（废弃） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线