搜索_华为云

Confluent Avro Format - 数据湖探索 DLI

password 否无 String SSL truststore的密码。 avro-confluent.subject 否无 String 用于在序列化期间此格式使用的注册schema的Confluent Schema Registry主题。默认情况下，'kafka'和'upsert-

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

开发说明本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。代码实现

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

例如：(start_date <> '202007'), partitions(start_date < '201912') 示例为了便于理解删除分区语句的使用方法，本节示例为您提供源数据，基于源数据提供删除分区的操作示例。使用DataSource语法创建一个OBS表分区表。创建了一个名为stud

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
trans - 数据湖探索 DLI
trans - 数据湖探索 DLI

多行的UDTF，将列中存储的以固定分隔符格式分隔的数组转为多行。使用限制所有作为key的列必须位于在前面，而要转置的列必须放在后面。在一个select中只能有一个UDTF，不可以再出现其他的列。不可以与group by、cluster by、distribute by、sort

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 其他函数
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

安全组规则的描述信息，非必填项。 _ 步骤4：创建增强型跨源连接登录DLI管理控制台，在左侧导航栏单击“跨源管理”，在跨源管理界面，单击“增强型跨源”，单击“创建”。在增强型跨源创建界面，配置具体的跨源连接参数。具体参考如下。连接名称：设置具体的增强型跨源名称。弹性资源池：选择DLI的队列。（未添加至资源池的队列，请直接选择队列名称。）

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

业任务的正常执行。本节操作介绍查看弹性资源池计算资源使用情况、作业所需CU数的查看方法。怎样查看弹性资源池的资源使用情况？登录DLI管理管理控制台。选择“资源管理 > 弹性资源池”。在弹性资源池的列表页查看资源池的“实际CUs”和“已使用CUs”。实际CUs：弹性资源池当前分配的可用CUs。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI弹性资源池和队列类
Over聚合 - 数据湖探索 DLI
Over聚合 - 数据湖探索 DLI

子句定义上下边界，其内的所有行都会聚合。Flink 只支持 CURRENT ROW 作为上边界。有两种方法可以定义范围：ROWS 间隔和 RANGE 间隔： RANGE 间隔 RANGE 间隔是定义在排序列值上的，在 Flink 里，排序列总是一个时间属性。下面的 RANG 间隔定义了聚合会在比当前行的时间属性小

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

15版本使用DEW管理访问凭据，在创建作业时，请配置作业使用Flink1.15版本、且已在作业中配置允许DLI访问DEW的委托信息。自定义委托及配置请参考自定义DLI委托权限。使用该功能，所有涉及OBS的桶，都需要进行配置AKSK。语法格式在Flink jar作业编辑界面，选择配置优化参数，配置信息如下:

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
停止计费 - 数据湖探索 DLI
停止计费 - 数据湖探索 DLI

使用DLI资源ID查找资源时，包含以下操作：在费用中心账单中获取DLI资源ID。并根据账单中资源ID查看资源名称。根据资源名称在DLI云服务的控制台查找资源。删除资源将资源停止计费。详细操作步骤如下：在费用中心账单中获取资源ID。登录管理控制台，在顶部菜单栏中选择“费用与成本 >

帮助中心 > 数据湖探索 DLI > 计费说明
get_json_object - 数据湖探索 DLI
get_json_object - 数据湖探索 DLI

json 是 STRING 标准的JSON格式对象，格式为{Key:Value, Key:Value,...} path 是 STRING 表示在json中的path，以$开头。不同字符的含义如下： $表示根节点。 .表示子节点。 []表示[number]表示数组下标，从0开始。 *表示Wildcard

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
聚合函数 - 数据湖探索 DLI
聚合函数 - 数据湖探索 DLI

DISTINCT ] expression) VAR_SAMP() 的同义方法。 RANK() 返回值在一组值中的排名。结果是 1 加上分区顺序中当前行之前或等于当前行的行数。排名在序列中不一定连续。 DENSE_RANK() 返回值在一组值中的排名。结果是一加先前分配的等级值。与函数 rank

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数 > 内置函数
跨源认证概述 - 数据湖探索 DLI

配置跨源认证后，无需在作业中重复配置数据源认证信息，提高数据源认证的安全性，便于DLI安全访问数据源。 SQL作业、Flink 1.12版本的跨源访问场景，使用DLI提供的“跨源认证”管理数据源的访问凭证。本节操作为您介绍DLI提供的跨源认证的使用方法。约束与限制表1 跨源认证约束限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
查询作业执行进度信息 - 数据湖探索 DLI

如果整个作业刚开始运行或者在提交中，则进度展示为0；如果作业运行结束，则进度展示为1。此时progress表示整个作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的tas

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Hudi表索引设计规范 - 数据湖探索 DLI

Flink在写Hudi的MOR表只会生成log文件，后续通过compaction操作，将log文件转为parquet文件。Spark在更新Hudi表时严重依赖parquet文件是否存在，如果当前Hudi表写的是log文件，采用Spark写入就会导致重复数据的产生。在批量初始化阶段

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
pyspark样例代码 - 数据湖探索 DLI

Row from pyspark.sql import SparkSession 创建会话并设置AK/SK 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 1 2 3 4 5 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
了解数据目录、数据库和表 - 数据湖探索 DLI

DLI当前支持DLI数据库和Lakeformation数据目录。在DLI数据目录库下创建数据库和表请参考在DLI控制台创建数据库和表。创建并使用Lakeformation元数据请参考创建并使用LakeFormation元数据。数据库数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
自定义函数参数传递 - 数据湖探索 DLI

如果您的自定义函数需要在多个作业中使用，但对于不同作业某些参数值不同，直接在UDF中修改较为复杂。您可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码中获取该参数并使用。如需修改参数值，直接在FlinkOpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

如果您的自定义函数需要在多个作业中使用，但对于不同作业某些参数值不同，直接在UDF中修改较为复杂。您可以在Flink OpenSource SQL编辑页面，自定义配置中配置参数pipeline.global-job-parameters，在UDF代码中获取该参数并使用。如需修改参数值，直接在FlinkOpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
字符串函数和运算符 - 数据湖探索 DLI

单个用户感观字符（这是语言书写系统的基本单位），但是函数会将每个代码点视为单独的单位。 lower和upper函数不执行某些语言所需的区域设置相关、上下文相关或一对多映射。 chr(n) → varchar 描述：返回Unicode编码值为n的字符值。 select chr(100);

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
配置SQL防御规则 - 数据湖探索 DLI

大数据领域的SQL引擎层出不穷，在带给解决方案多样性的同时，也暴露出一定的问题，例如SQL输入语句质量良莠不齐、SQL问题难定位、大SQL语句消耗资源过多等。低质量的SQL会对数据分析平台系统带来不可预料的冲击，影响系统的性能或者平台稳定性。 DLI在Spark SQL引擎中增加S

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业

总条数： 463

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Confluent Avro Format - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

trans - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

怎样查看弹性资源池和作业的资源使用情况？ - 数据湖探索 DLI

Over聚合 - 数据湖探索 DLI

Flink Jar 使用DEW获取访问凭证读写OBS - 数据湖探索 DLI

停止计费 - 数据湖探索 DLI

get_json_object - 数据湖探索 DLI

聚合函数 - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

查询作业执行进度信息 - 数据湖探索 DLI

Hudi表索引设计规范 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

字符串函数和运算符 - 数据湖探索 DLI

配置SQL防御规则 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线