搜索_华为云

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务功能描述 DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
创建DLI表关联RDS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接RDS表
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
创建DLI表关联DWS - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DWS表
SparkSQL建表参数规范 - 数据湖探索 DLI

建表必须指定primaryKey和preCombineField。 Hudi表提供了数据更新的能力和幂等写入的能力，该能力要求数据记录必须设置主键用来识别重复数据和更新操作。不指定主键会导致表丢失数据更新能力，不指定preCombineField会导致主键重复。参数名称参数描述

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。限制目标表必须是管控表（表属性external=false），否则执行语句将报错。示例 -- 删除原生/管控表

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

API语法说明设置写入方式 Hudi通过hoodie.datasource.write.operation参数设置写入模式。 insert：该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

// SASL_SSL相关配置项。设置jaas账号和密码，username和password为创建Kafka实例过程中开启SASL_SSL时填入的用户名和密码， // 或者创建SASL_SSL用户时设置的用户名和密码。格式如下， //

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

展示source到sink的数据处理流程。如图4所示。格式化：对SQL语句进行格式化。设为模板：将新创建的作业设置为作业模板。主题设置：设置页面主题，可以设置字体大小，自动换行和页面风格。帮助：跳转至帮助中心，为用户提供SQL语法参考。简化流图在OpenSource

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Flink Jar作业开发基础样例 - 数据湖探索 DLI

cEvolving的才是公开供用户调用的方法，DLI只对这些方法的兼容性做出产品保证。图4 配置参数表3 参数说明名称描述 CU数量一个CU为1核4G的资源量。CU数量范围为2~400个。管理单元设置管理单元的CU数，支持设置1~4个CU，默认值为1个CU。并行数

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

配的执行INSERT。这个语法仅需要一次全表扫描就完成了全部同步工作，执行效率要高于INSERT＋UPDATE。注意事项分区表合并需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Elasticsearch - 数据湖探索 DLI
Elasticsearch - 数据湖探索 DLI

Duration flush 缓冲操作的间隔。可以设置为'0'来禁用它。注意，'sink.bulk-flush.max-size'和'sink.bulk-flush.max-actions'都设置为'0'的这种 flush 间隔设置允许对缓冲操作进行完全异步处理。 sink.bulk-flush

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
对象存储OBS结果表 - 数据湖探索 DLI

归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的S

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Hudi Clustering操作说明 - 数据湖探索 DLI

间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
TABLESAMPLE - 数据湖探索 DLI
TABLESAMPLE - 数据湖探索 DLI

TABLESAMPLE 有BERNOULLI和SYSTEM两种采样方法。这两种采样方法都不允许限制结果集返回的行数。 BERNOULLI 每一行都将基于指定的采样率选择到采样表中。当使用Bernoulli方法对表进行采样时，将扫描表的所有物理块并跳过某些行（基于采样百分比和运行

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DQL 语法
管理Flink作业模板 - 数据湖探索 DLI

Flink模板包括样例模板和自定义模板。用户可以在已有的样例模板中进行修改，来实现实际的作业逻辑需求，节约编辑SQL语句的时间。也可以根据自己的习惯和方法自定义作业模板，方便后续可以直接调用或修改。 Flink模板管理主要包括如下功能： Flink SQL样例模板 Flink OpenSource

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 快速入门
VACUUM - 数据湖探索 DLI
VACUUM - 数据湖探索 DLI

管理的所有文件，并删除不再处于表事务日志最新状态且超过保留期阈值的数据文件。默认阈值为 7 天。注意事项 RETAIN num HOURS表示保留期阈值，建议设置为至少 7 天。如果对 Delta 表运行VACUUM，则将无法再回头查看在指定数据保留期之前创建的版本。 Delta Lake 具有一

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明

总条数： 514

上一页
1
...
5
6
7
...
26
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

创建DLI表关联RDS - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

创建DLI表关联DWS - 数据湖探索 DLI

SparkSQL建表参数规范 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

使用Flink Jar连接开启SASL_SSL认证的Kafka - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

Elasticsearch - 数据湖探索 DLI

对象存储OBS结果表 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

TABLESAMPLE - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

VACUUM - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线