搜索_华为云

Hudi Clean操作说明 - 数据湖探索 DLI

什么是Clean Cleaning用于清理Hudi表不再需要的老版本数据文件 (parquet文件或者log文件)，减轻存储压力，提升list操作效率。如何执行Clean 写完数据后clean Spark SQL（设置如下参数，随后执行任意写入SQL时，在满足条件时触发） hoodie.clean

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
开启Flink作业动态扩缩容 - 数据湖探索 DLI

注意：只有当用户开启动态扩缩时，该配置才有意义。 flink.dli.job.cu.max 用户CU初始值该配置表示当前作业在进行动态扩缩时允许使用的最大CU数，如果用户未配置则默认值为该作业的初始总CU数。注意：该配置值不能小于用户配置的总CU数，且只有当用户开启动态扩缩时，该配置才有意义。 flink

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
CREATE FUNCTION语句 - 数据湖探索 DLI

如果该函数已经存在，则不会进行任何操作。 LANGUAGE JAVA|SCALA Language tag 用于指定 Flink runtime 如何执行这个函数。目前，只支持 JAVA, SCALA，且函数的默认语言为 JAVA。示例创建一个名为STRINGBACK的函数。 create

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > SQL语法约束与定义 > DDL语法定义
INSERT INTO - 数据湖探索 DLI
INSERT INTO - 数据湖探索 DLI

non-strict模式，对主键表采用insert处理。 upsert模式，对于主键表的重复值进行更新操作。在提交Spark SQL作业时，用户可以在设置中配置以下参数，切换bulk insert作为Insert语句的写入方式。 hoodie.sql.bulk.insert.enable = true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

'datagen' ); 参数说明表1 参数说明参数是否必选默认值数据类型参数说明 connector 是无 String 指定要使用的连接器，这里是'datagen'。 rows-per-second 否 10000 Long 每秒生成的行数，用以控制数据发出速率。 fields

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
更新跨源认证（废弃） - 数据湖探索 DLI

用户安全集群的新登录密码。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

save(basePath) 无分区配置项说明 hoodie.datasource.write.partitionpath.field 配置为空字符串。 hoodie.datasource.hive_sync.partition_fields 配置为空字符串。 hoodie.datasource

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
设置SQL作业优先级 - 数据湖探索 DLI

设置SQL作业优先级在“ 设置 > 参数配置”中配置如下参数，其中x为优先级取值。 spark.sql.dli.job.priority=x 登录DLI管理控制台。单击“作业管理 > SQL作业”。选择待配置的作业，单击操作列下的编辑。在“ 设置 > 参数配置”中配置spark.sql.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
更新跨源认证 - 数据湖探索 DLI

用户安全集群的新登录密码。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
CLUSTERING - 数据湖探索 DLI
CLUSTERING - 数据湖探索 DLI

table与path参数必须存在一个，否则无法判断需要执行clustering的表。使用由DLI提供的元数据服务时，本命令仅支持配置table参数，不支持配置path参数。如果需要对指定分区进行clustering，参考格式：predicate => "dt = '2023-08-28'"

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
Hive方言 - 数据湖探索 DLI
Hive方言 - 数据湖探索 DLI

功能描述 Flink目前支持两种SQL 方言: default 和 hive。您需要先切换到Hive 方言，然后才能使用Hive语法编写。下面介绍如何使用SQL设置方言。您可以为执行的每个语句动态切换方言。无需重新启动会话即可使用其他方言。语法格式 SQL 方言可以通过 table.sql-dialect

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

Spark2.4.x：配置名为spark.launcher.childConectionTimeout Spark3.3.x：配置名修改为spark.launcher.childConnectionTimeout 升级引擎版本后是否对作业有影响：有影响，配置参数名称变化。 Spark3

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
DLI程序包标签管理 - 数据湖探索 DLI

标签”，显示当前程序包组或程序包的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框。在“添加/编辑标签”对话框中配置标签参数。表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。如果添加预定义标签，用户需要预先在标签管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
创建跨源认证 - 数据湖探索 DLI

Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password

帮助中心 > 数据湖探索 DLI > API参考 > 跨源认证相关API
Flink作业性能调优 - 数据湖探索 DLI

算子存在性能瓶颈，可以尝试优化状态操作的性能。主要可以尝试通过如下方式优化：增加状态操作内存，降低磁盘IO 增加单slot cu资源数配置优化参数： taskmanager.memory.managed.fraction=xx state.backend.rocksdb.block

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
创建跨源认证（废弃） - 数据湖探索 DLI

Kafka_SSL。 krb5_conf 否 String krb5配置文件obs路径。 keytab 否 String keytab配置文件obs路径。 truststore_location 否 String truststore配置文件obs路径。 truststore_password

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
设置Flink作业优先级 - 数据湖探索 DLI

Opensource SQL作业优先级登录DLI管理控制台。单击“作业管理 > Flink作业”。选择要待配置的作业，单击操作列下的编辑。单击“自定义配置”。在“自定义配置”中输入如下语句，先开启动态扩缩容功能，再设置作业优先级。对于Flink作业，必须先设置flink.dli

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

登录DLI管理控制台，单击“作业管理 > SQL作业”，对应SQL作业行的操作列，单击“编辑”按钮，跳转到“SQL编辑器”。在“SQL编辑器”中，单击“设置”，参考如下图配置添加参数。图1 设置参数重新执行作业。父主题： SQL作业运维类

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

连通性，确保执行Flink作业所在的队列可以访问Kafka所在的VPC网络。若果网络不可达，请先配置网络连通后再重新执行作业。操作方法请参考测试地址连通性。配置详情请参考配置网络连通。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Hudi Archive操作说明 - 数据湖探索 DLI

request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护

总条数： 734

上一页
1
...
29
30
31
...
37
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Hudi Clean操作说明 - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

CREATE FUNCTION语句 - 数据湖探索 DLI

INSERT INTO - 数据湖探索 DLI

DataGen源表 - 数据湖探索 DLI

更新跨源认证（废弃） - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

设置SQL作业优先级 - 数据湖探索 DLI

更新跨源认证 - 数据湖探索 DLI

CLUSTERING - 数据湖探索 DLI

Hive方言 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在通用队列的差异对比 - 数据湖探索 DLI

DLI程序包标签管理 - 数据湖探索 DLI

创建跨源认证 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

创建跨源认证（废弃） - 数据湖探索 DLI

设置Flink作业优先级 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线