搜索_华为云

在Spark SQL作业中使用UDF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Hudi Archive操作说明 - 数据湖探索 DLI

多会导致性能问题，所以元数据文件数量最好控制在1000以内。如何执行Archive 写完数据后archive Spark SQL（set设置如下参数，写数据时触发） hoodie.archive.automatic=true hoodie.keep.max.commits=30

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
管理队列 - 数据湖探索 DLI
管理队列 - 数据湖探索 DLI

管理队列查看队列的基本信息队列权限管理分配队列至项目创建消息通知主题队列标签管理队列属性设置测试地址连通性删除队列变更普通队列规格普通队列弹性扩缩容设置普通队列的弹性扩缩容定时任务修改普通队列的网段父主题：创建弹性资源池和队列

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Spark作业开发类 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

ne顺序执行各个节点。请参考步骤4：作业编排。测试作业运行：测试作业运行。请参考步骤5：测试作业运行。设置作业调度与监控：设置作业调度属性与监控规则。请参考步骤6：设置作业周期调度和相关操作。环境准备 DLI资源环境准备配置DLI作业桶使用DLI服务前需配置DLI作业桶

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多 > 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
ALTER SCHEMA - 数据湖探索 DLI
ALTER SCHEMA - 数据湖探索 DLI

DBPROPERTIES (property_name=property_value, ...); 描述这条命令并不会将SCHEMA当前的内容移动到修改后的路径下，也不会修改与指定schema关联的表或分区，它只会修改新添加进数据库的表的上级目录。示例 Create schema foo;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

网络连通性，确保执行Flink作业所在的队列可以访问Kafka所在的VPC网络。若果网络不可达，请先配置网络连通后再重新执行作业。操作方法请参考测试地址连通性。配置详情请参考配置网络连通。父主题： Flink SQL作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
费用账单 - 数据湖探索 DLI
费用账单 - 数据湖探索 DLI

明细账单”，在筛选条件中选择“资源ID”，并输入1.e中获取的资源ID，单击图标即可搜索该资源的账单。这里设置的统计维度为“按资源名称/ID”，统计周期为“按账期”，您也可以设置其他统计维度和周期，详细介绍请参见流水与明细账单。查看数据存储的资源账单 DLI控制台并未展示数据存储

 帮助中心 > 数据湖探索 DLI > 计费说明
Spark SQL常用配置项说明 - 数据湖探索 DLI

false 当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“tru

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建增强型跨源连接 - 数据湖探索 DLI

增强型跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。使用约束限制使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

查看队列对应的VPC的路由表信息。图11 查看路由表目的地址-1 检查VPC网络是否设置了ACL规则限制了网络访问网络ACL对子网进行防护，检查对应子网是否配置了ACL，是否设置了ACL规则限制了网络访问。例如当您设置了安全组放通队列的网段，同时设置的网络ACL规则包含拒绝该地址访问，那么此安全组规则不生效。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
pyspark样例代码 - 数据湖探索 DLI

mysql.jdbc.Driver" 参数说明请参考表1。设置数据 1 dataList = sparkSession.sparkContext.parallelize([(123, "Katie", 19)]) 设置schema 1 2 3 schema = StructTy

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
CLEANARCHIVE - 数据湖探索 DLI
CLEANARCHIVE - 数据湖探索 DLI

ZE时，该参数可以设置保留多少字节大小的归档文件，默认值5368709120字节（5G）。 hoodie.archive.file.cleaner.days.retained 当清理策略为KEEP_ARCHIVED_FILES_BY_DAYS时，该参数可以设置保留多少天以内的归档文件，默认值30（天）。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
修改表生命周期的时间 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式 ALTER TABLE table_name SET TBLPROPERTIES("dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
禁止或恢复表的生命周期 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式该语法在表级别禁止或恢复表的生命周期 1 ALTER TABLE table_name

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理

总条数： 528

上一页
1
...
15
16
17
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

在Spark SQL作业中使用UDF - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

管理队列 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

ALTER SCHEMA - 数据湖探索 DLI

Flink jobmanager日志一直报Timeout expired while fetching topic metadata怎么办？ - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

费用账单 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

创建增强型跨源连接 - 数据湖探索 DLI

创建跨源成功但测试网络连通性失败怎么办？ - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

CLEANARCHIVE - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

禁止或恢复表的生命周期 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线