搜索_华为云

创建CSS类型跨源认证 - 数据湖探索 DLI

安全集群的登录密码。 Certificate路径上传“安全证书”的OBS路径。即步骤2的OBS桶地址。图1 创建认证信息-CSS 访问CSS的表。跨源认证创建成功后，在创建访问CSS的表时只需关联跨源认证即可安全访问数据源。例如在使用Spark SQL来创建访问CSS的表时使用es

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
创建DLI表关联DCS - 数据湖探索 DLI

参数描述 host DCS的连接IP，需要先创建跨源连接，管理控制台操作请参考增强型跨源连接。创建增强型跨源连接后，使用DCS提供的"连接地址"。"连接地址"有多个时，选择其中一个即可。说明：访问DCS目前只支持增强型跨源。 port DCS的连接端口，例如6379。 password

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DCS表
手动续费 - 数据湖探索 DLI
手动续费 - 数据湖探索 DLI

单击左侧导航栏的图标，选择“大数据 > 数据湖探索 DLI”。在队列或弹性资源池的列表页，选中待续费的包年/包月资源。单击“操作”列下的“更多 > 续费”。选择续费时长，判断是否勾选“统一到期日”，将到期时间统一到各个月的某一天（详细介绍请参见统一包年/包月资源的到期日）。确认配置费用后单击“去支付”。

帮助中心 > 数据湖探索 DLI > 计费说明 > 续费
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

单击“创建” 。设置告警规则基本信息，并配置告警规则的详细信息。详细参数说明请参考按全量指标创建。配置告警规则时选择的Prometheus实例应是需要配置告警通知的作业所在的弹性资源池绑定的Prometheus 实例。配置高级设置：仅”全量指标创建”的方式支持该配置项，配

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
Hudi Compaction操作说明 - 数据湖探索 DLI

会将TimeLine里的所有Compaction Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-O

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
创建DLI表关联DDS - 数据湖探索 DLI

authSource=admin" database DDS的数据库名，如果在"url"中同时指定了数据库名，则"url"中的数据库名不生效。 collection DDS中的collection名，如果在"url"中同时指定了collection，则"url"中的collection不生效。 user

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接DDS表
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表3 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 快速入门
SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

返回文件/目录在集群中占用的实际空间，即它考虑了为集群设置的复制因子 quota 名称配额（名称配额是对当前目录树中的文件和目录名称数量的硬性限制） space_quota 空间配额（空间配额是对当前目录树中的文件所使用的字节数量的硬性限制）注意事项使用由DLI提供的元数据服务时，不支持本命令。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？在Flink 作业中，可以使用CREATE语句来定义Source表和Sink表，并指定它们的连接器类型以及相关的属性。如果需要将数据写入到不同的Elasticsearch集群，您需要为每个集群配置不同的连接参数，并确保Fl

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
Hudi 结果表 - 数据湖探索 DLI
Hudi 结果表 - 数据湖探索 DLI

桶内。建表或第一次写入数据时设置后不能修改，否则更新数据会存在异常。 hoodie.bucket.index.hash.field：进行分桶时计算Hash值的字段，必须为主键的子集，默认为Hudi表的主键。该参数不填则默认为recordkey.field。创建Flink OpenSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
Hudi Archive操作说明 - 数据湖探索 DLI

什么是Archive Archive用户清理Hudi表的元数据文件（位于.hoodie目录下，格式为 ${时间戳}.${操作类型}.${操作状态}，比如20240622143023546.deltacommit.request）。对Hudi表进行的每次操作都会产生元数据文件，而元数据文件过多

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
使用DataSource语法创建OBS表 - 数据湖探索 DLI

默认值：false nullValue 否设置代表null的字符，例如，nullValue="nl"表示设置nl代表null。 comment 否设置代表注释开头的字符，例如，comment='#'表示以#开头的行为注释。 compression 否设置数据的压缩格式。目前支持gzip、b

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
Spark SQL常用配置项说明 - 数据湖探索 DLI

个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“true”时，DLI不会提前删除分区，而是在运行时覆盖那些有数据写入的分区。 spark.sql.files.maxPartitionBytes 134217728 读取文件时要打包到单个分区中的最大字节数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源池扩缩容策略生效规则为：在任意一个时间段周期内，优先满

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
BlackHole结果表 - 数据湖探索 DLI

Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，您可以将WITH参数修改为'connector'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark作业开发类 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK 如何查看DLI Spark作业的实际资源使用情况将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
修改表生命周期的时间 - 数据湖探索 DLI

修改表生命周期的时间功能描述修改已存在的分区表或非分区表的生命周期。当第一次开启生命周期时，会扫描表/分区会扫描路径下的表数据文件，更新表/分区的LAST_ACCESS_TIME，耗时与分区数和文件数相关。约束限制表生命周期处于公测阶段，如果有需要请联系客服申请开通白名单。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
count函数如何进行聚合 - 数据湖探索 DLI

count函数如何进行聚合使用count函数进行聚合的正确用法如下： SELECT http_method, count(http_method) FROM apigateway WHERE service_id = 'ecs' Group BY http_method 或者

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
队列相关API（推荐） - 数据湖探索 DLI

队列相关API（推荐）创建队列删除队列查询所有队列查询队列详情重启/扩容/缩容队列创建指定地址连通性测试请求查询指定地址连通性测试详情

 帮助中心 > 数据湖探索 DLI > API参考

总条数： 650

上一页
1
...
18
19
20
...
33
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建CSS类型跨源认证 - 数据湖探索 DLI

创建DLI表关联DCS - 数据湖探索 DLI

手动续费 - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

创建DLI表关联DDS - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

SHOW_FS_PATH_DETAIL - 数据湖探索 DLI

如何在一个Flink作业中将数据写入到不同的Elasticsearch集群中？ - 数据湖探索 DLI

Hudi 结果表 - 数据湖探索 DLI

Hudi Archive操作说明 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

调整弹性资源池中队列的扩缩容策略 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

队列相关API（推荐） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线