搜索_华为云

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

访问数据源》。如果您想通过Spark Jar作业在DLI创建数据库和表，请参考《使用Spark作业访问DLI元数据》。完整样例代码参考认证用的access.key和secret.key硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi Compaction操作说明 - 数据湖探索 DLI

tion Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
更新表分区信息（只支持OBS表） - 数据湖探索 DLI

表名称。 partition_specs 分区字段。 obs_path OBS存储路径。注意事项该命令的主要应用场景是针对分区表，如当手动在OBS上面添加分区目录时，再通过上述命令将该新增的分区信息刷新到元数据库中，通过“SHOW PARTITIONS table_name”命令查看新增的分区。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Delta清理和优化 - 数据湖探索 DLI

delta_table0 RETAIN 168 HOURS;--单位只支持HOURS 优化Delta表为了提高查询速度，Delta Lake支持优化数据在存储中的布局，这会将许多较小的文件压缩为较大的文件。 optimize delta_table0; optimize delta_table0

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
file - 数据湖探索 DLI
file - 数据湖探索 DLI

是STORED AS，只能指定ORC和PARQUET。 ORC对RCFile做了优化，可以提供一种高效的方法来存储Hive数据。 PARQUET是面向分析型业务的列式存储格式。父主题：标示符

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 标示符
配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

持多种类型的组件监控，提供预置监控大盘和全面托管的Prometheus服务，通过Prometheus监控来统一采集、存储和显示监控对象的数据，适用于时间序列数据库的收集和处理，尤其适用于监控Flink作业场景。本节操作介绍配置DLI对接AOM Prometheus监控的操作步骤。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用AOM监控DLI服务
在Spark SQL作业中使用UDF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图11 选择队列和数据库在SQL编辑区域输入下列命令创建UDF函数，单击“执行”提交创建。 CREATE FUNCTION TestSumUDF AS

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
创建DLI表关联CSS - 数据湖探索 DLI

常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch.size.bytes 单次batch的总数据量上限，默认为1mb。如果单条数据非常小，在bulk存储到总数据量前提前

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
队列属性设置 - 数据湖探索 DLI

如需判断当前是否已开启SQL作业结果保存DLI作业桶请参考怎样查看SQL队列是否已开启作业结果保存至DLI作业桶。推荐您开启作业结果保存至DLI作业桶，以便更好地管理和存储SQL作业的查询结果。不涉及单击“确定”完成队列属性的设置。怎样查看SQL队列是否已开启作业结果保存至DLI作业桶方法1：在SQL作业详情页面查看结果路径

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
下载并安装JDBC驱动包 - 数据湖探索 DLI

单击“确定”，下载证书。下载成功后，在credentials文件中即可获取AK和SK信息。认证用的AK和SK硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。获取Token 当您使用Token认证方式完成认证鉴

 帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
ClickHouse结果表 - 数据湖探索 DLI

ttp_port”配置参数值。默认为：21425。数据库名为ClickHouse集群创建的数据库名称。 connector.table 是要创建的ClickHouse的表名。 connector.driver 否连接数据库所需要的驱动。如果建表时不指定该参数，驱动会自动通过ClickHouse的url提取。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

使用Notebook实例提交DLI作业必须使用弹性资源池下的通用队列。每一个弹性资源池关联唯一的Notebook实例。 Notebook作业运行过程中产生的临时数据将会存储在DLI作业桶中，且必须使用并行文件系统。请在ModelArts管理控制台管理Notebook实例。请参考管理Notebook实例。 N

帮助中心 > 数据湖探索 DLI > 用户指南
删除表 - 数据湖探索 DLI
删除表 - 数据湖探索 DLI

DLI表：删除其数据及相应的元数据信息。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。注意事项所要删除的表必须是当前数据库下存在的，否则会出错，可以通过添加IF EXISTS来避免出错。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关
区域和可用区 - 数据湖探索 DLI

区域和可用区用于描述数据中心的位置，您可以在特定的区域、可用区创建资源。区域（Region）：从地理位置和网络时延维度划分，同一个Region内共享弹性计算、块存储、对象存储、VPC网络、弹性公网IP、镜像等公共服务。Region分为通用Region和专属Region，通用Region指面向公共租户提供通用

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
DataGen - 数据湖探索 DLI
DataGen - 数据湖探索 DLI

15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

默认值数据类型参数说明 connector 是无 String 读取表类型。需要填写'hudi' path 是无 String 表存储的路径。如obs://xx/xx table.type 是 COPY_ON_WRITE String Hudi表类型。 MERGE_ON_READ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

secret_key：your-sk queue：your-queue-name database: your-dli-database schema: your-dli-schema 表2 DBT连接DLI参数说明参数是否必选说明

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。在SQL编辑区域输入下列命令创建UDAF函数，单击“执行”提交创建。如果该客户

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink OpenSource SQL1.10语法概览 - 数据湖探索 DLI

Flink OpenSource SQL1.10语法概览本章节介绍目前DLI所提供的Flink OpenSource SQL语法列表。参数说明，示例等详细信息请参考具体的语法说明。创建源表相关语法表1 创建源表相关语法语法分类功能描述创建源表 Kafka源表 DIS源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考

总条数： 622

上一页
1
...
21
22
23
...
32
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

更新表分区信息（只支持OBS表） - 数据湖探索 DLI

Delta清理和优化 - 数据湖探索 DLI

file - 数据湖探索 DLI

配置DLI对接AOM Prometheus监控 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

队列属性设置 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

ClickHouse结果表 - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

删除表 - 数据湖探索 DLI

区域和可用区 - 数据湖探索 DLI

DataGen - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

Flink OpenSource SQL1.10语法概览 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线