搜索_华为云

增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
常用操作与系统权限关系 - 数据湖探索 DLI

ALTER_TABLE_RECOVER_PARTITION 恢复表分区 √ × √ √ ALTER_TABLE_SET_LOCATION 设置分区路径 √ × √ √ GRANT_PRIVILEGE 表的赋权 √ × √ √ REVOKE_PRIVILEGE 表权限的回收 √ ×

帮助中心 > 数据湖探索 DLI > 用户指南 > 权限管理
pyspark样例代码 - 数据湖探索 DLI

IntegerType, StringType, Row from pyspark.sql import SparkSession 创建会话并设置AK/SK 认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。 1

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
初始化DLI客户端 - 数据湖探索 DLI

险，建议在配置文件或者环境变量中密文存放, 使用时解密, 确保安全。本示例以ak和sk保存在环境变量中为例，运行本示例前请先在本地环境中设置环境变量xxx_SDK_AK和xxx_SDK_SK。 regionName ：所属区域名称 projectId ：项目ID 通过以下方式可

 帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > Java SDK环境配置
CREATE TABLE AS SELECT - 数据湖探索 DLI

CREATE TABLE AS SELECT 命令功能 CREATE TABLE As SELECT命令通过指定带有表属性的字段列表来创建Hudi Table。在使用由DLI提供的元数据服务时仅可创建外表，即需要通过LOCATION指定表路径。命令格式 CREATE TABLE

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DML语法说明
开启Flink作业动态扩缩容 - 数据湖探索 DLI

据。因扩缩容过程中需要触发savepoint，因此必须配置obs桶，并保存日志，同时请注意开启checkpoint。扩缩容检测周期不要设置过小，避免频繁启停作业。扩缩容作业恢复过程中的时间长短受savepoint的大小影响，如果保存点较大，可能恢复时间较慢。如果需要调整动

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DLI作业开发流程 - 数据湖探索 DLI

DLI作业开发流程本节内容为您介绍DLI作业开发流程。创建IAM用户并授权使用DLI 如果您是企业用户，并计划使用IAM对您所拥有的DLI资源进行精细的权限管理，请创建IAM用户并授权使用DLI。具体操作请参考创建IAM用户并授权使用DLI。首次使用DLI您需要根据控制台的

 帮助中心 > 数据湖探索 DLI > 用户指南
类型转换函数 - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
创建数据库 - 数据湖探索 DLI
创建数据库 - 数据湖探索 DLI

创建数据库功能描述创建数据库。语法格式 1 2 3 CREATE [DATABASE | SCHEMA] [IF NOT EXISTS] db_name [COMMENT db_comment] [WITH DBPROPERTIES (property_name=property_value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 DLI支持将数据存储到OBS上，后续再通过创建OBS表即可对OBS上的数据进行分析和处理。本指导中的操作内容包括：创建OBS表、导入OBS表数据、插入和查询OBS表数据等内容来帮助您更好的在DLI上对OBS表数据进行处理。前提条件已

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
数组函数和运算符 - 数据湖探索 DLI

数组函数和运算符下标操作符：[] 描述：下标操作符用于访问数组中的元素，并从1开始建立索引。 select myarr[5] from (values array [1,4,6,78,8,9],array[2,4,6,8,10,12]) as t(myarr); _col0

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
Print - 数据湖探索 DLI
Print - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 1 2 3 4 5 6 7 8 9 create table printSink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
count函数如何进行聚合 - 数据湖探索 DLI

apigateway WHERE service_id = 'ecs' Group BY http_method 或者 SELECT http_method FROM apigateway WHERE service_id = 'ecs' DISTRIBUTE BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
重命名分区（只支持OBS表） - 数据湖探索 DLI

partition_specs RENAME TO PARTITION partition_specs; 关键字 PARTITION：分区。 RENAME：重命名。参数说明表1 参数描述参数描述 table_name 表名称。 partition_specs 分区字段。注意事项

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

(orc_table_property = value [, ...] ) ] 限制创建分区表时，如果bucket_count为-1且建表语句中未设置buckets，则使用默认值16。默认外部表存储位置{lakeformation_catalog_url}/{schema_name}.

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

窗口去重功能描述窗口去重是一种特殊的去重，它根据指定的多个列来删除重复的行，保留每个窗口和分区键的第一个或最后一个数据。对于流式查询，与普通去重不同，窗口去重只在窗口的最后返回结果数据，不会产生中间结果。它会清除不需要的中间状态。因此，窗口去重查询在用户不需要更新结果时，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
DLI弹性资源池与队列简介 - 数据湖探索 DLI

图1 DLI计算资源模式弹性资源池模式：计算资源的池化管理模式，提供计算资源的动态扩缩容能力，同一弹性资源池中的队列共享计算资源。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率，应对业务高峰期的资源需求。适用场景：适合业务量有明显波动的场合，如周期性的数据批处理任务或实时数据处理需求。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表

总条数： 506

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

增强型跨源连接标签管理 - 数据湖探索 DLI

常用操作与系统权限关系 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

初始化DLI客户端 - 数据湖探索 DLI

CREATE TABLE AS SELECT - 数据湖探索 DLI

开启Flink作业动态扩缩容 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

创建数据库 - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

Print - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

重命名分区（只支持OBS表） - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

DLI弹性资源池与队列简介 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线