搜索_华为云

了解数据目录、数据库和表 - 数据湖探索 DLI

导入数据的编码格式仅支持UTF-8。数据导出只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。导出文件格式为json格式，且文本格式仅支持UTF-8。支持跨账号导出数据，即B账户对A账户授权后，A账户拥有B账户OBS桶的元数据信息

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

表必须已经存在。如果动态分区不需要指定分区，则将“part_spec”作为普通字段放置SELECT语句中。被插入的OBS表在建表时只能指定文件夹路径。源表和目标表的数据类型和列字段个数应该相同，否则插入失败。不建议对同一张表并发插入数据，可能会由于并发冲突导致插入数据结果异常。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Spark SQL常用配置项说明 - 数据湖探索 DLI

批作业SQL语法的常用配置项。表1 常用配置项名称默认值描述 spark.sql.files.maxRecordsPerFile 0 要写入单个文件的最大记录数。如果该值为零或为负，则没有限制。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

62版本的huaweicloud-sdk-core。准备环境已安装和配置IntelliJ IDEA等开发工具以及安装JDK和Maven。 pom文件配置中依赖包 <dependency> <groupId>com.huaweicloud.sdk</groupId> <a

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

创建CDM迁移作业。登录CDM控制台，选择“集群管理”，选择已创建的CDM集群，在操作列选择“作业管理”。在“作业管理”界面，选择“表/文件迁移”，单击“新建作业”。在新建作业界面，配置当前作业配置信息，具体参数参考如下：图7 新建CDM作业作业配置作业名称：自定义数据迁

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
查询所有队列 - 数据湖探索 DLI

] } 状态码状态码如表5所示。表5 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题：队列相关API（推荐）

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
离线Compaction配置 - 数据湖探索 DLI

run archivelog on $tablename; // 执行archivelog合并清理元数据文件关于清理、归档参数的值不宜设置过大，会影响Hudi表的性能，通常建议： hoodie.cleaner.commits.retained =

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

存储计费按照存储在DLI服务中的表数据存储量（单位为“GB”）收取存储费用。在估算存储费用时，请特别注意，DLI采用压缩存储，通常能压缩到原文件大小的 1/5 。DLI存储按照压缩后的大小计费。如果数据存储在OBS服务中，则DLI服务不收取存储费用，对应的费用由OBS服务收取。扫描量计费

 帮助中心 > 数据湖探索 DLI > 计费说明
配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

使用Lakeformation catgalog时必填，对应的Lakeformation catgalog名称。否 lfcatalog 在“库”页中，单击添加文件，添加1中的huaweicloud-dli-jdbc-xxx-dependencies.jar。图3 上传驱动添加后驱动类为空，需要单

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

with "Provided" scope，否则本地调试运行时会加载不到pom文件中的依赖包。具体操作以IntelliJ IDEA版本2020.2为例，参考如下：在IntelliJ IDEA界面，选择调试的配置文件，单击“Edit Configurations”。在“Run/Debug

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数
使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

下面的示例展示了一个经典的业务流水线，维度表来自 Hive，每天通过批处理流水线作业或 Flink 作业更新一次，kafka流来自实时在线业务数据或日志，需要与维度表连接以扩充流。使用spark sql 创建 hive obs 外表，并插入数据。 CREATE TABLE if not exists

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
修改组或资源包拥有者（废弃） - 数据湖探索 DLI

字符。 resource_name 否 String 包名。名称只能包含数字字母，下划线，感叹号，中划线，点，但是不能以点开头，长度（包含文件后缀）不能超过128个字符。修改组下的资源包拥有者，则该参数为必选参数。 “group_name”和“resource_name”可以单独使用，也可以组合使用。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 分组资源相关API（废弃）
跨源认证概述 - 数据湖探索 DLI

Kerberos类型的跨源认证：适用于开启Kerberos认证的MRS安全集群。配置时需指定MRS集群认证凭证，包括“krb5.conf”和“user.keytab”文件。详细操作请参考创建Kerberos跨源认证。 Kafka_SSL类型的跨源认证：适用于开启SSL的Kafka，配置时需指定KafkaTr

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
权限管理 - 数据湖探索 DLI
权限管理 - 数据湖探索 DLI

于策略的授权是一种更加灵活的授权方式，能够满足企业对权限最小化的安全管控要求。例如：针对DLI服务，管理员能够控制IAM用户仅能对某一类云服务器资源进行指定的管理操作。DLI支持的API授权项请参见《权限策略和授权项》。表1 DLI系统权限系统角色/策略名称描述类别依赖关系

 帮助中心 > 数据湖探索 DLI > 产品介绍
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tpch文件夹中，并且赋予了只读访问权限，方便用户进行查询操作。 TPC-H的测试和度量指标 TPC-H 测试分解为3 个子测试：数据装载测试、Pow

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
二进制函数和运算符 - 数据湖探索 DLI

lpad(binary, size, padbinary) → varbinary 左填充二进制以使用padbinary调整字节大小。如果size小于二进制文件的长度，则结果将被截断为size个字符。size不能为负，并且padbinary不能为空。 select lpad(x'15245F', 11

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
userDefined结果表 - 数据湖探索 DLI

@Override public void close() throws Exception {} } 依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
右外连接 - 数据湖探索 DLI
右外连接 - 数据湖探索 DLI

OUTER JOIN：返回右表的所有记录，没有匹配值的记录将返回NULL。注意事项所要进行JOIN连接的表必须是已经存在的表，否则会出错。示例右外连接和左外连接相似，但是会将右边表（这里的course_info)中的所有记录返回，没有匹配值的左表记录将返回NULL。 1 2 SELECT

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT > 连接
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

00,180.00,2021-03-24 16:10:06,0001,Alice,330106 读取sink表中配置的obs路径中的orc文件，其数据结果如下 202103251202020001, miniAppShop, 2021-03-25 12:02:02, 60.0, 60

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format

总条数： 535

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

了解数据目录、数据库和表 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

查询所有队列 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

配置DBeaver连接DLI进行数据查询和分析 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

使用Temporal join关联维表的最新分区 - 数据湖探索 DLI

修改组或资源包拥有者（废弃） - 数据湖探索 DLI

跨源认证概述 - 数据湖探索 DLI

权限管理 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

二进制函数和运算符 - 数据湖探索 DLI

userDefined结果表 - 数据湖探索 DLI

右外连接 - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线