搜索_华为云

SHOW_INVALID_PARQUET - 数据湖探索 DLI

SHOW_INVALID_PARQUET 命令功能查看执行路径下损坏的parquet文件。命令格式 call show_invalid_parquet(path => 'path') 参数描述表1 参数描述参数描述是否必填 path 需要查询的FS路径是示例 call show_invalid_parquet(path

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi CALL COMMAND语法说明
DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

具体请参考《数据湖探索用户指南》。 MRS服务Spark组件的是建立在客户的购买MRS服务所分配的虚机上，用户可以根据实际需求调整及优化Spark服务，支持各种接口调用。 MRS的这种模式提供了更高的自由度和定制性，适合有大数据处理经验的用户使用。具体请参考《MapReduce服务开发指南》。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

Map 中的空 key 值。示例该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
数学运算函数 - 数据湖探索 DLI

计算给定A的正弦值。 COS(A) 所有数字类型计算给定A的余弦值。 TAN(A) 所有数字类型计算给定A的正切值。 COT(A) 所有数字类型计算给定A的余切值。 ASIN(A) 所有数字类型计算给定A的反正弦值。 ACOS(A) 所有数字类型计算给定A的反余弦值。 ATAN(A)

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
TRUNCATE TABLE - 数据湖探索 DLI
TRUNCATE TABLE - 数据湖探索 DLI

TABLE table_name 描述从表或分区中移除所有行。当表属性“auto.purge”采用默认值“false”时，被删除的数据行将保存到文件系统的回收站，否则，当“auto.purge”设置为“true”时，数据行将被直接删除。限制目标表必须是管控表（表属性extern

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Hudi数据表Archive规范 - 数据湖探索 DLI

Archive（归档）是为了减轻Hudi读写元数据的压力，所有的元数据都存放在这个路径：Hudi表根目录/.hoodie目录，如果.hoodie目录下的文件数量超过10000就会发现Hudi表有非常明显的读写时延。规则 Hudi表必须执行Archive。对于Hudi的MOR类型和COW类型的表，都需要开启Archive。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
下载并安装JDBC驱动包 - 数据湖探索 DLI

JDBC驱动文件。本文介绍通过JDBC连接DLI并提交SQL作业。获取服务端连接地址连接DLI服务的地址格式为：jdbc:dli://<endPoint>/<projectId>。因此您需要获取对应的Endpoint和项目编号。在地区和终端节点获取DLI对应的Endpoi

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
API语法说明 - 数据湖探索 DLI
API语法说明 - 数据湖探索 DLI

该操作不需要通过索引去查询具体更新的文件分区，因此它的速度比upsert快。当不包含更新数据时建议使用该操作，如果存在更新数据使用该操作会出现重复数据。 bulk_insert：该操作会对主键进行排序后直接以写普通parquet表的方式插入Hudi表，该操作性能是最高的，但是无法控制小文件，而upse

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Spark datasource API语法参考
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
OBS表压缩率较高怎么办？ - 数据湖探索 DLI

OBS表压缩率较高怎么办？当您在提交导入数据到DLI表的作业时，如果遇到Parquet/Orc格式的OBS表对应的文件压缩率较高，超过了5倍的压缩率，您可以通过调整配置来优化作业的性能。具体方法：在submit-job请求体conf字段中配置“dli.sql.files.ma

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
Hudi数据表Compaction规范 - 数据湖探索 DLI

新版本的Parquet文件，那旧版本的文件就不能被Clean清理，增加存储压力。提交Spark jar作业时，CPU与内存比例为1:4~1:8。 Compaction作业是将存量的parquet文件内的数据与新增的log中的数据进行合并，需要消耗较高的内存资源，按照之前的表设计

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

DLI提供了一个通用接口，可用于获取用户在启动Flink作业时设置的委托的临时凭证。该接口将获取到的该作业委托的临时凭证封装到com.huaweicloud.sdk.core.auth.BasicCredentials类中。本操作介绍获取Flink作业委托临时凭证的操作方法。 Spark作业场景 Spark

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

* 从 Kafka brokers 中的 consumer 组（consumer 属性中的 group.id 设置）提交的偏移量中开始读取分区。 * 如果找不到分区的偏移量，那么将会使用配置中的 auto.offset.reset 设置。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
SQL作业运行慢如何定位 - 数据湖探索 DLI

带有driver的归档日志文件夹名示例图3 container_xxx_000001归档日志文件夹示例 Spark Jar作业： Spark Jar作业的归档日志文件夹以“batch”开头。图4 Spark Jar作业归档日志文件夹名示例进入归档日志文件目录，在归档日志文件目录下，下载“gc

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
MySql CDC - 数据湖探索 DLI
MySql CDC - 数据湖探索 DLI

为每个Reader设置不同的Server ID 每个用于读取Binlog的MySQL客户端都应该有一个唯一的Server ID，确保MySQL服务器能够区分不同的客户端并维护各自的Binlog读取位置。如果不同的作业共享相同的Server ID，可能会导致从错误的Binlog位置读取数据，从而引发数据不一致的问题。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

DLI支持创建的数据库的最大数量为50个。数据表 DLI支持创建的表的最大数量为5000个。 DLI支持创建表类型： Managed：数据存储位置为DLI的表。 External：数据存储位置为OBS的表。 View：视图，视图只能通过SQL语句创建。跨源表：表类型同样为External。创建DLI表时不支持指定存储路径。

帮助中心 > 数据湖探索 DLI > 产品介绍
资源相关 - 数据湖探索 DLI
资源相关 - 数据湖探索 DLI

SDK概述下载样例代码。 kind：资源包类型，当前支持包类型分别为： jar：用户jar文件 pyfile：用户Python文件 file：用户文件 modelfile：用户AI模型文件 paths：对应资源包的OBS路径，参数构成为：{bucketName}.{obs域名}/{jarPath}/{jarName}。

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK
导出查询结果 - 数据湖探索 DLI

参数类型说明 data_path 是 String 导出结果存储的路径（当前仅支持将数据存储在OBS上）。另外，该路径下的文件夹须不存在，如请求样例中的“path”文件夹。 compress 否 String 导出数据的压缩格式，目前支持gzip，bzip2和deflate压缩方式；

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Hive源表 - 数据湖探索 DLI
Hive源表 - 数据湖探索 DLI

String 流源的分区顺序，支持 create-time、partition-time 和 partition-name。 create-time 比较分区/文件创建时间，这不是 Hive metaStore 中的分区创建时间，而是文件系统中的文件夹/文件修改时间，如果分区文件夹以某种方

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
复杂数据类型 - 数据湖探索 DLI

一组有序字段，使用指定的值构造ARRAY数组。可以为任意类型，要求所有字段的数据类型必须相同。 array(<value>,<value>[, ...]) 具体使用示例详见：ARRAY示例。 MAP 一组无序的键/值对，使用给定的Key和Value对生成MAP。键的类型必须是原生数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据类型

总条数： 1275

上一页
1
...
5
6
7
...
64
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

SHOW_INVALID_PARQUET - 数据湖探索 DLI

DLI中的Spark组件与MRS中的Spark组件有什么区别？ - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

TRUNCATE TABLE - 数据湖探索 DLI

Hudi数据表Archive规范 - 数据湖探索 DLI

下载并安装JDBC驱动包 - 数据湖探索 DLI

API语法说明 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

OBS表压缩率较高怎么办？ - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

MySql CDC - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

资源相关 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

Hive源表 - 数据湖探索 DLI

复杂数据类型 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线