搜索_华为云

Flink 1.12版本说明 - 数据湖探索 DLI

CDC源表、Postgres CDC源表、Redis源表、Upsert Kafka源表、Hbase源表。 Flink 1.12新增支持小文件合并功能。 Flink 1.12新增支持Redis维表、RDS维表。父主题：版本支持公告

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
查看Delta表历史操作记录 - 数据湖探索 DLI

isolationLevel 隔离级别 isBlindAppend 是否追加数据 operationMetrics 操作的度量（例如，修改的文件数、行数、字节数等信息） engineInfo Spark和Delta版本信息父主题： Delta Time Travel

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta Time Travel
Hbase维表 - 数据湖探索 DLI
Hbase维表 - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据所有 HBase 表的列簇必

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
DLI的数据可存储在哪些地方 - 数据湖探索 DLI

DLI表与OBS表有什么区别？ DLI表表示数据存储在本服务内部，用户不感知数据存储路径。 OBS表表示数据存储在用户自己账户的OBS桶中，源数据文件由用户自己管理。 DLI表相较于OBS表提供了更多权限控制和缓存加速的功能，性能相较于外表性能更好，但是会收取存储费用。父主题： DLI产品咨询类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
如何获取AK/SK？ - 数据湖探索 DLI

单击“新增访问密钥”，进入“新增访问密钥”页面。根据提示输入对应信息，单击“确定”，在弹出的提示页面单击“立即下载”。下载成功后，打开凭证文件，获取AK/SK信息。为防止访问密钥泄露，建议您将其保存到安全的位置。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

选择已有的虚拟私有云。如需重新创建VPC和子网，请参考创建虚拟私有云和子网。说明：跨源场景数据源网段和弹性资源池的网段不能重合。 - 数据库端口默认使用3306端口。 3306 安全组安全组限制实例的安全访问规则，加强云数据库RDS服务与其他服务间的安全访问。数据源的安全组需放通DLI弹性资源池的网段。

帮助中心 > 数据湖探索 DLI > 快速入门
提交SQL作业（推荐） - 数据湖探索 DLI

当前仅支持运行命令ANALYZE TABLE COMPUTE statistics noscan的配置单元元存储表，和直接根据数据文件计算统计信息的基于文件的数据源表。 spark.sql.shuffle.partitions 200 为连接或聚合过滤数据时使用的默认分区数。 spark

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
Spark开源命令支持说明 - 数据湖探索 DLI

DATABASE testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
创建并使用跨源链接 - 数据湖探索 DLI

9-f5aab22e1281", "elastic_resource_pools": "elastic_pool_dli", "hosts": [ { "ip":"192.168.0.1", "name":"ecs-97f8-0001"

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

Spark作业。 DLI支持的SDK分为SDK V3和DLI服务自行开发的SDK。（推荐）DLI SDK V3：是根据定义API的YAML文件统一自动生成，其接口参数与服务的API一致。具体操作请参考SDK V3版本开发指南。 DLI SDK（服务自研）：是DLI服务自行开发的SDK，本手册介绍DLI

帮助中心 > 数据湖探索 DLI > SDK参考
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

range 0 = 0 to 479 while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Flink SQL作业类 - 数据湖探索 DLI

在Flink SQL作业中创建表使用EL表达式，作业运行提示DLI.0005错误怎么办？ Flink作业输出流写入数据到OBS，通过该OBS文件路径创建的DLI表查询无数据 Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.Il

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

aegg包所在的OBS路径。分组设置和分组名称根据情况选择。单击“确定”完成程序包上传。在报错的Spark作业编辑页面，“依赖python文件”处选择已上传的egg程序包，重新运行Spark作业。 pyspark作业对接MySQL，需要创建跨源链接，打通DLI和RDS之间的网络。

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
FileSystem源表 - 数据湖探索 DLI
FileSystem源表 - 数据湖探索 DLI

connector 是无 String 固定位filesystem。 path 是无 String OBS路径。 format 是无 String 文件格式。支持csv、parquet格式。常见问题无父主题：创建源表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

面测试数据源网络是否打通。操作步骤如下：在队列管理页面选择队列。单击“操作”列中的“更多 > 测试地址连通性”。输入数据源的“IP:端口”测试网络连通性。在增强型跨源连接的详情页可以查看对等连接的相关信息。对等连接ID：增强型跨源在该队列所在集群中创建的对等连接ID。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

error message 该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

OVERWRITE、TRUNCATE TABLE）时是否清除相关数据： "auto.purge"='true'时，清除元数据和数据文件。 "auto.purge"='false'时，仅清除元数据，数据文件会移入OBS回收站。默认值为“false”，且不建议用户修改此属性，避免数据删除后无法恢复。 CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
数据迁移与传输方式概述 - 数据湖探索 DLI

LI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
创建Bucket索引表调优 - 数据湖探索 DLI

理：持续大量新增数据的维度表方法一：预留桶数，如使用非分区表则需通过预估较长一段时间内的数据增量来预先增加桶数，缺点是随着数据的增长，文件依然会持续膨胀；方法二：大粒度分区（推荐），如果使用分区表则需要根据数据增长情况来计算，例如使用年分区，这种方式相对麻烦些但是多年后表无需重新导入。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
Avro Format - 数据湖探索 DLI
Avro Format - 数据湖探索 DLI

format 是（none） String 指定使用格式，这里应该是'avro'。 avro.codec 否（none） String 仅用于文件系统，avro 压缩编解码器。默认不压缩。目前支持：deflate、snappy、bzip2、xz。数据类型映射目前，Avro schema

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format

总条数： 384

上一页
1
...
15
16
17
...
20
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink 1.12版本说明 - 数据湖探索 DLI

查看Delta表历史操作记录 - 数据湖探索 DLI

Hbase维表 - 数据湖探索 DLI

DLI的数据可存储在哪些地方 - 数据湖探索 DLI

如何获取AK/SK？ - 数据湖探索 DLI

使用DLI提交SQL作业查询RDS MySQL数据 - 数据湖探索 DLI

提交SQL作业（推荐） - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Flink SQL作业类 - 数据湖探索 DLI

将Spark作业结果存储在MySQL数据库中，缺少pymysql模块，如何使用python脚本访问MySQL数据库？ - 数据湖探索 DLI

FileSystem源表 - 数据湖探索 DLI

增强型跨源连接绑定弹性资源池 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

创建Bucket索引表调优 - 数据湖探索 DLI

Avro Format - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线