搜索_华为云

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

range 0 = 0 to 479 while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
Spark开源命令支持说明 - 数据湖探索 DLI

DATABASE testDB SET DBPROPERTIES ('Edited-by' = 'John'); 不支持不支持修改数据库在OBS上的文件存放路径 ALTER DATABASE testDB SET LOCATION 'obs://bucketName/filePath'; 不支持

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

error message 该场景下就需要使用REFRESH TABLE来解决该问题。REFRESH TABLE是用于重新整理某个分区的文件，重用之前的表元数据信息，能够检测到表的字段的增加或者减少，主要用于表中元数据未修改，表的数据修改的场景。语法格式 1 REFRESH TABLE

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

使用gsjdbc200驱动连接时，格式为：jdbc:gaussdb://${ip}:${port}/${dbName}。 table-name 是无 String 读取数据库中的数据所在的表名。 driver 否无 String jdbc连接驱动，默认为: org.postgresql.Driver。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
数据迁移与传输方式概述 - 数据湖探索 DLI

LI集中分析和管理，您可以通过云数据迁移服务CDM等迁移工具迁移数据至DLI，再使用DLI提交作业分析数据。 CDM支持数据库、数据仓库、文件等多种类型的数据源，通过可视化界面对数据源迁移任务进行配置，提高数据迁移和集成的效率。具体操作请参考迁移外部数据源数据至DLI。图1 迁移数据至DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

OVERWRITE、TRUNCATE TABLE）时是否清除相关数据： "auto.purge"='true'时，清除元数据和数据文件。 "auto.purge"='false'时，仅清除元数据，数据文件会移入OBS回收站。默认值为“false”，且不建议用户修改此属性，避免数据删除后无法恢复。 CREATE

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

2021-03-24 16:06:06,200.00,180.00,2021-03-24 16:10:06,0001,Alice,330106 读取kafka中作为sink的topic，结果如下： 202103251505050001,qqShop,"2021-03-25 15:05:05"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Notebook相关操作请参考JupyterLab简介及常用操作。 Notebook中的数据上传请参考上传文件至JupyterLab。 Notebook中的数据下载请参考下载JupyterLab文件到本地。（可选）配置Notebook访问DLI元数据在完成DLI和Notebook的对接后

 帮助中心 > 数据湖探索 DLI > 用户指南
userDefined源表 - 数据湖探索 DLI
userDefined源表 - 数据湖探索 DLI

open、run、close和cancel函数。实现完成后将该类编译打在jar中，通过sql编辑页的UDF Jar上传。依赖的pom配置文件内容参考如下： <dependency> <groupId>org.apache.flink</groupId> <ar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
使用DLI分析电商实时业务数据 - 数据湖探索 DLI

OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。

帮助中心 > 数据湖探索 DLI > 最佳实践
离线Compaction配置 - 数据湖探索 DLI

run archivelog on $tablename; // 执行archivelog合并清理元数据文件关于清理、归档参数的值不宜设置过大，会影响Hudi表的性能，通常建议： hoodie.cleaner.commits.retained =

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Bucket调优示例
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

后续查看作业日志。认证用的username和password等硬编码到代码中或者明文存储都有很大的安全风险，建议使用DEW管理凭证。配置文件或者环境变量中密文存放，使用时解密，确保安全。Flink Opensource SQL使用DEW管理访问凭据语法格式 create table

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Hudi表模型设计规范 - 数据湖探索 DLI

Spark批处理场景，对写入时延要求不高的场景，采用COW表。 COW表模型中，写入数据存在写放大问题，因此写入速度较慢；但COW具有非常好的读取性能力。而且批量计算对写入时延不是很敏感，因此可以采用COW表。 Hudi表的写任务要开启Hive元数据同步功能。 SparkSQL天然与

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
创建JDBC维表 - 数据湖探索 DLI
创建JDBC维表 - 数据湖探索 DLI

数据源类型，‘jdbc’表示使用JDBC connector，必须为jdbc connector.url 是数据库的URL connector.table 是读取数据库中的数据所在的表名 connector.driver 否连接数据库所需要的驱动。若未配置，则会自动通过URL提取 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
ALTER TABLE - 数据湖探索 DLI
ALTER TABLE - 数据湖探索 DLI

PARTITION时指定了分区保存路径，那么在DROP PARTITION执行后，分区所在文件夹和数据不会被删除。如果ADD PARTITION时未指定分区保存路径，分区目录将从OBS上删除，数据会移到.Trash/Current文件夹。 ALTER TABLE table_name DROP [IF

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Flink作业常用操作 - 数据湖探索 DLI

选择需导入的作业配置文件的完整OBS路径。单击“下一步”。配置同名作业策略。单击“下一步”。勾选“配置同名替换”，如果待导入的作业名已存在，则覆盖已存在的作业配置，并且作业状态重置为草稿。不勾选“配置同名替换”，如果待导入的作业名已存在，则不导入同名作业的配置。确认“配置文件”和“同

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

集群上创建数据库和表中创建的数据库“testdwsdb”。用户名待连接数据库的用户。该数据库用户需要有数据表的读写权限，以及对元数据的读取权限。本示例使用创建DWS数据库实例的默认管理员用户“dbadmin”。密码对应的DWS数据库用户的密码。图2 CDM配置DWS数据源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

DLI.0007 不支持该操作。 400 DLI.0008 元数据错误。 400 DLI.0009 系统限制。 400 DLI.0011 文件权限校验错误。 400 DLI.0012 资源对象不可用。 401 DLI.0013 用户认证错误。 401 DLI.0014 服务认证错误。

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

jdbc连接地址，格式为：jdbc:postgresql://${ip}:${port}/${dbName} 。 connector.table 是读取数据库中的数据所在的表名 connector.driver 否 jdbc连接驱动，默认为: org.postgresql.Driver。 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
自定义函数 - 数据湖探索 DLI
自定义函数 - 数据湖探索 DLI

with "Provided" scope，否则本地调试运行时会加载不到pom文件中的依赖包。具体操作以IntelliJ IDEA版本2020.2为例，参考如下：在IntelliJ IDEA界面，选择调试的配置文件，单击“Edit Configurations”。在“Run/Debug

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数

总条数： 372

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

Spark开源命令支持说明 - 数据湖探索 DLI

REFRESH TABLE刷新表元数据 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

userDefined源表 - 数据湖探索 DLI

使用DLI分析电商实时业务数据 - 数据湖探索 DLI

离线Compaction配置 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

创建JDBC维表 - 数据湖探索 DLI

ALTER TABLE - 数据湖探索 DLI

Flink作业常用操作 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

自定义函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线