搜索_华为云

使用Hive语法创建DLI表 - 数据湖探索 DLI

DLI表不支持在建表时指定多字符的分隔符。关于分区表的使用说明：创建分区表时，PARTITONED BY中指定分区列必须是不在表中的列，且需要指定数据类型。分区列支持string, boolean, tinyint, smallint, short, int, bigint, long

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
创建DWS维表 - 数据湖探索 DLI
创建DWS维表 - 数据湖探索 DLI

postgresql.Driver。 connector.username 否数据库认证用户名，需要和'connector.password'一起配置 connector.password 否数据库认证密码，需要和'connector.username'一起配置 connector.read.partition

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建维表
DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

示例1：使用SQL队列，将Spark版本从Spark 2.4.x升级至Spark 3.3.1对数据表的版本有影响吗？不需要，Spark 2.4.x的SQL队列支持V1表和V2表，因此升级Spark版本只需要考虑Spark版本对SQL语法的兼容性。示例2：使用通用队列，将Spark版本从Spark 2

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
弹性资源池关联队列 - 数据湖探索 DLI

资源池。弹性资源池Flink版本只支持1.10及其以上版本，如果准备分配到弹性资源池的作业使用Flink1.7版本可能会出现兼容性问题，需要提前做好Flink版本适配。约束与限制弹性资源池和队列均是可用状态。队列是按需专属队列。队列和弹性资源池状态正常，资源未被冻结。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
作业相关 - 数据湖探索 DLI
作业相关 - 数据湖探索 DLI

value1,part2=value2"))，也可以在创建ImportJob对象的时候直接通过参数的形式创建。导入作业默认是追加写，如果需要覆盖写，则可以调用ImportJob对象的setOverWrite接口设置，如：importJob.setOverWrite(Boolean

帮助中心 > 数据湖探索 DLI > SDK参考 > Java SDK > SQL作业相关
INSERT - 数据湖探索 DLI
INSERT - 数据湖探索 DLI

select_statement 限制如果数据表中只有一个字段，且字段类型为row、struct，那么插入数据时需要用row对类型进行包裹。 -- 单字段表插入复杂类型需要用row()包裹 CREATE TABLE test_row (id row(c1 int, c2 string));

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DML 语法
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

index.enabled'='true' 创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.15”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table hudiSource

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

控制台操作请参考《数据湖探索用户指南》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.opentsdb。如果选择Spark版本为3.1.1时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
插入数据至HBase表 - 数据湖探索 DLI

已创建跨源连接的DLI表名称。 DLI_TEST 为包含待查询数据的表。 field1,field2...，field 表“DLI_TEST”中的列值，需要匹配表“DLI_TABLE”的列值和类型。 where_condition 查询过滤条件。 num 对查询结果进行限制，num参数仅支持INT类型。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接HBase表
开启或关闭数据多版本 - 数据湖探索 DLI

开启多版本功能后，在执行insert overwrite或者truncate操作时会自动在OBS存储路径下存储多版本数据。关闭多版本功能后，需要通过如下命令把多版本数据目录回收。 RESTORE TABLE [db_name.]table_name TO initial layout;

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
datediff1 - 数据湖探索 DLI
datediff1 - 数据湖探索 DLI

yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 datepart 是 STRING 代表需要返回的时间单位。参数datepart支持扩展的日期格式：年-year、月-month或-mon、日-day和小时-hour。 yyyy代表年份。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
CREATE VIEW - 数据湖探索 DLI
CREATE VIEW - 数据湖探索 DLI

TBLPROPERTIES('format'='orc') as select * from fruit; 注意事项当使用alter修改创建视图所依赖的表时，需要重新创建视图，否则再次查询视图会报错。父主题： DDL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
pyspark样例代码 - 数据湖探索 DLI

》。API操作请参考《数据湖探索API参考》>《创建批处理作业》。如果选择spark版本为2.3.2（即将下线）或2.4.5提交作业时，需要指定Module模块，名称为：sys.datasource.hbase。如果选择Spark版本为3.1.1时，无需选择Module模块，

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

'yyyymmdd') = substr('20220601',1,8) 解决措施在使用join进行多表关联查询时，不管表数据量大小，join时都需要指定on条件来减少多表关联的数据量，从而减轻队列的负荷，提升查询效率。例如，问题现象中的问题语句可以根据业务场景，在join时通过指定o

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
配置Hudi数据列默认值 - 数据湖探索 DLI

修改列默认值 alter table h3 alter column price set default 14.56; 插入数据使用列默认值，需要指定写入的列名，和插入的数据一一对应 insert into h3(id, name) values(1, 'aaa'); insert into

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

2或更早版本中，x为double类型。 Spark3.3.x：x类型等于函数输入值的类型。升级引擎版本后是否对作业有影响：有影响，涉及相关用法需要适配。示例代码：准备数据： create table test_histogram_numeric(val int); INSERT INTO

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
unix_timestamp - 数据湖探索 DLI
unix_timestamp - 数据湖探索 DLI

yyyy-mm-dd yyyy-mm-dd hh:mi:ss yyyy-mm-dd hh:mi:ss.ff3 pattern 否 STRING 代表需要转换的格式。 pattern为空时，默认为yyyy-MM-dd hh:mm:ss格式。 format:格式为代表年月日时分秒的时间单位与任意字符的组合，其中：

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 日期函数
创建Password类型跨源认证 - 数据湖探索 DLI

创建源表、结果表、维表时均使用该字段关联跨源认证。通过配置pwd_auth_name字段写入创建的Password类型的跨源认证名称。如果配置该参数则不需要在SQL中配置数据源的账号密码。具体的建表操作指导请参考DLI 语法参考。 Flink OpenSource SQL语法参考：创建DWS源表

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 使用DLI的跨源认证管理数据源访问凭证
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

"spark.hadoop.fs.obs.access.key"参数对应的值"xxx"需要替换为账号的AK值。 "spark.hadoop.fs.obs.secret.key"参数对应的值“yyy”需要替换为账号的SK值。 AK和SK值获取请参考：如何获取AK和SK。读取OBS桶中的“people

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

确保本地编译环境可以正常访问公网。约束与限制需要在DLI控制台下“全局配置 > 服务授权”开启Tenant Adminstrator（全局服务）。写入数据到OBS的桶必须为主账号下所创建的OBS桶。使用Flink1.15版本的计算引擎时，需要用户自行配置委托，否则可能影响作业运行。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南

总条数： 659

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Hive语法创建DLI表 - 数据湖探索 DLI

创建DWS维表 - 数据湖探索 DLI

DLI datasourceV1表和datasourceV2表 - 数据湖探索 DLI

弹性资源池关联队列 - 数据湖探索 DLI

作业相关 - 数据湖探索 DLI

INSERT - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

插入数据至HBase表 - 数据湖探索 DLI

开启或关闭数据多版本 - 数据湖探索 DLI

datediff1 - 数据湖探索 DLI

CREATE VIEW - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

join表时没有添加on条件，造成笛卡尔积查询，导致队列资源爆满，作业运行失败怎么办？ - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

unix_timestamp - 数据湖探索 DLI

创建Password类型跨源认证 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线