搜索_华为云

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

勾选该参数后，还需要选择“Checkpoint路径”。 “Checkpoint路径”：选择checkpoint保存路径。必须和应用程序中配置的Checkpoint地址相对应。且不同作业的路径不可一致，否则无法获取准确的Checkpoint。单击右上角“保存”，保存作业和相关参数。单击右上角“启动”，进入“启动Flink作业”页面。

帮助中心 > 数据湖探索 DLI > 快速入门
添加分区（只支持OBS表） - 数据湖探索 DLI

ADD [IF NOT EXISTS] PARTITION partition_specs1 [LOCATION 'obs_path1'] PARTITION partition_specs2 [LOCATION 'obs_path2']; 关键字 IF NOT EX

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
Kafka源表 - 数据湖探索 DLI
Kafka源表 - 数据湖探索 DLI

'(topic-a|topic-b|topic-[0-9]*)' connector.properties.bootstrap.servers 是 kafka brokers地址，以逗号分隔。 connector.properties.group.id 否消费组名称 connector.startup-mode 否

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

issive') PERMISSIVE（默认）：尽可能地解析bad records，如果遇到不能转换的字段，则整行为null DROPMALFORMED：忽略掉无法解析的bad records FAILFAST：遇到无法解析的记录时，抛出异常并使Job失败 BADRECORDSP

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

分区，适用于在处理具有大量分区的表时。如果SQL查询中包含大量的嵌套left join操作，并且表有大量的动态分区时，这可能会导致在数据解析时消耗大量的内存资源，导致Driver节点的内存不足，并触发频繁的Full GC。在这种情况下，可以配置该参数为false即禁用动态分区

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
更新Flink Jar作业 - 数据湖探索 DLI

-1或大于0。默认值为“-1”，表示无限次数。 checkpoint_path 否 String 用户Jar中checkpoint的储存地址，不同作业路径需要保持不同。 runtime_config 否 String Flink作业运行时自定义优化参数。 job_type 否 String

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
错误码 - 数据湖探索 DLI
错误码 - 数据湖探索 DLI

DLI.0002 对象不存在。 400 DLI.0003 SQL权限校验未通过。 400 DLI.0004 SQL语法解析错误。 400 DLI.0005 SQL语义解析错误。 400 DLI.0006 对象已存在错误。 400 DLI.0007 不支持该操作。 400 DLI.0008

帮助中心 > 数据湖探索 DLI > API参考 > 公共参数
查看指定表所有分区 - 数据湖探索 DLI

语法格式 1 2 SHOW PARTITIONS [db_name.]table_name [PARTITION partition_specs]; 关键字 PARTITIONS：表中的分区。 PARTITION：分区。参数说明表1 参数描述参数描述 db_name Da

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 查看表
数组函数和运算符 - 数据湖探索 DLI

数组函数和运算符下标操作符：[] 描述：下标操作符用于访问数组中的元素，并从1开始建立索引。 select myarr[5] from (values array [1,4,6,78,8,9],array[2,4,6,8,10,12]) as t(myarr); _col0

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
新建Flink Jar作业 - 数据湖探索 DLI

-1或大于0。默认值为“-1”，表示无限次数。 checkpoint_path 否 String 用户Jar中checkpoint的储存地址，不同作业路径需要保持不同。 tags 否 Array of Objects Flink jar作业的标签。具体请参考表3。 runtime_config

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Redis结果表 - 数据湖探索 DLI
Redis结果表 - 数据湖探索 DLI

connector.type 是 connector类型，对于redis，需配置为'redis'。 connector.host 是 redis连接地址。 connector.port 是 redis连接端口。 connector.password 否 redis认证密码。 connector

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

登录OBS控制台，将生成的Jar包文件上传到OBS路径下。登录DLI控制台，选择“作业管理 > Spark作业”。单击操作列“编辑”。编辑“应用程序”，选择1上传的OBS地址。图11 配置应用程序 Spark 3.3以下版本：分别上传Jar包到OBS和DLI下。登录OBS控制台，将生成的Jar包文件上传到OBS路径下。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
在DLI控制台创建数据库和表 - 数据湖探索 DLI

在DLI控制台创建数据库和表数据库是按照数据结构来组织、存储和管理数据的建立在计算机存储设备上的仓库。表是数据库最重要的组成部分之一。表是由行与列组合成的。每一列被当作是一个字段。每个字段中的值代表一种类型的数据。数据库是一个框架，表是其实质内容。一个数据库包含一个或者多个表。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
Python SDK环境配置 - 数据湖探索 DLI

Python SDK环境配置操作场景在进行二次开发时，要准备的开发环境如表1所示。表1 开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
SHOW语法使用概要 - 数据湖探索 DLI

规则4：|可以用来配置多种规则，规则之间用“|”分隔。规则5：当想将“_”作为匹配条件时，可以使用ESCAPE 指定一个转义字符，对“_”进行转义，以免按照规则1对“_”进行解析。父主题： DDL 语法

 帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI 本文为您介绍如何通过CDM数据同步功能，迁移MRS Hive数据至DLI。其他MRS Hadoop组件数据，均可以通过CDM与DLI进行双向同步。前提条件已创建DLI的SQL队列。创建DLI队列的操作可以参考创建DLI队列。创建DLI

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明 redis只支持增强型跨源。只能使用包年包月队列。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Redis
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
使用DataSource语法创建OBS表 - 数据湖探索 DLI

timestampFormat 否指定CSV文件中timestamp字段的日期格式。默认值： yyyy-MM-dd HH:mm:ss mode 否指定解析CSV时的模式，有三种模式。默认值：PERMISSIVE PERMISSIVE：宽容模式，遇到错误的字段时，设置该字段为Null DROPMALFORMED:

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建OBS表

总条数： 322

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

添加分区（只支持OBS表） - 数据湖探索 DLI

Kafka源表 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

更新Flink Jar作业 - 数据湖探索 DLI

错误码 - 数据湖探索 DLI

查看指定表所有分区 - 数据湖探索 DLI

数组函数和运算符 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

Redis结果表 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

SHOW语法使用概要 - 数据湖探索 DLI

典型场景示例：迁移Hive数据至DLI - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

使用DataSource语法创建OBS表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线