搜索_华为云

Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

UpsertKafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Spark SQL语法概览 - 数据湖探索 DLI

自定义函数相关语法创建函数删除函数显示函数详情显示所有函数数据多版本相关语法创建OBS表时开启数据多版本修改表时开启或关闭数据多版本设置多版本备份数据保留周期查看多版本备份数据恢复多版本备份数据配置多版本过期数据回收站清理多版本数据

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
pyspark样例代码 - 数据湖探索 DLI

driver = "org.postgresql.Driver" 设置数据 1 dataList = sparkSession.sparkContext.parallelize([(1, "Katie", 19)]) 设置schema 1 2 3 schema = StructType([StructField("id"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
套餐包计费 - 数据湖探索 DLI
套餐包计费 - 数据湖探索 DLI

续使用。购买套餐包登录DLI管理控制台。选择“资源管理 > 队列管理”。在队列管理页面，单击“购买套餐包”。在“购买套餐包”页面设置相关参数。表2 参数说明参数名称描述区域选择所在的区域。不同区域的云服务之间内网互不相通；请就近选择靠近您业务的区域，可减少网络时延，提高访问速度。

帮助中心 > 数据湖探索 DLI > 计费说明
CREATE TABLE AS - 数据湖探索 DLI
CREATE TABLE AS - 数据湖探索 DLI

创建包含SELECT查询结果的新表。使用CREATE TABLE创建空表。使用IF NOT EXISTS子句时，如果表已经存在则不会报错。可选WITH子句可用于设置新创建的表的属性，如表的存储位置（location）、是不是外表（external）等。示例用指定列的查询结果创建新表orders_column_aliased：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
CREATE TABLE LIKE - 数据湖探索 DLI
CREATE TABLE LIKE - 数据湖探索 DLI

order01 INCLUDING PROPERTIES; 创建表orders_like02，它将包含表order02定义的列，并将表的存储格式设置为‘TEXTFILE’ CREATE TABLE orders_like02 like order02 STORED AS TEXTFILE;

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
增强型跨源连接标签管理 - 数据湖探索 DLI

在对应连接的“操作”列，选择“更多”>“标签”。进入标签管理页面，显示当前连接的标签信息。单击“添加/编辑标签”，弹出“添加/编辑标签”对话框，配置参数。标签键和标签值设置完成后，单击“添加”，将标签加入到输入框中。图1 添加标签表1 标签配置参数参数参数说明标签键您可以选择：在输入框的下拉列表中选择预定义标签键。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 管理增强型跨源连接
导出DLI表数据至OBS中 - 数据湖探索 DLI

随导出创建指定路径：指定的导出目录必须不存在，如果指定目录已经存在，系统将返回错误信息，无法执行导出操作。覆盖指定路径：在指定目录下新建文件，会删除已有文件。表头:无/有设置导出数据是否含表头。单击“确定”即可导出数据。（可选）您可以在“作业管理”>“SQL作业”页面查看导出作业的“状态”、“执行语句”等信息。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
插入数据 - 数据湖探索 DLI
插入数据 - 数据湖探索 DLI

* from ... 在“数据湖探索管理控制台>SQL编辑器”页面，单击编辑窗口右上角“设置”，可配置参数。通过配置“spark.sql.shuffle.partitions”参数可以设置非DLI表在OBS桶中插入的文件个数，同时，为了避免数据倾斜，在INSERT语句后可加上“distribute

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 -W：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。 CREATE DATABASE

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

弹性资源池网段设置后不支持更改。仅支持查看30天以内的弹性资源池扩缩容历史。弹性资源池无法直接访问公网。弹性资源池关联队列弹性资源池关联队列：仅支持关联按需计费模式的队列（包括专属队列）。队列和弹性资源池状态正常，资源未被冻结。弹性资源池扩缩容弹性资源池CU设置、弹性资

 帮助中心 > 数据湖探索 DLI > 产品介绍
Parquet Format - 数据湖探索 DLI
Parquet Format - 数据湖探索 DLI

STRUCT 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列> 找到作业的所属队列> 更多> 测试地址连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Flink作业推荐配置指导 - 数据湖探索 DLI

执行Checkpoint机制会影响实时计算性能，配置间隔时间需权衡对业务的性能影响及恢复时长，建议大于Checkpoint的完成时间，建议设置为5分钟。 Exactly Once模式保证每条数据只被消费一次，At Least Once模式每条数据至少被消费一次，请依据业务情况选择。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
在Spark SQL作业中使用UDTF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。图11 创建程序包创建DLI的UDTF函数。登录DLI管理控

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Boolean 当解析异常时，是跳过当前字段或行，还是抛出错误失败（默认为 false，即抛出错误失败）。如果忽略字段的解析异常，则会将该字段值设置为null。 canal-json.timestamp-format.standard 否 'SQL' String 指定输入和输出时间戳

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
从Kafka读取数据写入到DWS - 数据湖探索 DLI

连接，请指定为集群“内网访问地址”或“内网访问域名”。如果通过弹性负载均衡连接，请指定为“弹性负载均衡地址”。 dbadmin：创建集群时设置的默认管理员用户名。 password ：默认管理员用户的密码。在命令行窗口输入以下命令创建数据库“testdwsdb”。 CREATE

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
类型转换函数 - 数据湖探索 DLI

sql作业，输入以下作业运行脚本，提交运行作业。注意：创建作业时，在作业编辑界面的“运行参数”处，“Flink版本”选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。如下脚本中的加粗参数请根据实际环境修改。 CREATE TABLE kafkaSource (

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
CREATE TABLE - 数据湖探索 DLI
CREATE TABLE - 数据湖探索 DLI

Hudi当前只有int、bigint、float、double、decimal、string、date、timestamp、boolean、binary类型支持设置默认值。 Hudi表必须指定primaryKey与preCombineField。在指定路径下创建表时，如果路径下已存在Hudi表，则建

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考 > Hudi DDL语法说明
增强型跨源连接概述 - 数据湖探索 DLI

增强型跨源连接需要使用VPC、子网、路由、对等连接功能，因此需要获得VPC（虚拟私有云）的VPC Administrator权限。可在服务授权中进行设置。使用约束限制使用DLI增强型跨源时，弹性资源池/队列的网段与数据源网段不能重合。访问跨源表需要使用已经创建跨源连接的队列。跨源表不支持Preview预览功能。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
管理Flink作业模板 - 数据湖探索 DLI

保存保存修改。创建作业使用当前模板创建作业。格式化对SQL语句进行格式化，将SQL语句格式化后，需要重新编辑SQL语句。主题设置更改字体大小、自动换行、页面风格（黑色底或白色底）等配置。在SQL语句编辑区域，输入SQL语句，实现业务逻辑功能。SQL语句的编写请参考《数据湖探索SQL语法参考》。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业

总条数： 545

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

0/200

提交反馈取消

Raw Format - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

套餐包计费 - 数据湖探索 DLI

CREATE TABLE AS - 数据湖探索 DLI

CREATE TABLE LIKE - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

插入数据 - 数据湖探索 DLI

典型场景示例：迁移DWS数据至DLI - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

Parquet Format - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

在Spark SQL作业中使用UDTF - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

从Kafka读取数据写入到DWS - 数据湖探索 DLI

类型转换函数 - 数据湖探索 DLI

CREATE TABLE - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

管理Flink作业模板 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线