搜索_华为云

Spark 3.1.1版本说明 - 数据湖探索 DLI

Spark 3.1.1版本说明数据湖探索（DLI）遵循开源Spark计算引擎的发布一致性。本文介绍Spark 3.1.1版本所做的变更说明。更多Spark 3.1.1版本说明请参考Spark Release Notes。 Spark 3.1.1版本发布时间版本名称发布时间

 帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告
创建输出流 - 数据湖探索 DLI
创建输出流 - 数据湖探索 DLI

DWS输出流（通过OBS转储方式） MRS HBase输出流 MRS Kafka输出流开源Kafka输出流文件系统输出流(推荐） OBS输出流 RDS输出流 SMN输出流父主题： Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
创建输出流 - 数据湖探索 DLI
创建输出流 - 数据湖探索 DLI

EdgeHub输出流（EOS） MRS HBase输出流 MRS Kafka输出流开源Kafka输出流文件系统输出流(推荐） OBS输出流 RDS输出流 SMN输出流父主题： Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL）
创建DLI表关联CSS - 数据湖探索 DLI

X版本时，该参数只需要填写index即可。 pushdown CSS的下压功能是否开启，默认为“true”。包含大量IO传输的表在有where过滤条件的情况下能够开启pushdown降低IO。 strict CSS的下压是否是严格的，默认为“false”。精确匹配的场景下比pushdown降低更多IO。 batch

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 跨源连接CSS表
创建DLI表关联CSS - 数据湖探索 DLI

X版本时，该参数只需要填写index即可。 pushdown CSS的下压功能是否开启，默认为“true”。包含大量IO传输的表在有where过滤条件的情况下能够开启pushdown降低IO。 strict CSS的下压是否是严格的，默认为“false”。精确匹配的场景下比pushdown降低更多IO。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_extract REGEXP_EXTRACT函数用于将字符串source按照pattern的分组规则进行字符串匹配，返回第groupid个组匹配到的字符串内容。命令格式 regexp_extract(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 内置函数 > 字符串函数
regexp - 数据湖探索 DLI
regexp - 数据湖探索 DLI

regexp_extract REGEXP_EXTRACT函数用于将字符串source按照pattern的分组规则进行字符串匹配，返回第groupid个组匹配到的字符串内容。命令格式 regexp_extract(string <source>, string <pattern>[

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 内置函数 > 字符串函数
自拓展输入流 - 数据湖探索 DLI

数据源。 type_class_name 是用户实现获取源数据的source类名称，注意包含完整包路径。 type_class_parameter 是用户自定义source类的入参，仅支持一个string类型的参数。注意事项用户自定义source类需要继承类RichPar

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 自拓展生态
添加列 - 数据湖探索 DLI
添加列 - 数据湖探索 DLI

); 关键字 ADD COLUMNS：添加列。 COMMENT：列描述。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 表名称。 col_name 列字段名称。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线） > 修改表
自拓展输入流 - 数据湖探索 DLI

数据源。 type_class_name 是用户实现获取源数据的source类名称，注意包含完整包路径。 type_class_parameter 是用户自定义source类的入参，仅支持一个string类型的参数。注意事项用户自定义source类需要继承类RichPar

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 自拓展生态
取消作业（推荐） - 数据湖探索 DLI

取消作业（推荐）功能介绍该API用于取消已经提交的作业，若作业已经执行结束或失败则无法取消。调试您可以在API Explorer中调试该接口。 URI URI格式： DELETE /v1.0/{project_id}/jobs/{job_id} 参数说明表1 URI 参数

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
添加列 - 数据湖探索 DLI
添加列 - 数据湖探索 DLI

); 关键字 ADD COLUMNS：添加列。 COMMENT：列描述。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name 表名称。 col_name 列字段名称。

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 修改表
删除SQL模板 - 数据湖探索 DLI
删除SQL模板 - 数据湖探索 DLI

Array<String> 待删除的sql模板ID列表。响应参数表3 响应参数说明名称参数类型说明 is_success Boolean 是否成功。 message String 系统提示信息，执行成功时，信息可能为空。执行失败时，用于显示执行失败的原因。请求消息删除ID为

 帮助中心 > 数据湖探索 DLI > API参考 > SQL模板相关API
普通队列弹性扩缩容 - 数据湖探索 DLI

容到设定的目标大小。队列资源缩容时，系统不保证将队列资源完全缩容到设定的目标大小。通常队列资源缩容时，系统会先检查资源使用情况，判断是否存在缩容空间，如果现有资源无法按照最小缩容步长执行缩容任务，则队列可能缩容不成功，或缩容一部分规格的情况。因资源规格不同可能有不同的缩容步长

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理队列
Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

授权记录”中查看当前用户的权限。确认当前用户所属用户组下的权限是否包含OBS写入的权限，比如“OBS OperateAccess”。如果没有OBS写入权限，则给对应的用户组进行授权。授权完成后，等待5到10分钟等待权限生效。再次运行失败的Flink SQL作业，查看作业运行状态。

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > Flink SQL作业相关问题
查询所有SQL样例模板（废弃） - 数据湖探索 DLI

价格摘要报告查询。\r\n-- 在单个表lineitem上查询某个时间段内，对已经付款的、已经运送的等各类商品进行统计，包括业务量的计费、发货、折扣、税、平均价格等信息。\r\n-- 特点：带有分组、排序、聚集操作并存的单表查询操作。这个查询会导致表上的数据有95%到97%行被读取到。\r\nSELECT\r\n

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 模板相关API（废弃）
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

TypeSerializer 序列化的字节序列。示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列 > 找到作业的所属队列 >

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建并管理SQL作业模板 - 数据湖探索 DLI

创建并管理SQL作业模板创建SQL作业模板使用SQL作业模板开发并提交SQL作业 DLI预置的SQL模板中TPC-H样例数据说明父主题：使用DLI提交SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。解决方案建议可以尝试调小spark.sql.shuffle

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业相关问题 > 作业运维报错
查询弹性资源池下所有队列 - 数据湖探索 DLI

系统提示信息，执行成功时，信息可能为空。 queues 否 Array of objects 该弹性资源池下所有queue的资源权重信息。详细参数说明请参考表4。 count 否 Long 该资源池下关联的队列数量。表4 queues 参数是否必填参数类型描述 queue_name 否 String

帮助中心 > 数据湖探索 DLI > API参考 > 弹性资源池相关API

总条数： 998

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Spark 3.1.1版本说明 - 数据湖探索 DLI

创建输出流 - 数据湖探索 DLI

创建输出流 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

regexp - 数据湖探索 DLI

regexp - 数据湖探索 DLI

自拓展输入流 - 数据湖探索 DLI

添加列 - 数据湖探索 DLI

自拓展输入流 - 数据湖探索 DLI

取消作业（推荐） - 数据湖探索 DLI

添加列 - 数据湖探索 DLI

删除SQL模板 - 数据湖探索 DLI

普通队列弹性扩缩容 - 数据湖探索 DLI

Flink SQL作业运行失败，日志中有connect to DIS failed java.lang.IllegalArgumentException: Access key cannot be null错误 - 数据湖探索 DLI

查询所有SQL样例模板（废弃） - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

创建并管理SQL作业模板 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

查询弹性资源池下所有队列 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线