搜索_华为云

Python开发环境配置 - 数据湖探索 DLI

Visual C++ xx.x is required. Get it with Build Tools for Visual Studio ”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

479 range 0 = 0 to 479 while trying to read 143805 bytes 问题原因上述报错可能原因是当前导入的文件数据量较大，同时因为spark.sql.shuffle.partitions参数设置的并行度过大，导致缓存区大小不够而导入数据报错。

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业运维类
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

开发流程说明序号阶段操作界面说明 1 创建DLI通用队列 DLI控制台创建作业运行的DLI队列。 2 OBS桶文件配置 OBS控制台如果是创建OBS表，则需要上传文件数据到OBS桶下。配置Spark创建表的元数据信息的存储路径。该文件夹路径用来存储Spark创建表的元数据信息“spark

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
将OBS数据导入至DLI - 数据湖探索 DLI

CSV 数据源路径直接输入路径或单击选择OBS的路径，如果没有合适的桶可直接跳转OBS创建。创建OBS表时指定的路径必须是文件夹，如果建表路径是文件将导致导入数据失败。当OBS的目录下有同名文件夹和文件时，数据导入指向该路径会优先指向文件而非文件夹。说明：路径同时支持文件和文件夹。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

ITEMS TERMINATED BY '-'：表示第二个字段hobbies是array形式，元素与元素之间通过'-'分隔。 MAP KEYS TERMINATED BY ':'：表示第三个字段address是k-v形式，每组k-v内部由':'分隔。查询hiveobstable2表数据。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
批作业SQL常用配置项说明 - 数据湖探索 DLI

expandThreshold - 参数说明：对于包含count(distinct)的多维分析（with cube）的查询场景，spark典型的执行计划是将cube使用expand算子来实现，但该操作会导致查询膨胀，为了避免出现查询膨胀，建议执行如下配置： spark.sql.keep.distinct

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Spark SQL语法参考（即将下线）
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
窗口去重 - 数据湖探索 DLI
窗口去重 - 数据湖探索 DLI

列。否则优化器无法翻译。 Flink 使用 ROW_NUMBER() 移除重复数据，就像窗口TopN一样。理论上，窗口是一种特殊的窗口 Top-N：N是1并且是根据处理时间或事件时间排序的。更多介绍和使用请参考开源社区文档：窗口去重。语法格式 SELECT [column_list]

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML > 窗口
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出DLI表数据至OBS中支持将数据从DLI表中导出到OBS服务中，导出操作将在OBS服务新建文件夹，或覆盖已有文件夹中的内容。注意事项支持导出json格式的文件，且文本格式仅支持UTF-8。只支持将DLI表（表类型为“Managed”）中的数据导出到OBS桶中，且导出的路径必须指定到文件夹级别。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
创建SQL作业模板 - 数据湖探索 DLI

输入模板名称、语句和描述信息，详细参数介绍请参见表1。图1 创建模板表1 参数说明参数名称描述名称模板名称。模板名称只能包含数字、英文字母和下划线，但不能是纯数字，不能以下划线开头，且不能为空。输入长度不能超过50个字符。语句需要保存为模板的SQL语句。描述该模板的相应描述。分组设置

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
BlackHole结果表 - 数据湖探索 DLI

BlackHole Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
BlackHole结果表 - 数据湖探索 DLI

BlackHole Connector允许接收所有输入记录，常用于高性能测试和UDF 输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Spark SQL常用配置项说明 - 数据湖探索 DLI

expandThreshold - 参数说明：对于包含count(distinct)的多维分析（with cube）的查询场景，spark典型的执行计划是将cube使用expand算子来实现，但该操作会导致查询膨胀，为了避免出现查询膨胀，建议执行如下配置： spark.sql.keep.distinct

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中问题现象 SQL作业中存在join操作，作业提交后状态一直是运行中，没有结果返回。问题根因 Spark SQL作业存在join小表操作时，会触发自动广播所有executor，使得join快速完成。但同时该操

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
BlackHole - 数据湖探索 DLI
BlackHole - 数据湖探索 DLI

功能描述 BlackHole Connector允许接收所有输入记录，常用于高性能测试和UDF输出，其不是实质性Sink。Blackhole结果表是系统内置的Connector。例如，如果您在注册其他类型的Connector结果表时报错，但您不确定是系统问题还是结果表WITH参数错误，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据 interval 所定义的不活跃时间所确定；即一个会话时间窗口在定义的间隔时间内没有事件出现，该窗口会被关闭。例如时间窗口的间隔时间是 30 分钟，当其不活跃的时间达到30分钟后，若观测到新的记录，则会启动一个新的会话时间窗口（否则该行数据会被添加到当前的窗口），且若在 30

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

根据 interval 所定义的不活跃时间所确定；即一个会话时间窗口在定义的间隔时间内没有事件出现，该窗口会被关闭。例如时间窗口的间隔时间是 30 分钟，当其不活跃的时间达到30分钟后，若观测到新的记录，则会启动一个新的会话时间窗口（否则该行数据会被添加到当前的窗口），且若在 30

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

time_attr设置为processing-time时无需指定类型。对于批处理的 SQL 查询，分组窗口函数的 time_attr 参数必须是一个timestamp类型的属性。表1 分组函数表分组窗口函数说明 TUMBLE(time_attr, interval) 定义一个滚动窗口。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
DLI作业开发流程 - 数据湖探索 DLI

例如，在自定义镜像中加入机器学习相关的Python包或者C库，可以通过这种方式帮助用户实现功能扩展。创建自定义镜像请参考使用自定义镜像增强作业运行环境。 DLI元数据是SQL作业、Spark作业场景开发的基础。在执行作业前您需要根据业务场景定义数据库和表。 Flink支持动态数据类型，可以在运行时定义数据结构，不需要事先定义元数据。

帮助中心 > 数据湖探索 DLI > 用户指南
SMN结果表 - 数据湖探索 DLI
SMN结果表 - 数据湖探索 DLI

message-column' = '' ); 参数说明表1 参数说明参数是否必选说明 connector.type 是 sink的类型，smn表示输出到消息通知服务中 connector.region 是 SMN所在区域 connector.topic-urn 否 SMN服务的主题URN，用于静态主

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 540

上一页
1
...
21
22
23
...
27
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Python开发环境配置 - 数据湖探索 DLI

LOAD数据到OBS外表报错：IllegalArgumentException: Buffer size too small. size - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

将OBS数据导入至DLI - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

批作业SQL常用配置项说明 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

窗口去重 - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

BlackHole结果表 - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

SQL作业中存在join操作，因为自动广播导致内存不足，作业一直运行中 - 数据湖探索 DLI

BlackHole - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

SMN结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线