搜索_华为云

文件系统输出流(推荐） - 数据湖探索 DLI

使用文件系统输出流写入数据到OBS时，应避免多个作业写同一个目录的情况。 OBS对象存储桶的默认行为为覆盖写，可能导致数据丢失。 OBS并行文件系统桶的默认行为追加写，可能导致数据混淆。因为以上OBS桶类型行为的区别，为避免作业异常重启可能导致的数据异常问题，请根据您的业务需求选择OBS桶类型。 HDFS代理用户配置

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
Python开发环境配置 - 数据湖探索 DLI

Get it with Build Tools for Visual Studio ”，可能是由于缺少C++编译器导致的报错，建议您根据提示信息安装相应版本的Visual Studio编译器解决。部分操作系统Visual Studio安装后需重启才可以生效。父主题： Python

帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK > Python SDK环境配置
库表管理标签管理 - 数据湖探索 DLI

标签管理标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略，则需按照标签

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建DLI元数据 > 在DLI控制台管理数据库资源
作业语义检验时提示DIS通道不存在怎么处理？ - 数据湖探索 DLI

登录到DIS管理控制台，在左侧菜单栏选择“通道管理”。检查Flink作业SQL语句中的DIS通道是否存在。如果Flink作业中的DIS通道还未创建，请参见《数据接入服务用户指南》中“开通DIS通道”章节。确保创建的DIS通道和Flink作业处于统一区域。如果DIS通道已创建，则检查确保

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > 运维指导
增强型跨源连接标签管理 - 数据湖探索 DLI

操作场景标签是用户自定义的、用于标识云资源的键值对，它可以帮助用户对云资源进行分类和搜索。标签由标签“键”和标签“值”组成。如果用户在其他云服务中使用了标签，建议用户为同一个业务所使用的云资源创建相同的标签键值对以保持一致性。如您的组织已经设定DLI的相关标签策略，则需按照标

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相关问题 > 作业开发
创建SQL作业模板 - 数据湖探索 DLI

创建SQL作业模板为了便捷快速的执行SQL操作，DLI支持定制模板或将正在使用的SQL语句保存为模板。保存模板后，不需编写SQL语句，可通过模板直接执行SQL操作。 SQL模板包括样例模板和自定义模板。当前系统默认的样例模板包括22条标准的TPC-H查询语句，可以满足用户大部分的TPC-H需求场

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
时间序列预测 - 数据湖探索 DLI

为序列均值加上q个之前值的白噪声的线性组合。利用线性组合的权值也可预测下一个值。 ARMA(p, q)：自回归移动平均模型，综合了AR和MA两个模型的优势，在ARMA模型中，自回归过程负责量化当前数据与前期数据之间的关系，移动平均过程负责解决随机变动项的求解问题，因此，该模型比AR/MA更为有效和常用。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
Flink作业推荐配置指导 - 数据湖探索 DLI

Flink作业推荐配置指导用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2 添加订阅登录DLI控制台，创建Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业相关问题 > 性能调优
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Flink作业标签管理 - 数据湖探索 DLI

个业务所使用的云资源创建相同的标签键值对以保持一致性。 DLI支持以下两类标签：资源标签：在DLI中创建的非全局的标签。预定义标签：在标签管理服务（简称TMS）中创建的预定义标签，属于全局标签。有关预定义标签的更多信息，请参见《标签管理服务用户指南》。如您的组织已经设定D

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
时间序列预测 - 数据湖探索 DLI

为序列均值加上q个之前值的白噪声的线性组合。利用线性组合的权值也可预测下一个值。 ARMA(p, q)：自回归移动平均模型，综合了AR和MA两个模型的优势，在ARMA模型中，自回归过程负责量化当前数据与前期数据之间的关系，移动平均过程负责解决随机变动项的求解问题，因此，该模型比AR/MA更为有效和常用。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
在DLI控制台配置表权限 - 数据湖探索 DLI

赋权：当前用户可将表的权限赋予其他用户。回收：当前用户可回收其他用户具备的此表的权限，并且不能回收表所有者的权限。查看其他用户具备的权限：查看其他用户具备的当前表的权限。分区表还具有以下权限：删除分区：删除分区表中的分区。显示所有分区：显示分区表中的所有分区。只适用于“用户授权”的权限包括：

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建DLI元数据 > 在DLI控制台管理表资源
FileSystem结果表 - 数据湖探索 DLI

考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完全可以配置为基于时间的方式往桶中写入数据，比如可以设置每个小时的数据写入一个新桶中。即桶中将包含一个小时间隔内接收到的记录。桶目录中的数据被拆分成多个Part文件。对于相应的接收数据的桶的Sink的每个Subta

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > FileSystem
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

单击“提交”完成弹性资源池的创建。在弹性资源池的列表页，选择要操作的弹性资源池，单击操作列的“添加队列”。配置队列的基础配置，具体参数信息如下。表4 弹性资源池添加队列基础配置参数名称参数说明配置样例名称弹性资源池添加的队列名称。 dli_queue_01 类型选择创建的队列类型。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
怎样排查DLI计费异常？ - 数据湖探索 DLI

了大量数据而产生的计费。具体操作请参考数据存储。数据存储进入“数据管理”>“库表管理”页面。查看所建的数据库中是否有存储在DLI中的数据：单击所要查看的数据库名，进入对应的“表管理”页面；查看对应表的“数据存储位置”是否为DLI。如果有存储在DLI中的数据，则按照存储计费的标准计费。

帮助中心 > 数据湖探索 DLI > 计费说明 > 计费相关问题
在弹性资源池中添加队列 - 数据湖探索 DLI

17)。同一队列不同优先级的时间段区间不能有交集。最小CU 当前扩缩容策略支持的最小CU数。在全天的任意一个时间段内，弹性资源池中所有队列的最小CU数之和必须小于等于弹性资源池的最小CU数。当队列的最小CUs小于16CUs时，在队列属性中设置的“最大spark driver实例数”和“最大预拉起spark

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
使用Flink Jar连接开启SASL - 数据湖探索 DLI

ink Jar，并指定主类。主要参数的填写说明：所属队列：选择Flink Jar作业运行的队列。应用程序：自定义的程序包主类：指定类名：输入类名并确定类参数列表（参数间用空格分隔）。其他依赖文件：自定义的依赖文件。选择2和4导入的jks和properties文件。 Flink版本：1

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink Jar作业开发指南
从DLI导入数据到OBS，为什么数据量出现差异？ - 数据湖探索 DLI

TE BY 1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通

 帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业相关问题 > 运维指导

总条数： 614

上一页
1
...
23
24
25
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

文件系统输出流(推荐） - 数据湖探索 DLI

Python开发环境配置 - 数据湖探索 DLI

库表管理标签管理 - 数据湖探索 DLI

作业语义检验时提示DIS通道不存在怎么处理？ - 数据湖探索 DLI

增强型跨源连接标签管理 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

创建SQL作业模板 - 数据湖探索 DLI

时间序列预测 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

Flink作业标签管理 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

时间序列预测 - 数据湖探索 DLI

在DLI控制台配置表权限 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

怎样排查DLI计费异常？ - 数据湖探索 DLI

在弹性资源池中添加队列 - 数据湖探索 DLI

使用Flink Jar连接开启SASL - 数据湖探索 DLI

从DLI导入数据到OBS，为什么数据量出现差异？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线