搜索_华为云

FileSytem结果表 - 数据湖探索 DLI

FileSytem结果表功能描述 FileSystem结果表用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。数据生成后，可直接对生成的目录创建非DLI表，通过DLI SQL进行下一步处理分析，并且输出数据目录支持分区表结构。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
FileSystem结果表 - 数据湖探索 DLI

FileSystem结果表功能描述 FileSystem sink用于将数据输出到分布式文件系统HDFS或者对象存储服务OBS等文件系统。适用于数据转储、大数据分析、备份或活跃归档、深度或冷归档等场景。考虑到输入流可以是无界的，每个桶中的数据被组织成有限大小的Part文件。完

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > FileSystem
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？数据湖探索（DLI）服务对于PySpark是原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Py

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？在DLI执行作业时，为了避免因字符编码不一致导致的乱码问题，建议您统一数据源的编码格式。 DLI服务只支持UTF-8文本格式，因此在执行创建表和导入操作时，用户的数据需要以UTF-8编码。在将数据导入DLI之前，确保源数据文件（如CSV、JSO

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类
实时聚类 - 数据湖探索 DLI
实时聚类 - 数据湖探索 DLI

实时聚类聚类算法是非监督算法中非常典型的一类算法，经典的K-Means算法通过提前确定类别数目，计算数据点之间的距离来分类。对于离线静态数据集，我们可以依赖领域中知识来确定类别数目，运行K-Means算法可以取得比较好的聚类效果。但是对于在线实时流数据，数据是在不断变化和演进，

帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
数据迁移与传输方式概述 - 数据湖探索 DLI

数据迁移与传输方式概述导入数据至OBS DLI支持在不迁移数据的情况下，直接访问OBS中存储的数据进行查询分析。您只需将本地数据导入OBS即可开始使用DLI进行数据分析。导入数据的具体操作请参考上传对象。迁移数据至DLI 为了将分散在不同系统中的数据迁移到DLI，确保数据

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
创建并使用跨源链接 - 数据湖探索 DLI

创建并使用跨源链接场景描述本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云

 帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
pyspark样例代码 - 数据湖探索 DLI

pyspark样例代码开发说明 mongo只支持增强型跨源。只能使用包年包月队列。 DDS即文档数据库服务，兼容MongoDB协议。前提条件在DLI管理控制台上已完成创建增强跨源连接，并绑定包年/包月队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接Mongo
实时聚类 - 数据湖探索 DLI
实时聚类 - 数据湖探索 DLI

实时聚类聚类算法是非监督算法中非常典型的一类算法，经典的K-Means算法通过提前确定类别数目，计算数据点之间的距离来分类。对于离线静态数据集，我们可以依赖领域中知识来确定类别数目，运行K-Means算法可以取得比较好的聚类效果。但是对于在线实时流数据，数据是在不断变化和演进，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > StreamingML
创建DLI委托（废弃） - 数据湖探索 DLI

创建DLI委托（废弃）功能介绍该API用于创建DLI用户委托。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： POST /v2/{project_id}/agency 参数说明表1 URI参数参数名称是否必选参数类型

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 委托相关API（废弃）
创建程序包 - 数据湖探索 DLI
创建程序包 - 数据湖探索 DLI

创建程序包 DLI支持用户通过批处理方式将程序包提交至通用队列中运行。如果用户需要更新程序包，可以使用相同的程序包或文件上传至DLI的同一个位置（同一个分组），直接覆盖原有的程序包或文件。前提条件所使用的程序包需提前上传至OBS服务中保存。创建程序包步骤在管理控制台左侧，单击“数据管理”>“程序包管理”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作 > 管理Jar作业程序包
导入Flink作业 - 数据湖探索 DLI
导入Flink作业 - 数据湖探索 DLI

导入Flink作业功能介绍该API用于导入Flink作业数据。调试您可以在API Explorer中调试该接口。 URI URI格式 POST /v1.0/{project_id}/streaming/jobs/import 参数说明表1 URI参数说明参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
获取DLI委托信息（废弃） - 数据湖探索 DLI

获取DLI委托信息（废弃）功能介绍该API用于获取DLI用户委托信息。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。 URI URI格式： GET /v2/{project_id}/agency 参数说明表1 URI参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 委托相关API（废弃）
CloudTable OpenTSDB输出流 - 数据湖探索 DLI

CloudTable OpenTSDB输出流功能描述 DLI将Flink作业的输出数据输出到CloudTable的OpenTSDB中。OpenTSDB是基于HBase的分布式的，可伸缩的时间序列数据库。它存储的是时间序列数据，时间序列数据是指在不同时间点上收集到的数据，这类数据

 帮助中心 > 数据湖探索 DLI > SQL语法参考（即将下线） > 历史版本（即将下线） > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
CloudTable OpenTSDB输出流 - 数据湖探索 DLI

CloudTable OpenTSDB输出流功能描述 DLI将Flink作业的输出数据输出到CloudTable的OpenTSDB中。OpenTSDB是基于HBase的分布式的，可伸缩的时间序列数据库。它存储的是时间序列数据，时间序列数据是指在不同时间点上收集到的数据，这类数据

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流
计费概述 - 数据湖探索 DLI
计费概述 - 数据湖探索 DLI

计费概述数据湖探索DLI的计费由不同的计费项组成，不同的计费项有不同的计费模式，如图1所示。图1 DLI的计费组成计费项 DLI的计费项包括计算计费、存储计费、扫描量计费。DLI的计费详情请参见DLI产品价格详情。您可以通过DLI提供的价格计算器，快速计算出购买资源的参考价格。

帮助中心 > 数据湖探索 DLI > 计费说明
Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？问题描述 Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为不一致根因分析该问题的根因是数据库设置的时区不合理，通常该问题出现时F

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink SQL作业类
创建Flink Jar作业 - 数据湖探索 DLI

创建Flink Jar作业 Flink Jar作业是基于Flink能力进行二次开发的场景，即构建自定义应用Jar包并提交到DLI的队列运行。 Flink Jar作业场景需要用户自行编写并构建应用Jar包，适用于对流计算处理复杂度要求较高的用户场景，且用户可以熟练掌握Flink二次开发能力。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
CloudTable HBase输出流 - 数据湖探索 DLI

CloudTable HBase输出流功能描述 DLI将作业的输出数据输出到CloudTable的HBase中。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > 历史版本 > Flink SQL语法参考（不再演进，推荐使用Flink OpenSource SQL） > 创建输出流

总条数： 843

上一页
1
...
35
36
37
...
43
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

FileSytem结果表 - 数据湖探索 DLI

FileSystem结果表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

字符码不一致导致数据乱码怎么办？ - 数据湖探索 DLI

实时聚类 - 数据湖探索 DLI

数据迁移与传输方式概述 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

实时聚类 - 数据湖探索 DLI

创建DLI委托（废弃） - 数据湖探索 DLI

创建程序包 - 数据湖探索 DLI

导入Flink作业 - 数据湖探索 DLI

获取DLI委托信息（废弃） - 数据湖探索 DLI

CloudTable OpenTSDB输出流 - 数据湖探索 DLI

CloudTable OpenTSDB输出流 - 数据湖探索 DLI

计费概述 - 数据湖探索 DLI

Flink Opensource SQL从RDS数据库读取的时间和RDS数据库存储的时间为什么会不一致？ - 数据湖探索 DLI

创建Flink Jar作业 - 数据湖探索 DLI

CloudTable HBase输出流 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线