搜索_华为云

Flink作业概述 - 数据湖探索 DLI
Flink作业概述 - 数据湖探索 DLI

DLI允许用户提交编译为Jar包的Flink作业，提供了更高的灵活性和自定义能力，适合需要进行复杂数据处理的场景。当社区版Flink提供的Connector不能满足特定需求时，用户可以通过Jar作业来实现自定义的Connector或数据处理逻辑。适合需要实现UDF（用户定义函数）或特定库集成的场景，用

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
清理多版本数据 - 数据湖探索 DLI

older_than：指定清理多版本数据的时间范围。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。时间戳删除该时间戳时间点之前的多版本数据。时间格式需要为yyyy-MM-dd

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

选择左侧导航栏的“总览”，单击页面右上角的“登录指令”，在弹出的页面中单击复制登录指令。在安装容器引擎的虚拟机中执行上一步复制的登录指令。创建容器镜像组织。如果已创建组织则本步骤可以忽略。登录SWR管理控制台。选择左侧导航栏的“组织管理”，单击页面右上角的“创建组织”。填写组织名称，单击“确定”。

帮助中心 > 数据湖探索 DLI > 用户指南 > DLI常用管理操作
功能总览 - 数据湖探索 DLI
功能总览 - 数据湖探索 DLI

0支持弹性资源池和队列使用DLI提交作业前，您需要为提交作业准备所需的计算资源。 · 弹性资源池和队列：弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），灵活应对业务对计算资源变化的需求。同一弹性资源池中，队列之间的计算资源支持共享。通过合理设置队列的计算资源分配策略，可以提高计算资源利用率。

帮助中心 > 数据湖探索 DLI > 功能总览
Flink作业推荐配置指导 - 数据湖探索 DLI

Flink作业推荐配置指导用户在创建Flink作业时，可以通过如下配置实现流应用的高可靠性能。用户在消息通知服务（SMN）中提前创建一个“主题”，并将其指定的邮箱或者手机号添加至主题订阅中。此时指定的邮箱或者手机会收到请求订阅的通知，单击链接确认订阅即可。图1 创建主题图2 添加订阅登录DLI控制台，创建Flink

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
资产识别与管理 - 数据湖探索 DLI

可以通过标签实现资源的标识与管理。使用场景通常您的业务系统可能使用了华为云的多种云服务，您可以为这些云服务下不同的资源实例分别设置标签，各服务的计费详单会体现这些资源实例设置的标签。如果您的业务系统是由多个不同的应用构成，为同一种应用拥有的资源实例设置统一的标签将很容易帮助您对不同的应用进行使用量分析和成本核算。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
DLI常用跨源分析开发方式 - 数据湖探索 DLI

跨源分析当DLI有访问外部数据源的业务需求时，首先需要通过建立增强型跨源连接，打通DLI与数据源之间的网络，再开发不同的作业访问数据源以实现DLI跨源分析。本节操作介绍DLI支持的数据源对应的开发方式。使用须知 Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

弹性资源池为DLI作业运行提供所需的计算资源（CPU和内存），用于灵活应对业务对计算资源变化的需求。创建弹性资源池后，您可以在弹性资源池中创建多个队列，队列关联到具体的作业和数据处理任务，是资源池中资源被实际使用和分配的基本单元，即队列是执行作业所需的具体的计算资源。同一弹性资源池中，队列之间的计算资源支持共享。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
数学运算函数 - 数据湖探索 DLI

返回小数部分，d位之后数字的四舍五入，d为int型。例如round(21.263,2)，返回21.26。 PI 所有数字类型返回pi的值。 E() 所有数字类型返回e的值。 RAND() 所有数字类型返回一个0.0和1.0之间的随机double类型的数（包含0.0，不包含1.0）。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
应用场景 - 数据湖探索 DLI
应用场景 - 数据湖探索 DLI

数据，非结构化的空间位置数据、三维建模数据；在大体量的地理大数据中，通过高效的挖掘工具或者挖掘方法实现价值提炼，是用户非常关注的话题。优势提供地理专业算子：支持全栈Spark能力，具备丰富的Spark空间数据分析算法算子，全面支持结构化的遥感影像数据、非结构化的三维建模、激光

 帮助中心 > 数据湖探索 DLI > 产品介绍
Spark SQL语法概览 - 数据湖探索 DLI

Spark SQL语法概览本章节介绍了目前DLI所提供的Spark SQL语法列表。参数说明，示例等详细信息请参考具体的语法说明。表1 批作业SQL语法语法分类操作链接数据库相关语法创建数据库删除数据库查看指定数据库查看所有数据库创建OBS表相关语法使用DataSource语法创建OBS表

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
新建Flink Jar作业 - 数据湖探索 DLI

String 标签的键。说明：标签的键的最大长度为128个字符，标签的键可以包含任意语种字母、数字、空格和_ . : =+-@ ,但首尾不能含有空格，不能以_sys_开头。 value 是 String 标签的值。说明：标签值的最大长度为255个字符，标签的值可以包含任意语种字母、数字、空格和_

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
使用Hive语法创建DLI表 - 数据湖探索 DLI

使用Hive语法创建DLI表。DataSource语法和Hive语法主要区别在于支持的表数据存储格式范围、支持的分区数等有差异，详细请参考语法格式和注意事项说明。注意事项 CTAS建表语句不能指定表的属性。 Hive DLI表不支持在建表时指定多字符的分隔符。关于分区表的使用说明：创建分区表时，PARTITONED

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 创建DLI表
查询队列详情 - 数据湖探索 DLI

String 创建队列的用户。 create_time 否 Long 创建队列的时间。是单位为“毫秒”的时间戳。 queueType 否 String 队列类型。 sql general all 如果不指定，默认为“sql”。 cuCount 否 Integer 与该队列绑定的计算单元数。即当前队列的CU数。

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

别为：一种为"yyyy-MM"即保存年份和月份，精度到月份，它的range参数可以为YEAR或者YEAR To Month。一种为天时间"dd HH:mm:sss.fff"，用来保存天数、小时、分钟、秒和毫秒，精度最低到毫秒。它的range参数可以为DAY、MINUTE、DAY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若能连通，则表示跨源已经绑定成功，否则表示未成功。连接DWS

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

原生支持的。对于数据分析来说Python是很自然的选择，而在大数据分析中PySpark无疑是不二选择。对于JVM语言系的程序，通常会把程序打成Jar包并依赖其他一些第三方的Jar，同样的Python程序也有依赖一些第三方库，尤其是基于PySpark的融合机器学习相关的大数据分析

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。实际产生的费用与存储的文件大小、用户访问所产生的请求次数和流量大小有关，请根据自己的业务进行预估。 DLI 在创建SQL作业前需购买队列，使用DLI的队列资源时，按照队列CU时进行计费。

帮助中心 > 数据湖探索 DLI > 最佳实践
查看表的用户权限（废弃） - 数据湖探索 DLI

项目编号，用于资源隔离。获取方式请参考获取项目ID。 database_name 是 String 被查询的表所在的数据库名称。 table_name 是 String 被查询的表名称。 user_name 是 String 被查询的用户名称。请求消息无请求参数。响应消息表2 响应参数参数名称是否必选

 帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

别为：一种为"yyyy-MM"即保存年份和月份，精度到月份，它的range参数可以为YEAR或者YEAR To Month。一种为天时间"dd HH:mm:sss.fff"，用来保存天数、小时、分钟、秒和毫秒，精度最低到毫秒。它的range参数可以为DAY、MINUTE、DAY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数

总条数： 793

上一页
1
2
3
4
5
...
40
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业概述 - 数据湖探索 DLI

清理多版本数据 - 数据湖探索 DLI

使用自定义镜像增强作业运行环境 - 数据湖探索 DLI

功能总览 - 数据湖探索 DLI

Flink作业推荐配置指导 - 数据湖探索 DLI

资产识别与管理 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

在DataArts Studio开发DLI SQL作业 - 数据湖探索 DLI

数学运算函数 - 数据湖探索 DLI

应用场景 - 数据湖探索 DLI

Spark SQL语法概览 - 数据湖探索 DLI

新建Flink Jar作业 - 数据湖探索 DLI

使用Hive语法创建DLI表 - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？ - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

查看表的用户权限（废弃） - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线