搜索_华为云

查询作业执行进度信息 - 数据湖探索 DLI

rogress表示整个作业的运行进度，因为没有子作业在运行，sub_job_id不展示。如果有子作业在运行中，则展示该子作业的运行进度，progress的计算方法为：子作业已经完成的task数除以子作业总的task数。此时progress表示子作业的运行进度，sub_job_id展示。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JSON Format - 数据湖探索 DLI
JSON Format - 数据湖探索 DLI

该示例是从kafka的一个topic中读取数据，并使用kafka sink将数据写入到kafka的另一个topic中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建并提交Spark作业 - 数据湖探索 DLI

描述：查询项目ID为48cc2c48765f481480c7db940d6409d1下的ID为0a324461-d9d9-45da-a52a-3b3c7a3d809e的批处理作业的后台日志。示例URL：GET https://{endpoint}/v2.0/48cc2c48765f48148

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
OpenTSDB结果表 - 数据湖探索 DLI
OpenTSDB结果表 - 数据湖探索 DLI

OpenTSDB是基于HBase分布式的，可伸缩的时间序列数据库。OpenTSDB的设计目标是用来采集大规模集群中的监控类信息，并可实现数据的秒级查询，解决海量监控类数据在普通数据库中查询存储的局限性，可用于系统监控和测量、物联网数据、金融数据和科学实验结果数据的收集监控。 DLI可以通过

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
Upsert Kafka源表 - 数据湖探索 DLI

EXCEPT_KEY：记录的value部分包含schema的所有内容，定义为主键的字段除外。 properties.* 否无 String 该选项可以传递任意的Kafka参数。 “properties.”后的后缀名必须匹配定义在 kafka参数文档中的参数名。 Flink会自动移除选项名中的 "properties

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
创建Flink OpenSource SQL作业 - 数据湖探索 DLI

其他服务的操作权限。 CU数量 CU数量为DLI的计算单元数量和管理单元数量总和，CU也是DLI的计费单位，1CU=1核4G。当前配置的CU数量为运行作业时所需的CU数，不能超过其绑定队列的CU数量。说明：当开启TaskManager配置时，为了优化弹性资源池队列的管理，在您设置“单TM

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业
创建并使用跨源链接 - 数据湖探索 DLI

本章节指导用户通过API创建增强型跨源连接。约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。创建增强型跨源连接之前需要获取需要建立连接的服务对应VPC的ID和其所在子网的网络ID。获取VPC的ID接口，具体请参考《虚拟私有云API参考》。获取子网网络ID接口，具体请参考《虚拟私有云API参考》。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
创建Spark作业 - 数据湖探索 DLI
创建Spark作业 - 数据湖探索 DLI

在下拉列表中选择要使用的队列。选择Spark版本。在下拉列表中选择支持的Spark版本，推荐使用最新版本。不建议长期混用不同版本的Spark/Flink引擎。长期混用不同版本的Spark/Flink引擎会导致代码在新旧版本之间不兼容，影响作业的执行效率。当作业依赖于特定版本的库或组件，

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
Confluent Avro Format - 数据湖探索 DLI

ent avro的形式写入作为sink的topic中。根据kafka和ecs所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka和ecs的地址测试队列连通性（通用队列 > 找到作业的所属队列 > 更多

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
创建并提交Flink作业 - 数据湖探索 DLI

约束限制新队列第一次运行作业时，需要一定的时间，通常为6~10分钟。涉及接口创建弹性资源池：创建弹性资源池。创建队列：在弹性资源池中添加队列。上传分组资源：上传Flink自定义作业所需的资源包。查询组内资源包：确认上传的资源包是否正确。创建Flink自定义作业：创建Flink自定义作业。

帮助中心 > 数据湖探索 DLI > API参考 > API快速入门
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

端口信息”。若使用经典型跨源，填写经典型跨源返回的连接地址，管理控制台操作请参考《数据湖探索用户指南》。 metric 所创建的dli表对应的OpenTSDB中的指标名称。 tags metric对应的标签，用于归类、过滤、快速检索等操作，可以是1到8个，以“，”分隔，包括对应metric下的所有tagk的值。通过SQL

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接OpenTSDB
窗口函数 - 数据湖探索 DLI
窗口函数 - 数据湖探索 DLI

的所有行。在没有ORDER BY的情况下，所有行都被视为对等行，因此未绑定的前导和当前行之间的范围等于未绑定的前导和未绑定的后续之间的范围。例如：下面的查询将salary表中的信息按照每个部门员工工资的大小进行排序。 --创建数据表并插入数据 create table salary

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > SQL函数和操作符
了解数据目录、数据库和表 - 数据湖探索 DLI

敏感类的业务，如交互类的查询等。库表管理中表的列表页面，表类型为Managed的即代表DLI表。 OBS表 OBS表的数据存储在OBS上，适用于对时延不敏感的业务，如历史数据统计分析等。 OBS表通常以对象的形式存储数据，每个对象包含数据和相关的元数据。库表管理中表的列表页面

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

Flink Jar作业只能运行在预先创建的独享队列上。如果“所属队列”下拉框中无可用的独享队列，请先创建一个独享队列并将该队列绑定到当前用户选择Flink Jar作业运行的队列应用程序用户自定义的程序包自定义的程序包主类指定加载的Jar包类名，如FlinkDisToDisExample。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
ClickHouse - 数据湖探索 DLI
ClickHouse - 数据湖探索 DLI

和Kafka集群所在的虚拟私有云和子网分别创建跨源连接，并绑定所要使用的Flink弹性资源池。设置ClickHouse和Kafka集群安全组的入向规则，使其对当前将要使用的Flink作业队列网段放通。参考测试地址连通性根据ClickHouse和Kafka的地址测试队列连通性。如

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
pyspark样例代码 - 数据湖探索 DLI

指南》中的“选择依赖资源参数说明”。通过API提交作业请参考《数据湖探索API参考》>《创建批处理作业》中“表2-请求参数说明”关于“modules”参数的说明。完整示例代码通过DataFrame API 访问认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接CSS
DLI作业开发流程 - 数据湖探索 DLI

您还可以通过自定义镜像增强DLI的计算环境，通过下载DLI提供的基础镜像再按需制作自定义镜像，将作业运行需要的依赖（文件、jar包或者软件）、私有能力等内置到自定义镜像中，可以改变Spark作业和Flink作业的容器运行环境，增强作业的功能、性能。例如，在自定义镜像中加入机器学习相关的Python

帮助中心 > 数据湖探索 DLI > 用户指南
Hudi Clustering操作说明 - 数据湖探索 DLI

调度Clustering：使用可插拔的Clustering策略创建Clustering计划。识别符合Clustering条件的文件：根据所选的Clustering策略，调度逻辑将识别符合Clustering条件的文件。根据特定条件对符合Clustering条件的文件进行分组。每个组的数据大小应为t

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
java样例代码 - 数据湖探索 DLI
java样例代码 - 数据湖探索 DLI

java样例代码开发说明本样例只适用于MRS的HBase。前提条件在DLI管理控制台上已完成创建跨源连接并绑定队列。具体操作请参考《数据湖探索用户指南》。认证用的password硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Elasticsearch结果表 - 数据湖探索 DLI

DLI将Flink作业的输出数据输出到云搜索服务CSS的Elasticsearch中。Elasticsearch是基于Lucene的当前流行的企业级搜索服务器，具备分布式多用户的能力。其主要功能包括全文检索、结构化搜索、分析、聚合、高亮显示等。能为用户提供实时搜索、稳定可靠的服务。适用于日志分析、站内搜索等场景。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表

总条数： 224

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

查询作业执行进度信息 - 数据湖探索 DLI

JSON Format - 数据湖探索 DLI

创建并提交Spark作业 - 数据湖探索 DLI

OpenTSDB结果表 - 数据湖探索 DLI

Upsert Kafka源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业 - 数据湖探索 DLI

创建并使用跨源链接 - 数据湖探索 DLI

创建Spark作业 - 数据湖探索 DLI

Confluent Avro Format - 数据湖探索 DLI

创建并提交Flink作业 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

窗口函数 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

使用Flink Jar读写DIS开发指南 - 数据湖探索 DLI

ClickHouse - 数据湖探索 DLI

pyspark样例代码 - 数据湖探索 DLI

DLI作业开发流程 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

java样例代码 - 数据湖探索 DLI

Elasticsearch结果表 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线