搜索_华为云

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

heckpoint文件恢复内部状态和消费位点，保证数据不丢失及聚合算子等内部状态的精确一致语义。同时，为了保证数据不重复，建议使用带主键数据库或者文件系统作为目标数据源，否则下游处理业务需要加上去重逻辑（最新成功Checkpoint记录位点到异常时间段内的数据会重复消费）。图1

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
查看多版本备份数据 - 数据湖探索 DLI

HISTORY FOR TABLE：查看备份数据。 PARTITION：指定分区列。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 column 分区列名。 value

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
配置多版本过期数据回收站 - 数据湖探索 DLI

TBLPROPERTIES：TBLPROPERTIES子句给表添加key/value的属性。参数说明表1 参数说明参数描述 db_name 数据库名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以数字和下划线开头。 table_name 表名称。 obs桶多版本回收站目录

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 多版本备份恢复数据
指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

PARTITIONS：分区。参数说明表1 参数描述参数描述 db_name Database名称，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。 table_name Database中的表名，由字母、数字和下划线（_）组成。不能是纯数字，且不能以下划线开头。匹配规则为：^(

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 分区相关
在Spark SQL作业中使用UDF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDF函数。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。图11 选择队列和数据库在SQL编辑区域输入下列命令创建UDF函数，单击“执行”提交创建。 CREATE FUNCTION TestSumUDF AS

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
基本语句 - 数据湖探索 DLI
基本语句 - 数据湖探索 DLI

col_name_list]] [LIMIT number]; 关键字表1 SELECT关键字说明参数描述 ALL ALL关键字用于返回数据库所有匹配的行，包括重复的行。ALL关键字的后面只能跟*，否则执行语句会出错。 ALL是SQL语句的默认行为，通常不会被明确写出，如果不指定

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > SELECT
创建DLI表关联CSS - 数据湖探索 DLI

IP2:PORT2"。 resource 指定在CSS关联的资源名，用"/index/type"指定资源位置（可简单理解index为database，type为table，但绝不等同）。说明： ES 6.X版本中，单个Index只支持唯一type，type名可以自定义。 ES 7

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
Hive结果表 - 数据湖探索 DLI
Hive结果表 - 数据湖探索 DLI

写入具有分区提交功能的Hive表。 CREATE CATALOG myhive WITH ( 'type' = 'hive' , 'default-database' = 'demo', 'hive-conf-dir' = '/opt/flink/conf' ); USE CATALOG

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
查询经典型跨源连接列表 - 数据湖探索 DLI

String 创建连接时，用户指定的对端服务（CloudTable/CloudTable.OpenTSDB/MRS.OpenTSDB/DWS/RDS/CSS）。 create_time 否 Long 创建连接的时间。为UTC的时间戳。 queue_list 否 Array of Strings

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 经典型跨源连接相关API（废弃）
获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Spark3.3.1版本（Spark通用队列场景）使用委托授权访问临时凭证：在创建作业时，请配置作业使用Spark3

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
API概览 - 数据湖探索 DLI
API概览 - 数据湖探索 DLI

本章节介绍了目前DLI所提供的API列表。表1 DLI API列表类型说明权限相关API 包括队列赋权、查看队列的使用者、数据赋权、查看数据库的使用者、查看表的使用者、查看表的用户权限和查看赋权对象使用者权限信息。全局变量相关API 包括创建全局变量、删除全局变量、修改全局变量和查询所有全局变量。

帮助中心 > 数据湖探索 DLI > API参考
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

OBS，为了确保AKSK数据安全，您可以用过数据加密服务（Data Encryption Workshop，DEW）、云凭据管理服务（Cloud Secret Management Service，CSMS），对AKSK统一管理，有效避免程序硬编码或明文配置等问题导致的敏感信息泄露以及权限失控带来的业务风险。

帮助中心 > 数据湖探索 DLI > 快速入门
使用DLI分析账单消费数据 - 数据湖探索 DLI

在数据湖探索服务中创建表。登录DLI控制台，左侧导航栏单击“SQL编辑器”，执行引擎选择“spark”，选择执行的队列和数据库。本次演示队列和数据库选择“default”。下载的文件中包含时间用量等，按表头意义在DLI上创建表，具体可以参考如下示例，其中amount列为费用。

帮助中心 > 数据湖探索 DLI > 最佳实践
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。登录DLI管理控制台，单击“SQL编辑器”，执行引擎选择“spark”，选择已创建的SQL队列和数据库。在SQL编辑区域输入下列命令创建UDAF函数，单击“执行”提交创建。如果该客户

 帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
SQL作业运行慢如何定位 - 数据湖探索 DLI

小文件过多：当一个表中的小文件过多时，可能会造成Driver内存FullGC。登录DLI控制台，选择SQL编辑器，在SQL编辑器页面选择问题作业的队列和数据库。执行以下语句，查看作业中表的文件数量。“表名”替换为具体问题作业中的表名称。 select count(distinct fn) FROM

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

表2配置参数。JDBC配置对象，除了在url中以分号间隔设置配置项外，还可以通过Info对象动态设置属性项，具体属性项参见表3。表2 数据库连接参数参数描述 url url的格式如下。 jdbc:dli://<endPoint>/projectId? <key1>=<val1>;<key2>=<val2>…

帮助中心 > 数据湖探索 DLI > 开发指南 > 使用客户端工具连接DLI > 使用JDBC提交SQL作业
使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

如下脚本中的加粗参数请根据实际环境修改。 CREATE CATALOG myhive WITH ( 'type' = 'hive' , 'default-database' = 'demo', 'hive-conf-dir' = '/opt/flink/conf' ); USE CATALOG

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hive
Hudi表模型设计规范 - 数据湖探索 DLI

precombine字段值可以保证数据的准确性，老数据不会覆盖新数据，也就是幂等写入能力。该字段可用选择的类型包括：业务表中更新时间戳、数据库的提交时间戳等。precombine字段不能有null值和空值，可以参考以下示例设置precombine字段： SparkSQL: //通

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表设计规范
获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

仅支持获取AK、SK、SecurityToken。获取到AK、SK、SecurityToken后，请参考如何使用凭据管理服务替换硬编码的数据库账号密码查询凭据。约束限制仅支持Flink1.15版本使用委托授权访问临时凭证：在创建作业时，请配置作业使用Flink1.15版本

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink作业委托场景开发指导
在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

hive_sync.table", tableName) .option("hoodie.datasource.hive_sync.database", databaseName) .mode(SaveMode.Overwrite) .save(basePath)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业

总条数： 612

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Flink作业重启后，如何保证不丢失数据？ - 数据湖探索 DLI

查看多版本备份数据 - 数据湖探索 DLI

配置多版本过期数据回收站 - 数据湖探索 DLI

指定筛选条件删除分区（只支持OBS表） - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

基本语句 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

Hive结果表 - 数据湖探索 DLI

查询经典型跨源连接列表 - 数据湖探索 DLI

获取Spark作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

API概览 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

SQL作业运行慢如何定位 - 数据湖探索 DLI

使用JDBC连接DLI并提交SQL作业 - 数据湖探索 DLI

使用Temporal join关联维表的最新版本 - 数据湖探索 DLI

Hudi表模型设计规范 - 数据湖探索 DLI

获取Flink作业委托临时凭证用于访问其他云服务 - 数据湖探索 DLI

在DLI使用Hudi提交Spark Jar作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线