搜索_华为云

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

别配置如下参数。用户名：自定义的用户名。当前示例输入为：testuser2。用户类型：当前选择为“人机”。密码和确认密码：输入当前用户名对应的密码。用户组和主组：选择kafkaadmin。角色：选择Manager_viewer角色。图1 MRS Manager上创建Kafka用户

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
count函数如何进行聚合 - 数据湖探索 DLI

apigateway WHERE service_id = 'ecs' Group BY http_method 或者 SELECT http_method FROM apigateway WHERE service_id = 'ecs' DISTRIBUTE BY http_method

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

开启Kerberos认证时的相关配置文件参考《从零开始使用Kerberos认证集群》中的“创建安全集群并登录其Manager”章节创建Kerberos认证集群。参考“创建角色和用户”章节添加用户并赋权。参考《使用HBase客户端》使用1中创建的用户认证登录。“人机”用户第一次登录时需修改密码。登录Manager界面，选择“系统

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

String 指定字节序来编码数字值的字节。有效值为'big-endian'和'little-endian'。更多细节可查阅字节序。数据类型映射下表详细说明了这种格式支持的 SQL 类型，包括用于编码和解码的序列化类和反序列化类的详细信息。表2 数据类型映射 Flink SQL 类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

”SQL作业”跳转到SQL作业记录中检查。在执行SQL的时候配置Hudi参数： DLI不支持直接使用SET语句配置参数点击”设置”，随后在”参数设置”一栏可以配置键和值，Hudi的参数可以通过此处提交。配置在此处的参数会在提交SQL作业时被应用。随后可以在左侧菜单点击”作业管理”->”SQL作业”，随后

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
Python SDK环境配置 - 数据湖探索 DLI

开发环境准备项说明操作系统 Windows系统，推荐Windows 7及以上版本。安装Python Python版本建议使用2.7.10和3.4.0以上版本，需要配置Visual C++编译环境Visual C++ build tools 或者 Visual Studio。安装Python依赖库

 帮助中心 > 数据湖探索 DLI > SDK参考 > Python SDK
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

interval表示时间间隔。有两种类型，分别为：一种为"yyyy-MM"即保存年份和月份，精度到月份，它的range参数可以为YEAR或者YEAR To Month。一种为天时间"dd HH:mm:sss.fff"，用来保存天数、小时、分钟、秒和毫秒，精度最低到毫秒。它的range参数可以为DAY、MINUTE、DAY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 函数 > 内置函数
时间函数 - 数据湖探索 DLI
时间函数 - 数据湖探索 DLI

interval表示时间间隔。有两种类型，分别为：一种为"yyyy-MM"即保存年份和月份，精度到月份，它的range参数可以为YEAR或者YEAR To Month。一种为天时间"dd HH:mm:sss.fff"，用来保存天数、小时、分钟、秒和毫秒，精度最低到毫秒。它的range参数可以为DAY、MINUTE、DAY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数 > 内置函数
身份认证与访问控制 - 数据湖探索 DLI

具体的授权方式请参考创建IAM用户并授权使用DLI以及《如何创建子用户》和《如何修改用户策略》。 DLI ReadOnlyAccess 数据湖探索只读权限。系统策略 Tenant Administrator 租户管理员。操作权限：具有所有云服务的管理和使用权限。创建后，可通过ACL赋权给其他子用户使用。

帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
增强型跨源连接概述 - 数据湖探索 DLI

、密钥安全、密钥管理复杂等问题。具体操作请参考使用DEW管理数据源访问凭证。约束和限制表1 增强型跨源连接约束限制限制项说明适用场景约束限制在同一队列中，如果同时使用了经典型跨源连接和增强型跨源连接，则经典型跨源连接优先于增强型跨源连接。推荐使用增强型跨源连接。 DL

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
DWS结果表（不推荐使用） - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

参考增强型跨源连接，在DLI上根据DWS和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置DWS和Kafka的安全组，添加入向规则使其对Flink的队列网段放通。参考测试地址连通性分别根据DWS和Kafka的地址测试队列连通性。若

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

upsert-kafka 将 null 值视为墓碑消息（在键上删除）。因此，如果该字段可能具有 null 值，我们建议避免使用 upsert-kafka 连接器和 raw format 作为 value.format。 Raw format 连接器是内置的。参数说明表1 参数是否必选默认值类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
查询Flink作业日志 - 数据湖探索 DLI

单击需要查看的作业名称，进入“作业详情”页面。在“运行日志”页签，可以查看运行中作业的JobManager和TaskManager信息。图4 Flink作业运行日志 JobManager和TaskManager信息每分钟刷新一次，默认展示最近一分钟的运行日志。如果作业配置了保存作业日

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

在OBS管理控制台找到DLI作业桶。查看所选桶的桶策略。 DLI Flink作业所需要使用的桶授权信息如下，其中domainId和userId分别为DLI的账号和子账号，bucketName为用户桶名，timeStamp为策略创建时的时间戳。 { "Statement": [

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI权限管理类
RESTORE - 数据湖探索 DLI
RESTORE - 数据湖探索 DLI

参数描述表1 参数描述参数描述 database_name Database名称，由字母、数字和下划线（_）组成。 table_name Database中的表名，由字母、数字和下划线（_）组成。 obs_path Obs路径，表示Delta表的存储位置。 timestamp_expression

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
DLI委托概述 - 数据湖探索 DLI
DLI委托概述 - 数据湖探索 DLI

agement_agency，新的委托包含跨源操作、消息通知、用户授权操作所需的权限。配置DLI云服务委托权限。使用Flink 1.15和Spark 3.3.1（Spark通用队列场景）及以上版本的引擎执行作业时，需完成以下配置操作：需用户自行在IAM页面创建相关委托，并在作

 帮助中心 > 数据湖探索 DLI > 用户指南 > 配置DLI访问其他云服务的委托权限
在Spark SQL作业中使用UDF - 数据湖探索 DLI

在工程路径的“src > main > java”文件夹上鼠标右键，选择“New > Package”，新建Package和类文件。图6 新建Package和类文件 Package根据需要定义，本示例定义为：“com.huawei.demo”，完成后回车。图7 自定义Package

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
对象存储OBS源表 - 数据湖探索 DLI

次。已处理的文件在 source 的整个生命周期内存储在 state 中，因此，source 的 state 在 checkpoint 和 savepoint 时进行保存。更短的时间间隔意味着文件被更快地发现，但也意味着更频繁地遍历文件系统/对象存储。如果未设置此配置选项，

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > 对象存储OBS
Hudi开发规范概述 - 数据湖探索 DLI

说明：对此规则或建议进行的解释。示例：对此规则或建议从正、反两个方面给出。适用范围基于DLI-Hudi进行数据存储、数据加工作业的设计、开发、测试和维护。该设计开发规范是基于Spark 3.3.1，Hudi 0.11.0版本。父主题： DLI Hudi开发规范

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范

总条数： 637

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

典型场景示例：迁移Kafka数据至DLI - 数据湖探索 DLI

count函数如何进行聚合 - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

在DLI使用Hudi提交Spark SQL作业 - 数据湖探索 DLI

Python SDK环境配置 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

时间函数 - 数据湖探索 DLI

身份认证与访问控制 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

DWS结果表（不推荐使用） - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

查询Flink作业日志 - 数据湖探索 DLI

提交作业时提示作业桶权限不足怎么办？ - 数据湖探索 DLI

RESTORE - 数据湖探索 DLI

DLI委托概述 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

对象存储OBS源表 - 数据湖探索 DLI

Hudi开发规范概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线