搜索_华为云

scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

fetchsize 读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 DBT（Data Build Tool），是一款开源的数据建模和转换工具，运行在Python环境上。DBT连接DLI，用来定义和执行SQL转换，支持从数据集成、转换到分析的整个数据生命周期管理，适用于大规模数据分析项目和复杂的数据分析场景。本节操作介绍DBT连接DLI的操作步骤。

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
查看Flink作业详情 - 数据湖探索 DLI

te等算子经过最大保留时间后仍未更新的中间状态，默认设置为1小时。脏数据策略作业出现脏数据时的处理策略。作业配置脏数据策略时显示该参数。忽略。抛出异常。保存。脏数据转储地址 “脏数据策略”选择“保存”时，保存脏数据的OBS路径。创建时间作业创建的具体时间。更新时间

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Flink作业 > 管理Flink作业
DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

入方向规则：检查本安全组内的入方向网段及端口是否已开放，若没有则添加。出方向规则：检查出方向规则网段及端口是否开放（建议所有网段开放）。客户安全组入方向和出方向配置的都是DLI队列的子网。建议客户将入方向源地址配成0.0.0.0/0，端口8000，表示任意地址都可以访问DWS8000端口。将入方向源地址配成0

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

资源池的网段。获取共享VPC下数据源的私有内网IP和端口。以RDS数据源为例：在RDS控制台“实例管理”页面，单击对应实例名称，查看“连接信息”>“内网地址”，即可获取RDS内网地址。查看“连接信息”>“数据库端口”，获取RDS数据库实例端口。在DLI管理控制台，单击“资源管理

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
使用DLI提交Spark Jar作业 - 数据湖探索 DLI

说明步骤1：上传数据至OBS 准备Spark Jar作业程序包并上传至OBS。步骤2：创建弹性资源池并添加队列创建提交Spark Jar作业所需的计算资源。步骤3：使用DEW管理访问凭证跨源分析场景中，使用DEW管理数据源的访问凭证，并创建允许DLI访问DEW的委托。步骤

 帮助中心 > 数据湖探索 DLI > 快速入门
Hudi Clustering操作说明 - 数据湖探索 DLI

limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能够支持快速摄取的同时不影响查询性能，引入了Clustering服务来重写数据以优化Hudi数据湖文件的布局。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
Redis维表 - 数据湖探索 DLI
Redis维表 - 数据湖探索 DLI

fields：适用于所有数据类型 fields-scores：适用于sorted set数据类型 array：适用于list、set、sorted set数据类型 array-scores：适用于sorted set数据类型 map：适用于hash、sorted set数据类型 schem

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
弹性资源池权限管理 - 数据湖探索 DLI

弹性资源池权限管理针对不同用户，管理员可以通过权限设置赋予各用户不同的操作权限，控制各用户弹性资源池的操作范围。注意事项管理员用户和弹性资源池的所有者拥有所有权限，不需要进行权限设置且其他用户无法修改其队列权限。给新用户设置弹性资源池权限时，该用户所在用户组的所属区域需具有Tenant

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列 > 管理弹性资源池
DWS源表 - 数据湖探索 DLI
DWS源表 - 数据湖探索 DLI

DLI将Flink作业从数据仓库服务（DWS）中读取数据。DWS数据库内核兼容PostgreSQL，PostgreSQL数据库可存储更加复杂类型的数据，支持空间信息服务、多版本并发控制（MVCC）、高并发，适用场景包括位置应用、金融保险、互联网电商等。数据仓库服务（Data Warehouse

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
Redis源表 - 数据湖探索 DLI
Redis源表 - 数据湖探索 DLI

创建source流从Redis获取数据，作为作业的输入数据。前提条件创建该作业前，需要建立DLI和Redis的增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Redis
COMMENT - 数据湖探索 DLI
COMMENT - 数据湖探索 DLI

COMMENT 语法 COMMENT ON TABLE name IS 'comments' 描述设置表的注释信息，可以通过设置注释信息为NULL来删除注释。示例修改表users的注释为“master table”，表的注释语句可以通过show create table tablename语句查看：

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > HetuEngine SQL语法 > DDL 语法
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

创建source流从HBase中获取数据，作为作业的输入数据。HBase是一个稳定可靠，性能卓越、可伸缩、面向列的分布式云存储系统，适用于海量数据存储以及分布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
导出查询结果 - 数据湖探索 DLI

操作。 “Overwrite”：覆盖。在指定目录下新建文件，会删除已有文件。 with_column_header 否 Boolean 导出csv和json格式数据时，是否导出列名。设置为“true”，表示导出列名。设置为“false”，表示不导出列名。若为空，默认为“false”。

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
JDBC结果表 - 数据湖探索 DLI
JDBC结果表 - 数据湖探索 DLI

DLI通过JDBC结果表将Flink作业的输出数据输出到关系型数据库中。前提条件 DLI要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
配置Hudi数据列默认值 - 数据湖探索 DLI

配置Hudi数据列默认值该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
使用DLI提交Flink Jar作业 - 数据湖探索 DLI

步骤3：使用DEW管理访问凭据跨源分析场景中，需要在connector中设置账号、密码等属性。但是账号密码等信息属于高度敏感数据，需要做加密处理，以保障用户的数据隐私安全。数据加密服务（Data Encryption Workshop，DEW）安全、可靠、简单易用隐私数据加解密方案。

帮助中心 > 数据湖探索 DLI > 快速入门
创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

project_id 是 String 项目编号，用于资源隔离。获取方式请参考获取项目ID。 queue_name 是 String 需要设置定时扩缩计划的队列名称，名称只能包含数字、英文字母和下划线，但不能是纯数字，且不能以下划线开头。名称长度为1~128个字符。请求消息表2

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 队列相关API（废弃）
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

请务必确保您的账户下已在数据仓库服务（DWS）里创建了DWS集群。如何创建DWS集群，请参考《数据仓库服务管理指南》中“创建集群”章节。请确保已创建DWS数据库表。该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

创建提交作业所需的计算资源。步骤3：创建数据库 DLI元数据是SQL作业开发的基础。在执行作业前您需要根据业务场景定义数据库和表。步骤4：创建表数据库创建完成后，需要在数据库db1中基于OBS上的样本数据创建表。步骤5：查询数据使用标准SQL语句进行数据的查询和分析。准备工作已注

 帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 1508

上一页
1
...
5
6
7
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

scala样例代码 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

查看Flink作业详情 - 数据湖探索 DLI

DLI增强型跨源连接DWS失败怎么办？ - 数据湖探索 DLI

建立DLI与共享VPC中资源的网络连接 - 数据湖探索 DLI

使用DLI提交Spark Jar作业 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

Redis维表 - 数据湖探索 DLI

弹性资源池权限管理 - 数据湖探索 DLI

DWS源表 - 数据湖探索 DLI

Redis源表 - 数据湖探索 DLI

COMMENT - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

导出查询结果 - 数据湖探索 DLI

JDBC结果表 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

使用DLI提交Flink Jar作业 - 数据湖探索 DLI

创建队列定时扩缩容计划（废弃） - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线