搜索_华为云

Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

1589362330904, "transaction": null } 用户可按下述操作查看输出结果: 方法一："更多" -> "FlinkUI" -> "Task Managers" -> "Stdout"。方法二：若在提交运行作业前选择了保存日志，则可以从日志的taskmanager.out文件中查看。

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
Orc Format - 数据湖探索 DLI
Orc Format - 数据湖探索 DLI

String 指定要使用的格式，这里应该是 'orc'。 Orc 格式也支持来源于 Table properties 的表属性。举个例子，您可以设置 orc.compress=SNAPPY 来允许spappy压缩。数据类型映射 Orc 格式类型的映射和 Apache Hive 是兼容的。下面的表格列出了

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
管理Spark作业模板 - 数据湖探索 DLI

自定义Spark作业模板，本节操作介绍在Spark管理页面创建Spark模板的操作方法。新建Spark作业模板 Spark作业模板的创建方法是在创建Spark作业时，可直接将配置完成的作业信息设置为模板。在DLI管理控制台的左侧导航栏中，单击“作业模板”>“Spark模板”，页面跳转至Spark作业页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

本例中选择TCP协议，端口值不填或者填写为步骤1：获取外部数据源的内网IP、端口和安全组获取的数据源的端口。类型 IP地址类型。 IPv4 源地址源地址用于放通来自IP地址或另一安全组内的实例的访问。本例填写步骤2：获取DLI队列网段获取的队列网段。描述安全组规则的描述信息，非必填项。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

参数说明参数名具体含义举例 bootstrap.servers kafka连接地址 kafka服务IP地址1:9092,kafka服务IP地址2:9092,kafka服务IP地址3:9092 group.id kafka消费组如当前kafka消费组为test-group topic

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Postgres CDC源表 - 数据湖探索 DLI

CDC要求Postgre版本为9.6或者10，11，12。要与实例建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
配置Hudi数据列默认值 - 数据湖探索 DLI

该特性允许用户在给表新增列时，设置列的默认值。查询历史数据时新增列返回默认值。使用约束新增列在设置默认值前，如果数据已经进行了重写，则查询历史数据不支持返回列的默认值，返回NULL。数据入库、更新、执行Compaction、Clustering都会导致部分或全部数据重写。列的默认值设置要与列的类

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi SQL语法参考
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
使用CDM迁移数据至DLI - 数据湖探索 DLI

所示。表1 MySQL连接参数参数名说明取值样例名称输入便于记忆和区分的连接名称。 mysqllink 数据库服务器 MySQL数据库的IP地址或域名。 - 端口 MySQL数据库的端口。 3306 数据库名称 MySQL数据库的名称。 sqoop 用户名拥有MySQL数据库的读、写和删除权限的用户。

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 迁移外部数据源数据至DLI
Spark增量读取Hudi参数规范 - 数据湖探索 DLI

增量查询之前必须指定当前表的查询为增量查询模式，并且查询后重写设置表的查询模式如果增量查询完，不重新将表查询模式设置回去，将影响后续的实时查询示例以SQL作业为例：配置参数 hoodie.tableName.consume.mode=INCREMENTAL // 必须设置当前表读取为增量读取模式 hoodie

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Spark on Hudi开发规范
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

读取数据时，每一批次获取数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 batchsize 写入数据时，每一批次写入数据的记录数，默认值1000。设置越大性能越好，但占用内存越多，该值设置过大会有内存溢出的风险。 truncate 执行

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接DWS
修改主机信息 - 数据湖探索 DLI

"ip":"192.168.0.1", "name":"ecs-97f8-0001" }, { "ip":"192.168.0.2", "name":"ecs-97f8-0002" } ] } 响应示例 { "is_success":

帮助中心 > 数据湖探索 DLI > API参考 > 增强型跨源连接相关API
DWS维表 - 数据湖探索 DLI
DWS维表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

k版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。 Flink跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，优先推荐您使用DLI提供的跨源认证。跨源认证简介及操作方法请参考跨源认证简介。语法格式 1 2 3 4

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
DWS维表（不推荐使用） - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > DWS
队列赋权（废弃） - 数据湖探索 DLI

的权限或者收回使用权限。用户所属的用户组需要在所属区域内具有Tenant Guest权限。关于Tenant Guest权限的介绍和开通方法，详细参见权限策略和《统一身份认证服务用户指南》中的创建用户组。当前接口已废弃，不推荐使用。调试您可以在API Explorer中调试该接口。

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 权限相关API（废弃）
查询队列详情 - 数据湖探索 DLI

enterprise_project_id 否 String 企业项目ID。 "0”表示default，即默认的企业项目。说明：开通了企业管理服务的用户可设置该参数绑定指定的项目。 resource_type 否 String 资源类型。 vm：ecf集群 container：容器化集群（k8s）

帮助中心 > 数据湖探索 DLI > API参考 > 队列相关API（推荐）
Hudi Clustering操作说明 - 数据湖探索 DLI

间进行权衡，Hudi提供了一个hoodie.parquet.small.file.limit配置来设置最小文件大小。用户可以将该配置设置为“0”，以强制新数据写入新的文件组，或设置为更高的值以确保新数据被“填充”到现有小的文件组中，直到达到指定大小为止，但其会增加摄取延迟。为能

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
服务韧性 - 数据湖探索 DLI
服务韧性 - 数据湖探索 DLI

服务韧性 DLI通过流量限制、跨AZ容灾、备份恢复等技术方案，保障数据的持久性和可靠性。流量限制：DLI通过设置流量控制机制，防止服务过载并保持服务的稳定性。跨AZ容灾：DLI云服务采用跨可用区容灾部署，减少单点故障的风险，提高系统的可用性和弹性。备份恢复：DLI自动化的备

 帮助中心 > 数据湖探索 DLI > 产品介绍 > 安全
使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 快速入门

总条数： 571

上一页
1
...
6
7
8
...
29
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Debezium Format - 数据湖探索 DLI

Orc Format - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

典型场景示例：配置DLI与内网数据源的网络联通 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Postgres CDC源表 - 数据湖探索 DLI

配置Hudi数据列默认值 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

使用CDM迁移数据至DLI - 数据湖探索 DLI

Spark增量读取Hudi参数规范 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

修改主机信息 - 数据湖探索 DLI

DWS维表 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

DWS维表（不推荐使用） - 数据湖探索 DLI

队列赋权（废弃） - 数据湖探索 DLI

查询队列详情 - 数据湖探索 DLI

Hudi Clustering操作说明 - 数据湖探索 DLI

服务韧性 - 数据湖探索 DLI

使用DLI提交SQL作业查询OBS数据 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线