搜索_华为云

DataGen源表 - 数据湖探索 DLI
DataGen源表 - 数据湖探索 DLI

创建Flink OpenSource SQL作业时，在作业编辑界面的“运行参数”处，“Flink版本”需要选择“1.12”，勾选“保存作业日志”并设置保存作业日志的OBS桶，方便后续查看作业日志。语法格式 create table dataGenSource( attr_name attr_type

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

ink Jar写入数据到OBS开发指南。 Flink 1.15 Jar 程序，采用反向类加载机制（child-first），可通过优化参数设置某些依赖包由父类加载器加载：parent.first.classloader.jars=test1.jar,test2.jar Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

大CU。同一队列不同扩缩容策略的时间段区间不能有交集。弹性资源池队列中的扩缩容策略时间段仅支持整点的时间段设置，并且包含设置的开启时间，不包含设置的结束时间，例如设置时间段00-09，则时间段范围为：[00:00，09:00)。默认的扩缩容策略不支持时间段配置修改。弹性资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列
FileSytem结果表 - 数据湖探索 DLI

timestamp(3), time。为了避免数据丢失或者数据被覆盖，开启作业异常自动重启，需要配置为“从checkpoint恢复”。 checkpoint间隔设置需在输出文件实时性、文件大小和恢复时长之间进行权衡，比如10分钟。使用HDFS时需要绑定相应的跨源，并填写相应的主机信息。使用hdfs

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
查询所有作业 - 数据湖探索 DLI

false } ] } 状态码状态码如表6所示。表6 状态码状态码描述 200 查询成功。 400 请求错误。 500 内部服务器错误。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。父主题： SQL作业相关API

帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

登录数据湖探索管理控制台，选择“SQL作业”，在要修改的作业所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
Spark SQL常用配置项说明 - 数据湖探索 DLI

false 当前配置设置为“false”时，DLI在覆盖写之前，会删除所有符合条件的分区。例如，分区表中有一个“2021-01”的分区，当使用INSERT OVERWRITE语句向表中写入“2021-02”这个分区的数据时，会把“2021-01”的分区数据也覆盖掉。当前配置设置为“tru

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考
使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

// 设置两次checkpoint的最小间隔时间 streamEnv.getCheckpointConfig().setMinPauseBetweenCheckpoints(60000); // 设置checkpoint超时时间

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
Hbase结果表 - 数据湖探索 DLI
Hbase结果表 - 数据湖探索 DLI

际所需设置相应安全组规则。若使用MRS HBase，请在增强型跨源的主机信息中添加MRS集群所有节点的主机ip信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
使用Notebook实例提交DLI作业 - 数据湖探索 DLI

0/16 创建安全组登录VPC管理控制台，进入安全组列表页面。在安全组列表右上方，单击“创建安全组”。进入“创建安全组”页面。根据界面提示，设置安全组参数。具体参数说明请参考创建安全组。请确保安全组需要对DLI弹性资源池网段放通TCP的8998和30000-32767端口。步骤3：创建增强型跨源连接

 帮助中心 > 数据湖探索 DLI > 用户指南
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

query的运行得到错误的结果或者非预期的异常。解决方案：将作业参数 table.exec.source.cdc-events-duplicate 设置成true，并在该source上定义PRIMARY KEY。框架会生成一个额外的有状态算子，使用该primary key来对变更事件去重

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
管理Spark作业模板 - 数据湖探索 DLI

可直接将配置完成的作业信息设置为模板。在DLI管理控制台的左侧导航栏中，单击“作业模板”>“Spark模板”，页面跳转至Spark作业页面。参考创建Spark作业配置作业参数。作业编辑完成后，单击“设为模板”。输入模板名称和描述信息。设置模板的分组信息。便于模板的统一管理。

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交Spark作业
创建DLI表关联CSS - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
修改表生命周期的时间 - 数据湖探索 DLI

表生命周期功能支持Hive、DataSource语法创建表、多版本表，暂不支持跨源表、Carbon表。生命周期单位为天，取值为正整数。生命周期只能在表级别设置，不能在分区级设置。为分区表指定的生命周期，适用于该表所有的分区。语法格式 ALTER TABLE table_name SET TBLPROPERTIES("dli

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 表相关 > 表生命周期管理
在DLI控制台创建数据库和表 - 数据湖探索 DLI

如果所建队列属于企业项目，可选择对应的企业项目。企业项目是一种云资源管理方式，企业项目管理服务提供统一的云资源按项目管理，以及项目内的资源管理、成员管理。关于如何设置企业项目请参考《企业管理用户指南》。说明：只有开通了企业管理服务的用户才显示该参数。描述该数据库的描述。标签使用标签标识云资源

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
Flink作业性能调优 - 数据湖探索 DLI

key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer.aggphase-strategy=TWO_PHASE count distinct优化在count

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据操作语句DML
窗口 - 数据湖探索 DLI
窗口 - 数据湖探索 DLI

TUMBLE窗口结束之前，可以根据设置的触发频率周期性地触发窗口，输出从窗口开始时间到当前周期时间窗口内的计算结果值，但不影响最终窗口输出值，从而在窗口结束前的每个周期都可以看到最新的结果。提高数据的精确性在窗口结束后，允许设置延迟时间。根据设置的延迟时间，每到达一个迟到数据，则更新窗口的输出结果

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 数据操作语句DML
创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

在“SQL编辑器”页面创建队列。在DLI管理控制台的左侧导航栏中，选择“SQL编辑器”。单击“队列”切换到该页签，单击右侧的创建队列。在“购买队列”页面，参见表2设置相关参数。表2 参数说明参数名称描述计费模式包年/包月该计费模式的队列为专属队列。按需计费：建议购买cu时套餐包享受优惠。区域

 帮助中心 > 数据湖探索 DLI > 用户指南 > 创建弹性资源池和队列

总条数： 492

上一页
1
...
16
17
18
...
25
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DataGen源表 - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

典型场景示例：配置弹性资源池队列扩缩容策略 - 数据湖探索 DLI

FileSytem结果表 - 数据湖探索 DLI

查询所有作业 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

Spark SQL常用配置项说明 - 数据湖探索 DLI

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

Hbase结果表 - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

使用Notebook实例提交DLI作业 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

管理Spark作业模板 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

修改表生命周期的时间 - 数据湖探索 DLI

在DLI控制台创建数据库和表 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

窗口 - 数据湖探索 DLI

创建非弹性资源池队列（废弃，不推荐使用） - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线