搜索_华为云

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

// 设置两次checkpoint的最小间隔时间 streamEnv.getCheckpointConfig().setMinPauseBetweenCheckpoints(60000); // 设置checkpoint超时时间

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
在Spark SQL作业中使用UDAF - 数据湖探索 DLI

在“程序包管理”页面，单击右上角的“创建”创建程序包。在“创建程序包”对话框，配置以下参数。包类型：选择“JAR”。 OBS路径：程序包所在的OBS路径。分组设置和组名称根据情况选择设置，方便后续识别和管理程序包。单击“确定”，完成创建程序包。创建UDAF函数。登录登录DLI管理控制台，创建SQL队列和数据库。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
CONVERT TO DELTA - 数据湖探索 DLI
CONVERT TO DELTA - 数据湖探索 DLI

转换过程会收集统计信息，以提升转换后的 Delta 表的查询性能。如果提供表名，则元存储也将更新，以反映该表现在是 Delta 表。注意事项分区表转换需要设置参数spark.sql.forcePartitionPredicatesOnPartitionedTable.enabled为false。

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DDL语法说明
Flink Jar作业类 - 数据湖探索 DLI

Jar作业访问DWS启动异常，提示客户端连接数太多错误 Flink Jar作业运行报错，报错信息为Authentication failed Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 Hadoop jar包冲突，导致Flink提交失败 Flink作业提交错误，如何定位父主题：

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
创建DLI表关联CSS - 数据湖探索 DLI

多IO。 batch.size.entries 单次batch插入entry的条数上限，默认为1000。如果单条数据非常大，在bulk存储设置的数据条数前提前到达了单次batch的总数据量上限，则停止存储数据，以batch.size.bytes为准，提交该批次的数据。 batch

帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 跨源连接相关 > 跨源连接CSS表
Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

ink Jar写入数据到OBS开发指南。 Flink 1.15 Jar 程序，采用反向类加载机制（child-first），可通过优化参数设置某些依赖包由父类加载器加载：parent.first.classloader.jars=test1.jar,test2.jar Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

dbt_project.yml文件。参考dbt_project.yml配置项目。确保步骤2：配置DBT连接DLIprofile文件中已设置该项目的profiles.yml中定义的数据源名称。图1 profile文件图2 dbt_project.yml文件中配置的profile

帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

UpsertKafka 示例使用kafka发送数据，输出到print中。根据kafka所在的虚拟私有云和子网创建相应的跨源，并绑定所要使用的队列。然后设置安全组，入向规则，使其对当前将要使用的队列放开，并根据kafka的地址测试队列连通性（通用队列-->找到作业的所属队列-->更多-->测试

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

0/{project_id}/jobs/submit-job 其“Content-Type”只支持“application/json”，若设置为“text”则会报错，报错信息为“unsupported media Type”。父主题： DLI API类

 帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

执行语句，运行时长，创建时间，结束时间，参数设置，标签，结果条数，已扫描数据，数据库。查询（select）作业（作业类型：QUERY），包括以下信息：队列，作业ID，用户名，类型，状态，执行语句，运行时长，创建时间，结束时间，参数设置，标签，结果条数（运行成功，可导出结果），已

 帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

登录数据湖探索管理控制台，选择“SQL作业”，在要修改的作业所在行的“操作”列，单击“编辑”进入SQL编辑器界面。在SQL编辑器界面，单击“设置”，在“配置项”尝试添加以下几个Spark参数进行解决。参数项如下，冒号前是配置项，冒号后是配置项的值。 spark.sql.enableToString:false

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

API以同步模式调用运行时会有两分钟的超时时间限制，如果API调用超过该时间限制则会超时报错。解决方案调用“提交SQL作业”API时可以通过设置“dli.sql.sqlasync.enabled”参数为“true”来异步运行该作业。具体可以参考提交SQL作业API。父主题： DLI

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI API类
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据应用场景 Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项

 帮助中心 > 数据湖探索 DLI > 最佳实践
Flink作业性能调优 - 数据湖探索 DLI

key不均衡场景下，group聚合计算存在单点或者数据倾斜问题，此时，可以通过将聚合计算拆分成Local-Global进行优化。配置方式为设置调优参数: table.optimizer.aggphase-strategy=TWO_PHASE count distinct优化在count

帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类 > Flink作业性能调优类
Debezium Format - 数据湖探索 DLI
Debezium Format - 数据湖探索 DLI

指定要使用的格式，此处应为 'debezium-json'。 debezium-json.schema-include 否 false Boolean 设置 Debezium Kafka Connect 时，用户可以启用 Kafka 配置 'value.converter.schemas.enable'

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

优先级当前弹性资源池中的优先级数字越大表示优先级越高。本例设置一条扩缩容策略，默认优先级为1。 1 时间段首条扩缩容策略是默认策略，不能删除和修改时间段配置。即设置00-24点的扩缩容策略。 00-24 最小CU 设置扩缩容策略支持的最小CU数。 16 最大CU 当前扩缩容策略支持的最大CU数。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
DWS结果表 - 数据湖探索 DLI
DWS结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与DWS集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。语法格式 DWS结果表中不允许指定所有属性为PRIMARY

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建结果表
约束与限制 - 数据湖探索 DLI
约束与限制 - 数据湖探索 DLI

弹性资源池网段设置后不支持更改。仅支持查看30天以内的弹性资源池扩缩容历史。弹性资源池无法直接访问公网。弹性资源池关联队列弹性资源池关联队列：仅支持关联按需计费模式的队列（包括专属队列）。队列和弹性资源池状态正常，资源未被冻结。弹性资源池扩缩容弹性资源池CU设置、弹性资

 帮助中心 > 数据湖探索 DLI > 产品介绍
CSV Format - 数据湖探索 DLI
CSV Format - 数据湖探索 DLI

false Boolean 是否禁止对引用的值使用引号 (默认是 false). 如果禁止，选项 'csv.quote-character' 不能设置。 csv.quote-character 否 ‘’ String 用于围住字段值的引号字符 (默认"). csv.allow-comments

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
概述 - 数据湖探索 DLI
概述 - 数据湖探索 DLI

概述欢迎使用数据湖探索。数据湖探索（Data Lake Insight，简称DLI）是完全兼容Apache Spark、Apache Flink、trino生态，提供一站式的流处理、批处理、交互式分析的Serverless融合处理分析服务。用户不需要管理任何服务器，即开即用。支持标准SQL/Spark

帮助中心 > 数据湖探索 DLI > API参考 > API使用前必读

总条数： 467

上一页
1
...
13
14
15
...
24
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

使用Flink Jar写入数据到OBS开发指南 - 数据湖探索 DLI

在Spark SQL作业中使用UDAF - 数据湖探索 DLI

CONVERT TO DELTA - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

创建DLI表关联CSS - 数据湖探索 DLI

Flink OpenSource SQL 1.15版本使用说明 - 数据湖探索 DLI

配置DBT连接DLI进行数据调度和分析 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

提交SQL作业时，返回“unsupported media Type”信息 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

创建SQL作业的API执行超过时间限制，运行超时报错 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Flink作业性能调优 - 数据湖探索 DLI

Debezium Format - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

DWS结果表 - 数据湖探索 DLI

约束与限制 - 数据湖探索 DLI

CSV Format - 数据湖探索 DLI

概述 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线