搜索_华为云

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

除了开源connector之外，还提供开箱即用的connector，包括数据库（RDS、GaussDB）、消息队列（DMS）、数据仓库（DWS）、对象存储（OBS）相比开源connector有较多易用性和稳定性提升。仅提供开源connector。开发与运维监控、告警支持对接华为云C

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI产品咨询类
导出DLI表数据至OBS中 - 数据湖探索 DLI

导出数据的文件格式。当前只支持json格式。队列选择队列。压缩格式导出数据的压缩方式，选择如下压缩方式。 none bzip2 deflate gzip 存储路径输入或选择OBS路径。导出路径必须为OBS桶中不存在的文件夹，即用户需在OBS目标路径后创建一个新文件夹。文件夹名称不能包含下列特殊字符：\

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表 > 在DLI控制台管理表资源
使用DLI分析账单消费数据 - 数据湖探索 DLI

数据湖探索（DLI）作为华为云大数据分析平台，其计费项包括存储费用与计算费用两项，计费类型包括包周期（包年包月），套餐包和按需计费三种。 DLI目前支持三种作业：SQL作业，Flink作业和Spark作业。 SQL作业的计费包括存储计费和计算计费，其中计算计费有包年包月计费和按需计费两种。

帮助中心 > 数据湖探索 DLI > 最佳实践
Hudi Compaction操作说明 - 数据湖探索 DLI

tion Plan一个一个去执行，一直到全部都执行完。对于Merge-On-Read表，数据使用列式Parquet文件和行式Avro文件存储，更新被记录到增量文件，然后进行同步/异步compaction生成新版本的列式文件。Merge-On-Read表可减少数据摄入延迟，因而进

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > 数据管理维护
增强型跨源连接概述 - 数据湖探索 DLI

在跨源开发场景中直接配置跨源认证信息存在密码泄露的风险，Spark 3.3.1及以上版本、Flink 1.15及以上版本的跨源访问场景推荐使用数据加密服务DEW来存储数据源的认证信息，为您解决数据安全、密钥安全、密钥管理复杂等问题。具体操作请参考使用DEW管理数据源访问凭证。约束和限制表1 增强型跨源连接约束限制

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
查询作业状态 - 数据湖探索 DLI

作业的标签。具体请参考表3。 user_conf String SQL查询的相关列信息的Json字符串。 result_format String 作业结果的存储格式，当前只支持csv。 result_path String 作业结果的OBS路径。表3 tags参数参数名称是否必选参数类型说明

 帮助中心 > 数据湖探索 DLI > API参考 > SQL作业相关API
使用Spark作业访问DLI元数据 - 数据湖探索 DLI

2 OBS桶文件配置 OBS控制台如果是创建OBS表，则需要上传文件数据到OBS桶下。配置Spark创建表的元数据信息的存储路径。该文件夹路径用来存储Spark创建表的元数据信息“spark.sql.warehouse.dir”。 3 新建Maven工程，配置pom文件 IntelliJ

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
本文样例表数据准备 - 数据湖探索 DLI

CREATE SCHEMA IF NOT EXISTS traffic; --创建一个新表orders，使用子句with指定创建表的存储格式、存储位置、以及是否为外表: CREATE TABLE orders ( orderkey bigint, orderstatus varchar

帮助中心 > 数据湖探索 DLI > HetuEngine SQL语法参考 > 附录
成长地图 - 数据湖探索 DLI
成长地图 - 数据湖探索 DLI

了解更多常见问题、案例和解决方案通用问题怎样升级DLI作业的引擎版本？怎样排查DLI计费异常？ DLI Flink与MRS Flink有什么区别？ DLI的数据可存储在哪些地方？更多 SQL作业相关问题如何理解DLI分区表的列赋权？如何避免字符码不一致导致的乱码？ OBS表压缩率较高更多跨源连接相关问题

 帮助中心 > 数据湖探索 DLI > 成长地图
查询作业列表 - 数据湖探索 DLI

checkpoint_interval 否 Integer 快照时间间隔。单位为秒，默认值为“10”。 log_enabled 否 Boolean 是否启用日志存储。默认为“false”。 obs_bucket 否 String OBS桶名。 smn_topic 否 String SMN主题名。当作业异常时，向该SMN主题推送告警信息。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
查询作业详情 - 数据湖探索 DLI

at_least_once：数据至少被消费一次。默认值为“exactly_once”。 log_enabled 否 Boolean 是否启用日志存储。默认为“false”。 obs_bucket 否 String OBS桶名。 root_id 否 Integer 父作业ID。 edge_group_ids

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
扫描量计费 - 数据湖探索 DLI
扫描量计费 - 数据湖探索 DLI

TABLE等语句）、管理分区语句、失败的查询语句无需付费。取消的查询，按取消查询时扫描的总数据量计费。若计算任务超时或失败，则当次计算不收取费用。数据的存储方式（包括格式，是否压缩）对计算费用有直接的影响。假设Parquet格式文件为原CSV文件大小的1/4，则数据扫描费用为原CSV文件扫描费用的1/4。

帮助中心 > 数据湖探索 DLI > 计费说明
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

Flink SQL 中的 INSERT / UPDATE / DELETE 消息编码为 Canal 格式的 JSON 消息，输出到 Kafka 等存储中。但需要注意的是，目前 Flink 还不支持将 UPDATE_BEFORE 和 UPDATE_AFTER 合并为一条 UPDATE 消息。因此，Flink

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > Format
MERGE INTO - 数据湖探索 DLI
MERGE INTO - 数据湖探索 DLI

Database中的表名，由字母、数字和下划线（_）组成。 bucket_name obs桶名称。 tbl_path Delta表在obs桶中的存储位置。 target_alias 目标表的别名。 sub_query 子查询。 source_alias 源表或源表达式的别名。 merge_condition

帮助中心 > 数据湖探索 DLI > Delta SQL语法参考 > Delta SQL语法参考 > Delta DML语法说明
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

只对于MOR表，高（合并parquet + delta log) 低（读取parquet文件性能） COW表查询实时视图读取（SparkSQL为例）：直接读取元数据服务里面存储的Hudi表即可，${table_name}表示表名称。 select (字段 or 聚合函数) from ${table_name}; 实时视图读取（Spark

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
管理SQL作业 - 数据湖探索 DLI
管理SQL作业 - 数据湖探索 DLI

作业ID，用户名，类型，状态，执行语句，运行时长，创建时间，结束时间，参数设置，标签，结果条数，已扫描数据，扫描数据条数，错误记录条数，存储路径，数据格式，数据库，表，表头，分隔符，引用字符，转义字符，日期格式，时间戳格式，CPU累计使用量，输出字节。建表（create ta

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业
Hudi源表 - 数据湖探索 DLI
Hudi源表 - 数据湖探索 DLI

默认值数据类型参数说明 connector 是无 String 读取表类型。需要填写'hudi' path 是无 String 表存储的路径。如obs://xx/xx table.type 是 COPY_ON_WRITE String Hudi表类型。 MERGE_ON_READ

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hudi
DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

TPC组织颁布的TPC-H 标准满足了数据仓库领域的测试需求,并且促使各个厂商以及研究机构将该项技术推向极限。本示例将演示DLI直接对存储在OBS中的TPC-H数据集进行查询的操作，DLI已经预先生成了100M的TPC-H-2.18的标准数据集，已将数据集上传到了OBS的tp

帮助中心 > 数据湖探索 DLI > 用户指南 > 使用DLI提交SQL作业 > 创建并管理SQL作业模板
在Spark SQL作业中使用UDF - 数据湖探索 DLI

新建Project 选择Maven，Project SDK选择1.8，单击“Next”。图3 选择Maven 定义样例工程名和配置样例工程存储路径，单击“Finish”完成工程创建。图4 创建工程在pom.xml文件中添加如下配置。 <dependencies>

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
更新SQL作业 - 数据湖探索 DLI
更新SQL作业 - 数据湖探索 DLI

多个ID以逗号分隔。 dirty_data_strategy 否 String 作业脏数据策略。 “2:obsDir”：保存，obsDir表示脏数据存储路径。 “1”：抛出异常。 “0”：忽略。默认值为“0”。 udf_jar_url 否 String 用户已上传到DLI资源管理系统的资源包名，用户sql作业的udf

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API

总条数： 304

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI Flink与MRS Flink有什么区别？ - 数据湖探索 DLI

导出DLI表数据至OBS中 - 数据湖探索 DLI

使用DLI分析账单消费数据 - 数据湖探索 DLI

Hudi Compaction操作说明 - 数据湖探索 DLI

增强型跨源连接概述 - 数据湖探索 DLI

查询作业状态 - 数据湖探索 DLI

使用Spark作业访问DLI元数据 - 数据湖探索 DLI

本文样例表数据准备 - 数据湖探索 DLI

成长地图 - 数据湖探索 DLI

查询作业列表 - 数据湖探索 DLI

查询作业详情 - 数据湖探索 DLI

扫描量计费 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

MERGE INTO - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

管理SQL作业 - 数据湖探索 DLI

Hudi源表 - 数据湖探索 DLI

DLI预置的SQL模板中TPC-H样例数据说明 - 数据湖探索 DLI

在Spark SQL作业中使用UDF - 数据湖探索 DLI

更新SQL作业 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线