搜索_华为云

Maxwell Format - 数据湖探索 DLI
Maxwell Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi查询类型 - 数据湖探索 DLI
Hudi查询类型 - 数据湖探索 DLI

Latency（查询时延）只对于MOR表，高（合并parquet + delta log) 低（读取parquet文件性能） COW表查询实时视图读取（SparkSQL为例）：直接读取元数据服务里面存储的Hudi表即可，${table_name}表示表名称。 select (字段 or 聚合函数)

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Canal Format - 数据湖探索 DLI
Canal Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

查询，生成了csv数据文件，文件内容为insert插入的数据内容。图4 查询结果指定的OBS数据目录包含数据文件。在OBS桶“dli-test-021”根目录下创建数据文件目录“data2”。创建如下内容的测试数据文件“test.csv”，并上传文件到“obs://dli-test-021/data2”目录下。

帮助中心 > 数据湖探索 DLI > 开发指南 > SQL作业开发指南
Flink Jar作业类 - 数据湖探索 DLI

Jar作业运行报错，报错信息为Authentication failed Flink Jar作业设置backend为OBS，报错不支持OBS文件系统 Hadoop jar包冲突，导致Flink提交失败 Flink作业提交错误，如何定位父主题： Flink作业类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Flink作业类
DLI常用跨源分析开发方式 - 数据湖探索 DLI

推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。表1 跨源分析语法参考服务名称开发SQL作业开发Spark jar作业开发Flink OpenSource SQL作业开发Flink Jar作业 CloudTable

帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

（推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1 DLI获取访问凭据相关开发指南类型

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
Hudi - 数据湖探索 DLI
Hudi - 数据湖探索 DLI

Hudi Hudi是一种数据湖的存储格式，在Hadoop文件系统之上提供了更新数据和删除数据的能力以及消费变化数据的能力。支持多种计算引擎，提供IUD接口，在HDFS的数据集上提供了插入更新和增量拉取的功能。表1 支持类别类别详情支持Flink表类型源表、结果表支持hudi表类型

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表
Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

导出CSV文件时保留特殊字符的引号说明： Spark2.4.x：在Spark 2.4.x版本中，导出CSV文件时，如果字段值中包含特殊字符如换行符（\n）和回车符（\r），并且这些特殊字符被引号（例如双引号"）包围，Spark会自动处理这些引号，在导出的CSV文件中舍弃这些引号。

帮助中心 > 数据湖探索 DLI > 服务公告 > 版本支持公告 > Spark 2.4.x与Spark 3.3.x版本差异对比
新建SQL作业 - 数据湖探索 DLI
新建SQL作业 - 数据湖探索 DLI

"status_name": "job_init", "status_desc": "" } } 状态码状态码如表6所示。表6 状态码状态码描述 200 创建作业成功。 400 输入参数无效。错误码调用接口出错后，将不会返回上述结果，而是返回错误码和错误信息，更多介绍请参见错误码。

帮助中心 > 数据湖探索 DLI > API参考 > Flink作业相关API
Print结果表 - 数据湖探索 DLI
Print结果表 - 数据湖探索 DLI

单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取taskmanager.out文件查看结果日志。父主题：创建结果表

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Raw Format - 数据湖探索 DLI
Raw Format - 数据湖探索 DLI

按照如下方式查看taskmanager.out文件中的数据结果：登录DLI管理控制台，选择“作业管理 > Flink作业”。单击对应的Flink作业名称，选择“运行日志”，单击“OBS桶”，根据作业运行的日期，找到对应日志的文件夹。进入对应日期的文件夹后，找到名字中包含“taskmanager”的文件夹进入，下载获取

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Format
Hudi数据表Clean规范 - 数据湖探索 DLI

Plan能够被成功执行，Compaction Plan只是记录了Hudi表中哪些Log文件要和哪些Parquet文件合并，所以最重要的地方在于保证Compaction Plan在被执行的时候它需要合并的文件都存在。而Hudi表中只有Clean操作可以清理文件，所以建议Clean的触发阈值（hoodie.cleaner

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
DLI Delta表概述 - 数据湖探索 DLI

DLI Delta表概述 Delta表是一种基于Delta Lake技术实现的数据存储解决方案，它使用基于文件的事务日志扩展了 Parquet 数据文件，可以处理 ACID 事务和可缩放的元数据。 Delta Lake与Apache Spark API完全兼容，并且其设计能够与结

 帮助中心 > 数据湖探索 DLI > Delta SQL语法参考
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

成本说明 OBS 需要创建一个OBS桶将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。 OBS的使用涉及以下几项费用：存储费用：静态网站文件存储在OBS中产生的存储费用。请求费用：用户访问OBS中存储的静态网站文件时产生的请求费用。流量费用：用户使用自定义域名通过公网访问OBS时产生的流量费用。

帮助中心 > 数据湖探索 DLI > 最佳实践
Flink Jar作业开发基础样例 - 数据湖探索 DLI

其他依赖文件用户自定义的依赖文件。在选择依赖文件之前需要将对应的文件上传至OBS桶中，并在“数据管理>程序包管理”中创建程序包，包类型没有限制，具体请参考创建程序包。通过在应用程序中添加以下内容可访问对应的依赖文件。其中，“fileName”为需要访问的文件名，“ClassName”为需要访问该文件的类名。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
获取跨源认证列表（废弃） - 数据湖探索 DLI

String krb5配置文件obs路径。 keytab String keytab配置文件obs路径。 truststore_location String truststore配置文件obs路径。 keystore_location String keystore配置文件obs路径。 owner

帮助中心 > 数据湖探索 DLI > API参考 > 历史API > 跨源认证相关API（废弃）
Spark作业开发类 - 数据湖探索 DLI

如何在DLI中运行复杂PySpark程序？如何通过JDBC设置spark.sql.shuffle.partitions参数提高并行度 Spark jar 如何读取上传文件添加Python包后，找不到指定的Python环境为什么Spark jar 作业一直处于“提交中”？父主题： Spark作业相类

 帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类
DLI SDK简介 - 数据湖探索 DLI
DLI SDK简介 - 数据湖探索 DLI

DLI支持的SDK分为SDK V3和DLI服务自行开发的SDK。（推荐）DLI SDK V3：是根据定义API的YAML文件统一自动生成，其接口参数与服务的API一致。具体操作请参考SDK V3版本开发指南。 DLI SDK（服务自研）：是DLI服务自行开发的SDK，本手册介绍DLI

帮助中心 > 数据湖探索 DLI > SDK参考
从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

1”，可以将多个task生成的多个文件汇总为一个文件。操作步骤在管理控制台检查对应SQL作业详情中的“结果条数”是否正确。检查发现读取的数据量是正确的。图1 检查读取的数据量确认客户验证数据量的方式是否正确。客户验证的方式如下：通过OBS下载数据文件。通过文本编辑器打开数据文件，发现数据量缺失。

帮助中心 > 数据湖探索 DLI > 常见问题 > DLI数据库和表类

总条数： 675

上一页
1
...
7
8
9
...
34
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

Maxwell Format - 数据湖探索 DLI

Hudi查询类型 - 数据湖探索 DLI

Canal Format - 数据湖探索 DLI

使用Spark SQL作业分析OBS数据 - 数据湖探索 DLI

Flink Jar作业类 - 数据湖探索 DLI

DLI常用跨源分析开发方式 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

Hudi - 数据湖探索 DLI

Spark 2.4.x与Spark 3.3.x版本在SQL队列的差异对比 - 数据湖探索 DLI

新建SQL作业 - 数据湖探索 DLI

Print结果表 - 数据湖探索 DLI

Raw Format - 数据湖探索 DLI

Hudi数据表Clean规范 - 数据湖探索 DLI

DLI Delta表概述 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

获取跨源认证列表（废弃） - 数据湖探索 DLI

Spark作业开发类 - 数据湖探索 DLI

DLI SDK简介 - 数据湖探索 DLI

从DLI导入数据到OBS，数据量不一致怎么办？ - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线