搜索_华为云

DLI常用跨源分析开发方式 - 数据湖探索 DLI

Flink作业访问DIS，OBS和SMN数据源，无需创建跨源连接，可以直接访问。推荐使用增强型跨源连接打通DLI与数据源之间的网络。跨源分析开发方式表1提供DLI支持的数据源对应的开发方式。表1 跨源分析语法参考服务名称开发SQL作业开发Spark jar作业开发Flink OpenSource SQL作业

 帮助中心 > 数据湖探索 DLI > 用户指南 > 数据迁移与数据传输 > 配置DLI读写外部数据源数据 > 配置DLI与数据源网络连通（增强型跨源连接）
流生态作业开发指引 - 数据湖探索 DLI

流生态作业开发指引流生态系统基于Flink和Spark双引擎，完全兼容Flink/Storm/Spark开源社区版本接口，并且在此基础上做了特性增强和性能提升，为用户提供易用、低时延、高吞吐的数据湖探索。数据湖探索的流生态开发包括云服务生态、开源生态和自拓展生态：云服务生态

 帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
使用HetuEngine on Hudi - 数据湖探索 DLI

HetuEngine是高性能的交互式SQL分析及数据虚拟化引擎，它与大数据生态无缝融合，实现海量数据秒级交互式查询，并支持跨源跨域统一访问，使能数据湖内、湖间、湖仓一站式SQL融合分析。 HetuEngine对Hudi仅支持select操作，即支持SELECT语法来查询Hudi表中的数据。 HetuEngine暂不支持查询Hudi的增量视图。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI中使用Hudi开发作业
DLI Hudi元数据 - 数据湖探索 DLI
DLI Hudi元数据 - 数据湖探索 DLI

DLI Hudi元数据 DLI Hudi元数据说明创建Hudi表时会在元数据仓创建表的相关元数据信息。 Hudi支持对接DLI元数据和Lakeformation元数据（仅Spark 3.3.1及以上版本支持对接Lakeformation元数据），对接方式与Spark一致。 DL

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考
执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

行，即为数据倾斜的情况。图1 数据倾斜样例常见数据倾斜场景 Group By聚合倾斜在执行Group By聚合操作时，如果某些分组键对应的数据量特别大，而其他分组键对应的数据量很小，在聚合过程中，数据量大的分组会占用更多的计算资源和时间，导致处理速度变慢，出现数据倾斜。 JOIN

帮助中心 > 数据湖探索 DLI > 常见问题 > SQL作业类 > SQL作业开发类
入门实践 - 数据湖探索 DLI
入门实践 - 数据湖探索 DLI

SQL作业创建OBS表、导入OBS表数据、插入和查询OBS表数据等操作。 Flink OpenSource SQL作业开发从Kafka读取数据写入到RDS 介绍使用Flink OpenSource SQL作业从Kafka读取数据写入到RDS的开发示例。从Kafka读取数据写入到DWS 介绍使用Flink

帮助中心 > 数据湖探索 DLI > 快速入门
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

row 1。原因分析客户的数据中存在emoj表情，这些表情是按照四个字节一个单位进行编码的，而通常使用的utf-8编码在mysql数据库中默认是按照三个字节一个单位进行编码的，这个原因导致将数据存入mysql数据库时出现错误。出现该问题可能原因如下：数据库编码问题。处理步骤修改字符集为utf8mb4。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
MRS配置 - 数据湖探索 DLI
MRS配置 - 数据湖探索 DLI

DLI跨源连接中配置MRS主机信息在DLI管理控制台上已完成创建跨源连接。具体操作请参考《数据湖探索用户指南》。对接MRS HBase需要在DLI队列的host文件中添加MRS集群节点的/etc/hosts信息。详细操作请参考《数据湖探索用户指南》中的“修改主机信息”章节描述。开启Kerberos认证时的相关配置文件

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
SQL作业开发指南 - 数据湖探索 DLI

SQL作业开发指南使用Spark SQL作业分析OBS数据在DataArts Studio开发DLI SQL作业在Spark SQL作业中使用UDF 在Spark SQL作业中使用UDTF 在Spark SQL作业中使用UDAF

帮助中心 > 数据湖探索 DLI > 开发指南
导入数据 - 数据湖探索 DLI
导入数据 - 数据湖探索 DLI

PERMISSIVE：选择PERMISSIVE模式时，如果某一列数据类型与目标表列数据类型不匹配，则该行数据将被设置为null。 DROPMALFORMED：选择DROPMALFORMED模式时，如果某一列数据类型与目标表列数据类型不匹配，则不导入该行数据。 FAILFAST：选择FAILFAST模

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据相关
Flink Jar作业开发基础样例 - 数据湖探索 DLI

Flink Jar作业开发基础样例概述用户可以基于Flink的API进行二次开发，构建自己的应用Jar包，提交到DLI队列运行，实现与MRS Kafka、HBase、Hive、HDFS，DWS，DCS等数据源的交互。本章节以通过自定义作业与MRS进行交互为例进行说明。更多样例代码请通过DLI样例代码获取。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
查看指定数据库 - 数据湖探索 DLI

查看指定数据库功能描述查看指定数据库的相关信息，包括数据库名称、数据库的描述等。语法格式 1 DESCRIBE DATABASE [EXTENDED] db_name; 关键字 EXTENDED：除了显示上述信息外，还会额外显示数据库的属性信息。参数说明表1 参数说明

 帮助中心 > 数据湖探索 DLI > Spark SQL语法参考 > 数据库相关
Spark Jar作业开发指南 - 数据湖探索 DLI

Spark Jar作业开发指南使用Spark Jar作业读取和查询OBS数据使用Spark作业访问DLI元数据使用Spark作业跨源访问数据源 Spark Jar 使用DEW获取访问凭证读写OBS 获取Spark作业委托临时凭证用于访问其他云服务

 帮助中心 > 数据湖探索 DLI > 开发指南
Flink OpenSource SQL作业开发 - 数据湖探索 DLI

OpenSource SQL作业开发从Kafka读取数据写入到RDS 从Kafka读取数据写入到DWS 从Kafka读取数据写入到Elasticsearch 从MySQL CDC源表读取数据写入到DWS 从PostgreSQL CDC源表读取数据写入到DWS Flink作业高可靠推荐配置指导（异常自动重启）

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南
对接HBase - 数据湖探索 DLI
对接HBase - 数据湖探索 DLI

对接HBase MRS配置 scala样例代码 pyspark样例代码 java样例代码故障处理父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
对接CSS - 数据湖探索 DLI
对接CSS - 数据湖探索 DLI

对接CSS CSS安全集群配置 scala样例代码 pyspark样例代码 java样例代码父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
使用DLI分析电商BI报表 - 数据湖探索 DLI

使用DLI进行电商数据分析的操作过程主要包括以下步骤：步骤1：上传数据。将数据上传到对象存储服务OBS，为后面使用DLI完成数据分析做准备。步骤2：分析数据。使用DLI对待分析的数据进行查询。具体样例数据及详细SQL语句可以通过数据包进行下载。数据说明为保护用户的隐私和数据安全，所有数据均已进行了采样和脱敏。

帮助中心 > 数据湖探索 DLI > 最佳实践
scala样例代码 - 数据湖探索 DLI
scala样例代码 - 数据湖探索 DLI

通过SQL API访问数据源插入数据 1 sparkSession.sql("insert into test_hbase values('12345','abc','guiyang',false,null,3,23,2.3,2.34)") 查询数据 1 sparkSession

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接HBase
对接RDS - 数据湖探索 DLI
对接RDS - 数据湖探索 DLI

对接RDS scala样例代码 pyspark样例代码 java样例代码父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源
对接OpenTSDB - 数据湖探索 DLI
对接OpenTSDB - 数据湖探索 DLI

对接OpenTSDB scala样例代码 pyspark样例代码 java样例代码故障处理父主题：使用Spark作业跨源访问数据源

 帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源

总条数： 1507

上一页
1
2
3
4
5
...
76
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

DLI常用跨源分析开发方式 - 数据湖探索 DLI

流生态作业开发指引 - 数据湖探索 DLI

使用HetuEngine on Hudi - 数据湖探索 DLI

DLI Hudi元数据 - 数据湖探索 DLI

执行SQL作业时产生数据倾斜怎么办？ - 数据湖探索 DLI

入门实践 - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

MRS配置 - 数据湖探索 DLI

SQL作业开发指南 - 数据湖探索 DLI

导入数据 - 数据湖探索 DLI

Flink Jar作业开发基础样例 - 数据湖探索 DLI

查看指定数据库 - 数据湖探索 DLI

Spark Jar作业开发指南 - 数据湖探索 DLI

Flink OpenSource SQL作业开发 - 数据湖探索 DLI

对接HBase - 数据湖探索 DLI

对接CSS - 数据湖探索 DLI

使用DLI分析电商BI报表 - 数据湖探索 DLI

scala样例代码 - 数据湖探索 DLI

对接RDS - 数据湖探索 DLI

对接OpenTSDB - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线