搜索_华为云

pyspark样例代码 - 数据湖探索 DLI

s").getOrCreate() 通过DataFrame API 访问连接参数配置 1 2 3 4 5 url = "jdbc:mysql://to-rds-1174404952-ZgPo1nNC.datasource.com:3306" dbtable = "test.customer"

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南 > 使用Spark作业跨源访问数据源 > 对接RDS
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

布式计算的场景，用户可以利用HBase搭建起TB至PB级数据规模的存储系统，对数据轻松进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以从HBase中读取数据，用于过滤分析、数据转储等场景。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.10语法参考 > 数据定义语句DDL > 创建源表
JDBC维表 - 数据湖探索 DLI
JDBC维表 - 数据湖探索 DLI

从Kafka源表中读取数据，将JDBC表作为维表，并将二者生成的表信息写入Kafka结果表中，其具体步骤如下：参考增强型跨源连接，在DLI上根据MySQL和Kafka所在的虚拟私有云和子网分别创建相应的增强型跨源连接，并绑定所要使用的Flink弹性资源池。设置MySQL和Kafka

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建维表
从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS 本指导仅适用于Flink 1.12版本。场景描述 CDC是变更数据捕获（Change Data Capture）技术的缩写，它可以将源数据库的增量变动记录，同步到一个或多个数据目的中。CDC在数据同步过程中，还可以对数据进行一定的处理，例如分组（GROUP

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

客户的数据中存在emoj表情，这些表情是按照四个字节一个单位进行编码的，而通常使用的utf-8编码在mysql数据库中默认是按照三个字节一个单位进行编码的，这个原因导致将数据存入mysql数据库时出现错误。出现该问题可能原因如下：数据库编码问题。处理步骤修改字符集为utf8mb4。

帮助中心 > 数据湖探索 DLI > 常见问题 > 增强型跨源连接类
自定义函数参数传递 - 数据湖探索 DLI

context.getJobParameter("url","jdbc:mysql://xx.xx.xx.xx:3306/table"); context.getJobParameter("driver","com.mysql.jdbc.Driver"); context.getJobParameter("user"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > 函数
自定义函数参数传递 - 数据湖探索 DLI

context.getJobParameter("url","jdbc:mysql://xx.xx.xx.xx:3306/table"); context.getJobParameter("driver","com.mysql.jdbc.Driver"); context.getJobParameter("user"

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 函数
从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch 本指导仅适用于Flink 1.12版本。场景描述本示例场景对用户购买商品的数据信息进行分析，将满足特定条件的数据结果进行汇总输出。购买商品数据信息为数据源发送到Kafka中，再将Kafka数据的分析结果输出到Elasticsearch中。

帮助中心 > 数据湖探索 DLI > 开发指南 > Flink作业开发指南 > Flink OpenSource SQL作业开发
使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据操作场景 DLI完全兼容开源的Apache Spark，支持用户开发应用程序代码来进行作业数据的导入、查询以及分析处理。本示例从编写Spark程序代码读取和查询OBS数据、编译打包到提交Spark Jar作业等完整的操作步骤说明来帮助您在DLI上进行作业开发。

帮助中心 > 数据湖探索 DLI > 开发指南 > Spark Jar作业开发指南
Hudi表使用约束 - 数据湖探索 DLI

更新操作需要通过重写原始parquet文件完成。优点：读取时，只读取对应分区的一个数据文件即可，较为高效。缺点：数据写入的时候，需要复制一个先前的副本再在其基础上生成新的数据文件，这个过程比较耗时。且由于耗时，读请求读取到的数据相对就会滞后。 Merge On Read 读时

 帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > Hudi表概述
Hudi数据表Compaction规范 - 数据湖探索 DLI

mor表更新数据以行存log的形式写入，log读取时需要按主键合并，并且是行存的，导致log读取效率比parquet低很多。为了解决log读取的性能问题，Hudi通过compaction将log压缩成parquet文件，大幅提升读取性能。规则有数据持续写入的表，24小时内至少执行一次compaction。

帮助中心 > 数据湖探索 DLI > Hudi SQL语法参考 > DLI Hudi开发规范 > Hudi数据表管理操作规范
使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Parquet是面向分析型业务的列式存储格式，这种格式可以加快查询速度，查询Parquet格式数据时，只检查所需要的列并对它们的值执行计算，也就是说，只读取一个数据文件或表的一小部分数据。Parquet还支持灵活的压缩选项，因此可以显著减少磁盘上的存储。使用DLI可轻松将CSV格式数据转换为Parquet格式数据。

帮助中心 > 数据湖探索 DLI > 最佳实践
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以从HBase中读取数据，用于过滤分析、数据转储等场景。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考 > Connector列表 > Hbase
Connector列表 - 数据湖探索 DLI
Connector列表 - 数据湖探索 DLI

DataGen Doris DWS Elasticsearch 对象存储OBS Hbase Hive Hudi JDBC Kafka MySql CDC Print Redis Upsert Kafka 父主题： Flink Opensource SQL1.15语法参考

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.15语法参考
创建源表 - 数据湖探索 DLI
创建源表 - 数据湖探索 DLI

创建源表 DataGen源表 DWS源表 Hbase源表 JDBC源表 Kafka源表 MySQL CDC源表 Postgres CDC源表 Redis源表 Upsert Kafka源表 FileSystem源表父主题：数据定义语句DDL

帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL
Upsert Kafka结果表 - 数据湖探索 DLI

该场景作业需要运行在DLI的独享队列上，因此要与Kafka集群建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数据湖探索用户指南》中增强型跨源连接章节。如何设置安全组规则，请参见《虚拟私有云用户指南》中“安全组”章节。 Flink跨源开发场景中直接配置跨源

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建结果表
Hbase源表 - 数据湖探索 DLI
Hbase源表 - 数据湖探索 DLI

进行过滤分析，毫秒级得到响应，快速发现数据价值。DLI可以从HBase中读取数据，用于过滤分析、数据转储等场景。前提条件该场景作业需要运行在DLI的独享队列上，因此要与HBase建立增强型跨源连接，且用户可以根据实际所需设置相应安全组规则。如何建立增强型跨源连接，请参考《数

 帮助中心 > 数据湖探索 DLI > Flink SQL语法参考 > Flink Opensource SQL1.12语法参考 > 数据定义语句DDL > 创建源表
了解数据目录、数据库和表 - 数据湖探索 DLI

导出文件格式为json格式，且文本格式仅支持UTF-8。支持跨账号导出数据，即B账户对A账户授权后，A账户拥有B账户OBS桶的元数据信息和权限信息的读取权限，以及路径的读写权限，则A账户可将数据导出至B账户的OBS路径中。表管理页面在“数据管理”页面中，单击对应数据库名称或“操作”列中的“表管理”，可进入其表管理页面。

帮助中心 > 数据湖探索 DLI > 用户指南 > 创建数据库和表
通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK （推荐）方案1：使用临时AK/SK 建议使用临时AK/SK，获取方式可参见统一身份认证服务_获取临时AK/SK。认证用的ak和sk硬编码到代码中或者明文存储都有很大的安全风险，建议在配置文件或者环境变量中密文存放，使用时解密，确保安全。表1

帮助中心 > 数据湖探索 DLI > 常见问题 > Spark作业相类 > Spark作业开发类
配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

接口与Kyuubi进行交互。是 mysql thrift_binary kyuubi.engine.dli.schema.show.name 用于指定当用户执行show schemas或show databases语句时，Kyuubi引擎如何展示数据源接口的模式名称。 true：表示在展示模式名称时，包含

 帮助中心 > 数据湖探索 DLI > 最佳实践 > 使用BI工具连接DLI分析数据

总条数： 610

上一页
1
2
3
4
5
...
31
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

pyspark样例代码 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

JDBC维表 - 数据湖探索 DLI

从PostgreSQL CDC源表读取数据写入到DWS - 数据湖探索 DLI

跨源RDS表，执行insert overwrite提示Incorrect string value错误怎么办？ - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

自定义函数参数传递 - 数据湖探索 DLI

从Kafka读取数据写入到Elasticsearch - 数据湖探索 DLI

使用Spark Jar作业读取和查询OBS数据 - 数据湖探索 DLI

Hudi表使用约束 - 数据湖探索 DLI

Hudi数据表Compaction规范 - 数据湖探索 DLI

使用DLI将CSV数据转换为Parquet数据 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

Connector列表 - 数据湖探索 DLI

创建源表 - 数据湖探索 DLI

Upsert Kafka结果表 - 数据湖探索 DLI

Hbase源表 - 数据湖探索 DLI

了解数据目录、数据库和表 - 数据湖探索 DLI

通用队列操作OBS表如何设置AK/SK - 数据湖探索 DLI

配置SuperSet通过Kyuubi连接DLI进行数据查询和分析 - 数据湖探索 DLI

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线